Komputer uczy się na błędach (językowych)

Opublikowano: sobota, 22, październik 2016

 

https://pixabay.com/pl/klawiatura-komputer-zielony-klucze-191805/

 

Aby sprawić, żeby komputery i smartfony rozumiały, gdy zwracamy się do nich w obcym dla nas języku, grupa naukowców z USA postanowiła zapoznać je z ...błędami, jakie mogą popełniać obcokrajowcy.

Ośmioletni Staszek od czasu do czasu bawi się smartfonem taty zadając pytania Cortanie, a ściślej mówiąc angielskojęzycznej wersji tej aplikacji, która posiadła umiejętność „rozumienia” mowy ludzkiej.

 

Niestety w większości przypadków Cortana nie rozumie tych pytań, gdyż nie do końca poprawna angielszczyzna stanowi dla komputera problem (Staszek chodzi do amerykańskiej szkoły, mówi płynnie w tym języku, ale wciąż popełnia sporo błędów). W podobnej sytuacji, co Staszek jest prawdopodobnie wiele spośród 603 milionów (ethnologue.com) osób znających angielski, ale nie będących rodzimymi użytkownikami tego języka. Błędy gramatyczne, jakie popełniają oni mówiąc w języku Szekspira, utrudniają im – a w niektórych przypadkach wręcz uniemożliwiają – głosowe porozumiewanie się z komputerem. Jednak wkrótce może się to zmienić dzięki projektowi badawczemu realizowanemu na Massachussetts Institute of Technology (MIT).

 Jak tłumaczy Jewgienij Berzak – doktorant na wydziale inżynierii elektrycznej i nauk komputerowych MIT i główny autor projektu – większość aplikacji przetwarzających języki naturalne (a co za tym idzie umożliwiających smartfonom i komputerom wykonywać polecenia sformułowane w języku potocznym) jest opartych na zasadach uczenia się maszyn. W ramach tego „uczenia”, komputer szuka prawidłowości wśród olbrzymiej liczby danych, a następnie je analizuje i  przyswaja. Dotychczas dostarczano komputerom tylko dane zawierające materiał językowy pochodzący od rodzimych użytkowników języka angielskiego, czyli złożony ze zdań, które są w olbrzymiej większości poprawne. Tymczasem systemy, które powstałyby w oparciu o niestandardowy angielski, mogłyby lepiej wyczuwać typowe błędy nierodzimych użytkowników języka angielskiego, np. tendencje do opuszczania lub nadużywania przysłówków, mylenia czasów, zastępowania czasowników posiłkowych innymi itp.

Baza danych, którą stworzyli w ramach projektu badacze z MIT, zawiera 5 124 zdania zaczerpnięte z wypracowań napisanych przez osoby uczące się języka angielskiego. Grupa autorów wypracowań składała się – w równych proporcjach – z rodzimych użytkowników 10 najpopularniejszych języków świata (poza angielskim), którymi włada mniej więcej 40 proc. ludzkości. Każde ze zdań przetwarzanych przez komputer zawierało co najmniej jeden błąd gramatyczny i zostało opisane przez grupę studentów według szczegółowej instrukcji opracowanej przez Berzaka i współpracujących z nim językoznawców. Anotacje zawierały informacje nt. każdego słowa – jego formy gramatycznej (liczby, rodzaju, osoby, stopnia itp.), a także związków z innymi wyrazami w ramach danego zdania. Ten szczegółowy sposób opisu miał komputerowi pomóc w analizie dostarczonego materiału. Opracowanie wytycznych, jak tworzyć anotacje wymagało sporego wysiłku koncepcyjnego z tego względu, że błędy gramatyczne mogą sprawić, że funkcje poszczególnych słów w ramach zdania są trudne do interpretacji. Kluczowa była tu także jednolitość opisu, bowiem komputer nie jest w stanie poprawnie zanalizować materiału, jeśli dostarczone mu dane zostaną opisane na różne sposoby. 

Nie jest to jednak pierwszy projekt realizowany przez Jewgienija Berzaka na MIT, w ramach którego na warsztat zostały wzięte błędy popełniane przez nierodzimych użytkowników języka angielskiego. Wcześniej pochodzący z Rosji doktorant analizował błędy użytkowników różnych języków piszących po angielsku. Prawidłowości w ten sposób odkryte pozwoliły wysnuć cały szereg bardzo ciekawych wniosków, o których pisaliśmy w innym miejscu (por. Językoznawstwo z komputera).

 

Karol Chlipalski

 

Serwis Wszystko o dwujęzyczności jest dostępny na licencji Creative Commons Uznanie autorstwa 3.0 Polska. Pewne prawa zastrzeżone na rzecz Uniwersytetu Warszawskiego. Utwór powstał w ramach zlecania przez Kancelarię Senatu zadań w zakresie opieki nad Polonią i Polakami za granicą w 2016 roku. Zezwala się na dowolne wykorzystanie utworu, pod warunkiem zachowania ww. informacji, w tym informacji o stosowanej licencji, o posiadaczach praw oraz o zleceniu zadania publicznego przez Kancelarię Senatu oraz przyznaniu dotacji na jego wykonanie w 2016 r.”. 

 

Mojabancarella 22/10/2016

Dodaj komentarz


Kod antyspamowy
Odśwież

O nas

MOJABANCERELLA.com to portal o charakterze informacyjnym, gdzie staram się na bieżąco przekazywać Państwu informacje dotyczące Polonii włoskiej i nie tylko.

„Mojabancarella” – moja -, czyli nasza, każdego z osobna i - bancarella – słowo które stało się naszym spolszczonym tłumaczeniem słowa stragan, gdzie można znaleźć wszelkie dobro. 

ZAPRASZAM NA MOJABANCARELLA

Najnowsze artykuły

6. urodziny sklepu „U MICHAŁA”

 

 

Michał Zalewski, Dorota Budnicka i Sara Zalewska serdecznie zapraszają na 6-tą rocznicę powstania sklepu polskiego w Rzymie „U MICHAŁA”, które odbędą się 3 grudnia, w siedzibie sklepu na Viale Trastevere 233.

Jak co roku będziemy mogli posmakować polskich specjałów, zrobić zakupy i zamówić produkty na święta Bożego Narodzenia. A święta już za pasem!

 

Polacy podbijają Alpy

 

 

TO NIEBYWAŁE: POLACY PODBIJAJĄ ALPY! 

ALE JAK SOBIE RADZIĆ W RAZIE WYPADKU NA STOKU?

 

Coraz więcej Polaków jeździ na narty do Włoch. Dla naszych amatorów sportów zimowych Alpy są krainą marzeń: świetne warunki narciarskie, dobra pogoda, słońce pozwalające się pięknie opalić nawet zimą, przepyszne włoskie jedzenie oraz wino, no i włoski styl. 

 

Jak wynika z raportu ISTAP wydawanego corocznie przez Prowincję Autonomiczną Trydentu, w ubiegłym sezonie zimowym na narty do tego rejonu przyjechało 2,9 mln obcokrajowców. Polacy, nawet przed Niemcami, stanowią najliczniejszą grupę turystów - mile widzianą do tego stopnia, że tutejsze struktury wypoczynkowe zatrudniają w hotelarstwie i gastronomi coraz więcej pracowników polskojęzycznych. Można też spotkać napisy po polsku. 

 

Wzmacniajmy płomień pamięci

 

 

UWAGA ***MIĘDZY'narodowy KONKURS

WZNIECAJMY PłOMIEŃ PAMIĘCI *PATRIOTYZM JEST W NAS

 

I. Zgłoszenia i prace przyjmowane są do 25.02.2018r.

Rozstrzygnięcie 31.03.2018 r.

 

II. Tematyka prac: 

1. Życie lub walki gen. Stanisława Maczka.

2. Czasy wojny i wyzwolenia: I i II wojna światowa. 

Okres międzywojenny, wszyscy generałowie, dowódcy, naczelni brygad, oddziałów, jednostek etc...

O poległych i żyjących kombatantach, sanitariuszach, żołnierzach.

 

Rzymskie Kolędowanie 2017

 

 

„Gdy kolęda do drzwi puka to na pewno Ciebie szuka,

Gdyż chce z Tobą kolędować wspólnie z nami się radować.”

J. P. 

 

Stowarzyszenia Kulturalne Mojabancarella i Videopyja mają zaszczyt zaprosić na kolejne już RZYMSKIE KOLĘDOWANIE, które odbędzie się w sobotę 16 grudnia 2017 roku o GODZ. 20.00, w KOŚCIELE SANTA MARIA DELLA CONSOLAZIONE - Piazza della Consolazione RZYM.