Komputer uczy się na błędach (językowych)

Opublikowano: sobota, 22, październik 2016

 

https://pixabay.com/pl/klawiatura-komputer-zielony-klucze-191805/

 

Aby sprawić, żeby komputery i smartfony rozumiały, gdy zwracamy się do nich w obcym dla nas języku, grupa naukowców z USA postanowiła zapoznać je z ...błędami, jakie mogą popełniać obcokrajowcy.

Ośmioletni Staszek od czasu do czasu bawi się smartfonem taty zadając pytania Cortanie, a ściślej mówiąc angielskojęzycznej wersji tej aplikacji, która posiadła umiejętność „rozumienia” mowy ludzkiej.

 

Niestety w większości przypadków Cortana nie rozumie tych pytań, gdyż nie do końca poprawna angielszczyzna stanowi dla komputera problem (Staszek chodzi do amerykańskiej szkoły, mówi płynnie w tym języku, ale wciąż popełnia sporo błędów). W podobnej sytuacji, co Staszek jest prawdopodobnie wiele spośród 603 milionów (ethnologue.com) osób znających angielski, ale nie będących rodzimymi użytkownikami tego języka. Błędy gramatyczne, jakie popełniają oni mówiąc w języku Szekspira, utrudniają im – a w niektórych przypadkach wręcz uniemożliwiają – głosowe porozumiewanie się z komputerem. Jednak wkrótce może się to zmienić dzięki projektowi badawczemu realizowanemu na Massachussetts Institute of Technology (MIT).

 Jak tłumaczy Jewgienij Berzak – doktorant na wydziale inżynierii elektrycznej i nauk komputerowych MIT i główny autor projektu – większość aplikacji przetwarzających języki naturalne (a co za tym idzie umożliwiających smartfonom i komputerom wykonywać polecenia sformułowane w języku potocznym) jest opartych na zasadach uczenia się maszyn. W ramach tego „uczenia”, komputer szuka prawidłowości wśród olbrzymiej liczby danych, a następnie je analizuje i  przyswaja. Dotychczas dostarczano komputerom tylko dane zawierające materiał językowy pochodzący od rodzimych użytkowników języka angielskiego, czyli złożony ze zdań, które są w olbrzymiej większości poprawne. Tymczasem systemy, które powstałyby w oparciu o niestandardowy angielski, mogłyby lepiej wyczuwać typowe błędy nierodzimych użytkowników języka angielskiego, np. tendencje do opuszczania lub nadużywania przysłówków, mylenia czasów, zastępowania czasowników posiłkowych innymi itp.

Baza danych, którą stworzyli w ramach projektu badacze z MIT, zawiera 5 124 zdania zaczerpnięte z wypracowań napisanych przez osoby uczące się języka angielskiego. Grupa autorów wypracowań składała się – w równych proporcjach – z rodzimych użytkowników 10 najpopularniejszych języków świata (poza angielskim), którymi włada mniej więcej 40 proc. ludzkości. Każde ze zdań przetwarzanych przez komputer zawierało co najmniej jeden błąd gramatyczny i zostało opisane przez grupę studentów według szczegółowej instrukcji opracowanej przez Berzaka i współpracujących z nim językoznawców. Anotacje zawierały informacje nt. każdego słowa – jego formy gramatycznej (liczby, rodzaju, osoby, stopnia itp.), a także związków z innymi wyrazami w ramach danego zdania. Ten szczegółowy sposób opisu miał komputerowi pomóc w analizie dostarczonego materiału. Opracowanie wytycznych, jak tworzyć anotacje wymagało sporego wysiłku koncepcyjnego z tego względu, że błędy gramatyczne mogą sprawić, że funkcje poszczególnych słów w ramach zdania są trudne do interpretacji. Kluczowa była tu także jednolitość opisu, bowiem komputer nie jest w stanie poprawnie zanalizować materiału, jeśli dostarczone mu dane zostaną opisane na różne sposoby. 

Nie jest to jednak pierwszy projekt realizowany przez Jewgienija Berzaka na MIT, w ramach którego na warsztat zostały wzięte błędy popełniane przez nierodzimych użytkowników języka angielskiego. Wcześniej pochodzący z Rosji doktorant analizował błędy użytkowników różnych języków piszących po angielsku. Prawidłowości w ten sposób odkryte pozwoliły wysnuć cały szereg bardzo ciekawych wniosków, o których pisaliśmy w innym miejscu (por. Językoznawstwo z komputera).

 

Karol Chlipalski

 

Serwis Wszystko o dwujęzyczności jest dostępny na licencji Creative Commons Uznanie autorstwa 3.0 Polska. Pewne prawa zastrzeżone na rzecz Uniwersytetu Warszawskiego. Utwór powstał w ramach zlecania przez Kancelarię Senatu zadań w zakresie opieki nad Polonią i Polakami za granicą w 2016 roku. Zezwala się na dowolne wykorzystanie utworu, pod warunkiem zachowania ww. informacji, w tym informacji o stosowanej licencji, o posiadaczach praw oraz o zleceniu zadania publicznego przez Kancelarię Senatu oraz przyznaniu dotacji na jego wykonanie w 2016 r.”. 

 

Mojabancarella 22/10/2016

Dodaj komentarz


Kod antyspamowy
Odśwież

O nas

MOJABANCERELLA.com to portal o charakterze informacyjnym, gdzie staram się na bieżąco przekazywać Państwu informacje dotyczące Polonii włoskiej i nie tylko.

„Mojabancarella” – moja -, czyli nasza, każdego z osobna i - bancarella – słowo które stało się naszym spolszczonym tłumaczeniem słowa stragan, gdzie można znaleźć wszelkie dobro. 

ZAPRASZAM NA MOJABANCARELLA

Najnowsze artykuły

Elżbieta Grzybek prezentuje

 

 

„Czas historyczny wchłonięty zostaje ostatecznie przez wieczny przepływ czasu mitycznego."    

Joanna Ugniatowska "Historia literatury włoskiej XX w".  

 

   

Ela Grzybek - artysta plastyk, projektantka mody, arteterapeutka, nauczyciel plastyki, studentka Filozofii i Etyki Uniwersytetu w Białymstoku odbywająca praktyki studenckie Rzymie, w ramach programu Erasmus, w Stowarzyszeniu Kulturalnym Mojabancarella, którego Prezesem jest Alicja Kołtunowicz.

 

III Krajowa Konferencja Metodyczna we Włoszech – rekrutacja

 

 

Stowarzyszenie "Wspólnota Polska" wraz z Radą Oświaty Polonijnej we Włoszech, Stowarzyszeniem Instytut dla Polonii oraz  Wydziałem Konsularnym Ambasady RP w Rzymie zaprasza nauczycieli polonijnych z Włoch na III Krajową Konferencję Metodyczną w Neapolu.

Konferencja jest kontynuacją rozpoczętej w 2014 roku kampanii na rzecz rozwoju oświaty polonijnej we Włoszech. Tym razem zostaną poruszone tematy, które pozwolą nauczycielom na zwiększenie ich kompetencji w zakresie doboru materiału i metod nauczania przystosowanych dla dzieci dwujęzycznych z Włoch.

 

Ojczyzna o mnie zapomniała

 

 

Dominika Zamara, polski sopran, anielski głos (tak jest nazywana na świecie), Ambasadorka Polski a jednak w głosie Dominiki słychać wielką nutę nostalgii i tęsknoty za krajem.

Posłuchajcie wywiadu, który Dominika udzieliła portalowi Wideoportal

 

Mojabancarella 18/08/2017

 

Allora, Ela e Ola a Roma

 

 

Wszystkie drogi prowadzą do Rzymu, a więc i nas, Elę Grzybek i Aleksandrę Sadokierską jedna z nich zawiodła do Wiecznego Miasta. Naszym gościńcem okazała się Mojabancarella. To stowarzyszenie kulturalne, dzieło Alicji Kołtunowicz, dało początek naszym spotkaniom z polonią rzymską. Przyjechałyśmy tu nie jako turystki, lecz studentki Filozofii i Etyki z Uniwersytetu w Białymstoku, na praktyki w ramach otrzymanego stypendium Erasmus.