Komputer uczy się na błędach (językowych)

Opublikowano: sobota, 22 październik 2016

 

https://pixabay.com/pl/klawiatura-komputer-zielony-klucze-191805/

 

Aby sprawić, żeby komputery i smartfony rozumiały, gdy zwracamy się do nich w obcym dla nas języku, grupa naukowców z USA postanowiła zapoznać je z ...błędami, jakie mogą popełniać obcokrajowcy.

Ośmioletni Staszek od czasu do czasu bawi się smartfonem taty zadając pytania Cortanie, a ściślej mówiąc angielskojęzycznej wersji tej aplikacji, która posiadła umiejętność „rozumienia” mowy ludzkiej.

 

Niestety w większości przypadków Cortana nie rozumie tych pytań, gdyż nie do końca poprawna angielszczyzna stanowi dla komputera problem (Staszek chodzi do amerykańskiej szkoły, mówi płynnie w tym języku, ale wciąż popełnia sporo błędów). W podobnej sytuacji, co Staszek jest prawdopodobnie wiele spośród 603 milionów (ethnologue.com) osób znających angielski, ale nie będących rodzimymi użytkownikami tego języka. Błędy gramatyczne, jakie popełniają oni mówiąc w języku Szekspira, utrudniają im – a w niektórych przypadkach wręcz uniemożliwiają – głosowe porozumiewanie się z komputerem. Jednak wkrótce może się to zmienić dzięki projektowi badawczemu realizowanemu na Massachussetts Institute of Technology (MIT).

 Jak tłumaczy Jewgienij Berzak – doktorant na wydziale inżynierii elektrycznej i nauk komputerowych MIT i główny autor projektu – większość aplikacji przetwarzających języki naturalne (a co za tym idzie umożliwiających smartfonom i komputerom wykonywać polecenia sformułowane w języku potocznym) jest opartych na zasadach uczenia się maszyn. W ramach tego „uczenia”, komputer szuka prawidłowości wśród olbrzymiej liczby danych, a następnie je analizuje i  przyswaja. Dotychczas dostarczano komputerom tylko dane zawierające materiał językowy pochodzący od rodzimych użytkowników języka angielskiego, czyli złożony ze zdań, które są w olbrzymiej większości poprawne. Tymczasem systemy, które powstałyby w oparciu o niestandardowy angielski, mogłyby lepiej wyczuwać typowe błędy nierodzimych użytkowników języka angielskiego, np. tendencje do opuszczania lub nadużywania przysłówków, mylenia czasów, zastępowania czasowników posiłkowych innymi itp.

Baza danych, którą stworzyli w ramach projektu badacze z MIT, zawiera 5 124 zdania zaczerpnięte z wypracowań napisanych przez osoby uczące się języka angielskiego. Grupa autorów wypracowań składała się – w równych proporcjach – z rodzimych użytkowników 10 najpopularniejszych języków świata (poza angielskim), którymi włada mniej więcej 40 proc. ludzkości. Każde ze zdań przetwarzanych przez komputer zawierało co najmniej jeden błąd gramatyczny i zostało opisane przez grupę studentów według szczegółowej instrukcji opracowanej przez Berzaka i współpracujących z nim językoznawców. Anotacje zawierały informacje nt. każdego słowa – jego formy gramatycznej (liczby, rodzaju, osoby, stopnia itp.), a także związków z innymi wyrazami w ramach danego zdania. Ten szczegółowy sposób opisu miał komputerowi pomóc w analizie dostarczonego materiału. Opracowanie wytycznych, jak tworzyć anotacje wymagało sporego wysiłku koncepcyjnego z tego względu, że błędy gramatyczne mogą sprawić, że funkcje poszczególnych słów w ramach zdania są trudne do interpretacji. Kluczowa była tu także jednolitość opisu, bowiem komputer nie jest w stanie poprawnie zanalizować materiału, jeśli dostarczone mu dane zostaną opisane na różne sposoby. 

Nie jest to jednak pierwszy projekt realizowany przez Jewgienija Berzaka na MIT, w ramach którego na warsztat zostały wzięte błędy popełniane przez nierodzimych użytkowników języka angielskiego. Wcześniej pochodzący z Rosji doktorant analizował błędy użytkowników różnych języków piszących po angielsku. Prawidłowości w ten sposób odkryte pozwoliły wysnuć cały szereg bardzo ciekawych wniosków, o których pisaliśmy w innym miejscu (por. Językoznawstwo z komputera).

 

Karol Chlipalski

 

Serwis Wszystko o dwujęzyczności jest dostępny na licencji Creative Commons Uznanie autorstwa 3.0 Polska. Pewne prawa zastrzeżone na rzecz Uniwersytetu Warszawskiego. Utwór powstał w ramach zlecania przez Kancelarię Senatu zadań w zakresie opieki nad Polonią i Polakami za granicą w 2016 roku. Zezwala się na dowolne wykorzystanie utworu, pod warunkiem zachowania ww. informacji, w tym informacji o stosowanej licencji, o posiadaczach praw oraz o zleceniu zadania publicznego przez Kancelarię Senatu oraz przyznaniu dotacji na jego wykonanie w 2016 r.”. 

 

Mojabancarella 22/10/2016

Dodaj komentarz


O nas

MOJABANCERELLA.com to portal o charakterze informacyjnym, gdzie staram się na bieżąco przekazywać Państwu informacje dotyczące Polonii włoskiej i nie tylko.

„Mojabancarella” – moja -, czyli nasza, każdego z osobna i - bancarella – słowo które stało się naszym spolszczonym tłumaczeniem słowa stragan, gdzie można znaleźć wszelkie dobro. 

ZAPRASZAM NA MOJABANCARELLA

Przedsięwzięcie jest współfinansowane przez Stowarzyszenie „Wspólnota Polska” ze środków otrzymanych od Kancelarii Senatu w ramach sprawowania opieki Senatu Rzeczypospolitej Polskiej nad Polonią i Polakami za granicą.

  

Najnowsze artykuły

#likePolska

 
100 powodów, dla których lubisz Polskę – w rocznicę odzyskania niepodległości pokaż, za co lubisz Polskę
Mazury, Bieszczady, Gdańsk, Pałac w Wilanowie, a może polonez, toruńskie pierniki lub bociany? Pokaż, za co najbardziej lubisz Polskę. Zrób zdjęcie, nagraj film i 11 listopada w Narodowe Święto Niepodległości opublikuj wpis na Twitterze, Facebooku albo Instagramie z #likePolska.

 

Dominika Zamara zaprasza do Rzymu


Dominika Zamara serdecznie zaprasza mieszkańców Rzymu na koncert poświęcony Papieżowi Janowi Pawłowi II. W sobotę 24 listopada 2018 roku w Rzymie, w Teatro del Pepe, o godz. 20.30 odbędzie się koncert „Perle di opere e musica sacra dedicate al Santo Padre Giovanni Paolo II”.


Najpiękniejsze utwory sakralne zaśpiewa Dominika Zamara a towarzyszyć jej będzie gitarzysta, Maestro Stanley Alexandrowicz.


Mojabancarella 10/11/2018

Narodowe Czytanie „Przedwiośnia” Stefana Żeromskiego w Rzymie

Stowarzyszenie Le Rondini zaprasza na Narodowe Czytanie “Przedwiośnia” Stefana Żeromskiego, które odbędzie się w Rzymie 8 września 2018 roku, w siedzibie Ambasady RP w Rzymie.

8 września br. roku, w ramach akcji Narodowego Czytania, która ma na celu propagowanie bogactwa polskiej literatury oraz popularyzację czytelnictwa, cała Polska będzie czytać „Przedwiośnie” Stefana Żeromskiego. Nad odbywającą się już po raz siódmy akcją patronat honorowy objęła Para Prezydencka - Andrzej Duda i Agata Kornhauser-Duda.

 

Święty Jan Paweł II w oczach dziecka

 

 

XIII edycja Międzynarodowego Konkursu Plastycznego Święty Jan Paweł II w oczach dziecka.

Muzeum w Bielsku Podlaskim Oddział Muzeum Podlaskiego w Białymstoku, Wydział Katechezy i Szkolnictwa Katolickiego Kurii Diecezjalnej w Drohiczynie oraz Dekanat Bielski zapraszają dzieci i młodzież do udziału w XIII edycji Międzynarodowego Konkursu Plastycznego Święty Jan Paweł II w oczach dziecka.

 

Konkurs Wiedzy „Święty Stanisław Kostka. Patron Polski, dzieci i młodzieży”



Stowarzyszenie Społeczno-Kulturalne Le Rondini włączyło się w obchody Roku Świętego Stanisława Kostki., ogłaszając Konkurs Wiedzy „Św. Stanisław Kostka. Patron Polski, dzieci i młodzieży”. Współorganizatorem Konkursu jest Duszpasterstwo przy kościele św. Stanisława B.M. w Rzymie. Patronat Honorowy nad Konkursem objęli: Ambasada Rzeczypospolitej Polskiej przy Stolicy Apostolskiej oraz Parafia św. Stanisława Kostki w Rostkowie.

 

Zlot Motocyklowy przy Kwaśnicy

 

 

Festiwal Kwaśnicy oraz Mojabancarella serdecznie zapraszają wszystkich miłośników motocykli, na Zlot Motocyklowy przy Kwaśnicy, który odbędzie się w Żywcu, w dniach 10 – 12 sierpnia 2018 roku.

Zlot Motocyklowy połączony jest z jubileuszem XV-lecia Festiwalu Kwaśnicy. Zlot rozpocznie się w piątek o godz. 16.00 mszą św. polową. W sobotę zapraszamy na Paradę Motocyklową ulicami Żywca, która wyruszy spod Amfiteatru i skieruje się na żywiecki Rynek, gdzie zaplanowany jest krótki postój a następnie powrót pod Amfiteatr.

 

XV Festiwal Kwaśnicy

 

 

Światowa Loża Smakoszy Beskidzkiej Kwaśnicy zaprasza serdecznie na jubileusz XV-lecia Festiwalu Kwaśnicy, który odbędzie się w Żywcu, w dniach od 10 do 12 sierpnia 2018 roku, na błoniach Amfiteatru pod Grojcem.

Pomysłodawczyni i organizator, sławnej na całą Polskę Kwaśnicy, Barbara Czul, o tegorocznym Festiwalu mówi, że będzie niepowtarzalny a program Festiwalu zostanie tak ułożony, aby każdy z uczestników znalazł w nim coś atrakcyjnego dla siebie – niezależnie od wieku oraz płci.

 

Beskidy Music Festival 2018

 

 

Maciej Maleńczuk, Sławomir i Smolik // Kev Fox to gwiazdy, które wystąpią na żywieckiej scenie podczas Beskidy Music Festival, który odbędzie się 16 – 17 czerwca 2018 roku, na Błoniach Amfiteatru pod Grojcem.

Organizatorami Beskidy Music Festival jest Stowarzyszenie Światowa Loża Smakoszy Beskidzkiej Kwaśnicy oraz portal Beskidy.News.