Komputer uczy się na błędach (językowych)

Opublikowano: sobota, 22, październik 2016

 

https://pixabay.com/pl/klawiatura-komputer-zielony-klucze-191805/

 

Aby sprawić, żeby komputery i smartfony rozumiały, gdy zwracamy się do nich w obcym dla nas języku, grupa naukowców z USA postanowiła zapoznać je z ...błędami, jakie mogą popełniać obcokrajowcy.

Ośmioletni Staszek od czasu do czasu bawi się smartfonem taty zadając pytania Cortanie, a ściślej mówiąc angielskojęzycznej wersji tej aplikacji, która posiadła umiejętność „rozumienia” mowy ludzkiej.

 

Niestety w większości przypadków Cortana nie rozumie tych pytań, gdyż nie do końca poprawna angielszczyzna stanowi dla komputera problem (Staszek chodzi do amerykańskiej szkoły, mówi płynnie w tym języku, ale wciąż popełnia sporo błędów). W podobnej sytuacji, co Staszek jest prawdopodobnie wiele spośród 603 milionów (ethnologue.com) osób znających angielski, ale nie będących rodzimymi użytkownikami tego języka. Błędy gramatyczne, jakie popełniają oni mówiąc w języku Szekspira, utrudniają im – a w niektórych przypadkach wręcz uniemożliwiają – głosowe porozumiewanie się z komputerem. Jednak wkrótce może się to zmienić dzięki projektowi badawczemu realizowanemu na Massachussetts Institute of Technology (MIT).

 Jak tłumaczy Jewgienij Berzak – doktorant na wydziale inżynierii elektrycznej i nauk komputerowych MIT i główny autor projektu – większość aplikacji przetwarzających języki naturalne (a co za tym idzie umożliwiających smartfonom i komputerom wykonywać polecenia sformułowane w języku potocznym) jest opartych na zasadach uczenia się maszyn. W ramach tego „uczenia”, komputer szuka prawidłowości wśród olbrzymiej liczby danych, a następnie je analizuje i  przyswaja. Dotychczas dostarczano komputerom tylko dane zawierające materiał językowy pochodzący od rodzimych użytkowników języka angielskiego, czyli złożony ze zdań, które są w olbrzymiej większości poprawne. Tymczasem systemy, które powstałyby w oparciu o niestandardowy angielski, mogłyby lepiej wyczuwać typowe błędy nierodzimych użytkowników języka angielskiego, np. tendencje do opuszczania lub nadużywania przysłówków, mylenia czasów, zastępowania czasowników posiłkowych innymi itp.

Baza danych, którą stworzyli w ramach projektu badacze z MIT, zawiera 5 124 zdania zaczerpnięte z wypracowań napisanych przez osoby uczące się języka angielskiego. Grupa autorów wypracowań składała się – w równych proporcjach – z rodzimych użytkowników 10 najpopularniejszych języków świata (poza angielskim), którymi włada mniej więcej 40 proc. ludzkości. Każde ze zdań przetwarzanych przez komputer zawierało co najmniej jeden błąd gramatyczny i zostało opisane przez grupę studentów według szczegółowej instrukcji opracowanej przez Berzaka i współpracujących z nim językoznawców. Anotacje zawierały informacje nt. każdego słowa – jego formy gramatycznej (liczby, rodzaju, osoby, stopnia itp.), a także związków z innymi wyrazami w ramach danego zdania. Ten szczegółowy sposób opisu miał komputerowi pomóc w analizie dostarczonego materiału. Opracowanie wytycznych, jak tworzyć anotacje wymagało sporego wysiłku koncepcyjnego z tego względu, że błędy gramatyczne mogą sprawić, że funkcje poszczególnych słów w ramach zdania są trudne do interpretacji. Kluczowa była tu także jednolitość opisu, bowiem komputer nie jest w stanie poprawnie zanalizować materiału, jeśli dostarczone mu dane zostaną opisane na różne sposoby. 

Nie jest to jednak pierwszy projekt realizowany przez Jewgienija Berzaka na MIT, w ramach którego na warsztat zostały wzięte błędy popełniane przez nierodzimych użytkowników języka angielskiego. Wcześniej pochodzący z Rosji doktorant analizował błędy użytkowników różnych języków piszących po angielsku. Prawidłowości w ten sposób odkryte pozwoliły wysnuć cały szereg bardzo ciekawych wniosków, o których pisaliśmy w innym miejscu (por. Językoznawstwo z komputera).

 

Karol Chlipalski

 

Serwis Wszystko o dwujęzyczności jest dostępny na licencji Creative Commons Uznanie autorstwa 3.0 Polska. Pewne prawa zastrzeżone na rzecz Uniwersytetu Warszawskiego. Utwór powstał w ramach zlecania przez Kancelarię Senatu zadań w zakresie opieki nad Polonią i Polakami za granicą w 2016 roku. Zezwala się na dowolne wykorzystanie utworu, pod warunkiem zachowania ww. informacji, w tym informacji o stosowanej licencji, o posiadaczach praw oraz o zleceniu zadania publicznego przez Kancelarię Senatu oraz przyznaniu dotacji na jego wykonanie w 2016 r.”. 

 

Mojabancarella 22/10/2016

Dodaj komentarz


Kod antyspamowy
Odśwież

O nas

MOJABANCERELLA.com to portal o charakterze informacyjnym, gdzie staram się na bieżąco przekazywać Państwu informacje dotyczące Polonii włoskiej i nie tylko.

„Mojabancarella” – moja -, czyli nasza, każdego z osobna i - bancarella – słowo które stało się naszym spolszczonym tłumaczeniem słowa stragan, gdzie można znaleźć wszelkie dobro. 

ZAPRASZAM NA MOJABANCARELLA

Najnowsze artykuły

Gelato Festival 2017 w Warszawie

 

 

Wszystkich spędzających obecny weekend w Warszawie zapraszamy na ósmą edycję europejskiego festiwalu lodów Gelato Festival 2017. Organizatorzy zapraszają od 23 do 25 czerwca 2017 roku na Plac przy Torwarze od godz. 12.00 do 20.00.

To już VIII edycja! Gelato Festival jest najważniejszym wydarzeniem w świecie lodów po włosku. To konkurs w skali europejskiej, w którym nagradzani są najlepsi włoscy i zagraniczni producenci lodów oraz smaki, które stworzyli specjalnie na tę okazję. 

 

Lato, lato wszędzie

 

 

„Lato, lato wszędzie, zwariowało oszalało moje serce”, jak śpiewa Formacja Nieżywych Schabów, lato zawładnęło naszą planetą. 21 czerwca, pierwszy dzień lata!

Dzisiaj, oficjalnie, o godzinie 6.45 zaczęło się astronomiczne lato i potrwa aż do 22 września 2017 roku.

 

Wieczór poetycki Aleksandry Piguły

 

 

Szanowni Państwo,

Duszpasterstwo Polaków przy Kościele św. Stanisława w Rzymie zaprasza na spotkanie muzyczno-literackie "Od Kropli do Strofy" z poetką - Panią Aleksandrą Pigułą, które odbędzie się  25 czerwca 2017 roku o godz. 19.00 w Auli św. Jana Pawła II przy Kościele św. Stanisława B.M w Rzymie, via delle Botteghe Oscure 15.

Aleksandra Piguła jest Prezesem Mieleckiej Grupy Literackiej SŁOWO przy Towarzystwie Miłośników Ziemi Mieleckiej.

 

The Engineers Band zapraszają do Rzeszowa

 

 

Serdecznie zapraszamy do Rzeszowa, gdzie w najbliższy piątek Orkiestra Rozrywkowa Politechniki Warszawskiej wystąpi podczas międzynarodowego festiwalu Europejski Stadion Kultury. Jest to ogromne widowisko plenerowe, gromadzące 50-tysięczną widownię na trybunach Stadionu Miejskiego „Stal” z udziałem młodych polskich gwiazd muzyki rozrywkowej, które wykonają utwory przygotowane wspólnie z muzycznymi partnerami z Europy. Festiwalowi przewodzi bowiem idea muzyki jako łącznika między krajami i narodowościami.