Komputer uczy się na błędach (językowych)

Opublikowano: sobota, 22, październik 2016

 

https://pixabay.com/pl/klawiatura-komputer-zielony-klucze-191805/

 

Aby sprawić, żeby komputery i smartfony rozumiały, gdy zwracamy się do nich w obcym dla nas języku, grupa naukowców z USA postanowiła zapoznać je z ...błędami, jakie mogą popełniać obcokrajowcy.

Ośmioletni Staszek od czasu do czasu bawi się smartfonem taty zadając pytania Cortanie, a ściślej mówiąc angielskojęzycznej wersji tej aplikacji, która posiadła umiejętność „rozumienia” mowy ludzkiej.

 

Niestety w większości przypadków Cortana nie rozumie tych pytań, gdyż nie do końca poprawna angielszczyzna stanowi dla komputera problem (Staszek chodzi do amerykańskiej szkoły, mówi płynnie w tym języku, ale wciąż popełnia sporo błędów). W podobnej sytuacji, co Staszek jest prawdopodobnie wiele spośród 603 milionów (ethnologue.com) osób znających angielski, ale nie będących rodzimymi użytkownikami tego języka. Błędy gramatyczne, jakie popełniają oni mówiąc w języku Szekspira, utrudniają im – a w niektórych przypadkach wręcz uniemożliwiają – głosowe porozumiewanie się z komputerem. Jednak wkrótce może się to zmienić dzięki projektowi badawczemu realizowanemu na Massachussetts Institute of Technology (MIT).

 Jak tłumaczy Jewgienij Berzak – doktorant na wydziale inżynierii elektrycznej i nauk komputerowych MIT i główny autor projektu – większość aplikacji przetwarzających języki naturalne (a co za tym idzie umożliwiających smartfonom i komputerom wykonywać polecenia sformułowane w języku potocznym) jest opartych na zasadach uczenia się maszyn. W ramach tego „uczenia”, komputer szuka prawidłowości wśród olbrzymiej liczby danych, a następnie je analizuje i  przyswaja. Dotychczas dostarczano komputerom tylko dane zawierające materiał językowy pochodzący od rodzimych użytkowników języka angielskiego, czyli złożony ze zdań, które są w olbrzymiej większości poprawne. Tymczasem systemy, które powstałyby w oparciu o niestandardowy angielski, mogłyby lepiej wyczuwać typowe błędy nierodzimych użytkowników języka angielskiego, np. tendencje do opuszczania lub nadużywania przysłówków, mylenia czasów, zastępowania czasowników posiłkowych innymi itp.

Baza danych, którą stworzyli w ramach projektu badacze z MIT, zawiera 5 124 zdania zaczerpnięte z wypracowań napisanych przez osoby uczące się języka angielskiego. Grupa autorów wypracowań składała się – w równych proporcjach – z rodzimych użytkowników 10 najpopularniejszych języków świata (poza angielskim), którymi włada mniej więcej 40 proc. ludzkości. Każde ze zdań przetwarzanych przez komputer zawierało co najmniej jeden błąd gramatyczny i zostało opisane przez grupę studentów według szczegółowej instrukcji opracowanej przez Berzaka i współpracujących z nim językoznawców. Anotacje zawierały informacje nt. każdego słowa – jego formy gramatycznej (liczby, rodzaju, osoby, stopnia itp.), a także związków z innymi wyrazami w ramach danego zdania. Ten szczegółowy sposób opisu miał komputerowi pomóc w analizie dostarczonego materiału. Opracowanie wytycznych, jak tworzyć anotacje wymagało sporego wysiłku koncepcyjnego z tego względu, że błędy gramatyczne mogą sprawić, że funkcje poszczególnych słów w ramach zdania są trudne do interpretacji. Kluczowa była tu także jednolitość opisu, bowiem komputer nie jest w stanie poprawnie zanalizować materiału, jeśli dostarczone mu dane zostaną opisane na różne sposoby. 

Nie jest to jednak pierwszy projekt realizowany przez Jewgienija Berzaka na MIT, w ramach którego na warsztat zostały wzięte błędy popełniane przez nierodzimych użytkowników języka angielskiego. Wcześniej pochodzący z Rosji doktorant analizował błędy użytkowników różnych języków piszących po angielsku. Prawidłowości w ten sposób odkryte pozwoliły wysnuć cały szereg bardzo ciekawych wniosków, o których pisaliśmy w innym miejscu (por. Językoznawstwo z komputera).

 

Karol Chlipalski

 

Serwis Wszystko o dwujęzyczności jest dostępny na licencji Creative Commons Uznanie autorstwa 3.0 Polska. Pewne prawa zastrzeżone na rzecz Uniwersytetu Warszawskiego. Utwór powstał w ramach zlecania przez Kancelarię Senatu zadań w zakresie opieki nad Polonią i Polakami za granicą w 2016 roku. Zezwala się na dowolne wykorzystanie utworu, pod warunkiem zachowania ww. informacji, w tym informacji o stosowanej licencji, o posiadaczach praw oraz o zleceniu zadania publicznego przez Kancelarię Senatu oraz przyznaniu dotacji na jego wykonanie w 2016 r.”. 

 

Mojabancarella 22/10/2016

Dodaj komentarz


Kod antyspamowy
Odśwież

O nas

MOJABANCERELLA.com to portal o charakterze informacyjnym, gdzie staram się na bieżąco przekazywać Państwu informacje dotyczące Polonii włoskiej i nie tylko.

„Mojabancarella” – moja -, czyli nasza, każdego z osobna i - bancarella – słowo które stało się naszym spolszczonym tłumaczeniem słowa stragan, gdzie można znaleźć wszelkie dobro. 

ZAPRASZAM NA MOJABANCARELLA

Najnowsze artykuły

IV Edycja ,,Wystawa psów domowych’’ Fundacji Księcia Laurenta w Brukseli

 

 

Fundacja Księcia Laurenta powstała w 1996 roku w Belgii. Działa na terenie Brukseli, Antwerpii, Gent,  Seraing, Hornu. Fundacja Rocznie pomaga około 12.000 zwierząt – w szczepieniach, leczeniu, hospitalizacji, kastracji etc.  

Na Wystawę zorganizowaną  14.10.2017 przybyła Księżna Claire  wraz z trojgiem dzieci Louise, Nicolas i Aymeric. Jako Goście Honorowi zasiedli również  Madame la Baronne Janine Delruelle, Prezes Fundacji Księcia Laurenta oraz inni Szanowni Goście.

 

And I dreamt of painting Marty Kunikowskiej

 

 

W Galerii Sztuki Katarzyny Napiórkowskiej została zaprezentowana wystawa malarstwa - And I dreamt of painting Marty Kunikowskiej – Mikulskiej. Malarka otrzymała Wyróżnienie honorowe Fundacji im. Franciszki Eibisch.

Galeria Sztuki Katarzyny Napiórkowskiej powstała jako jedna z pierwszych galerii prywatnych w Polsce. Posiada salony ekspozycyjne w Warszawie, Poznaniu oraz imponujące i prężnie działające od 5 lat w Brukseli.

 

Życie zaklęte w bursztynie

 

 

“Życie zaklęte w bursztynie”, czyli  wystawa w Savignano

Dnia 30 września 2017  w Muzeum w Savignano s/Panaro, dzięki staraniom Stowarzyszenia “Via dell’Ambra” została zainaugurowana wystawa: “Życie zaklęte w bursztynie”.

Plansze ukazały wydarzenia sprzed ok.55 lat, kiedy to owady zamieszkujące tropikalne lasy, przylepiły się do sosnowej żywicy.

 

Razem stwórzmy kolekcję Muzeum Historii Polski

 

 

Trwa ogólnoświatowa społeczna zbiórka pamiątek historycznych „Małe Wielkie Historie” zainaugurowana w 2016 roku. Do tej pory udało się pozyskać blisko 5500 obiektów dla Muzeum Historii Polski do Wśród eksponatów znalazły się przedmioty otrzymane przez darczyńców z kraju, jak i zagranicy – Wielkiej Brytanii, Stanów Zjednoczonych, Szwecji czy Niemiec.