https://frosthead.com

Bozkávanie jazykových bariér Zbohom

Univerzálny prekladateľ bol dlho posadnutosťou popkultúry. Star Trek ho predstavuje ako vreckový stroj pripomínajúci mikrofón, ktorý dokáže okamžite preložiť väčšinu jazykov . Sprievodca po stopách galaxie sa môže pochváliť babelou, tvorom, ktorý keď uviazne vo vnútri ucha, ponúka okamžitý preklad ľubovoľného jazyka v galaxii.

Preto by nemalo byť žiadnym prekvapením, že dnešní ľudia sa snažia vytvoriť zariadenie, ktoré funguje rovnako dobre. Existujú desiatky prekladateľských aplikácií pre smartfóny, ale väčšina prekladá slová jednoduchým spôsobom. používateľ napíše alebo vysloví slovo a aplikácia sa vráti späť s prekladom. Teraz je cieľom a skutočným peňažným neočakávaným cieľom, aby inžinieri a podnikatelia umožnili dvom ľuďom konverzovať v rôznych jazykoch, zatiaľ čo malé zariadenie vypĺňa preklady v reálnom čase.

Existujúce prekladateľské aplikácie

Na výlete do Grécka ochorel anglicky hovoriaci Andrew Lauder.

"Išiel som do lekárne a oni nemohli porozumieť anglicky, takže som nedostal žiadne lieky, " hovorí Lauder, generálny riaditeľ spoločnosti Vocre Translate. Značky liekov mu boli doslova grécke. Pre svetových cestujúcich sú bežné jazykové bariéry. V cudzej krajine sa malé transakcie, ako je nákup medicíny alebo získanie pokynov - ďalšou ťažkosťou, ktorej čelí Lauder - stanú herkulskými úlohami.

Keď sa vrátil do štátu, Lauder vytvoril aplikáciu Vocre Translate, aplikáciu na preklad hlasu a textu. Začalo to ako aplikácia typu text-text (nazvaná MyLangauge), potom sa pôvodne zmenila na model reči na text, ktorý podobne ako iné aplikácie vrátane programu SayHi Translate používal tradičný model, v ktorom sa slovo prekladá priamo do iného slova. Povedzte „Ahoj“ a smartfón alebo tablet cvrlikajú späť automatickú „Holu“. „Zbohom“ sa stáva „Sayonara“. A tak ďalej, podobne ako textový prekladateľ.

Tvorcovia týchto aplikácií potrebovali údaje, aby vytvorili jednoduchý zvukový preklad. Vocre vytiahol svoje informácie z verejne dostupných záznamov a dokumentov, ako sú staré filmy alebo verejné vypočutia. „V podstate sme prosili o službu prepisovania hlasovej schránky, aby sme mohli využívať ich cloud na rozpoznávanie reči, “ hovorí generálny riaditeľ SayHi Lee Bossier.

Akonáhle inžinieri mali zvukové a textové údaje, spárovali zvuk a text, slovo za slovom. Softvér na rozpoznávanie hlasu rozpoznáva „syr“ a prevádza ho na text. Prevedie sa to do francúzštiny a aplikácia nájde francúzsku výslovnosť pre „fromage“.

To znamená, že ak používateľ čestne nazýva niečo „syrový“, prekladateľ nefunguje tak dobre, pretože hovorený jazyk nie je zďaleka tak statický ako písaný jazyk. Kadencia, slang, skloňovanie, výslovnosť, dialekt a konverzačný tok môžu zmeniť zmysel

Avšak v priebehu času chcel Lauder konverzačnejšie zariadenie. V e-maile hovorí: „Na základe našich údajov o používaní sme zistili, že ľudia hovoria veľmi odlišne od spôsobu, akým píšu. Hovorené slovo je oveľa spontánnejšie a oveľa menej formálne a doslovné. “Preto použil štatistický strojový preklad, ktorý používa aj spoločnosť Google, ktorá používa údaje na nájdenie spoločného používania slov, čím sa vzdáva tradičného prekladateľského modelu medzi slovami. Vocre sa v podstate učí, ako sa používa. „Učí sa na základe každej konverzácie, každej frázy, ktorá ňou prechádza. Je to niečo, čo sa časom stáva múdrejším, “hovorí Lauder.

Prekladanie oboch aplikácií stále trvá niekoľko sekúnd, ale nepochybne sú efektívne, najmä v zhode s rečou tela, na transakčné rozhovory, ako je objednanie jedla. Koniec koncov, ľudia si objednávajú jedlo v cudzom jazyku už roky a vždy dokážu stále jesť. Nedokázali však viesť dôkladné a zložité rozhovory.

S programami Vocre a SayHi môžu rozhovory strnulým spôsobom pôsobiť, ale to nie je to isté ako chatovanie vo vašom rodnom jazyku. Spoločnosť Google to chce úplne zmeniť.

Prístup spoločnosti Google (štatistický strojový preklad)

Keď sa v škole učíme nový jazyk, začíname individuálnymi slovnými zásobami. Jazyk je však plynulejší - slová potrebujú kontext.

„Prístup [Google] je všeobecnejší, “ hovorí Josh Estelle, softvérový inžinier pre Google Translate. „Namiesto toho, aby sme sa pokúšali všetky tieto pravidlá zakódovať, snažíme sa ich naučiť pomocou údajov.“

Technická spoločnosť sa vyhýba metóde „one-to-one, word-for-word“ a namiesto toho používa štatistický strojový preklad, pričom nepozerá na to, čo slová znamenajú, ale na to, ako je jazyk modelovaný, čo sa učí prostredníctvom údajov . Zameriava sa teda na les, nie na stromy. Anglický príklad: poznáme definície slov „break“ a „up“. Fráza „break up“ však nie je doslovnou kombináciou týchto dvoch slov.

Štatistický strojový preklad vyžaduje údaje. Hory toho. Na to, aby metóda fungovala, nepotrebuje iba skutočnosť, že „syr“ je francúzsky v prípade syra, ale 100 príkladov „syra“ a syra, ktoré sa používajú v skutočných vetách.

Estelle hovorí, že ak má anglický rečník dve ponuky, totožné s tým rozdielom, že je vytlačené v angličtine a jedno v čínštine, „pravdepodobne môžete zistiť, čo je čínska postava pre„ polievku “.“ Kontext je kráľ. Ak však chcete vytvoriť tento kontext, musíte mať prístup k miliónom ponúk a ku všetkým ostatným dokumentom, ktoré si možno predstaviť.

Čo je presne to, čo má Google. Bez webového gigantu, ktorý by zhromažďoval hromady údajov, nemohla babelova ryba existovať. Prechádza webom a zhromažďuje všetko - text a zvuk. Potom tieto údaje prenesie do algoritmov, ktoré porovnávajú všetko so všetkým ostatným. Tieto porovnania pomáhajú dostať sa ku koreňu toho, ako jazyk prirodzene funguje.

„Jedna vec, ktorá ľudí prekvapuje, keď hovoríme o preklade, je, že náš tím nemá žiadnych lingvistov, “ hovorí Estelle. „Spustili sme 71 jazykov a povedal by som, že náš tím nevie, ako hovoriť s drvivou väčšinou. Ľudský prekladateľ sa nebude môcť naučiť všetky tieto pojmy a veci tak rýchlo, ako sa naše [údaje] môžu naučiť z webu. “

Aký to má zmysel?

Podobne ako Google, aj Facebook vidí výhody. Zvážte preklad do vlastnej siete sociálnych médií.

„Poslaním Facebooku je spájať celý svet a jednou z bariér prepojenia sveta nie je to, že všetci hovoria rovnakým jazykom, “ hovorí Tom Stocky, technický riaditeľ na Facebooku. „Pokiaľ ide o preklad, myslím si, že skutočne ambiciózna vízia do budúcnosti je, keby ste mohli Facebook používať vo svojom rodnom jazyku a komunikovať s akýmkoľvek iným jazykom.“

Minulý august Facebook získal Jibbigo, aplikáciu na preklad reči do reči, ktorá je k dispozícii pre zariadenia so systémom Android a iOS.

Používatelia Facebooku Keen si všimnú, že sociálna stránka už používa nejaký preklad. Ak ste niekedy mali španielsky príspevok na svojej anglickej stránke, okamžite ste dostali príležitosť preložiť ho do svojho rodného jazyka.

Stocky však vníma hlasovú zložku ako potenciálneho meniča hry. Nárast inteligentných telefónov a tabletov víta neustále prepojený svet a nárast softvéru na rozpoznávanie reči pozýva nové prostriedky interakcie na webe. Stocky predvída budúcnosť, v ktorej môžu používatelia jednoducho hovoriť príkazom k svojim smartfónom a komunikovať s ostatnými používateľmi, okrem jazykových rozdielov.

„Niet pochýb, že sa to nakoniec stane, pretože jediným obmedzením je sila jazykového enginu a samozrejme čas spracovania a spracovateľský výkon, “ hovorí.

Laura Murphy, profesorka oddelenia globálnych zdravotných systémov a vývoja na Tulane University a priznaná skeptikka v oblasti technológií, spochybňuje hodnotu univerzálneho prekladateľa a nemusí poznať viac ako jeden jazyk.

Myslí si, že by toto zariadenie mohlo byť užitočné v cestovných, obchodných a medzinárodných vzťahoch, ale nebolo priekopnícke. Na určitej úrovni už máme prekladateľov (ľudí) a väčšina, ktorí pracujú v cudzích vzťahoch, pozná príslušné jazyky. Murphy verí, že zariadenie by mohlo mať negatívne následky.

"Myslím, že to môže ľudí leniviť, " hovorí Murphy. Preklady jazykov môžu byť duševne náročné tým, že donútia mozog - najmä ten, ktorý pozná viac ako dva jazyky -, aby pracoval iným spôsobom, ale cvičenie je predsa prospešné. Mozog sa sťahuje z miesta jazykovej empatie, ktorú ani ten najlepší prekladateľ hlasu nikdy nedosiahol.

Hoci táto univerzálna komunikácia môže byť pozitívna, Murphy uznáva, „môže to viesť k tomu, že si ľudia myslia, že komunikujú, keď nie sú.“ Kultúra nie je vždy úplne stelesnená v jazyku (napríklad sarkazmus) a komunikácia nie je vždy o odovzdávaných informáciách.

Kedy môžeme očakávať túto technológiu?

„V roku 2005 nám trvalo 40 hodín, kým sme preložili 1 000 viet, “ hovorí Estelle zo spoločnosti Google. „Dnes prekladáme ekvivalent 1 000 viet každých 10 milisekúnd.“

Ako slávne hovorí Richard Anderson v televíznom seriáli Šesťmiliónový dolár v sedemdesiatych rokoch, „Máme technológiu.“ Teraz je to len o čakaní na zber a analýzu údajov. Ako dlho to bude trvať, podľa Estelle nie je známe. Avšak opatrné odhady dávajú takéto zariadenie do našich rúk do desiatich rokov.

Zatiaľ čo tvorcovia aplikácií, ako sú Bossier alebo veľké spoločnosti ako Google a Facebook, nechcú vytvárať svoje vlastné verzie Biblickej veže v Babeli, nechcú ukončiť blábolenie. Predstavuje svet, v ktorom všetci komunikujeme, o medicíne, o politike, o nápadoch.

A tento svet nemusí byť ďaleko.

Poznámka editora: Tento príbeh sme aktualizovali 4. apríla 2014, aby sme presne opísali technológiu Vocre Translate.

Bozkávanie jazykových bariér Zbohom