V pozadí všetkých informácií od spoločnosti Google - od zistenia, ktoré výsledky vyhľadávania sú najdôležitejšie, až po čítanie a uchovávanie kariet vo vašom e-maile - je nejaká zaujímavá matematika. A nedávno na ňom urobil softvérový inžinier Javier Tordable, ktorý predniesol prezentáciu a otvoril okno do podivínskeho sveta Google iba bezva.
Začnime s Gmailom. Niekedy dostanete nevyžiadanú poštu, ale Gmail je celkom dobrý na to, aby zistil, že keď sa korešpondent snaží prinútiť vás, aby ste investovali do nigérijského princa, pravdepodobne nechcete túto poštu vo svojej doručenej pošte. Ako to vie? Krok 1: zaškolte stroj. Krok dva: dajte to do práce.
Hovorí sa tomu strojové učenie a Google to robí veľa. V prvom kroku musíte urobiť to, čo počítačoví vedci nazývajú „charakterizujú prípad“. Matematicky to znamená:
Všeobecne možno charakteristiku inštancie považovať za prvky vo vektore ndimenzionálneho euklidovského priestoru pre veľké n (100 - 1 000 rozmerov je normálne, 1M-10M nie je neslýchaných)
Ale tu je návod, ako o tom premýšľať, ak ste prestali matematiku po Calc 1. Gmail môže vytiahnuť niekoľko kľúčových informácií z ľubovoľného konkrétneho e-mailu. Aké je to dlhé? Koľko existuje veľkých písmen? Je to od niekoho, od ktorého ste už dostali e-mail? Nechcete, aby boli informácie potrebné na to, aby bolo rozhodnutie príliš ťažké na to, aby ste sa s nimi mohli vyrovnať, pretože to spomalí a zníži presnosť vášho stroja. Google teda nakreslí čiaru na základe toho, čo vie o spamu. E-maily, ktoré prechádzajú, spadajú na jednu stranu riadku a na spam na druhú stranu.
Viac matematiky:
Jednoduchý klasifikačný model je hyperplán v priestore charakteristík. Inštancie údajov na jednej strane hyperplánu sú klasifikované ako platné e-maily a inštancie na druhej strane sú klasifikované ako spam.
A čo hlasové vyhľadávanie - tiež sa nazýva automatické rozpoznávanie reči alebo ASR? Rovnako ako strojové učenie, ASR sa deje v dvoch častiach: spracovanie prichádzajúceho zvuku a zisťovanie toho, čo hovoríte. Prvá časť obsahuje Fourierove transformácie, ktoré izolujú dôležité bity, ktoré môže počítač prekladať. Druhou časťou je modelovanie reči pomocou tzv. Skrytého Markovovho modelu. Tordable vysvetľuje:
V tomto modeli sú stavy písmená správy a sled udalostí je zvukový signál. Algoritmus Viterbi možno použiť na získanie postupnosti stavov maximálnej pravdepodobnosti.
Spoločnosť Google by rada vylepšila a uľahčila rozpoznávanie hlasu. V tejto prípadovej štúdii píše skupina whizzes Google:
Cieľom spoločnosti Google je sprístupniť hovorený prístup všade. Chceli by sme nechať používateľa, aby si vybral - mali by byť schopní to považovať za samozrejmé, že hovorená interakcia je vždy možnosťou. Dosiahnutie všadeprítomnosti si vyžaduje dve veci: dostupnosť (tj zabudovanú do každej možnej interakcie, kde môže rečový vstup alebo výstup mať zmysel) a výkon (tj funguje tak dobre, že modalita neprináša interakcii žiadne trenie).
Ďalšou oblasťou, v ktorej spoločnosť Google používa matematiku, sú ich mapy - v centre pozornosti nedávno potom, čo Apple debutoval svojím mapovým systémom značnou kritikou. Jadrom služby Mapy Google je základná teória grafov - matematika získavania z jedného miesta na druhé pri cestovaní na najkratšiu vzdialenosť. Ale, samozrejme, je to zložitejšie. Tordable píše: „Jediným problémom je, že grafy používané v Mapách Google obsahujú milióny uzlov, ale algoritmy musia bežať v milisekundách.“
Google nám nepovie, ako to robia. Inak by Apple nenarazil na svoj problém, ale základy zahŕňajú škrípanie Dijsktraho algoritmu (pravdepodobne najbežnejšie používaný algoritmus grafového vyhľadávania). Počítačoví vedci z University of Karlsruhe opísali pred niekoľkými rokmi nový spôsob, ako hodnotiť dotazy na cesty, aby dosiahli oveľa rýchlejšie výsledky. Oni napísali:
Náš algoritmus pripraví osemmiestny počet uzlov potrebných pre mapy USA alebo západnej Európy za pár hodín pomocou lineárneho priestoru. Najkratšie (tj najrýchlejšie) dopyty na cesty potom trvajú približne osem milisekúnd, aby sa vytvorili presné najkratšie cesty. Je to asi 2 000-krát rýchlejšie ako pri použití algoritmu Dijkstra.
Program Tordable prechádza celým radom ďalších matematických nástrojov, ktoré používa spoločnosť Google, vrátane nástrojov zahrnutých v službách Knihy Google, Vyhľadávanie obrázkov, Analytics, YouTube, Prekladač Google, Google Earth a Picasa. Celú sadu snímok nájdete tu.
Viac z Smithsonian.com:
Smithsonian dostane Google Mapped
Sledujte trendy potravín pomocou kníh Google