https://frosthead.com

Big Data sa práve zväčšili, keď spoločnosť Watson od spoločnosti IBM spĺňa encyklopédiu života

Po 2 000 rokoch je konečná encyklopédia života na vrchole novej éry založenej na údajoch. Grant Národnej vedeckej nadácie bol udelený Encyklopédii života (EOL), IBM a Gruzínsku technologickému inštitútu. Grant umožní spracovanie a krížové indexovanie veľkého množstva údajov takým spôsobom, ktorý umožní priekopnícku vedu.

Súvisiaci obsah

  • Navrhovaný nový systém námorných rezerv ponúka ružový výhľad pre homáre, ako aj pre rybárov homárov

V roku 77 nl začal Pliny starší písať prvú svetovú encyklopédiu Prírodné dejiny. Zahŕňalo všetko od astronómie po botaniku, zoológiu až po antropológiu a ďalšie. Pliny sa pokúsil dať všetko, čo mohol osobne zhromaždiť o prírodnom svete, do jediného písomného diela. Počas posledných 2 000 rokov sledovala dlhá séria vedcov inšpirovaných Plinym rovnakú víziu.

Pliny zahrnoval 20 000 tém v 36 zväzkoch, ale narazil na obmedzenia toho, čo môže jedna osoba objaviť, zaznamenať a spracovať v ľudskom živote. Zomrel počas erupcie Vesuvu predtým, ako mohol dokončiť konečnú úpravu svojho Magnum opus. Ani v jeho vlastnej dobe nebolo možné, aby jeden človek čítal všetky knihy, učil sa všetko a vysvetľoval to všetko svetu.

Ako neskôr vedci, redaktori a knihovníci objavili vo svete, ktorý s každým ďalším rokom pribúda viac písomných vedomostí, aj keď by ste mohli všetky svetové knihy a výskumy uložiť v jednej budove, je výzvou sprístupniť všetky relevantné informácie vedci počas obmedzení ich krátkeho ľudského života.

EOL by to mohla zmeniť tým, že využije najmodernejšiu výpočtovú silu na oddeľovanie zbierok biologických údajov. Projekt je bezplatná a otvorená digitálna zbierka faktov, článkov a multimédií o biodiverzite, jedna z najväčších na svete. EOL so sídlom v Smithsonianskej inštitúcii a so svojimi 357 partnermi a poskytovateľmi obsahu vrátane Harvardskej univerzity a Novej Alexandrijskej knižnice v Egypte sa rozrástla z 30 000 strán, keď bola uvedená na trh v roku 2008, na viac ako 2 milióny, s 1, 3 milióna strán textu, máp, video, zvuk a fotografie a podporuje 20 jazykov.

„Prišiel som do Smithsonian v roku 2010 zo softvérového priemyslu, “ hovorí riaditeľ EOL Bob Corrigan. „Jedným z objavov, ktoré som tu prišiel, je to, že hoci IT je všade, neprenikol do múzejného sveta rovnako ako do komerčného sveta. Najmä v biológii boli najdôležitejšie údaje pochované v učebniciach a tabuľkách. “

Ako možno kombinovať a ťažiť biologické údaje v rôznych formách pre nové poznatky o živote na Zemi? Čo ak sa údaje o biodiverzite motýľov v Afrike za desať rokov kombinujú s údajmi o poľnohospodárskych postupoch a zrážkach? Dalo by sa niečo nové naučiť? Trvá to niečo väčšie ako ľudský mozog. Niečo ako superpočítač Watson od spoločnosti IBM.

„IBM prispieva k úsiliu a prístupu k verzii [Watson], ktorá nie je verejne dostupná, “ hovorí Jennifer Hammock, programová riaditeľka spoločnosti EOL. „Budú na nich tiež pracovať ľudia. IBM to robí ako nepeňažný príspevok. “

Watson je superpočítač, ktorý nielen hromadí čísla vo veľkých objemoch. Využíva umelú inteligenciu, ktorá používateľom umožňuje klásť otázky jednoduchým jazykom.

"Z pohľadu používateľa by som povedal, že to znamená, že databáza je niečo, kam sa môžete vydať a položiť otázku, akoby ste boli človekom, " hovorí Hammock. "Môžete mi povedať, či sa tento fialový motýľ vyskytuje v Afrike?"

„Odpoveď na jednoduchú otázku v akomkoľvek jazyku predpokladá existenciu mnohých vedomostí v zákulisí, “ hovorí Corrigan. „Aj keď je slovo fialové, predpokladá sa, že vieme, čo je fialové. Alebo motýľ, [počítač] musí pochopiť rozdiel medzi motýľom a motýľom. Okrem toho samotné súbory údajov majú rôzne spôsoby premýšľania o týchto rôznych pojmoch. Všetky tieto údaje sa dajú ťažiť bez Rosettovho terminálu. A to je časť kúzla toho, čo robí EOL. “

Jedna vedecká otázka, ktorú partnerstvo medzi spoločnosťami EOL, IBM a Georgia Tech dúfa, že sa vyrieši, je paradox planktónu.

Podľa Hammocka sa vedci, ktorí pracujú s počítačovými simuláciami, „snažia modelovať, čo sa deje v oceáne, tvrdením, že slnko svieti a riasy rastú., , je to trochu drsné priblíženie, ale nemôžu dosiahnuť stabilitu [počítačového modelu ekosystému]. Chvíľu idú a potom padajú. Pretože sú príliš jednoduché. Dúfajú, že ak dokážu ukázať trochu viac rozmanitosti vo svojej modelovej biosfére, stanú sa stabilnejšími., , . paradoxná bytosť: ako existuje morská biosféra? Prečo to nehrozí? “

„Ľudia sedia na údajoch, “ hovorí Corrigan. „Na celej planéte sú neuveriteľné nádrže na meranie biodiverzity. Dostávam veľa telefonátov od ľudí, ktorí sedia na týchto údajoch a chcú, aby sme ich pomohli uviesť do širšieho kontextu. Je dôležité, pretože sme v závode študovať túto planétu a dozvedieť sa, ako náš vývoj zdôrazňuje naše veľmi obmedzené zdroje., , Smithsonian môže zohrávať úlohu pri zvyšovaní vedomostí zo všetkých týchto zdrojov a byť skutočnou mocou na jeho šírenie. “

Štvrtina grantu vo výške 1 milión dolárov bude udelená Smithsonianovi za jeho podiel na práci, ale EOL zahŕňa mnoho ďalších hráčov. Niektorí vývojári sú v Egypte; vzdelávací tím je založený z Harvardu; a jednotka španielskeho jazyka sa nachádza v Mexico City.

Všetky údaje spoločnosti EOL budú naďalej verejné alebo licencované spoločnosťou Creative Commons. Výskum a údaje sú určené na to, aby boli verejne prístupné a nezakrývali sa za výplatou.

"Je to veľmi starý sen, " hovorí Hammock. „Jeden človek sa pravdepodobne nemôže všetko naučiť. Je ťažké dať všetko na jedno miesto, kde sa dá vedome skontrolovať proti sebe. Ale teraz máme počítače. “

Pliny by bola buď veľmi potešená alebo veľmi žiarlivá.

Big Data sa práve zväčšili, keď spoločnosť Watson od spoločnosti IBM spĺňa encyklopédiu života