Nárast testovania DNA prostredníctvom služieb, ako je 23andme, ukazuje, že existuje veľký trh pre rodinnú históriu.
Vedci teraz stavajú na týchto údajoch zverejnením toho, čo považujú za najväčšiu genealogickú databázu na svete, s rodokmenom, ktorý spája 13 miliónov ľudí a siaha viac ako päť storočí.
Ako hovorí Jocelyn Kaiser pre časopis Science, Yaniv Erlich, výpočtový genetik na Columbia University, vymyslel projekt pred siedmimi rokmi po prijatí e-mailu od vzdialeného príbuzného prostredníctvom Geni.com, jedného z mnohých miest, kde hľadajú rodinné väzby.
S podporou hlavného technologického riaditeľa spoločnosti Gemi.com stiahol Erlich verejné profily stránky - desiatky miliónov z nich. Hoci tieto údaje neponúkali údaje o DNA, tieto informácie obsahovali meno osoby, pohlavie, dátum a miesto narodenia, dátum smrti a bezprostredných príbuzných.
Príroda písala o Erlichovom projekte v ranom štádiu už v roku 2013 a minulý rok Sarah Zhang z Atlantického oceánu oznámila, že vedci vydali predtlač na obrovský strom. Teraz, Kaiser píše, Erlichov tím zverejnil štúdiu o svojej práci v časopise Science. Na základe týchto údajov skončilo 5, 3 milióna stromov, z ktorých najväčšie spája približne 13 miliónov príbuzných, väčšinou európskeho pôvodu.
Od začiatku projektu sa Erlich stal vedúcim vedeckého pracovníka spoločnosti MyHeritage, genealogickej spoločnosti a spoločnosti zaoberajúcej sa testovaním DNA, ktorá vlastní Geni.com. Minulý piatok urobil Reddit Ask Me Anything na svoje zistenia, napravil mylné predstavy a vysvetlil metodológiu projektu. Poznamenal tiež, že najzaujímavejšou časťou jeho skúsenosti bolo zistiť, ako prekladať všetky dostupné údaje do niečoho osobného.
V rozhovore pre Nicole Wetsman od National Geographic Erlich tvrdí, že najnáročnejšou časťou projektu bolo zistiť, ako s týmito údajmi pracovať. „Genomické súbory údajov majú špecifické nástroje, dátové štruktúry, metódy, ale nemali sme na to nič. Vychádzali sme volant, keď sme šli, “hovorí.
Vedci nakoniec na usporiadanie a overenie informácií použili teóriu matematických grafov, píše Laura Geggel pre Live Science . Porovnali tiež profily s približne 80 000 verejne dostupnými úmrtnými listami z Vermontu za 25 rokov, aby sa ubezpečili, že to nie sú len bohaté profily nahrané na Geni.com.
Tím potom rozhodol, aké informácie chceli vyhľadať, aby otestovali databázu, píše Wetsman.
Začali skúmať vzorce a zistili výkyvy v dĺžke života, niečo, čo očakávali. Napríklad počas občianskej a svetovej vojny I. a II. Storočia zaznamenali pokles mladých mužov a zvýšenie prežitia detí v 20. rokoch 20. storočia. Dokázali tiež sledovať migráciu, napríklad príchod Mayflower v roku 1620 v dnešnom štáte Massachusetts, po ktorom nasledoval nárast pôrodov v tejto oblasti.
Vedci tiež zistili, že dlhovekosť súvisí skôr so životným prostredím a správaním ako s genetikou; v skutočnosti sú zistené údaje gény zodpovedné za životnosť iba 16 percent. Paola Sebastiani, profesorka biostatistiky na Vysokej škole zdravotníctva v Bostone, však pri rozhovoroch s Wetsmanom varuje, aby okolo týchto údajov vyvodila závery. "Existuje veľa nejasností, pokiaľ ide o definície dlhovekosti, " hovorí.
Genetik Peter Visscher z University of Queensland v austrálskom Brisbane hovorí Kaiserovi, že údaje, ktoré splnil Erlichov tím, majú potenciál poskytnúť informácie o úlohe genetiky v prípade chorôb, ak sú údaje spojené so zdravotnými informáciami.
Výskumný tím už začal kombinovať strom s informáciami z DNA.Land, ktorý zhromažďuje údaje o DNA, čo by mohlo znamenať, že čoskoro príde ešte väčší strom. Vedci predpovedajú, že ak by sa databáza mohla vrátiť o 65 generácií, budú môcť strom doplniť.