MARCO RAMONI: Astăzi am să vă vorbesc despre... despre genetica de bază, despre ce fac geneticienii și despre modul în care genetica se deplasează în zona genomică prin creșterea dimensiunii, sferului și calității studiilor genetice. Vom face-- [SCRÂNTÂND UȘĂ] Poți închide ușa. Deci originea tuturor acestor lucruri este -- mă voi pune la un anumit punct de timp, iar originea tuturor acestor lucruri este publicarea Umanului -- a rezultatelor Proiectului Genomului Uman , o primă schiță a documentului uman. genomului. Și când au anunțat publicarea genomului uman, primul punct de pe agenda viitoare a fost o hartă SNP și au spus că această hartă SNP promite să revoluționeze atât cartografierea bolilor, cât și urmărirea istoriei umane. Și voi încerca să vă arăt cum le faceți pe amândouă folosind SNP-urile și, dacă nu știți ce sunt SNP-urile, țineți-vă respirația. O vei ști într-o secundă. [Ușa scârțâind] Te rog. SNP-urile, vă voi spune într- o secundă mai detaliat. SNP-urile sunt lucruri numite polimorfisme cu un singur nucleotide și există variații subtile în genomul uman de la o persoană la alta. Ce inseamna asta? Înseamnă că una dintre cele mai uimitoare statistici din Proiectul Genome este că toți suntem similari, foarte, foarte asemănători la nivel genetic. Dar există câteva variații foarte, foarte subtile, o pereche de baze schimbată ici și colo, care ne fac diferiți și, mai ales, ne fac genomul diferit. Și ceea ce puteți spune este că aceasta este adevărata carne a genomului uman. Oamenii au plătit miliarde de dolari nu pentru curiozitatea unui pumn de oameni de știință, ci pentru că promisiunea a fost că, odată ce vom cunoaște genomul uman, va fi mai ușor să găsim cauzele genetice ale bolilor și cauzele genetice ale... și -- posibil să găsești un remediu pentru ei și să înțelegi mai bine. Și după cum veți vedea, SNP-urile sunt adevărata carne a genomului uman. Așa că voi începe din anii '80, când oamenii au început să se gândească la... să se gândească serios la dezvoltarea unui proiect de genom uman . Și Proiectul Genomului Uman-- Vă voi spune ce sunt polimorfismele genetice, ce tip de polimorfisme există și apoi vă vom oferi o terminologie de bază despre care sunt termenii pe care geneticienii îi folosesc pentru a descrie proprietățile unui genom. Și apoi vă voi vorbi despre lucruri adevărate interesante, care sunt trăsături complexe, sau acele trăsături, acele boli, acele trăsături observabile ale unui individ care nu provin dintr-o singură genă, dar sunt rezultatul unei interacțiuni între mai multe gene sau interacțiunea genelor cu mediul și vă voi spune de ce aceste trăsături sunt complexe. Și apoi vă voi spune cum au conceput oamenii acest tip de... experimente pentru a identifica aceste trăsături complexe și, de asemenea, pe cele mai simple. Și odată ce l-au proiectat, îți voi spune cum analizezi aceste date odată ce le ai. Și apoi vă voi spune care este cuvântul pe stradă despre cea mai recentă modă în analiza genomului. Deci, așa cum spuneam, intuiția din spatele geneticii este că putem găsi cauzele bolilor fără a cunoaște mecanismul real al bolii, asociind doar schimbarea genomului cu trăsături observabile, caractere observabile. Acum, după cum vă puteți imagina, aceasta nu este chiar o idee ușor de vândut, iar când oamenii au început să o vândă la începutul secolului al XX-lea, oamenilor nu le-a plăcut foarte mult, în special biologilor, care spun, ce fel de știință este acest? Nu există niciun mecanism în asta. Nu se înțelege cum funcționează lucrurile. Dar apoi oamenii au început să ofere rezultate și cum să ofere rezultate în acest sens? Ei bine, odată ce știm că acea genă există... înainte, a fost cam dificil, dar... Îți voi arăta cum ai făcut-o înainte, înainte de a ști cum să genotipezi pe cineva. Dar una dintre principalele intuiții care a schimbat totul se datorează unui tip numit David Boston care, în 1997, a arătat că există markeri naturali pe genom numiti polimorfisme care ne fac diferiți și fac acest genom diferit, nu? Deci, dacă am o mică schimbare în populația mea, ceea ce pot încerca să fac este să adun oameni care au boala și să adun oameni care nu au boala și să văd care marker apare mai mult decât m-aș aștepta într-un grup sau altul. . Și îți voi spune cum joci aceste jocuri. Puteți să le jucați în mai multe moduri, dar modul în care ne bazăm-- facem-- facem studiile nu este prin etichetarea ceva, ci prin valorificarea etichetelor noastre naturale unde exact aceste polimorfisme. Acesta este doar un rezumat al dogmei centrale a biologiei moleculare. Cu toții știți asta. Ai primit un curs de la Dr. Butte, cred, despre asta. Unii dintre voi au un master și un doctorat în biologie, așa că știu asta mai bine decât mine. Presupunerea este că există ADN care este identic în toate celulele noastre, iar apoi acesta este tradus în ARN. Iar ARN-ul este apoi transformat în proteine care determină orice putem observa la cineva, trăsăturile, bolile susceptibile la, fiziologia lui, metabolismul, chiar și rezistența la medicamente. Așadar, ideea că polimorfismele ar putea fi folosite ca markeri naturali a creat exact fundalul Proiectului genomului uman, deoarece, la acel moment, aveam un instrument intelectual, un instrument științific pentru a urmări bolile folosind codul. Deci, cel mai ușor lucru pe care îl putem face este să aflăm bolile care sunt cauzate de o singură defecțiune într-o singură genă și există diferite moduri în care acest lucru poate fi de fapt o prostie sau nu. Ele pot fi dominante sau recesive. Recesiv înseamnă că trebuie să... știi, primești doi cromozomi, unul de la tatăl tău și unul de la mama ta. Pentru a fi recesiv, trebuie să ai ambii cromozomi care sunt înșurubați, gena ta în ambii cromozomi. Pentru a fi dominant, unul va fi suficient. Și clasificăm aceste boli și după o altă dimensiune, și anume, dacă este pe cromozomul X, care este... are... există o simetrie pentru bărbați și/sau dacă este orice alt cromozom. Deci, dacă este orice alt cromozom, va fi autozomal și poate fi dominant sau recesiv, iar exemplele sunt boala Huntington și fibroza chistică. Și dacă este X-linked, poate fi dominant sau recesiv și vă voi da imediat un mic exemplu în acest sens. Astăzi, au fost identificate aproximativ 400 de boli cu o singură genă . Deci, pentru 400 de boli, știm că există o mică înșurubare. Uneori există un motiv foarte, foarte simplu, pentru că o bază este transformată de la a fi o bază normală, care codifică aminoacizi, în semnale de oprire. Deci, atunci când acea anumită secvență este citită, proteina nu codifică după acel punct anume și proteina este înșurubată, iar acest lucru creează boală. OK, deci am nevoie de... aceasta este partea plictisitoare. Trebuie să-ți dau... Trebuie să-ți dau puțină terminologie. Acum, o alelă este o secvență de baze ADN. Deci, pentru fiecare SNP, pentru fiecare genă, pentru fiecare orice, pentru fiecare bucată din ADN-ul tău, ai două alele, una de la mama ta și una de la tatăl tău. Locusul este o locație fizică pe cromozom. Este ca [INAUDIBIL]. Știm exact unde este. Știm că este acolo. Știm pe ce cromozom se află și știm poziția cromozomului. Legătura este o apropiere a două alele de pe cromozom și este cam ambiguă pentru că, după cum veți vedea, proximitatea poate avea mai multe semnificații în genetică. Markerul este o alelă cu o anumită poziție pe care o putem urmări cumva. Distanța, distanța fizică, este numărul de baze dintre un punct și altul, dar aceasta nu este singura distanță pe care o avem și de fapt nu este cea mai interesantă distanță pe care o avem. Cea mai interesantă distanță este probabilitatea ca două puncte de pe cromozom să fie recombinate atunci când îți faci copiii. Iar distanța, această distanță probabilistică, nu se mapează neapărat pe cromozomul cu un număr constant de baze, așa cum veți vedea într-o secundă. Deci există... asta înseamnă că există puncte de pe cromozom care sunt mai ușor de recombinat și puncte de pe cromozom care sunt mai greu de combinat, mai puțin probabil să se recombine. Măsura prin care identificăm această distanță probabilistică se numește centimorgan. Un fenotip este un caracter observabil. Poate fi susceptibilitate la o boală. Poate fi diabet, o boală în sine. Genotipul este informația moștenită codificată intern, deci este o bucată de ADN. Iar penetranța este, dacă iei în serios interpretarea frecventă, este probabilitatea ca, având în vedere că ai alela, să dezvolți fenotipul. BINE? Deci distanța fizică dintre două alele este o pereche de baze, dar combinația dintre ele nu este constantă. Ei bine, știți cu toții prima lege a lui Mendel. Știm că perechea de alele se separă atunci când se formează gametul și sunt remaniere aleatoriu și creează noi perechi. Acum, folosiți-- măsura probabilistică pe care vrem să o folosim este probabilitatea ca două puncte să fie recombinate la următorul pasaj către generația următoare. Deci putem spune că, în medie, 1 centimorgan, care este probabilitatea ca 1% să fie recombinat, este de aproximativ-- se întâmplă între 1 megabază. La fiecare 1 megabază, aveți o probabilitate de a fi recombinat. Acum, acestea sunt un fel de bârfe mici. Dacă harta fizică autozomală umană are 3 miliarde de baze, după cum știți, harta de legătură în centimorgan-- distanța, distanța probabilistică dintre puncte-- este diferită între oameni și-- între bărbați și femei. Există 2.800 de centimorgan pentru bărbați și 4.200 de centimorgan pentru femei. De ce e așa? Femelele au un cod genetic mai mare. Masculii au acest mic cromozom Y, iar femelele au acest al doilea cromozom X mare și frumos , care este mult mai mare decât al nostru, mai puțin stabil, dar mai mare. Dar dacă calculezi diferența dintre aceste două lucruri, vezi că probabilitatea de recombinare a corespondenței dintre probabilitatea de recombinare pentru bărbați și femei este de asemenea diferită. Unul este un cod mai mare și deci diferența, ați spune, este de aproximativ 1-- în medie, este de 1 milion de perechi-- 1 centimorgan pentru 1 milion de baze. Și pentru femei... pentru bărbați și femei, este ceva mai mult de un milion pentru bărbați și puțin mai puțin de un milion pentru femei. Și o noțiune care ar fi absolut importantă pentru capacitatea noastră de a folosi markeri este cea de cosegregare, faptul că două alele sunt transmise împreună generației următoare. PUBLIC: Am doar o întrebare rapidă despre asta. MARCO RAMONI: Sigur. PUBLIC: Deci de ce... MARCO RAMONI: Ești supărat pentru că au spus că femeile au cromozomi mai buni decât noi? Nu. Publicul: Sunt de acord. Întrebarea pe care am avut-o este... a fost din nou în definițiile unui locus și doar m-am întrebat, așa că acele... acele lucruri, pot... sunt cele afectate de... așa că ați spus că este locația fizică pe un cromozom. Se poate schimba locusul unei anumite alele dacă împachetarea în structura cromozomală este modificată în vreun fel? Cum ar fi, este ceva... MARCO RAMONI: E o întrebare foarte bună. Așa că... AUDIENTA: Și apoi, în continuare, dacă acesta este cazul, afectează asta și cosegregarea? MARCO RAMONI: Da. Deci aceasta este o întrebare foarte bună. Vă puteți imagina un locus ca o variabilă și o alelă ca starea acestei variabile. Deci aveți... vi se dă acest locus, iar la poziția 3.022 pe cromozomul 5, aveți un A. Și dacă acesta este un polimorfism - dacă acesta nu este un polimorfism, toată lumea are A. Dar dacă acesta este un polimorfism , ne așteptăm ca peste 1% din populație să aibă o literă diferită acolo, cum ar fi un T sau un G. Acum, acest lucru se datorează mutațiilor și nu putem nimic -- nu este afectat de locus. Dar ambalarea genelor, a cromozomilor, acolo unde sunt unul lângă altul, poate afecta probabilitatea ca acesta să fie transmis împreună. Deci există mai multe motive pentru care există acest dezechilibru de legătură . Unul este recombinarea fizică a acesteia, care este foarte greu de identificat, iar al doilea sunt motive istorice. După cum vă voi spune într- o secundă, caucazienii provin dintr-o mână de oameni care au părăsit Africa, iar această mână de oameni au fost practic asimilați în acest proces. Deci venim cu toții dintr-un număr foarte, foarte restrâns de oameni care erau în viață între 25.000 și 50.000 de ani în urmă, ceea ce este o clipi din ochi din punct de vedere evolutiv. Deci, dacă te uiți la harta unei populații afro-americane, sau a unei populații africane și a unei populații europene, vei vedea că există o diferență uluitoare în variabilitatea acestora și variabilitatea noastră. Acum, dacă te uiți la lucrurile noastre, ai putea... dacă faci un studiu genotip al caucazienilor, vei vedea alele care merg împreună, dar nu vei putea spune dacă aceste alele merg împreună pentru o recombinare fizică reală sau pur și simplu pentru că tu trăiești, noi trăim... ne extragem codurile genetice dintr- un bazin epuizat în care sunt disponibile doar foarte puține combinații . Răspunde asta la întrebarea ta? PUBLIC: Da. MARCO RAMONI: Am o poză într-o secundă care poate fi de ajutor în acest sens. Deci, permiteți-mi să mă întorc la toate acestea, o singură boală funcționează și cât de dramatic poate fi efectul pe care îl are o singură boală. Hemofilia, după cum știți, este boala recesivă legată de X care este probabil fatală pentru femei. Deci, dacă un bărbat... este pe cromozomul X. Noi, bărbații, nu avem un cromozom X. Deci devenim doar recesivi. O luăm doar pe mama. Dar... și noi... deci dacă femeia o are, ea nu are nicio manifestare. Ea este doar o purtătoare, iar dacă un bărbat o are, el are manifestări ale bolii. Nu observăm femei cu... este foarte rar să găsim femei cu ambii cromozomi X, hemofilie masculină. Acum, aceasta este o greșeală majoră în istoria Europei, cauzată de o genă ca asta. Acum, acesta este arborele genealogic al Reginei Victoria, iar Regina Victoria este cea -- este a doua -- este cea din mijloc, jumătate portocalie și jumătate albă. Deci, dacă sunt rotunzi, ambii sunt femei, iar pătrați sunt bărbați. Și dacă este pe jumătate colorată, este purtătoare. Dacă este tot colorat, este un copil afectat. Deci, când regina Victoria a avut al cincilea copil, dar primul ei bărbat, vorbim despre monarhie. Bărbații au o anumită importanță aici. Primul bărbat, bărbatul sa transformat... Leopold, bărbatul, sa dovedit a fi hemofilic. Și ea a fost foarte, foarte supărată, iar declarația ei a fost că sângele lor era puternic și nu era nicio schimbare în el, nicio slăbiciune în el. Deci, dacă o luăm în serios, ce ai crede că s-a întâmplat? Adică, chestia asta are consecințe incredibile. Dacă te uiți aici jos și vezi acest rând de șapte... de cinci copii fără descendenți, asta e familia rusă. Ei au fost exterminați de -- în timpul Revoluției Ruse, iar oamenii spun că soția lui Nicolae al II-lea a început să-l vadă pe Rasputin -- a fost una dintre cauzele majore ale tulburării populației -- pentru că primul ei bărbat născut era hemofilic, așa că un încurcătură majoră. Adică, asta a dus la retragerea rușilor din Primul Război Mondial și la schimbări mari, mari, mari. Adică mai plătim taxe pentru că sunt comuniști, nu? Deci ce crezi că s-a întâmplat? Cine este responsabil pentru asta? Ei pleacă de la presupunerea că sunt puternici, sângele lor este puternic. Tu spui, OK, deci biata Victoria a avut o mutație. Ai crede asta? Bietul Leopold a avut mutația? Cum ai calcula asta? Ceea ce aș face este să mă uit la aleatorietatea distribuției acelor alele în a doua generație. Nu putem genotip acești oameni. Putem deduce genotipul doar privind ceea ce au, nu? Deci te-ai aștepta ca... toți acești tipi de pe al treilea rând, sunt descendenții Victoria. Te-ai aștepta la distribuția 50/50, nu? Acum, pentru unii dintre ei, nu putem evalua cu adevărat. Avem două... avem trei pe care trebuie să le scoatem pentru că nu au același lucru și nu știm nimic despre asta. Dacă îl iei pe celălalt, avem 1, 2-- avem 1, 2-- sunt de fapt sănătoși și aproape putem spune asta. Și apoi avem trei care sunt fie afectați, fie purtători. Acesta este un procent bun de 50%, nu? Adică, aș spune că nu poți obține ceva mai bun decât atât cu această dimensiune a eșantionului. Este aproape 50%. Dacă cobori și te uiți în jos, vei vedea că raportul va fi exact același. Pentru femei... pentru fiicele lui Nicolae al II-lea, nu putem ști, dar dacă te uiți la R acolo, vei vedea că ai aceeași distribuție. Aș spune că de la Victoria încolo totul este destul de consistent. Deci nu a... deci, OK, poate că are o mutație, sau poate că și-a înșelat soțul? Nu, pentru că altfel ar fi înșelat cu toată lumea, corect, pentru toți copiii. Avem o distribuție foarte frumoasă a acestui lucru. Deci ce s-a întâmplat? Ce zici de mama ei? Ei bine, mama ei, nu avem destule informații. Ce zici de tatăl ei? Tatăl ei s-a căsătorit cu o femeie cu 20 de ani mai tânără decât el. S-a zvonit că este homosexual și a murit șase luni mai târziu, s-a născut Victoria. Poștașul poate? Dacă ai un poștaș hemofil, ar fi o explicație bună. Acum, cineva a făcut câteva cercetări și a aflat că o bunica a reginei Victoria avea doi frați afectați care au murit de hemofilie. Deci, în acest caz, sângele nu este chiar atât de puternic pentru că vine din Saxa-Coburg, din acea linie, și devine parte a monarhiei aristocrației europene. Nu-ți plac acest tip de bârfă? Adică, aceasta este... [Râsete] Adică, aceasta a fost într-adevăr povestea zilei, a secolului, în... la vremea aceea. Dar vezi cum am făcut-o. A trebuit să așteptăm 200-- o sută și ceva de ani pentru a afla ce sa întâmplat cu adevărat pentru că a trebuit să observăm -- nu putem genotip acești oameni în acel moment, așa că trebuie să le observăm, desigur, caracterele lucrurilor lor. Dar dacă am fi capabili să le genotipăm, ce am putea face? Ei bine, am putea să ne uităm la acest lucru al acestor mici variații ale cromozomilor lor, iar cea mai veche variație pe care am putut să o folosim se numesc repetiții simple de secvență și microsateliți. Deci astea sunt... lasă-mă să văd dacă am un slide care explică asta. Nu. Deci, există părți din cromozomii codului genetic, în care aveți secvențe precum G-A-T-A care se repetă de mai multe ori în cromozomul tău, în codul tău genetic. Se repetă de 13 ori în mine și de 15 ori în tine, de două ori în altcineva. Și dacă numărăm aceste lucruri, putem identifica de fapt o regiune a cromozomului pe care prin legare -- ține minte, fiind atașată de ea din scopuri evolutive -- vom identifica o parte, o porțiune a genomului pe care o putem eticheta efectiv. . Acum, problema este că repetițiile simple ale secvenței și microsateliții adaugă acest mic dezavantaj. Ele nu pot apărea în regiuni cu adevărat interesante. Nu puteți schimba pentru a se potrivi cu un cod genetic repetând același lucru de 13 ori sau de două ori și sperați să obțineți proteine ​​coerente din el, nu? Așadar, suntem limitați în interesul pentru regiunile care, prin proiectare, se presupune că sunt oarecum neinteresante din... din punct de vedere funcțional. S- ar putea să existe interes din punct de vedere evolutiv, dar sunt un fel de rămase din altceva. Acum, SNP-urile au această proprietate grozavă. Sunt o singură bază. Și așa este ceva de genul acesta. Aveți secvența dvs. și aveți acea mică bază care în 90% din populație este T și în 10% din populație este G. Pentru a fi sigur că... pentru a califica o singură schimbare ca aceasta ca un SNP și nu doar un mutație simplă, trebuie să aibă un aspect minim în populație. Și am stipulat acest 1%, dar nimeni nu ia numărul în serios pentru că este sub eroarea de genotip - eroarea așteptată. Deci, atunci când genotipați oameni, de obicei aveți o limită mai mare pentru a spune, ei bine, acesta nu este cu adevărat un SNP. Acesta este ceva care se datorează doar erorii genotipului. Ele sunt, de asemenea, cel mai frecvent tip de variații. Nu numai că merg în locuri interesante, dar pot fi de fapt în orice loc din genom. Și au funcții diferite și roluri diferite în ceea ce privește codificarea proteinelor. Deci un cSNP este un SNP care apare într-o regiune de codificare. Un rSNP este un SNP care apare într-o regiune de reglare. sSNP este gena care apare într-o regiune de codificare, dar prin schimbarea SNP, nu schimbi aminoacidul. Corect, avem tot acest vocabular redundant de aminoacizi și, în acest caz, va fi tăcut funcțional, dar va fi totuși un marker. Acum, de ce de fapt nu putem face asta - de ce SNP-urile sunt importante și de ce nu putem avea microsateliți în alte regiuni? Ei bine, acesta este un studiu foarte vechi , unul dintre primele. Și ceea ce a făcut acest tip de la Kreitman a fost să secvențeze 11 alele dintr-un locus dintr-o genă numită alcool dehidrogenază în drosophila. Acum, dacă... aveți 11 regiuni de codare și aveți 14 site-uri care au baze alternative. Acum, dacă pur și simplu vă imaginați că acestea sunt schimbări aleatorii, v- ați aștepta ca aproximativ 70%, 75% dintre ele să schimbe aminoacidul. Acum, când te uiți la ele, vezi că practic niciunul nu o face. De ce este asta? Ei bine, pentru că aceasta este o genă foarte importantă pentru acest animal. Se nasc și sunt hrăniți în alcool, ca unii dintre prietenii mei de la facultate. Și ei... deci capacitatea de a detoxifica alcoolul va fi un punct evolutiv foarte important pentru ei. Deci natura poate greși, dar le poate oferi atât de multe schimbări într-o regiune critică. Dar vreau să provoc puțin sufletele voastre darwiniene. Mintea, nu este că le observăm, avem schimbarea, schimbarea aleatorie, omorâm 75% dintre ei și apoi vedem că restul de 25% au supraviețuit. Aceste lucruri pur și simplu nu se întâmplă. Nu există selecție naturală, în ceea ce privește mediul, care să omoare cei 75 de oameni -- 75% din drosophila, bine? Tu cu mine? Deci, într-o schemă darwiniană, ceea ce ne-am aștepta este că aveți o mutație aleatorie. Ieși afară. Nu alergi suficient de repede. Vei fi ucis. În acest caz, obțineți o mutație aleatorie. Mutația ta aleatorie este selectată de mediu într-un fel, de obicei prin uciderea ta, apoi-- înainte de a te putea reproduce-- și atât. Dar în acest caz, aceste lucruri pur și simplu nu se întâmplă, așa că nu există o schimbare aleatorie și apoi o selecție. Există ceva acolo în mecanismul de control care va împiedica animalul să aibă mutația de la început. BINE? Aceasta este harta SNP pe care o spuneam înainte. Așa citești o hartă SNP. Așa că vă amintiți că aveți două alele pentru fiecare locus și, în acest caz, ceea ce am făcut a fost să genotipăm toți acești oameni-- sunt rândurile-- pentru acești loci, adică coloanele. Deci daca un individ are o pata albastra, pata albastra inseamna ca este homozigot la alela majora, deci are ambii cromozomi cu alela cea mai frecventa, cea mai frecventa in populatie. Dacă este verde, este heterozigot, iar dacă este roșu, este homozigot în alelele minore. Și soția lui este o verigă lipsă. Acum, cum ați face un studiu de asociere? Să presupunem că trag acea linie roșie și îți spun, știi, aici jos, am fenotipul. Acolo sus, nu am fenotipul. Ai putea sa faci vreo asociere? Ei bine, știi, dacă te uiți aici, există câteva gene care, o parte sunt toate albastre și o parte este mai colorată. Poți să faci niște statistici și să spui, ei bine, acest lucru mi-ar permite să disting între aceste două grupuri și să prezic care dintre ele va obține SNP-- fenotipul. Acum, o să vă pun o întrebare puțin diferită. Aceasta este harta dvs. SNP. Care este fenotipul? Ce face aceste două grupuri diferite, ceva care este observabil? Poți să spui asta? Haide. Cumpără o pizza. Ghici. De ce? Ghici. Fără primitor? PUBLIC: Aceasta este o hartă umană sau... MARCO RAMONI: Da, este o hartă umană. Acestea sunt două mostre umane. PUBLIC: Adică, [INAUDIBIL] Afro-americani. MARCO RAMONI: Ai luat pizza. [Râsete] Acolo jos sunt afro-americani. Acolo sus sunt caucazieni. Și deci, pentru a reveni la întrebarea dvs., dacă vă uitați-- deci presiunea evolutivă a legăturii dintre două elemente din populația europeană-- luați al cincilea și-- nu, luați al șaselea și al șaptelea, două locuri, corect ? Iată... nu, lasă- mă să fac asta așa. Luați aceste două puncte, bine? Aceste două puncte, dacă le studiezi, merg împreună, dacă te uiți la statistici, vor merge împreună. De ce... dacă o faci într- o populație europeană. De ce? Pentru că nu ai alternative. Nu știi dacă aceste lucruri chiar merg împreună din cauza unor motive fizice sau se recombină într-adevăr ca nebunii, dar nu putem observa pentru că populația noastră este o populație care nu are acel SNP anume și acest SNP există doar în asta. altă populație. În acest caz, este vorba de poporul afro-american. Răspunde asta la întrebarea ta? PUBLIC: Va trebui să mă gândesc la asta. MARCO RAMONI: OK. Așa că lasă-mă să mă întorc aici. Deci prima lege cantitativă, cea mai importantă lege cantitativă pe care o avem în genetică, dictează câți oameni majori, minori și heterozigoți vom avea într-o anumită populație. Lasă-mă... haide. BINE. Deci, în acest caz, luați o singură alelă și puteți vedea de fapt că aveți o-- vă așteptați să aveți mai mulți oameni cu homozigoți la alela majoră, mai puțini oameni heterozigoți și mai puțini oameni care sunt homozigoți la alela minoră. . Acum, ce regulă există acolo pentru a face... pentru a distribui aceste proporții? Deci legea este legea Hardy-Weinberg. Se afirmă că probabilitatea de a avea o alela majoră, alela minoră și un heterozigot este această formulă, este p pătrat plus 2pq plus p pătrat este egal cu 1. Numim aceasta o situație de echilibru. Când totul este în regulă în populație, nu s-a întâmplat vreo încurcătură majoră, aceasta este legea care dictează distribuția. La asta ne așteptăm la o populație în echilibru. Acum, într-o populație hermafrodită avem un echilibru într-o generație prin redistribuirea acestor lucruri. Nu avem gene autozomale, așa că, în cazul nostru, avem nevoie de două generații pentru a obține un echilibru. Acum, puteți folosi acest lucru pentru a face o mulțime de jocuri mici, cum ar fi, de exemplu, câți caucazieni sunt purtători de fibroză chistică? Ei bine, știm că fibroza chistică afectează 1 din 2.500 de caucazieni, așa că acesta este pătratul nostru q, nu? Deci 0,02 va fi q-ul nostru, iar numărul de alele neafectate va fi 98-- 0,98, 98%, nu? Deci putem conecta p și q acolo și să calculăm 2pq ca 1 din 25, care este un număr remarcabil de mare pentru o boală ca aceasta. Acum, facem toate aceste calcule în baza unor ipoteze. Prima presupunere pe care o facem este împerecherea aleatorie, care nu este o justificare pentru a face sex cu cineva, ci este mecanismul de reproducere pe care ne imaginăm că există în populația noastră. Adică, persoana cu care te vei împerechea nu te va selecta pe baza unui anumit genotip. Dacă suntem interesați de acel genotip, ea nu ți-ar cere harta genetică și nu ți-ar spune, nu, ai un T în acest loc, nu te vreau. BINE? Dacă acesta este cazul, toate calculele noastre ies la gunoi. Ei bine, atunci putem face unele ajustări. Consecința acestui lucru este că avem o mulțime de probleme atunci când selecția se bazează pe lucruri care sunt proxy, cum ar fi a fi ruda mea. Dacă cineva este ruda mea, voi introduce o părtinire pentru că o voi selecta pe baza codului ei genetic. Știu că nu fac asta pentru codul genetic, dar voi avea... O voi face oricum. Și cealaltă presupunere pe care o avem este că avem o populație infinită, ceea ce este oarecum sensibil pentru noi, pentru 6 miliarde de oameni. Deci celălalt lucru... de ce avem nevoie de aceste presupuneri? Ei bine, pentru că știm că mecanismul de răspândire a unui caracter în populație -- se numește deriva -- este modul în care o anumită alelă va intra în populație și fie va cuceri totul, fie pur și simplu va dispărea, nu? Deci, la un moment dat, vom ajunge la un fel de stabilitate evolutivă în care aceste lucruri vor fi în jur. Și problema cu asta, momentul în care oamenii din temă-- se întâlnesc la nivel local, pentru că, din nou, asta creează o anumită populație -- o anumită părtinire cu faptul că iazul tău de pescuit este prea mic. Deci, la final, veți șterge totul în acea populație specială. Dacă toți se împerechează unul cu altul în particular... într-o populație foarte mică , orice putem spune despre variație va dispărea. Acum, contrastul de... ceea ce este opusul derivei este o mutație. Deci avem aceste mutații aleatorii care apar și apar în genomul nostru, dar, după cum puteți vedea, lucrul amuzant dintre aceste mecanisme - adică orice observăm este deriva și mutația - mutația introduce schimbări, deriva face aceste schimbări. stabil, așa că scăpați de ei... este în contrast puternic cu ceea ce ni s-a învățat în liceu, adică există un fel de selecție. Ce este selecția aici? Unde oamenii sunt mâncați, unde oamenii nu aleargă suficient de repede? Există o modalitate de a lua în considerare selecția în acest sens? Da este. Deci, să păstrăm o reprezentare cantitativă a selecției. O reprezentare cantitativă a selecției este o funcție de fitness. Asta vă va spune cât de bun este cineva cu acel SNP special, cu o anumită alelă, să supraviețuiască în acest mediu special, nu? Acum, să presupunem că aveți o alelă care are o distribuție de 0,6 și 0,4. Deci aplicați legea Hardy-Weinberg și aveți acea distribuție a homozigoților și a heterozigoților în populația dvs. Atunci ai o funcție. Avem o funcție de fitness care vă va spune că aveți o-- rata de selecție va fi 0,2 pentru că veți spune că dacă aveți alela majoră sau heterozigotă, sunteți în regulă. Probabilitatea ta de supraviețuire este 1. Dacă ești homozigot la alela minoră, ai o capacitate de supraviețuire diminuată. Deci, putem calcula din această funcție de fitness o funcție de selecție de 0,2 care ne va spune câți oameni pierdem într-o anumită categorie la fiecare generație. Acum, dacă te uiți la efectul asupra primei generații, vezi că există o creștere a homozigotului la alela majoră, o scădere a homozigotului - la heterozigot și scăderi mai accentuate la homozigot la alela minoră. Dar este ceva amuzant aici, că, pentru că am folosit un diferențial acolo, cu cât este mai mic numărul de indivizi homozigoți la alela minoră, cu atât mai mică va fi epuizarea lor, nu? Deci această mutație, aceasta este o mutație, nu dispare niciodată. Pur și simplu va rămâne acolo și va fi eliminat încet -- eliminând indivizi, dar va fi pândit în codul genetic pentru anii următori, bine? Nu avem nicio explicație în acest fel de ce au dispărut dinozaurii. Acest lucru ne spune pur și simplu că o anumită mutație va continua să plutească în populația noastră și nu avem modele matematice bune pentru a explica cum vor dispărea. Acum, asta e... totul se bazează pe legea Hardy-Weinberg, nu? Chiar functioneaza? Așa că acest tip, acest [INAUDIBIL] în 1975, în Anglia, au făcut acest experiment. Au luat probe de sânge. Acestea sunt grupele lor sanguine , care sunt, din nou, guvernate de o singură alelă. Și se uită la populația acestui grup, această populație aleatorie, și au descoperit că dacă calculezi valorile așteptate folosind Hardy-Weinberg și calculezi valorile, valorile observate, aceste numere sunt remarcabil de similare. Vezi tu, așa că ne-am aștepta ca 261,54 Mm de la Hardy-Weinberg. Obținem 363. Obținem 636 pentru Mn și obținem 334. Acum, aceste numere sunt atât de asemănătoare încât cineva a scris o lucrare care arată că de fapt au fost falsificate, pentru că nu... precizia acestui număr este peste orice. așteptări statistice rezonabile de precizie pentru o anumită lege, OK? Dar să presupunem că au falsificat numărul pentru că nu știau statistici și nu știau că pot obține o cale cu rezultate mai bune . Dar haideți să cumpărăm chestia asta pentru că am văzut în altă populație că nu este chiar atât de aproape, dar chiar funcționează. Dar am văzut și o populație în care nu prea funcționează. Așadar, modelul beta fiind anemia cu celule falciforme în Africa de Vest, dacă te uiți... dacă calculezi distribuția folosind Hardy-Weinberg și calculezi și observi distribuția în populație, ai această schimbare remarcabilă. Uită-te la diferența dintre aceste două numere. Ne așteptăm ca, să avem 254 și, de fapt, avem 64. De ce? PUBLIC: [INAUDIBIL]. MARCO RAMONI: Mai spune. PUBLIC: [INAUDIBIL], deci nu poți observa. MARCO RAMONI: OK. Cred că... nu, am făcut o greșeală. Este răsturnat. Deci avem... scuze, avem 600 și ceva, nu 64. Acesta este 645, deci explicația ta este inversă. Deci trebuie să explici fenomenul opus, nu de ce este mai mic, ci pentru că este mai mare. [Râsete] De fapt, ai un-- vezi că ai mai mulți homozigoți-- heterozigoți la mijloc? Oh, nu, nu. Numărul este corect. Deci asta este chestia. [Râsete] Lucrul inconsecvent este că ai prea mulți heterozigoți, având în vedere alelele homozigote și minore. Nu ar trebui să le ai. Vezi? PUBLIC: Dar nu este acea dovadă a unei selecții, o dovadă a selecției genelor? MARCO RAMONI: Primești două pizza. Deoarece heterozigoții primesc protecție împotriva malariei, astfel încât, făcând acest lucru, aveți o tendință de a avea o mulțime de heterozigoți la mijloc și păstrați alela în jurul populației. Iar celălalt de mai jos nu rămâne -- nu se schimbă cu adevărat, dar avantajul selectiv este pentru acești 5.400 de oameni care au heterozigoți. Deci, în acel caz special... acesta este ceva care probabil nu ar fi un test bun de făcut aici, pentru că aici malaria nu este cu adevărat o problemă mare. Dar în Africa de Vest va fi o mare problemă. PUBLIC: Dacă am face acest test la naștere sau înainte de naștere, ar fi în concordanță cu predicția? MARCO RAMONI: Înainte de naștere? PUBLIC: Dacă ai face dacă ai făcut aceeași distribuție a alelelor înainte ca acestea să aibă această presiune a malariei? MARCO RAMONI: Ei bine, acesta este... PUBLIC: Este factorul de moarte care cauzează diferența sau ceva de genul... MARCO RAMONI: Nu, nu există moarte. Ei bine, haideți să o punem așa. De fapt, o facem înainte de a se naște, pentru că selecția este de fapt pe acești părinți. Presiunea, ca de obicei, este asupra părinților. Deci, dacă păstrați aceste lucruri în preajmă, șansele ca acești oameni să meargă la o vârstă mai înaintată și să se reproducă sunt mai mari. Deci noi-- întreaga populație are un avantaj global în a păstra această variație particulară, dar numai în forma particulară, care este heterozigotul. Homozigotul va fi prea rău pentru tine, dar heterozigotul va atinge un echilibru frumos între îmbolnăvirea bolii și protejarea efectivă de... împotriva malariei. Dacă faci așa ceva aici, schimbi starea de mediu, ești înnebunit. Aici, sunt destul de sigur, dacă faci același test, acest lucru nu va apărea pentru că populația în ansamblu nu are o presiune pentru asta. Acum, cum mapam aceste lucruri? Cum folosim un marker ca atare? Ei bine, mai întâi vrem să găsim baza genetică, un genotip pentru o anumită boală care este fenotipul nostru și care este mentalitatea pentru cineva care caută asta? Nu căutăm cu adevărat SNP-ul sau mutația care se schimbă acolo. Încercăm să găsim markerul care se află în apropiere - ei bine, vom fi bucuroși să găsim markerul care se află în apropierea codurilor reale. Deci mentalitatea este mai mult sau mai puțin aceasta. Am un marker și observ în setul meu de date o dependență între fenotipul meu și markerul meu. Dar, în realitate, amploarea revendicării mele nu poate fi, acest marker cauzează acest fenotip. Amploarea afirmației mele poate fi doar acolo... acest marker este legat de echilibru cu un genotip real pe care nu l-am observat, care de fapt cauzează fenotipul. Și vezi de unde încep să apară complexitățile. Prima complexitate este că fenotipul și-- genotipul și fenotipul pot avea o formă complexă de cauzalitate. Ei pot avea o interacțiune cu o condiție de mediu sau pot spune că au penetrare incompletă. Și celălalt lucru este că, grupul nostru este echilibrul legat între marker și genotip. Nu mă aștept ca toată lumea să obțină exact aceeași pereche de genotipuri, nu? Deci, aici intervine stocasticitatea și aceasta este ceea ce ne face viața puțin mai complexă, dar cu siguranță mai interesantă. Acum, trăsăturile nu urmează cu adevărat modele cu o singură genă. Dacă te uiți la lista de boli pe care le-au dat, sunt un fel de boli minore, minore. Au o incidență mică. Sunt boli oribile, dar nu vor salva cei 50% dintre oamenii care mor din cauza unui accident vascular cerebral sau persoanele care au diabet sau persoanele care au acest lucru pentru factori alele mai complicate care provoacă boli mai interesante. Pe de altă parte, chiar și unele trăsături mendeliane sunt de fapt complexe. Deci, dacă te uiți la... deci... și anemia cu celule falciforme este o boală mendeliană clasică , dar... așa că știm de ce o ai. Dar variabilitatea fenotipică a bolii este imensă. Sunt copii care mor la 13 ani din cauza unui accident vascular cerebral și sunt oameni care trăiesc pentru totdeauna. Și există oameni perfect sănătoși. Nu știm de ce se întâmplă asta. Știm că acești oameni fac boala, dar nu știm ce... de ce se întâmplă asta. Și astfel oamenii, de exemplu, studiază mortalitatea timpurie a copiilor cu anemie secerată, încearcă să găsească SNP [INAUDIBIL] și spun, ei bine, știi, acești oameni suferă de această boală specifică care este găsită genetic. Poate că diferența dintre supraviețuirea lor pe termen lung - șansa de supraviețuire pe termen lung se datorează într-adevăr exclusiv unui alt SNP. De fapt, aproape că o găsesc. O altă problemă este penetranța incompletă atunci când aveți o interacțiune cu o altă variabilă. Acesta este un caz recent, foarte faimos, numit Bcr1. Bcr1 este o genă, este un loc special care va fi un predictor al riscului mai mare de a dezvolta cancer de sân la o femeie. Acum, știm că este foarte dificil pentru o femeie să dezvolte cancer de sân înainte de menopauză, așa că te aștepți că la 40 de ani să aibă o incidență foarte scăzută. Dar dacă te uiți la -- dacă faci o medie a tuturor acestor lucruri, a populației din -- între persoanele cu BCR 1 și persoanele fără Bcr1, vei vedea că dovezile nu sunt chiar atât de mari. Ei au o ușoară creștere a șanselor de a dezvolta cancer de sân. Dar dacă le împărțiți în funcție de vârsta lor, deci folosiți vârsta ca factor de mediu, vedeți cum schimbările cresc în timp. Deci, când ai 40 de ani, sunt 37 de șanse-- 37% șanse. Dar când ai 80 de ani, sunt șanse de 85% să se schimbe. Dar dacă le pui pe toate cap la cap, eh, ai ceva care nu este un rezultat atât de clar. Pe de altă parte, provocarea aici este de fapt de a afla care este factorul de mediu care face de fapt fapta. Acest mod este de a afla că vârsta este cea care împarte aceste femei în aceste grupuri diferite. Deci aceasta este o problemă necesară, suficientă, dar avem și o problemă de redundanță. De exemplu, avem retinită pigmentară care poate fi cauzată de 14 SNP-uri independente, mutații, nu? Deci oricare dintre aceste mutații va fi pozitivă la un anumit test genetic pentru asocierea cu boala. Și avem și alte boli despre care se știe că au cauze poligenice. Dacă aveți doar unul dintre aceștia, nu veți dezvolta boala, cum ar fi boala Hirschsprung, în care ați avea nevoie de două mutații diferite pe doi cromozomi diferiți, ceea ce, apropo, deschide o întrebare interesantă despre care este relația , relația evolutivă, a obiectelor care lasă loci care se află pe doi cromozomi diferiți? Sunt complet independenți? Ei bine, avem sisteme foarte complexe care sunt deplasate în jurul... există gene deplasate în jurul diferiților cromozomi și suntem capabili să reconstruim acest sistem de la o generație la alta. Cum combinăm asta cu ideea că, dacă măsori lucrurile cu centimorgan, două lucruri -- nu are sens să ai -- să compari distanța a doi loci pe doi cromozomi diferiți? Deci aceasta este o noțiune, un fel de noțiune radicală, dar propusă în anii '30 de Sir Ronald Fisher, părintele statisticii și geneticii moderne, sub numele de afinitate. El nu avea genotipuri la acel moment, dar era o lucrare despre natură, care vorbea despre acest fenomen foarte ciudat și despre cât de probabil era să nu existe nicio relație cu lucruri care erau foarte îndepărtate în codul genetic, în acest cod el isi imagina. Și erau, în același timp, strâns legate funcțional. Deci, cum încercăm să disecăm toate aceste lucruri complexe și, de asemenea, pe cele simple? Ei bine, știi, modalitatea tradițională este să facem același joc pe care l-am făcut pentru Secretele Victoria, corect, să găsești un pedigree mare, să aștepți, știi, cei 150, 200 de ani și să vezi ce se întâmplă de-a lungul a trei generații. Putem face asta cu drosophila mult mai repede, dar dacă vrem să ne apropiem de bolile umane, drosophila nu o reduce întotdeauna. Deci, dacă vrem să studiem același lucru la oameni, ce facem? Una este să găsești un pedigree mare. Unul este să spun, ei bine, știi, nu prea am nevoie de un pedigree mare. Ce pot obține sunt triouri. Am mamă, tată și copil, o familie nucleară foarte modernă. Și apoi îmi imaginez -- pentru că îi cunosc pe părinți -- îmi imaginez că voi obține dovezi statistice de transmitere prin repetarea aceleiași măsurători în sfere diferite. Dreapta? Ca, au fost un pedigree uriaș și, în acest caz, pot face totul în două generații. Pot avea... dar uneori, pentru unele boli, găsirea părinților este foarte dificilă. Dacă cauți două trăsături complexe care apar târziu în vârstă sau... există oameni care studiază de fapt asta, baza longevității. Și recrutează oameni în anii 90, sfârșitul anilor 90, începutul secolului I - începutul secolului al doilea. Este oarecum dificil să-i depistați părinții și, mai ales, este dificil să-i genotipați. Deci ce faci in acest caz? Primești frați. Dacă îl iei pe frate, încerci să-ți dai seama care a fost genotipul. Deci presupuneți că există un fel de distribuție aleatorie a acestor lucruri între cei doi copii și încercați să vă dați seama care a fost genotipul original al părinților. Sau puteți face un experiment standard de control al cazului în care colectați o grămadă de oameni - jumătate dintre ei sau amândoi au boala, în afară de aceasta, nu au boala - și comparați asocierea dintre un SNP, o mutație , iar dacă da, toate trei. Există o altă modalitate de a clasifica aceste experimente. Unul este... unul sunt experimentele care sunt, de exemplu, cu două fețe, ca experimentele caz-control. Am două... ambele părți ale poveștii, cea afectată și cea neafectată. Sau pot avea studii unilaterale-- și îți voi arăta cum le analizezi-- în care recrutezi părinți-- sunt părinți sănătoși cu un copil afectat-- și încerci să vezi care este transmisia care pleacă de la părinţi, copil, care îl fac pe copil afectat. În acest caz, tot pool-ul tău, tot pool-ul tău recrutat, ar fi făcut de persoane care sunt fie afectate, fie sunt rude cu o persoană afectată. Ceea ce face, de obicei, viața mult mai ușoară pentru recrutor, deoarece, dacă trebuie să ofer... să mă ofer voluntar pentru studiu dacă sunt afectat sau copilul meu este afectat, voi fi mai dispus să mă ofer voluntar pentru studiu decât dacă aș fi Sunt doar un bozo aleatoriu care nu are boala și, prin proiectare, trebuie să fiu independent de orice subiect cu boală. Așa că voi intra în detalii pentru fiecare dintre aceste studii. Deci primul lucru pe care îl putem face este să facem o analiză a legăturilor. Aceasta este o analiză tradițională a pedigree-urilor. Al doilea mod în care putem face... putem merge este să... este partajarea alelelor. Îți amintești despre ce îți spuneam, despre frați și surori în general? Deci, dacă aveți frați, ceea ce puteți face este să vă imaginați că există o distribuție aleatorie pentru un anumit SNP, pentru o anumită mutație. Și te-ai aștepta ca, dacă ai doi frați, acești doi frați vor avea o probabilitate deosebită de a obține o alelă sau alta. Acum, dacă începi să devii de la această distribuție, atunci începi să devii puțin suspicios. Studiile de asociere sunt studii de caz-control standard în care calculați probabilitatea ca un anumit SNP să provoace, afectând rezultatul. TDT, Testul de dezechilibru al transmisiei, este lucrul pe care îl folosim de fapt pentru triouri și vă voi spune într-o secundă. Și apoi, pentru trăsăturile complexe, cum ar fi trăsăturile cantitative, lucruri care nu sunt cu adevărat boli binare, dar sunt, de exemplu, rezistența ta la-- înclinația ta de a începe să bea, care poate avea grade diferite, sau înclinația ta de a renunța la fumat, care, din nou, , poate avea grade diferite. Cel mai bun mod de a le face, de a privi aceste trăsături cantitative, este să folosim modele animale, deci încrucișări, ceea ce nu avem voie să facem la oameni. De obicei, aceste colecții sunt bazate pe ipoteze. Așa că ceea ce fac acești oameni este că se trezesc dimineața, citesc multe ziare cu o seară înainte și fac un duș și spun, o , iată șapte, poate legate de boala mea. Așa că ies afară, cer bani. Ei recrutează o grămadă de oameni, folosesc banii pentru genotiparea acestor oameni, desfășoară un experiment și scriu o lucrare în care fie găsesc ceva, fie nu găsesc nimic. De obicei, dacă nu găsești nimic, poți scrie o lucrare, iar acest lucru a indus un comportament nepotrivit oamenilor de știință. Provocarea aici este că a face acest lucru este modul de modă veche. Ceea ce este foarte prețios pentru noi astăzi, sau în acest caz, sunt mostrele de oameni. Să zicem, imaginați-vă că aveți o singură picătură de eșantion-- sau dintr-o-- de la un individ și puteți face o mulțime de aceste SNP-uri, dar în acest caz, nu trebuie să citiți o mulțime de lucrări. Ce poți face este... sau poți avea îndoieli. Puteți spune, ei bine, poate că nu este doar acesta. Poate este al doilea. Poate al treilea. Poate este al cincilea. Ce se întâmplă dacă colectez 500 de SNP-uri și apoi le testez pe toate? Dacă fac o analiză care... nu colectăm niciun SNP? Le colectăm pe toate și încercăm să căutăm, să căutăm dependențe în setul de date. OK, în acest caz, devine foarte, foarte dificil. Așa se făceau lucrurile înainte. Și acesta este un studiu de legătură cu trei generații-- 3, 4-- patru generații . Și în acest caz, aveți o anumită boală, iar oamenii care sunt afectați, ei sunt cei roșii. Oamenii care nu sunt afectați sunt cei albăstrui. Și studiezi un mecanism de transmitere pentru un anumit SNP, pentru o anumită mutație. Și ceea ce faci este să folosești o cantitate numită raport [INAUDIBIL] sau cortex de pierdere. Ce este asta? Dezvolti o metodă... un model de transmitere care acuză că SNP-ul este responsabil pentru boală. BINE? Deci, urmărirea SNP-ului va urma -- transmiterea SNP-ului, a mutației, va urma modelul caracterelor observabile la indivizii pe care îi vedeți. Și apoi faci altul în care este... în care mutația nu este responsabilă pentru asta. Și apoi folosind metode statistice foarte simple, puteți calcula că datele pe care le observați sunt generate de un model și datele pe care le observați sunt generate de celălalt model. Și puteți compara aceste două modele, și spuneți, modelul în care... și puteți spune, modelul în care această mutație este responsabilă pentru boală, care urmează același model de moștenire, este de n ori mai probabil sau mai puţin probabilă decât ipoteza în care cele două modele nu sunt asociate între ele. Acum, problema aici este că, dacă ai un pedigree mare de-- ai multe SNP, ajungi în problema comparațiilor multiple. Așa că trebuie să vă spun asta pentru că aceasta este treaba mea, dar nu cred în asta. Dar dacă într-o zi doriți să publicați o lucrare folosind lucruri statistice standard, clasice, veți ajunge într- un lucru numit... într-o zonă plină de noroi numită comparații multiple. Acum, comparațiile multiple provin dintr-o superstiție clasică și din statistica clasică. Asta înseamnă că poți deduce - poți spune că două lucruri sunt diferite dacă poți, repetând experimentul de o sută de ori sau de un milion de ori sau de câteva ori, vei obține mai puțin de 0,05 greșeli. Ați auzit de această valoare p. Aceasta este valoarea p. Este probabilitatea ca veți face o eroare presupunând acea ipoteză de mai mult de n ori. BINE? În acest caz, este de cinci ori dintr-o sută. Acum, dacă testez o ipoteză, acesta este nivelul meu de eroare. Se presupune că testez două ipoteze. Ei bine, probabilitatea că voi face asta din întâmplare se dublează, așa că va fi produsul acestor două probabilități, corect, pentru că acestea sunt două distribuții comune de probabilitate . Să presupunem că observ 500, deci devine de 0,05 ori 0,05 -- un număr mai mic. Să presupunem că am 500 de SNP-uri. Ce ar trebuii să fac? Acel număr va deveni atât de mic încât ar fi imposibil să se dovedească ceva, pentru că numărul ar fi -- pentru că probabilitatea ca o singură ipoteză să înțeleg din întâmplare ar fi atât de mare încât voi avea nevoie de multe dovezi -- o sumă nepotrivită de dovezi pentru a accepta o anumită ipoteză. Deci oamenii frecventiști au această problemă. Oamenii pacienți nu. Dar este o problemă. Dacă doriți să publicați într-un jurnal, acesta este un-- acesta este ceva ce veți-- OK. Deci, aceasta este neparametrică - partajarea alelelor este ceea ce v-am spus înainte, metodă neparametrică de a evalua legătura. Și ceea ce faci este că folosești frați și presupui că SNP-ul tău particular este identic - distribuția SNP-ului, a acestei mutații, este identică prin descendență. Deci știu care este distribuția la care mă aștept și ceea ce pot face este să văd, pentru un anumit SNP, dacă există o abatere de la distribuție, m-aș aștepta dacă acești doi băieți ar fi înțeles -- și-au primit mutația din aceeași pereche de părinți. Dreapta? Deci aceștia sunt frați. Mă uit la probabilitatea că vom obține acest SNP întâmplător. Și dacă nu obțin SNP întâmplător pentru că sunt toți afectați, ceea ce aflăm este că acești oameni care sunt efectiv afectați au șanse mai mari de a obține acest SNP special, iar acest lucru îmi va face SNP-ul suspicios. A face suspectul nu înseamnă că o dovediți. Acum, dacă doriți să demonstrați așa ceva din punct de vedere statistic, folosind o metodă neparametrică - pentru că nu faceți nicio presupunere cu privire la natura distribuțională a datelor dvs. - va trebui să aveți nevoie de o cantitate uriașă. de date. Și acest lucru nu este întotdeauna fezabil, dar acest lucru este într-adevăr, cu adevărat fezabil. Deci, acesta este un test slab pentru că pur și simplu vă spune, singurul lucru pe care îl dovediți este că acea alelă este transmisă mai mult decât... într- un mod diferit decât aleatoriu, ei bine, mai mult decât populația sa aleatoare. Acum, studiile de asociere se fac de obicei folosind metode parametrice și testează asocierea între un anumit fenotip și genotip în două seturi, în două populații diferite, ei bine, în două eșantioane diferite. Care este problema? Este că uneori îți recrutezi eșantionul din două populații diferite. Știu că sună absolut prostesc, dar aceasta este una dintre preocupările majore. Să presupunem că oamenii în roșu sunt toți oameni cu astm bronșic, iar cei cu albastru sunt toți oameni fără astm. Dar apoi... și merg și află o asociere între SNP și asta... și o mutație și apoi acest fenotip. Dar apoi descopăr că, dintr-un motiv oarecare, i-am recrutat pe toți cu astm bronșic din Finlanda și pe toți fără astm din Sicilia. Acum, acest SNP va ține seama de astm, sau acest SNP va ține seama de orice variație este între aceste două populații. Acestea se numesc amestecuri de populație și știu că sună o prostie pentru oameni să recruteze lucruri în diferite țări sau populații îngropate, segregate . Pe de altă parte, s- ar putea să aveți... nu aveți nicio garanție că nu aveți stratificări în populația dvs. Chiar dacă recrutați într-un Massachusetts frumos multicultural , probabilitatea ca veți afla ceva despre... ceva despre eșantionul dvs. care nu vă place cu adevărat, ca o stratificare, nu este neglijabilă. Deci, ceea ce este cu adevărat, cu adevărat la modă astăzi este utilizarea testelor de dezechilibru de transmisie. Testele de dezechilibru de transmisie se bazează pe presupunerea că de fapt folosiți părinții unui individ ca control, așa că sunteți sigur că nu veți obține nicio stratificare, nu? Așa că o să recrutez o grămadă de triade, tată, mamă și copil, iar copilul este afectat și părinții nu sunt afectați, bine? Și atunci ceea ce voi face este să calculez pentru fiecare SNP particular, pentru un anumit SNP, pentru o anumită mutație, dacă există o dependență, dacă există un model, ca să spunem așa, între distribuția mea de transmisie și faptul că toți acești copii sunt de fapt afectați. Și în acest fel. Am un test foarte puternic și controale necertificate. Singura problemă este că nu este întotdeauna ușor, așa cum spuneam, să găsești părinți pentru asta. Și cealaltă problemă este că s-ar putea să găsiți stratificare fenotipică cu asta. Să presupunem că căutați o anumită boală care este legată de slăbiciune. Un exemplu pe care îl am este holera. Există-- oamenii cred că există un SNP și oamenii caută un SNP care este mai mult-- fac oamenii mai susceptibili de a avea un rezultat negativ de la holeră. Și ceea ce fac ei este să meargă și să recruteze oamenii din gospodării, așa că atunci când cineva apare în spital, ei recrutează întreaga gospodărie și îi folosesc pe părinți ca control. Acum, în acel moment, problema este că, pentru că fenotipul nu este chiar atât de ușor de identificat, nu știm dacă acești oameni, de exemplu, au primit o imunitate cu 20 de ani înainte pentru că au luat holera. Aceștia sunt părinții unui copil care are... care are 15 ani. În locurile în care au holeră gravă, de obicei aceștia sunt încă tineri, dar din structura societății, sunt cam bătrâni. Sunt acolo de aproximativ 35 de ani. Și asta înseamnă că, în acel moment, aveți această populație particulară care, prin proiectare, are un fenotip foarte diferit -- un fenotip care este foarte greu de caracterizat. Deci QTL-- trăsături care, ca în acest caz, variabilitate în intensitate. Nu caut ceva alb-negru. Caut ceva cu diferite grade de severitate. Și până anul trecut, chiar nu a existat nicio modalitate de a face aceste lucruri. Ei bine, nimeni nu a dovedit modalități de a face asta. Acum, oamenii muncesc foarte mult pentru că QTL sunt de fapt unul dintre cele mai interesante lucruri. Oamenii caută foarte greu să găsească modalități de a caracteriza cel puțin un anumit tip de QTL. Și poți... și QTL complexe, ca în cazul datelor recensământului. Deci, unul dintre studiile pe care le-am făcut este despre dezvoltarea... dezvoltarea sânilor la femei. Tu spui "de ce?" Ei bine, pentru că dezvoltarea sânilor a fost asociată cu cancerul de sân, așa că știm că dezvoltarea târzie a sânilor protejează cancerul de sân, cel puțin un tip de cancer de sân. Acum acesta este un QTL. De ce? Pentru că te uiți la vârsta, care nu este o variabilă binară. Și este un QTL foarte complicat pentru că este... este posibil să aveți date senzorului. Este posibil să aveți fete care la un moment dat decid dintr-un motiv sau altul să renunțe la studiu. Deci modul în care vă puteți organiza pentru acest QTL anume -- nu pentru fiecare QTL -- este să vă imaginați, să reprezentați structura ca un studiu de supraviețuire, în care vă imaginați că SNP-ul dvs., un anumit SNP, va fi un tratament iar celălalt va fi controlul. Îți desenezi curbele Kaplan-Meier , în acest caz, nu pentru supraviețuire, ci pentru dezvoltarea sânilor, care este un fel de punct limită. Și la sfârșit, puteți calcula diferența dintre aceste două mostre și puteți obține dovezi că de fapt există un factor care le pune împreună. Și puteți folosi alte structuri multivariate care vă permit să studiați interacțiunea SNP-urilor în QTL. Dar de obicei, dacă vrei să ai un model general pentru QTL, trebuie să apelezi la animale, modele animale. Acum există un alt lucru interesant care se întâmplă în mare parte pe această stradă și se întâmplă în ultimii patru sau cinci ani. Există... avem două sau trei studii fenotipice mari conduse de Harvard și spitale afiliate. Cel mai vechi este cunoscut sub numele de Framingham Heart Study. Framingham Heart Study adună, nu știu, 50.000 de oameni. Au fost urmăriți, iar acum sunt a treia generație. Au fost urmăriți. Membrii familiei lor au fost urmăriți. Despre acești oameni știm practic totul. Sunt... acestea sunt selectate pentru boli de inimă, dar există și studii... există studii de cohortă care nu au fost selectate pentru nimic, cum ar fi Studiul Asistentelor. Asistentele sunt persoane minunate, incredibil de conforme cu ordinul medicului. Așa că, chiar dacă îi hărțuiești timp de 30 de ani, cerându-i la doi ani un raport complet despre ceea ce au făcut, bolile pe care le au, care este dieta lor, cât cântăresc, se vor conforma. Nurses' Study are 150.000 de femei care, o dată la doi ani, merg și completează un chestionar doar de dragul ei. Așa că despre aceste femei - și asta este acum în a doua generație - știm absolut totul. Știm câți morcovi mănâncă în fiecare an. Și probabil vezi unul - motivul pentru care vezi aceste articole în New York Times, ele apar din întâmplare, sau la Școala de Sănătate Publică, dar de obicei înseamnă șansă, în acest caz. Există oameni care dețin aceste date. Și aceste articole sunt ca și cum, știi, părul roșu te va face să trăiești mai mult. Sau, știți, consumul de cinci morcovi pe zi a fost asociat cu a avea ochi mai strălucitori. De unde ies acele descoperiri ? Din studiul asistentelor. Există acești oameni care minează setul de date. Din nou, ei nu citesc în acest caz. Ei fac un duș dimineața și spun, ce pot să mă duc să mă uit la studiul de asistente? Și ei spun, ei bine, ce zici de asocierea dintre rimel și orbire? Avem 150.000 de femei care folosesc rimel în fiecare zi. Ei bine, de fapt, probabil că aveți o proporție bună care folosește rimel și o proporție bună care nu folosește rimel. Și tu știi asta. Deci ei merg acolo. Și gluma de pe stradă este că nu publică în New England Journal. Ei publică un director pe The New York Times, deoarece acestea sunt de obicei întrebări cu impact foarte mare pe care oamenii le primesc imediat. Dar imaginează-ți dacă poți lua toate acele lucruri, toate acele fenotipuri și ai putea genotipa acele femei - avem sânge pentru aproximativ 90.000 dintre ele - și ai face o scanare genetică completă pentru aceste femei, ce ai putea face? Ai putea găsi o asociere între rimel și SNP-uri sau orbire și SNP-uri sau orice altceva și SNP-uri. Putem face asta? De ce nu o facem? Ei bine, bine, genotipul este un cost net de aproximativ 0,45 USD, doar pentru a vă anunța unde vă aflați. Pentru a tăia o hartă individuală va costa-- îmi pare rău, o hartă individuală va fi aproximativ 90.000, OK? Deci 1.000 de persoane te vor costa 90 de milioane. Și banii aceia, sunt foarte greu de găsit în acea structură. Dacă mergi la NIH și ceri astfel de bani, îi vei primi. Nu munca este problema. Postdoc-urile la Harvard sunt ieftine. Și muncesc foarte mult. Deci, am putea avea de fapt 1.000 de hărți SNP complete în aproximativ 7.000 de zile, acum, ceea ce înseamnă aproximativ doi ani pentru 10 postdoc, nimic. Cum putem rezolva această problemă? Ei bine, îți amintești când am spus că aceste lucruri merg împreună? Poate că nu trebuie să le genotipăm pe toate. Acesta este un exemplu de genă. Îmi amintesc că noi... Nu-mi amintesc ce genă. Dar aceasta este o hartă a unei gene care îți spune distanța în termeni de r pătrat, care este măsura pe care ți-am spus înainte, distanța dintre... distanța pe perechi dintre două puncte. Și după cum puteți vedea, puteți identifica blocuri acolo, zonele albastre în care corelația dintre pătratul r din această zonă este atât de mare încât nu este nevoie să le genotipați pe toate. Puteți decide doar unde mergeți. Și spui, OK, alege-o pe oricare dintre ele. Problema este să știi asta, mai întâi trebuie să le genotipezi. Deci, în acel moment, nu există prea mult scop pentru asta. Și cealaltă problemă este că odată ce ai asta... deci aici este ușor, nu? Când am o regiune... acea regiune de recombinare, sunt patru sau cinci de recombinare inferioară. Pot să spun, OK, iau unul, doi, trei, patru. Acum, întrebarea este, pe care o aleg? Acum, să presupunem că nu au cinci. Am în acest caz, 59, care nu sunt atât de multe. Regiunile ca aceasta sunt lungi de 229. Ei bine, bănuiți. De câte SNP-uri am nevoie pentru genotip? Nu care, desigur. Ar fi nevoie de puțin. Dar de câte am nevoie să genotipez aici pentru a ține cont de toate variațiile? Deci acestea sunt SNP-urile. Acestea sunt toate combinațiile pe care le primesc în populație, bine? Aceste SNP merg împreună. Deci nu mă aștept să văd toate combinațiile posibile. De câte dintre ele va trebui să țin cont de cele 14 variante alternative diferite ale [INAUDIBLE] peste aceste 59 de SNP-uri? Vreau numărul. Jose, ai ajuns la a treia pizza. 15? PUBLIC: 10. MARCO RAMONI: 10? OK, avem un 10 aici. Se apropie cineva? E o presupunere bună. Vei cumpara 10? Cumpăr 10? Cinci. Aceste cinci SNP-uri vă permit să reconstruiți toate variațiile fără nicio pierdere de informații. Am un tip, Channing, un bun prieten de-al meu. Și când am dezvoltat metoda de a identifica acest lucru, mi-a cumpărat cina pentru că a petrecut doi ani uitându-se la aceste imagini și încercând să-și dea seama care au fost SNP-urile care au venit [INAUDIBIL]. Și de fapt, când a greșit, a primit o mulțime de rahat de la oameni pentru că, oh, m- ai înțeles greșit. Acum am menționat că este o sarcină năucitoare să te uiți la această imagine și să încerci să afli care sunt cele optime pentru genotip. Deci, ceea ce au făcut este să se joace cu structura numită haplotipuri. Haplotipurile sunt lucrurile pe care le primești de la mama ta și de la tatăl tău. Și există o întindere a genomului care este consistentă cu un cromozom pe altul. Acum, problema cu haplotipurile este că sunt foarte greu de identificat pentru noi. Când ordonezi pe cineva, vei avea hărți care arată ca cea pe care am arătat-o ​​înainte. Vă pot spune dacă sunteți heterozigot, homozigot sau majoritar, toți homozigoți, și din minoritatea de. Dar nu vă pot da două baze. Deci, dacă acel SNP special este A și T, ca două baze alternative, pot spune dacă sunteți A-T, T-T, A-A. Dar nu pot să- ți spun dacă ești T-A. Nu pot decide dacă două lucruri vin ambele de la mama ta sau ambele de la tatăl tău, care este exact tipul de informații de care avem nevoie pentru a construi astfel de hărți pentru a reduce aceste informații. Deci aceste structuri se numesc haplotipuri. Și există metode moleculare. Sunt îngrozitor de scumpe să facă asta. Deci intră în cromozomi. Și rup cromozomul și revin la cromozomi separați. Și știi că unul vine de la mama ta și unul vine de la tatăl tău. Există metode stocastice pentru a face acest lucru, în care puteți încerca să vă dați seama făcând anumite presupuneri cum se transmit aceste lucruri la o populație. Care este distribuția unui întreg haplotip? Dar cel mai bun mod de a face acest lucru este să folosiți triouri și să încercați să ghiciți care este SNP-ul care vine de la mamă și care este cel care vine de la tată. Și așa că ceea ce fac oamenii acum este să dezvolte un lucru numit HapMap în care vom avea o hartă -- puteți accesa hapmap.org. Și veți găsi toate datele disponibile în prezent. Este sistematic. Acum rezoluția este de 30.000 de baze, 30 de kilobaze, o genotipizare sistematică a tuturor SNP-urilor pe o populație relativ mică . Sunt 33 de ani în care putem afla de fapt care sunt fazele -- faptul că una provine de la tată și de la mamă se numește faza unui genotip. Putem identifica fazele de la părinți. Și de ce faci asta? Ei bine, pentru că data viitoare când vrem să proiectăm un studiu genetic, nu trebuie să conduc studiul genetic și apoi să spun, o, aș putea genotipul pe acesta. De fapt, pot merge acolo, să văd că sunt interesat de această genă specială, să aflu care sunt SNP-urile pe care chiar am nevoie să le genotipez. Dar există și o veste și mai bună că, aparent, toate aceste lucruri merg împreună în linii mari. Deci, aceasta este o lucrare de acum câțiva ani în care ei arată că au realizat o hartă de înaltă rezoluție a unei regiuni a cromozomului patru asociată cu boala Crohn. Și ce au găsit în afară de lucrurile clinice, ceea ce au aflat este că această regiune este de fapt din punct de vedere evolutiv ruptă în 11 subregiuni. Aceste regiuni sunt stabile. Se transmit împreună, ca să spunem așa. Și sunt întrerupte din când în când de recombinarea regională [INAUDIBILĂ] . Și [INAUDIBIL] este că ei au descoperit că, dacă te uiți la toate aceste variații ale haplotipurilor alternative comune pe care le ai în populație, ele de fapt vin -- vezi diferitele culori? Ele provin de fapt din patru haplotipuri ancestrale care sunt recombinate. Au fost recombinate de-a lungul generațiilor. Deci, din nou, aceasta revine la întrebarea dvs. Nu sunt sigur că există, din punct de vedere fizic, nu există... vezi blocul mare de acolo la mijloc, 92 de kilobaze? Ei bine, nu sunt complet sigur că nu există un punct de recombinare foarte mare acolo. Dar pentru că toate provin din patru haplotipuri, fără altă variație, nu pot vedea nicio recombinare acolo, deoarece probabilitatea recombinării necesită un mic bazin pentru a pescui. Și în acest caz, se bazează pentru a pescui de la este foarte, foarte sărac. Inutil să spun că toți sunt caucazieni. Și toți provin de la această mână de indivizi. Deci, aparent, acești oameni vin cu toții -- sunt 129 de perechi SNP -- nu perechi SNP, triouri. Toate provin din patru haplotipuri ancestrale. Modul în care faci este să folosești... modul în care identifici acest bloc este să folosești modelele Markov. Voi vorbi despre modelele Markov săptămâna viitoare pentru metoda de învățare automată. Deci nu te voi deranja cu asta. Și în acest moment, ceea ce putem face odată ce avem aceste blocuri este să identificăm SNP-urile care etichetează acele blocuri și apoi să le rulăm. Și același lucru pe care l-am arătat este o economie exponențială cu lungimea. Deci este vorba de o medie de 10%. Dar dacă blocul tău este foarte mare, numărul de SNP-uri de care vei avea nevoie va fi mult mai mic de 10%. Și dacă este un bloc mic, numărul de SNP de care veți avea nevoie va fi un număr mai mare. Deci mesajul de a lua acasă, mesajul fundamental de a lua acasă pentru o clasă de medicină este că toată această tehnologie are aceste proprietăți frumoase de a afla lucruri. Dar singura modalitate de a afla aceste lucruri este să ai fenotipuri bune. Într-o zi, rularea unui SNP va costa 0,01 USD. Poate că va costa o zecime de cent... aproape nimic. Dar ceea ce face foarte prețios, ceea ce face posibile aceste studii, este faptul că aveți ceva de genul studiului [INAUDIBIL] pe care l-ați adnotat critic, ați înregistrat fenotipuri cu atenție și l-ați caracterizat frumos. Și aici intervine cealaltă parte a cunoștințelor medicale , nu pentru a afla care este cu adevărat cauza, ci doar pentru a identifica exact, cât mai clar posibil, un anumit fenotip. În acel moment, puteți mapa de fapt fenotipul. Dacă fenotipul tău este alunecos, da, ei bine, este foarte greu să găsești vreo asociere. Și dacă îl găsiți, probabil că nu va fi asociere cu lucrul pe care îl doriți, deoarece acesta va fi un alt fenotip, cel la care vă gândiți. Deci, lucrul critic aici nu este, să te întorci la primul diapozitiv, nu este chiar să faci genetică în sac de fasole. Adevăratul lucru critic aici este să existe un medicament bun care să fie capabil să caracterizeze fenotipurile care, la rândul lor, au permis realizarea acestor studii și să creeze explicații bune pentru aceste fenotipuri. Iar celălalt mesaj important este că bazat pe ipoteze este demodat. Nu mai avem nevoie de ipoteze. Cu suficienți bani, putem avea abilități. Avem intelectul. Și avem fenotipuri. Avem suficiente informații. Avem suficientă suc să mergem să ne luăm răspunsul fără să ne gândim la ei la duș, dar să ne uităm sistematic la genomul și să profităm de faptul că ceva este mai probabil cu altceva. Deci, dacă vă spun că ceva este asociat cu altceva și acesta este singurul meu studiu, vom avea nevoie de 10 ani înainte ca oamenii să poată consolida studiile într-un studiu de metaanaliza și să spună, o, dovezile nu sunt atât de mari. Dar dacă încep să vă spun, am analizat 500, sau 5.000, sau 50.000 de SNP-uri și iată că vine. Acest SNP este de un milion de ori mai probabil decât orice alt SNP să fie asociat cu acest fenotip. Aceasta este o măsură pe care nu o puteți obține dintr-un test bazat pe ipoteză . Deci, OK, atunci când veți fi recenzori de lucrări și granturi, de obicei susțineți oameni pentru că studiile lor nu sunt bazate pe ipoteze, amintiți-vă acest lucru. Ne vedem data viitoare--