JOEL HIRSCHHORN: Deci subiectul este practic complet -- titlul este Trăsături complexe, ce să crezi, care cred că încearcă să afle esenta unuia dintre mesajele principale de aici și să se încadreze în numărul de caractere alocat pentru titlul unei prelegeri. . Și, practic, are de-a face cu eforturile actuale în genetica umană pentru a înțelege rolul pe care variația moștenită a secvenței ADN-ului îl joacă în reglarea a ceea ce se numesc trăsături complexe. Și lasă-mă să trec prin toate astea. Deci, acesta este, practic, planul pentru discuție, cel puțin așa cum este acum, și vă oferă doar o mică introducere în trăsăturile complexe și bolile comune și modul în care acestea se relaționează între ele. Deci, iată o listă cu... o listă oarecum aleatorie de boli pe care le-ați putea vedea într-un spital sau în cabinetul unui medic și care reprezintă o mulțime de morbiditate și mortalitate. Și se dovedește că cele mai multe dintre aceste boli se grupează în familii în moduri care ne spun că genetica joacă un rol în reglementarea cine va și nu va afecta aceste boli. Același lucru este valabil și pentru lucrurile care nu sunt boli, ci sunt trăsături cantitative pe care le puteți măsura. Unii dintre aceștia sunt totuși factori de risc foarte semnificativi. Enumerez aici doar lucruri care sunt relevante pentru endocrinologie, care este unul dintre interesele mele. Dar lucruri precum tensiunea arterială, evident, dacă aveți hipertensiune arterială, acesta este un factor de risc uriaș pentru boli de inimă, accident vascular cerebral și cetera și cetera. Obezitatea crescută este un factor de risc uriaș pentru deces și diabet și boli de inimă, iar multe dintre aceste alte lucruri au de-a face și cu bolile viitoare. Și acestea, de asemenea, se grupează în familii în moduri care ne spun că genetica joacă un rol. Dar pentru toate acestea, fie că este vorba de susceptibilitatea la boli sau de trăsătura cantitativă ilustrată aici, înălțimea adultului, știm și din modul în care se grupează în familii că sunt implicate mai multe gene și, în plus, că influențele de mediu și alte influențe non-genetice trebuie să joace un rol important. rol de asemenea. Deci, aceasta nu este o imagine atât de simplă precum, de exemplu, încercarea de a trage în jos gena care este responsabilă pentru fibroza chistică sau pentru boala Tay-Sachs. Și astfel scopul pe care îl au mulți oameni din genetică este să încerce să facă această legătură. Există variații în genomul uman, despre care voi vorbi destul de pe larg. Și există variații pe care le observăm în lume. Și știm că există o legătură aici și este o chestiune de a face acea conexiune. Și dacă comparați genomul așa cum, din nou, voi ajunge în scurt timp, descoperiți că oamenii sunt în mare parte la fel. Dar există diferențe între fiecare persoană. Și din nou, cele mai multe dintre aceste diferențe sunt diferențe aleatorii de ortografie în codul genetic care nu au nicio consecință. Dar unele dintre ele au consecințe biologice. Din nou, provocarea este să ne dăm seama care dintre aceste diferențe contează. Așa că am spus că știm că genetica joacă un rol și vreau doar să intru pe scurt, de unde știm asta, de fapt? Deci o cale este de la ceva numit studii pe gemeni. Am uitat micuțul... acesta este de la un grup de muzică country cu care nu am nicio afiliere și nu am auzit niciodată numit Taylor Brothers, dar notabil pentru o parte din promovarea lor este că sunt gemeni identici. Și poți vedea lucruri de parcă arată la fel, au aproximativ aceeași înălțime. Nu sunt sigur dacă vă puteți da seama dacă au aceeași preferință în ceea ce privește îmbrăcămintea sau nu din asta. Dar ei pot avea unele din aceeași aptitudine. Deci și ceea ce poți face este să faci studii pe gemeni în care compari gemenii identici cu gemenii care sunt ceea ce se numesc gemeni dizigoți, în principiu, unde numiți în mod obișnuit gemeni fraterni. Dacă compari gemenii fraterni de același sex și gemenii identici, ei sunt, teoretic, crescuți în aproximativ aceeași cantitate de mediu comun. Deci amândoi sunt crescuți în aceeași gospodărie și asta e treaba. Dar gemenii identici, sau gemenii monozigoți, împărtășesc 100% din ADN-ul lor, în timp ce gemenii dizigoți au doar 50% din ADN-ul lor. Împărtășesc la fel ca și frații. Și așadar, dacă există lucruri care sunt mai concordante sau mai asemănătoare la gemenii monozigoți decât la gemenii dizigoți, concluzia obișnuită este că genetica joacă un rol în această similitudine. Deci, de exemplu, dacă te uiți la diabetul de tip 2, dacă te uiți la gemenii monozigoți și îi urmărești de-a lungul vieții, există cel puțin o rată de concordanță de 80%-- și unii oameni cred că este de fapt aproape de 100%-- . Ceea ce înseamnă asta este de fapt un fel de izbitor, ceea ce înseamnă că există un anumit set de genotipuri, care este incredibil de predictiv pentru apariția diabetului. Da multumesc. Îmi pare rău. Am găsit un... Am găsit un... Am găsit un mic cablu. Deci una corectă și una greșită. Deci sunt bine. În timp ce dacă te uiți la gemenii dizigoți, există multă concordanță. Și o parte din asta se datorează faptului că împart 50% din materialul lor genetic. Și o parte din asta se datorează probabil pentru că împărtășesc mediul pe care l-au împărtășit. Dar rata de concordanță este mult, mult mai mare pentru gemenii monozigoți. Deci asta spune că există o influență genetică puternică. Și poți face și alte studii care nu depind de studiile pe gemeni. Și puteți face, de asemenea, studii pe gemeni în care există gemeni monozigoți crescuți separat, dar aceștia sunt mult mai puțin frecventi. Dar, practic, studii de familie în care, dacă cineva are diabet, care este riscul pentru fratele lor de a face diabet, spre deosebire de riscul cuiva de lângă, de exemplu? Și din nou, este mult mai mare pentru frați decât pentru populația generală. Acest raport este ceva numit lambda S. Și puteți estima și ceva numit ereditabilitate, care se pretinde a fi procentul de variație care este atribuit factorilor genetici și de fapt anumitor tipuri de factori genetici. Deci asta este practic o introducere. Deci, cele mai comune boli sunt aceste trăsături genetice complexe în care știm că genele joacă un rol. Și știm, de asemenea, din acele studii de familie, ei nu se segregează doar într-un model simplu în care, dacă tatăl-- dacă tatăl o are, jumătate dintre copii o vor avea și apoi jumătate dintre copiii lor o vor avea, etc. și/sau într-un model recesiv simplu. Dar este clar multifactorial. Deci, următoarea secțiune este motivul pentru care credem că ar putea exista o legătură între variația genetică comună și aceste boli comune. Deci aceasta este o întindere a unui genom. Cred că am împrumutat asta de la David Altshuler sau Eric Lander. Nu sunt sigur. Și așa arată variația genetică. Deci aveți o perioadă lungă de timp aici. Și dacă comparați două întinderi luate de la oameni diferiți, veți descoperi că există un loc aici și un loc aici unde poate diferă. Și cele mai multe dintre aceste variante schimbă o singură nucleotidă sau o singură literă de ADN și se numește, prin urmare, Polimorfismul Single Nucleotide. Și înseamnă că multe forme, sau în acest caz, ar fi doar două forme, sau un SNP pe scurt. Și ceea ce ați putea găsi este că există această porțiune de ADN în care toată lumea este la fel. Și apoi la această nucleotidă, unii oameni au un C și alții un T. Și ceea ce vrem să știm este, dintre toate aceste variante genetice diferite, care vor fi cele care vor afecta lucrurile care ne pasă. despre? Așa că iată ceva de care ar trebui să fim pasionați cu toții în următoarele câteva luni, deci dacă ești fericit sau trist că A-Rod a mers la Yankees sau ceva de genul. Dar nu, serios, dacă acesta ar fi sănătos și bolnav, ca să nu spunem care este care aici, atunci am fi interesați să vedem care variante urmăresc împreună cu boala. Și acesta va fi esența generală a ceea ce oamenii încearcă să facă. Așa că am spus că există o legătură între variantele comune și boală. Și așadar, o întrebare este, de ce am putea fi interesați de variante comune? Și dacă te gândești bine , înainte de a începe, ce se știe până acum despre boala genetică? Ați putea spune, ei bine, acesta este locul greșit în care să căutați, deoarece dacă vă uitați la lucruri precum Tay-Sachs sau fibroza chistică, acestea sunt cauzate în mare parte de variante genetice care sunt destul de rare în populație. Sunt mutații dăunătoare severe care provoacă aceste boli grave. Deci, dacă acele boli genetice sunt cauzate de variante rare, de ce lucruri precum diabetul nu ar fi cauzate de variante rare? Și este o întrebare deschisă și voi intra în asta. Dar permiteți-mi să vă expun cel puțin o parte din fundal. Așa că ți-am arătat mai devreme că, dacă secvențiază o porțiune de genom și îți imaginezi că este vorba de aproximativ 1.000 de baze de la doi cromozomi diferiți - ar putea fi doi cromozomi de la aceeași persoană sau ar putea fi un cromozom de la cineva de aici și un cromozom de la cineva. în întreaga lume-- ai primi același răspuns mai mult sau mai puțin, adică, în medie, ai vedea că aproximativ 1 din 1.200 de baze ar fi diferite. Apoi, puteți pune întrebarea, ei bine, după ce am identificat aceste două alele, alela C și alela A, dacă apoi mă uit în aceleași 1.000 de baze de o mulțime de alți cromozomi, este că această alela A sau poate această alela C este doar un eveniment cu adevărat unic care este privat pentru unul dintre acești cromozomi? Sau văd ambele alele în întreaga lume? Și răspunsul, de cele mai multe ori, aproximativ 90% din timp, este că vedeți ambele alele în întreaga lume. Și ceea ce înseamnă asta este că cele mai multe dintre diferențele pe care le puteți găsi între doi cromozomi sunt explicabile sau atribuibile variației, acele variante care sunt comune, care sunt împărtășite în întreaga lume, care nu sunt ca mutațiile Tay-Sachs . Dar sunt de fapt variante vechi care s-au întâmplat cu mult timp în urmă și sunt prezente în mai multe populații din întreaga lume. Deci corect. Și practic asta spune. Și astfel acest lucru a condus la o ipoteză. Așadar, ipotezele sunt următoarele: în primul rând, că majoritatea variațiilor din genom sunt neutre din punct de vedere evolutiv. Acest lucru poate fi sau nu adevărat, dar, de fapt, dacă nu este, atâta timp cât nu este, majoritatea variațiilor sunt benefice din punct de vedere evolutiv. Suntem ok. Dar să presupunem că există un fundal pentru genom. Deci, aveți o tăietură care este la 22 kb distanță de cea mai apropiată genă și probabil că nu afectează deloc funcția acelei gene. Asa ca presupunem ca evolutiei nu i-a pasat in mod special de schimbarea de baza. Știm că cea mai mare parte a acestei variații, cea mai mare parte a variației de fundal este probabil ceea ce ați numi asta, mai degrabă decât neutră, se datorează acestor variante comune. Asta tocmai v-am arătat, că 90% din acea variație se datorează unor variante comune. Știm, de asemenea, ceea ce v-am spus cu boala Tay-Sachs , că trăsăturile sub selecție negativă se vor datora, de fapt, în mare parte unor variante rare. Și există o descriere frumoasă a motivului pentru care acest lucru ar trebui să fie adevărat într-un articol al lui Jonathan Pritchard. Dar există o ipoteză că trăsăturile care nu sunt sub selecție negativă sau cel puțin nu sub selecție negativă severă se vor datora de fapt unor variante care arată mai mult ca fundal, deci sunt variante comune. Și deci aceasta este ceea ce se numește ipoteza boală comună-varianta comună . Și una dintre cele mai puternice descrieri, aș spune, este o lucrare a lui Reich și Lander în Trends in Genetics, 2002. Și ideea de ce bolile comune ar putea fi ca... s-ar putea datora alelelor care nu sunt sub grave. selecția negativă merge așa. În primul rând, sunt de fapt comune. Deci, într-un anumit sens, sună tautologic, dar de fapt nu este. Ele nu pot fi atât de dăunătoare din punct de vedere evolutiv dacă sunt extrem de... dacă sunt extrem de comune. Deci acesta este un argument. A doua este că sunt multifactoriale. Deci, fiecare genă care contribuie la aceste boli comune contribuie de fapt doar puțin la susceptibilitate. Iar aceasta va fi o temă care va trece prin toată această discuție. Deci, chiar dacă ar fi o... chiar dacă ar fi oarecum dăunătoare din punct de vedere evolutiv, fiecare alelă individuală ar contribui doar cu o mică parte din aceasta. În al treilea rând este că adesea tind să apară întârziere sau după vârsta reproductivă. Deci, din nou, evoluției îi pasă mai puțin de chestii de genul ăsta. Deși, nu știm. Poate fi bine să-l fi avut pe bunicul tău în Africa acum 50.000 de ani. Deci s-ar putea ca bolile cu debut tardiv să fie rele. Un alt lucru este că s-a emis ipoteza că unele dintre aceste boli, cum ar fi hipertensiunea sau diabetul, au de fapt ceea ce se numește selecția de echilibrare, și anume că da, îți dau diabet la sfârșitul vieții, dar motivul pentru care îți dau diabet este pentru că te ajută să faci. tine mai bine caloriile. Așa că asta îți dă obezitate acum când avem McDonald's în preajmă. Dar acum 100.000 de ani, când mâncarea era rară, poate că era foarte bun. Există ceva numit ipoteza genei economiei. Deci, pentru hipertensiune arterială, poate că era bine să te ții de sare dacă locuiești într-un deșert, așa ceva. Deci, dacă căutăm o variație comună sau ne gândim că acesta poate fi un loc bun pentru a căuta variantele genetice care stau la baza bolii comune - și din nou, această ipoteză nu spune că variația rară nu va contribui, de asemenea, la boala. Spune doar că o variație comună va face parte din contribuabili. Deci, dacă îl căutăm, s-a estimat că există aproximativ 10 milioane de SNP-uri comune în care ambele alele se găsesc la mai mult de 1% în populația generală. Aproximativ 6 milioane dintre acestea sunt deja în baze de date. Deci, de fapt, este cea mai-- o parte bună care a fost găsită. Și după cum veți vedea, există multă redundanță între SNP-uri. Deci, probabil, o parte foarte mare a variației, o variație comună a genomului, a fost catalogată, ceea ce este un lucru remarcabil. Când am început în acest domeniu nu cu mult timp în urmă, cred că în urmă cu șase ani , a apărut o lucrare care a apărut din laboratorul Lander, care este un tur de forță masiv, catalogând 2.000 de SNP-uri de-a lungul genomului. Și acest lucru a quintuplicat numărul de SNP-uri care au fost cunoscute. Și așa este acum... de 3.000 de ori mai multe acum, doar în ultimii șase ani. Și toate acestea le puteți găsi pe site-uri web precum dbSNP sau UCSC Genome Browser, iar CBI are un browser pentru genom. Și toți sunt acolo. Deci, aceasta este o captură de ecran din browserul UCSC Genome. Fiecare dintre aceste linii mici este un SNP. Și probabil că acesta este deja depășit, deși l-am luat nu cu mult timp în urmă de acolo. Și aceasta este doar într-o genă, fiecare dintre acestea sunt... pe fiecare dintre aceste două coloane este un SNP. Deci, dacă vrem să folosim acest catalog de variații comune pentru a încerca să găsim alelele responsabile de boală, cum putem face asta? Ei bine, o modalitate ar fi de fapt să încerci să studiezi fiecare variantă sau cel puțin fiecare variantă comună. Acest lucru ar fi grozav. Ar fi o căutare imparțială a întregului genom, practic a întregului univers de variație comună. Și asta ar fi grozav dacă am putea face asta, dar nu este practic în prezent. 10 milioane de oameni... scuze, 10 milioane de variante. Și așa cum vă voi arăta, aveți nevoie de multe mii de oameni pentru a face asta. Deci, de fapt, funcționează pentru sute de miliarde de genotipuri. Deci este ceva de genul bugetului Pentagonului sau ceva pentru un an pentru a face un studiu. Deci NIH nu-i plac astfel de granturi. Deci, practic, până când acest lucru devine mult mai ieftin și/sau aplicăm unele dintre comenzile rapide despre care vă voi spune, trebuie să alegeți ce gene și variante vom studia. Deci, aceasta aduce în metode de găsire a trăsăturilor. Aveți întrebări până acum? Așa că suntem pe cale să încercăm să găsim care dintre aceste variante comune ar putea contribui la boli comune. Deci, într-adevăr, trei abordări, dintre care două au de-a face cu variante comune și una care are de-a face în mod explicit cu variante rare. Și voi ajunge la asta la final. Deci abordarea tradițională de a găsi gene pentru boală a fost de fapt ceva numit legătură. Nu știu. Băieții au făcut legături? Este ceva ce s-a făcut aici? Da? Nu? Așa că voi trece pe scurt prin legătură. Prin urmare, legătura necesită familii în care , în caz de boală, aveți mai multe rude afectate în aceeași familie. Deci aceia ar putea fi frate/sora, sau ar putea fi veri sau un unchi și o nepoată sau ceva de genul ăsta. Și ideea este că există o singură alelă care cauzează boli care segrega acea familie. Așa că este transmis unora dintre persoanele din familie și nu altora. Și cealaltă presupunere este că boala va mai mult sau mai puțin -- nu trebuie să fie perfectă, dar trebuie să fie destul de bună -- se va urmări mai mult sau mai puțin cu acea alela. Acum, pentru legătură, nu tastezi de fapt alela în sine. Ceea ce faci, tastezi markeri care înconjoară alelele. Deci s-ar putea să fie la câteva milioane de baze distanță, de fapt. Și acesta este un lucru obișnuit despre markeri distanțați la fiecare 10 milioane - la fiecare câteva până la 10 milioane de baze. Și ideea este că, din moment ce doar cauți într-o familie, se dovedește că un milion de baze este ceea ce se numește un centimorgan, ceea ce înseamnă că evenimentele de recombinare au loc o dată la fiecare sută de meioză. deci în câțiva centimorgani, în general, nu vor exista evenimente de recombinare în cadrul unei familii. Deci, markerul care se află la câteva milioane de baze distanță va călători cu alela bolii în familie. Deci folosești acel marker ca surogat pentru alela bolii și urmărești markerul prin familie. Și spui care dintre acești markeri. Deci, dacă acest marker călătorește cu boală, spui că poate este destul de aproape de alela bolii. Dar un marker pe alt cromozom nu se va separa cu boala. Deci veți spune că regiunea nu este legată. Deci asta e legătura, practic. PUBLIC: [INAUDIBIL] JOEL HIRSCHHORN: Așadar, în mod tradițional, au fost microsateliți, care sunt markeri care sunt lucruri ca repetiții ale secvenței TATATATATA, iar unii oameni au... ADN polimeraza nu le place să le copieze foarte bine. Deci unii oameni au 50 de copii, alții au 44, alții au 53, așa ceva. Și le poți tasta. Sunt o durere în fund cu care să lucrezi, de fapt. Și astfel oamenii se schimbă, încep să utilizeze analiza de legături bazată pe SNP. Pentru că tot ce ai nevoie este practic un marker care să îți permită să distinge fiecare dintre cromozomii care se segregă în familie. Deci, probabil, microsateliții sunt... va... va avea loc o schimbare. Dar a avut un succes extraordinar pentru tulburările cu o singură genă. Și motivul pentru care a avut succes este pentru că există întotdeauna o singură copie într-o familie a alelei bolii, iar segregarea cu boala și acel marker este într-adevăr foarte bună, deoarece dacă aveți alela care cauzează boala , obțineți boală și dacă tu nu, nu ai. Deci, pentru bolile comune, niciunul dintre aceste lucruri nu este adevărat. În primul rând, deoarece sunt implicate mai multe gene, este posibil să nu aveți alela care cauzează boala, dar să obțineți boala oricum și invers. S- ar putea să aveți alela de susceptibilitate la boală, într-adevăr ar trebui să fie numită și să nu obțineți boala. Și, în plus, ar putea exista mai multe - deoarece ar putea fi o variantă comună, de fapt ar putea exista mai multe copii ale alelei de susceptibilitate care călătoresc în aceeași familie. Așa că markerii care sunt la câteva milioane de baze distanță acum nu mai marchează perfect alela de susceptibilitate la boală pentru că poate de această parte a familiei, este marcată de... călătorește cu acest marker, această alela. Dar apoi în această parte a familiei, unde se segregă, călătorește cu un marker diferit. Deci toate aceste lucruri conspiră împotriva ta pentru boli comune. Cu toate acestea, oamenii au găsit câteva lucruri prin legătura dintre bolile comune și le-au găsit. Genetica DeCODE din Islanda este probabil cel mai prolific exemplu în acest sens. Deci, dacă legătura nu funcționează, ne aduce la cealaltă abordare principală care este folosită, despre care voi petrece o mulțime de discuții, deoarece este metoda principală. Se numește studii de asociere. Și, practic, ceea ce înseamnă asta este că, în loc să cauți prin întregul genom, alegi gene candidate. Și Rich și [INAUDIBLE] au arătat că acest lucru este mult mai potrivit decât legătura cu acest scenariu în care aveți alele comune care au doar efecte modeste asupra bolii, ceea ce se numește penetranță modestă. Și apoi există o altă abordare pe care oamenii o adoptă, și anume ei spun: OK, înțeleg că legătura ar putea să nu fie cea mai bună cale de a merge. Dar nu cred chestia asta cu variantele comune. Vreau să caut variante rare care contribuie la boală. Și, așadar, ceea ce faci este că, din nou, alegi genele pe care să le vezi. Dar, în loc să scoată doar SNP-urile de pe harta publică și să caute variații comune, acestea sunt de fapt resecvențiere pentru a încerca să găsească acele variante rare care sunt prezente numai în boli. Și cele mai bune exemple în acest sens sunt BRCA1 pentru cancerul de sân, care de fapt a fost identificat inițial prin legătură, dar aceasta este o boală rară, precum și mutațiile MC4R. Aceasta este o genă a receptorului melanocortin-4, în care există o mulțime de variante rare care contribuie la debutul precoce, în special la obezitatea severă. Dificultatea cu această abordare în acest moment este că este foarte scumpă. Este mult mai costisitor să resecvențezi decât să faci genotiparea polimorfismelor. Și dacă cheltuiala ar fi inversată, oamenii ar face probabil această resecvențiere, deoarece asta vă aduce și variantele comune. Și este într-adevăr doar... este în mare parte o problemă de cheltuieli că nu putem face asta. Așa că am vorbit despre studiul care ar lua doar bugetul Pentagonului. Dacă ar fi să faci asta, probabil că ar lua PIB-ul pentru istoria Statelor Unite sau ceva de genul acesta. Deci suntem încă la o distanță de asta. Publicul: Totuși, asta contravine întregii ipoteze, [INAUDIBIL] JOEL HIRSCHHORN: Da. Deci spun doar că dacă alegi să... nu vreau să spun că ipoteza a fost dovedită. Cred că variantele comune contribuie la boala comună. Există încă oameni care cred că acest lucru nu este deloc adevărat și că, într-adevăr, acesta este singurul lucru care va aduce vreodată ceva este să caute variante rare. Deci și cu siguranță există câteva cazuri în care acest lucru a fost adevărat. Și acest lucru într-adevăr nu a fost explorat în nicio măsură doar pentru că este atât de scump. Și l-am pus acolo doar pentru că, dacă dintr-o dată, ai secvența genomul cuiva pentru 100 de dolari ar fi fezabil, ai lua 1.000 de oameni cu diabet și le-ai secvența genomurile. Și așa ar fi modul în care faci experimentul. Deci, de aceea este acolo. Deci aceasta este o versiune de desene animate a ceea ce tocmai v-am spus. Analiza legăturii vă permite să căutați întregul genom și vă indică o regiune, deși nu vă indică gena. Așa că nu uitați, acești markeri sunt la 10 milioane de baze unul de celălalt. Și, de fapt, din cauza unor capricii ale geneticii trăsăturilor complexe și a motivelor pentru care legătura nu este atât de potrivită, de obicei obțineți o regiune de aproximativ 20 de centimorgan sau aproximativ 20 de milioane de baze, care poate avea aproximativ 200 de gene în ea. . Și va spune undeva în acele 200 de gene, există ceva care contribuie la boală. În timp ce asocierea, cauți câte o genă la un moment dat, deci nu... dar trebuie să ghicesți corect unde să mergi. Și așa că trebuie să... deci aici este acest car de fân de 30.000 de gene sau 30.000 de paie. Și poți să scoți unul și să spui, este un pai sau un ac? Nu, este un pai. Următorul. Și uite. Și, evident, succesul depinde de faptul că poți ghici corect. Dar noi, de fapt... cel puțin pentru prima dată, știm ce sunt cele 30.000 de pai. Deci acum există un site web cu întregul genom pe el. Și devenim destul de buni, așa cum vă spun, să spunem dacă lucrurile contribuie real la boală sau nu. Dar această interpretare a faptului că acesta este un pai sau un ac va fi punctul central al multor discuții, deoarece acesta este studiul pe care mulți oameni îl fac este că aleg o genă și o testează și o pretind. are sau nu un rol în boală. Și vreau doar să vă ofer un pic de sofisticare în citirea unor astfel de studii pentru a încerca să spuneți că ar trebui să credeți tot ceea ce citiți? Răspunsul evident este nu. Dar așa este un studiu de asociere. Vă puteți imagina că ați avut persoane sănătoase și persoane cu boala Alzheimer. Și există o variantă comună în gena APOE numită APOE4. Codifică apolipoproteina E. Și este o variantă comună pentru că dacă te uiți în populația de control, vei vedea că este acolo aproximativ 10% din timp, ceva de genul ăsta. Dar dacă te uiți la persoanele cu boala Alzheimer, vei vedea că frecvențele au crescut de aproximativ trei ori. Și deci aceasta este... aceasta este paradigma pentru asocierile de boli comune și variante comune, și acest lucru a fost văzut din nou și din nou. Te uiți la aproape fiecare studiu care a fost făcut, vezi această creștere a riscului. Da. PUBLIC: Îmi pare rău. JOEL HIRSCHHORN: Nu, nu. Sigur. PUBLIC: Ar trebui să... De asemenea, te-ai uitat, evident, [INAUDIBIL] JOEL HIRSCHHORN: Da. Deci, de fapt, da. Deci, există un pic de subtilitate chiar și în această asociere. Așa s-a văzut și în alte etnii. Se pare... deși, ultima dată când m-am uitat la asta, datele nu erau suficient de puternice pentru a spune că a existat cu siguranță o diferență. Dar se pare că asocierea cu boala Alzheimer ar putea fi puțin mai slabă în populațiile africane. Ar putea exista o mare varietate de motive pentru care acest lucru este adevărat și voi trece prin câteva dintre ele doar în general. PUBLIC: Pentru că există mai puțin [INAUDIBIL] ca dacă tocmai ai făcut asta pentru toți indivizii -- dacă ai făcut asta [INAUDIBIL] JOEL HIRSCHHORN: Nu. Deci rata, frecvența APOE4, în acest caz, nu variază de fapt atât mult la nivelul populaţiilor. Este o alelă veche. Unele alele o fac, iar tu intri în ceva numit amestec etnic, la care cu siguranță voi ajunge în scurt timp. Deci, așa cum am spus, trebuie să ghiciți corect. Deci, există o problemă cu ce gene ghiciți? Și în mod ideal, din nou, cineva ar dori să le facă pe toate. Și este din ce în ce mai aproape să poți face asta, dar... da? PUBLIC: Persoane cu exemplul BCRA1, când luați studiul de legătură și găsiți acea regiune care pare a fi legată... JOEL HIRSCHHORN: Deci, acesta este cu siguranță un lucru pe care l-ați face. Așa că până în acest an a fost destul de greu să faci asta. Deci ai 200 de gene. Și să parcurgeți temeinic o genă și să vă uitați la toate cele 200 dintre ele a fost ceva care practic nu a fost la îndemână. Deci, ca să vă dau un exemplu, cred că tocmai am primit finanțare pentru a face exact asta pentru un vârf de legătură cu obezitatea. Și nu am fi putut să scriem să facem asta ca parte a unui grant obișnuit de tip R01. Nu am fi putut scrie un R01 pentru a face asta acum un an. Pur și simplu a fost prea scump și prea greu. Sunt doar informații despre ce variante să tastați și voi trece, din nou, folosind haplotipuri și chestii de genul ăsta pentru a face asta. Informațiile pur și simplu nu erau acolo, iar cheltuielile erau prea mari. Dar da, sunt de acord. Aceștia ar fi primii candidați. Așa că ați folosi informații din studiile de legătură. Și ați putea spune doar, nu-mi pasă de nimic altceva din ce spune cineva. Am de gând să iau legătura. Dacă trăsătura ta complexă sau boala ta obișnuită are norocul să aibă un vârf de legătură pe care îl crezi, ceea ce nu este adevărat pentru majoritatea dintre ei, de fapt, dar pentru unii dintre ei este, ați spune, acestea sunt cele mai bune 200 de gene. Mă duc după acelea. Aceasta este cu siguranță o abordare. Ai putea spune, ei bine, legătura nu este foarte bine alimentată pentru boala comună. Probabil că majoritatea genelor nu se află sub vârfurile de legătură. Și majoritatea genelor aflate sub vârful de legătură nu sunt cele potrivite. Așa că o să ignor asta. Voi alege lucruri care... Voi spune că 100 de ani de cercetare au însemnat ceva. Și dacă studiez diabetul, voi face calea de semnalizare a insulinei și funcția celulelor beta și genele de diferențiere a celulelor grase obez și chestii de genul ăsta, iar acestea sunt genele pe care o să merg. Sau ați putea spune, ei bine, aceasta este doar știință pentru lampă pentru că este biologia pe care oamenii o fac. Și acesta nu este foarte puternic, dar acesta este un instrument la nivelul întregului genom. Putem folosi analiza expresiei, așa că cercetăm toate genele, găsim lucruri care sunt exprimate la diferite niveluri în boala față de oameni sănătoși și spunem că unele dintre acele modificări sau multe dintre aceste modificări ar putea fi secundare stării bolii. Poate că unele dintre acestea reprezintă o variantă de reglementare primară care afectează boala. Și așa mă duc să le caut. Și ceea ce încercăm să facem și ceilalți oameni încearcă să facă este că, de fapt, cele mai interesante gene sunt probabil cele care se întâmplă să cadă aici, deși nu se spune că trebuie să cadă în această intersecție. Poate cad aici sau acolo sau acolo sau chiar doar unul dintre acestea sau în universul exterior cu totul. Dar vă voi da doar un exemplu pentru diabetul de tip 2 doar pentru că de fapt facem acest gen de lucruri. Deci există sute de ani de biologie sau 100 de ani de biologie probabil pe diabet, o mulțime de modele de șoareci, tulburări de o singură genă care provoacă boala. Deci asta e altceva. Dacă variația severă provoacă o formă severă a bolii, poate variația ușoară provoacă o formă cu debut tardiv. Deci poți... există o listă de gene acolo. Deci, pentru diabet, acesta este unul dintre acele lucruri în care într-adevăr nu există un vârf de legătură perfect de sub. Grupul lui Graeme Bell a identificat gena Calpain-10 mergând sub un vârf în care au avut o legătură semnificativă. Deși, dacă ai pune de fapt toate dovezile legate de legături de la toată lumea, nu ai fi spus că există vreo legătură semnificativă cu diabetul acolo. Această asociere este probabil adevărată, dar nu... așa că poți face asta, dar nu este sfârșitul. Și apoi au existat studii de exprimare în diabet care au indicat o cale de fosforilare oxidativă. Așa că unii colegi de-ai mei, [INAUDIBLE], David Altshuler, [INAUDIBLE], Cecilia Lindgren și alții, precum și o lucrare de la Nick Joselyn. Mary Elizabeth Patty a arătat spre acea cale. Și există gene care sunt de fapt în această zonă roșie, câteva dintre ele. Așa că mergem după acele gene, de exemplu. Deci, asta înseamnă alegerea genelor și este mai mult o... în acest moment, mai mult o formă de artă decât orice algoritm computerizat pentru a face asta. Deși, chiar dacă obțineți toate informațiile într-un singur loc, unde puteți chiar să faceți interogări despre ce gene se află sub vârful de legătură, ce gene sunt exprimate diferențial, ce gene sunt în căi cunoscute, acestea sunt de fapt instrumente pe care doar încercăm să le dezvoltăm. . Deci care gene și apoi ce variante? Deci, în mod ideal, aveți alela care cauzează boala în mână și o genotipați și o testați pentru că sunt markerul pe care îl testați, spre deosebire de a fi la distanță, este perfect corelat cu variantele. . Asta e situatia ideala. Și asta înseamnă că poate ar trebui să ne concentrăm cu adevărat eforturile pe găsirea variantelor care sunt cel mai probabil să fie funcționale, atât de similar cu modul în care ați putea încerca să găsiți genele care sunt cele mai probabile să fie responsabile. Deci cele mai evidente lucruri sunt variantele missense. Și acestea sunt ușor de recunoscut. S-a arătat că, dacă te uiți la ei... sunt mult mai rare decât ar trebui să fie, ceea ce înseamnă că evoluția s-a preocupat de ei pentru a le suprima. Atât de multe dintre ele sunt de fapt ușor dăunătoare. Poate că nu sunt dăunătoare severe, dar poate că acesta este doar echilibrul potrivit pentru a provoca o boală comună. Și chiar dacă faci variante rare, poți să le recunoști și să le grupezi și să le studiezi ca o clasă, dacă vrei să spui... dacă ai modelul că variantele rare provoacă boli. Deci, dar știm, și există o mulțime de cazuri acum, în care varianta care a fost identificată în cele din urmă este de fapt pentru o trăsătură complexă nu a fost o variantă greșit. A fost o variantă de reglementare care afectează nivelul genei, dar nu și structura proteinei pe care o codifică. Există un exemplu grozav din diabetul de tip 1 din grupul lui John Todd și alții în care a existat o variantă greșit despre care se credea că este varianta potrivită, dar apoi au făcut un studiu imens și au arătat că, de fapt, toată asocierea pe care au văzut-o cu varianta missense a fost de fapt explicată de ceva în UTR 3 prime și a afectat nivelul genei. Deci întrebarea este, ei bine, acestea sunt greu de recunoscut. Există o mulțime de variații la care nu avem idee cum să ajungem. Deci, motivul pentru care putem recunoaște variantele greșite este că cunoaștem codul genetic. Au spart asta la scurt timp după DNA. Dar nu cunoaștem codul de reglementare. Deci, există un efort acum pentru a încerca să descifram, în esență, codul de reglementare, folosind mai multe specii și făcând comparații. Deci asta e din grupul lui Eddie Rubin. Acesta este un site grozav. Se numește browser ECR. Și puteți vedea, ceea ce vedeți aici sunt regiuni care sunt de fapt conservate evolutiv între specii și, prin urmare, pot fi importante. Evoluţioniştilor le-a păsat din nou de ei. Deci ele pot fi regiuni de reglementare importante. Și există o rezervă experimentală pentru acea ipoteză. Deci, practic, asta ar sugera că ar trebui să-- și [INAUDIBLE] să fi sugerat această abordare, cel puțin pentru variantele greșite, că ar trebui să reordonăm regiunile vizate, să încercăm să găsim fiecare variantă care este acolo și să ne asigurăm că le introducem pe toate. . Și din nou, problema este că resecvențarea este costisitoare. Dar s-ar putea să nu avem varianta cauzală în mână dacă nu trecem prin această abordare sau dacă ne pricepem prost să ghicim care sunt variantele de reglementare. Deci ar trebui să încercăm să înțelegem și corelația dintre variante. Am făcut aluzie la faptul că SNP-urile sunt redundante între ele. Deci, dacă aveți varianta cauzală care nu a fost genotipată, trebuie să deduceți efectul acesteia prin genotipizarea SNP-urilor vecine. Și astfel trebuie să fie corelate sau ceea ce se numește în dezechilibru de legătură cu varianta cauzală. Se pare că de multe ori este adevărat. Deci, așa arată genomul de cele mai multe ori sau cea mai mare parte a genomului, unde diapozitivul pe care v-am arătat-o ​​înainte, imaginați-vă că este acum micșorat. Căutăm acum 30.000 de baze ale unui grup de cromozomi diferiți. Ceea ce vedeți este că dacă aveți un C aici și un C aici, puteți prezice că veți avea un G aici, un C aici, un A aici și un C acolo. Și aceste modele de alele se numesc haplotipuri. Și în cea mai mare parte a genomului, există aceste blocuri de corelație sau blocuri de dezechilibru de legături unde există doar câteva haplotipuri comune. În acest caz, există roșu, albastru și galben. Și ocazional, există o amestecare prin recombinare. Acestea au fost identificate pentru prima dată de Mark Daly și colegii din genetică, iar apoi acest lucru s-a dovedit a fi adevărat la scară la nivel de genom cu Stacey Gabriel și colab. Și motivul pentru care acest lucru este util este că, dacă există un polimorfism cauzal, dar nu unul pe care l-ați tastat, îl puteți prezice destul de bine de către markerii vecini. Deci, dacă aveți un C aici și un A aici, atunci probabil că aveți acest polimorfism cauzal. Vă voi explica pe scurt. Dar voi trece puțin peste asta, doar gama de cum arată aceste modele. Există o măsură a corelației, care nu este important de înțeles, numită D prim. Practic, roșul înseamnă că SNP-urile sunt corelate între ele, iar orice altă culoare înseamnă că nu ești sigur dacă sunt. Și vă voi arăta un mic diagramă ca acesta, unde acestea sunt datele pentru markerii 1 și 2 și acestea sunt datele pentru markerii 3 și 5. Și așa arată blocurile, unde vedeți o grămadă de roșii. triunghi aici, ceea ce înseamnă că toți markerii de la 1 la 6 sunt corelați unul cu celălalt. Și apoi aici, 8 până la 13 sunt toate corelate între ele. Și asta corespunde existenței a două blocuri de dezechilibru de legătură. Și din nou, din Gabriel, et al. hârtie, dacă te uiți, concentrează-te doar pe figura din dreapta, într-o populație europeană sau asiatică, de exemplu, peste aproape 40% din genom se găsește în blocuri de peste 50 kb, iar dimensiunea medie a blocului este de aproximativ 22 kb. Deci, în medie, dacă te uiți în genom, există această corelație care se extinde pe zeci de mii de baze de ordinul mărimii unei gene, deși nu se corelează neapărat perfect cu genele. Și în acele blocuri, așa cum v-am arătat cu acel model roșu, albastru și galben, sunt prezente doar câteva haplotipuri comune, deci de ordinul a trei până la patru pentru populațiile non-africane și încă unul sau două pentru populațiile africane. Și ei explică marea majoritate a cromozomilor din acea populație. Și, în plus, haplotipurile în sine sunt în general partajate, iar africanii au puțin mai mult. Și asta pentru că atunci când oamenii au apărut din Africa, doar un subset al diversității geniculate a mers cu ei. Deci Africa este de fapt un continent mai divers decât este restul lumii. Și nu voi trece prin motivele pentru care există blocuri, dar, practic, are de-a face cu natura recombinării, faptul că există puncte fierbinți de recombinare și această apariție - acest model din Africa. Și asta a condus la o propunere prin care, practic, dacă puteți recunoaște aceste modele roșii, albastre și galbene, puteți identifica apoi câteva SNP-uri etichetate, în acest caz, două, care disting acele modele. Deci, dacă ai varianta roșie, ești... dacă ai varianta pentru eticheta SNP 1, ești roșu, dacă ai varianta pentru eticheta SNP doi, ești galben și dacă nu ai nici una varianta, trebuie sa fi fost albastru. Și, deci, asta înseamnă că, dacă puteți introduce suficienți markeri pentru a distinge aceste modele, atunci puteți identifica aceste etichete SNP. Și asta reduce foarte mult efortul de care aveți nevoie pentru a acoperi o regiune. Și deci acesta este scopul hărții haplotipului uman , care este în curs de desfășurare. Este un proiect internațional de 100 de milioane de dolari . Practic, este să tastați aproximativ un milion sau mai mulți markeri în trei populații de referință diferite -- european-american, vest-african și apoi est-asiatic, care este japoneză și chineză. Și puteți accesa site-ul web al hărții hap sau puteți vedea această descriere a naturii. Dar scopul său este să identifice toate aceste SNP-uri etichetate. Și astfel abordarea ar fi, practic, să luați SNP-urile din baza de date, să genotipați aceste SNP-uri în panouri de referință, să măsurați dezechilibrul legăturii și apoi să identificați SNP-urile etichetelor, apoi să le selectați și apoi să luați acele SNP-uri și să le introduceți în populație. Așa s- ar fi înființat, în 2004, să facă un studiu de asociere, în care să alegi gene. Ai înțelege structura haplotipului. S- ar putea chiar să faceți niște resecvențieri pentru a vă asigura că aveți toate variantele missense. Și apoi ați lua un set, un subset de variante și le-ați introduce în populații și ați face studiul de asociere. Problema este că, după ce ai făcut toată munca pentru a configura acest lucru, faci o asociere, o publici și găsești că este foarte dificil pentru altcineva să o reproducă. Deci a fost multă muncă degeaba, nu? Așa că am vrut să înțelegem, dacă vom încerca să folosim asta ca un instrument, ei bine, de ce nu sunt reproduse studiile de asociere? Și chiar există trei explicații posibile. Una dintre ele ar putea fi false pozitive. Deci, când ți-ai făcut asocierea, a fost pur și simplu greșit. Poate ați testat o mulțime de gene și ați testat o mulțime de variante și o mulțime de gene și, întâmplător, ați obținut o valoare p de 0,01. Așa că mergi înainte și îl publici. Și a fost doar pentru că ai aruncat o monedă de câteva ori și ai primit un șir de... ai avut o serie de capete. Nu înseamnă că moneda are două capete. Ar putea însemna că, de fapt, ai avut dreptate, dar atunci oamenii care au venit după tine aveau studii mici, mici, și căutau un efect modest și pur și simplu nu aveau suficientă putere. Deci de fapt a fost... moneda a fost nedreaptă. Așa că iese cu capul mai des decât cu cozile, dar ei l-au răsturnat doar de cinci ori și a venit în sus-- sau l-au răsturnat doar de șase ori și a venit cu capul de trei ori și cozile de trei ori. Acest lucru este echivalent a face un studiu cu nu foarte mulți oameni. Deci este doar o lipsă de putere. Și atunci ar putea exista diferențe adevărate între populații, astfel încât markerul să fie într-adevăr asociat cu boala în populația dvs., dar nu în populația pe care a studiat-o altcineva. Așa că ne-am propus să trecem în revistă literatura studiului asociației și să spunem, ei bine, ce explicații se întâmplă de fapt aici? Și am identificat, din 2000 sau 2001, puțin peste 600 de asocieri între variante comune și boală. Și sunt mult mai multe decât asta acum. Au fost 166 care au fost studiate de cel puțin trei ori, așa că ajungem să înțelegem reproductibilitatea lor. Și primul lucru pe care l-am observat, dintre cele 166, doar 6 erau de fapt reproductibile în mod constant. Deci doar 6 au fost văzute 3/4 din timp. Deci ai putea spune, ei bine, asta este pur și simplu groaznic. Aproape toate asociațiile nu sunt cu adevărat reproductibile. Sau ai putea spune, ei bine, de fapt, ai testat doar 166 de lucruri. Ai găsit 6 adevărate. Asta e destul de bine. Există 10 milioane de lucruri de testat acolo. Deci acestea sunt cele 6. Și una dintre ele este această paradigmă pe care v-am arătat-o, APOE4. Apoi sunt lucruri precum CCR5-delta32, CTLA-4. Interesant, aceasta este varianta aia missense despre care v-am spus că de fapt acum ar trebui corectată la 3 prime UTR. Deci, deși nu aveau varianta potrivită, era totuși destul de reproductibilă. Factorul V în tromboza venoasă profundă și alții. Și există mai multe pe această listă acum, deși nu multe, care sunt atât de reproductibile în mod constant. Deci ce zici de celelalte 160? Sunt doar o prostie totală, sau ce? De ce sunt... de ce nu sunt reproductibile? Ei bine, următorul lucru pe care l-am observat a fost că dintre cele 160, 91 dintre ei au fost de fapt văzuți de mai multe ori, deci nu doar de persoana care le-a raportat, ci și de altcineva. Și asta a sugerat că poate se întâmplă ceva real , dar am vrut să privim asta într-un mod mai formal. Și pentru a face asta, practic, am ales 25 din aceste 160 de asociații pentru unele boli la care ne păsam și altele la întâmplare. Și am scăpat de prima persoană care a raportat-o. Și am spus, dintre toți ceilalți oameni care au încercat să o reproducă, cât de bine s-au descurcat? Deci au fost 301 studii pentru aceste 25 de asociații. Și dacă toate aceste 25 de asocieri ar fi incorecte, ne-am aștepta ca studiile ulterioare, teoretic sau naiv, să fi -- 5% dintre ele ar fi, din nou, să fie semnificative statistic cu o valoare p de 0,05. 1% ar fi trebuit să aibă o valoare p de 0,01, etc., etc. Deci ce am văzut? De fapt, am descoperit că aproximativ o cincime dintre ei aveau valori P mai mici de 0,05. Deci, acesta este mult mai mult decât v-ați aștepta. Acest lucru nu este doar întâmplător. Și încurajator, majoritatea asociațiilor au fost în aceeași direcție. Deci a fost aceeași alele care a fost asociată cu boala ca și în raportul original. Deci, de fapt, asta s-ar întâmpla nu de 1 din 20 de ori, ci de 1 din 40 de ori. Și, în plus, nu a fost că fiecare dintre cele 25 a avut câteva replicări. A fost că a existat o subfracție a acestora care a avut o mulțime de replicări, iar apoi restul nu au mai fost văzute niciodată. Deci, ați putea spune, ar putea fi aceasta părtinire de publicare? Deci, evident, am putut să ne uităm doar la rapoartele care au fost publicate. Așa că s-ar putea să fie mulți oameni care făceau aceste studii și când au obținut o valoare P mai mică de 0,05, au spart șampania, au sărbătorit și au trimis jurnalul - au trimis raportul la jurnal. Dar poate dacă au făcut-o și valoarea p nu era peste 0,05, a zăbovit în sertarul biroului. Și acesta este de fapt numele oficial pentru chestia asta. Este fenomenul sertarului biroului. Și așadar, ceea ce am întrebat a fost, ar putea exista un univers de studii nepublicate care să zăbovească în sertarele birourilor din întreaga lume, care să explice de ce am văzut atât de multe dintre aceste studii? Câte studii nepublicate ar trebui să facem ipoteza pe asociere pentru a explica fracția pe care am văzut-o? A fost unul, două sau trei, sau a fost doar un număr ridicol de studii? Și s-a dovedit, de fapt, că ar trebui să postulezi un număr ridicol de studii pentru a explica aspectele pozitive pe care le-am văzut. Ar trebui să explicați, eventual, aproximativ 40 până la 80 de studii negative nepublicate care zăbovesc în sertarele biroului din întreaga lume. Și pur și simplu nu sunt chiar atât de mulți oameni care fac studii de asociere pentru oricare dintre aceste boli. Așa că credem că aceasta este... și am făcut și alte lucrări pentru a arăta că nu este o părtinire de publicare. Deci ai întrebat despre stratificarea amestecurilor etnice. Așa că vreau să vorbesc puțin despre asta. PUBLIC: Am o întrebare. JOEL HIRSCHHORN: Da, sigur. Mergi drept înainte. Da. PUBLIC: [INAUDIBIL] o boală rară. JOEL HIRSCHHORN: Da. Da. Deci da, nu este o boală comună. Ai dreptate. Deci este o boală foarte ecologică. Deci, ceea ce este de fapt, este probabil o boală comună, dar doar expunerea la mediu necesară este rară. Deci, este ca și de fapt, un altul a fost HIV, care, din păcate, nu este o boală rară acum, deoarece expunerea la mediu este atât de comună. Dar vă puteți imagina, dacă lumea ar fi un loc diferit, ar fi o boală rară și același gen de lucruri. Și poate fi același lucru cu diabetul. Diabetul de tip 2 poate fi o boală comună, în parte din cauza expunerii la mediu. Publicul: Așa cum am spus, nu sunt sigur cum pot... cum poți obține cum arăți... JOEL HIRSCHHORN: Da, așa că se dovedește că este de fapt un factor de risc uriaș. Este un factor de risc genetic uriaș. Există un articol interesant în Science care analizează această variantă, care arată că au existat valuri de selecție în favoarea variantei de rezistență în triburile în care bolile prionice sunt endemice. PUBLIC: Este doar o secvență destul de comună. JOEL HIRSCHHORN: Da. Este destul de comun și se dovedește că este un efect mare. Așa obțineți putere, astfel încât, chiar dacă -- și sunt destui sporadici -- oamenii colectează câteva sute de cazuri sporadice ici și colo. Și este doar un efect mare, și de aceea au putut să-l vadă. Deci chiar și bolile rare pot avea variante comune care contribuie la ele. Deci amestec etnic. Ce este asta? Deci acesta este un studiu epidemiologic ideal. Deci, atunci când oamenii colectează cazuri și controale, ei vor întreba adesea despre etnie. Și au ceea ce se numește etnie auto-descrisă. Și lucrul ideal este că ai... în mod clar, toată lumea se potrivește cu ceea ce oamenii pun jos. Dar oamenii se vor autodescrierea diferit. Și s-ar putea să nu existe o auto-descriere exactă pentru care sunt mediile etnice și genetice reale ale oamenilor. Așa că speri că cumva această etnie auto-descrisă este suficient de bună pentru a avea de fapt o potrivire bună. Dar vă puteți imagina că într-un anumit grup etnic, ar putea exista câteva subgrupuri. Și acestea sunt, evident, distincțiile. Am desenat asta deoarece există subgrupul albastru și subgrupul verde. Dar, în realitate, ar fi probabil unele umbriri de la albastru la albastru-verde la verde-albastru la verde. Așa că vă puteți imagina că ar putea exista niște subgrupuri etnice diferite. Și te-ai putea gândi la asta, de exemplu. European ar putea fi nord- european și sud-european sau ceva de genul ăsta. Și ar putea exista boli în care boala este de fapt mai răspândită, să spunem, în nordul Europei. Deci, s-ar putea să aveți mai multe cazuri din ascendența nord-europeană și mai multe controale decât ascendența sud-europeană. Și, de exemplu, diabetul de tip 1 s- ar putea încadra în acest model. Mult mai frecvent în Finlanda decât în ​​sudul Franței, de exemplu. Deci, dacă ați avea un marker care a fost urmărit genetic cu ascendenții nord-europeni, dar nu cu ascendenții sud-europeni -- și nu există mulți markeri de genul ăsta, dar există cel puțin unul despre care știu -- atunci s-ar putea să găsiți că acel marker ar fi suprareprezentat în cazurile referitoare la controale doar pentru că acel grup etnic a fost suprareprezentat. Și se crede că aceasta este mai mult o problemă și în cazul populațiilor care au avut amestecuri recente, cum ar fi populațiile afro-americane sau populațiile latino, unde, în loc să fie nord- european/sud-european, acesta ar putea fi un grad de ascendență, deci ce fracție din cromozomii tăi au alele care sunt mai frecvente în Europa față de alele care sunt mai frecvente în Africa. Și puteți ajunge cu aceeași configurație. Deci, puteți obține, în teorie, asocieri fals pozitive din asta. Deci există modalități de ocolire acum. Așadar, primul mod care a fost propus de Rich Spielman și apoi de o mulțime de alți oameni este să folosească ceea ce se numește teste de familie bazate pe teste - teste de asociere bazate pe familie . Și nu am de gând să trec prin detaliile celor mai puțin decât să vă spun că sunt imuni la această problemă. Și celălalt mod este, practic, dacă faci... dacă nu poți face testul bazat pe familie și există o mulțime de motive pentru care s- ar putea să nu poți, poți folosi ceva numit control genomic, unde tastați o mulțime de marcatoare aleatorii și vedeți, ei bine, acei markeri aleatorii vă oferă aceste asocieri false? Și le puteți folosi pentru a corecta rezultatele asocierii sau chiar pentru a vă reapare cazurile și controalele pentru a vă asigura că sunt genetice - indiferent de etnia auto-descrisă, le puteți potrivi după fondul lor genetic, așa cum este evaluat de acești 100 de markeri. . Așa că ne-am uitat de fapt -- cel puțin pentru micul nostru studiu, majoritatea lucrurilor care s-au replicat sunt de fapt văzute în studii bazate pe familie sau în mai multe grupuri etnice, ceea ce face ca amestecul să fie mai puțin probabil. Dar nu înseamnă că acest lucru nu se întâmplă într-un mod rampant. Și, de exemplu, cele care nu au fost niciodată replicate, ar putea fi că unele dintre acele pozitive false se datorează amestecului. Apoi sunt adevărate diferențe de populație care ar putea intra în joc. Sunt o mulțime de lucruri diferite. Ar putea fi diferite diete în diferite populații. S- ar putea să existe și alte gene care sunt mai frecvente într-o populație decât în ​​alta și există o anumită interacțiune între ceea ce privești și asta. Și vreau să vorbesc despre un tip foarte specific de diferență pe care cel puțin l-am putea aborda, și anume că ar putea exista diferite modele de corelație în diferite populații. Și markerul care este folosit ar putea să nu fie markerul cauzal. Ar putea fi ceva care este corelat. Așa că v-am arătat această diagramă, unde puteți utiliza acest haplotip CA -- dacă vă uitați la acest haplotip cu doi markeri, utilizați acest haplotip CA pentru a încerca să preziceți dacă polimorfismul cauzal există. Și se descurcă destul de bine pentru că nu a existat prea mult din acest haplotip recombinant aici. Deci aici, de fapt, predicția... Nu am desenat săgețile. Dar predicția nu ar fi de fapt potrivită pentru acest singur cromozom. Dar de cele mai multe ori, corelația este destul de bună. Dar dacă ar exista o mulțime din acel cromozom recombinant într-o altă populație? Acum, dintr-o dată, aveți un haplotip CA comun fără SNP cauzal. Și așa că, pe lângă faptul că este... corelația nu mai este acum atât de bună, așa că s-ar putea să nu vezi o asociere. Deci, acesta este cel puțin un lucru posibil de reținut este că markerul la care vă uitați ar putea să nu fie cauzal , așa că în principiu înțelegeți modelele LD din jurul unei asocieri. Deci, odată ce o asociere a fost găsită, tastând o mulțime de alți markeri acolo și văzând, există un alt marker care o explică mai bine va deveni important și aproape nimeni nu face asta chiar acum. Și apoi, în cele din urmă, ultimul lucru la care ne-am uitat a fost, s-ar putea să fie că unele dintre asocierile pe care le-am văzut în meta- analiza noastră sunt de fapt adevărate, dar studiile care spuneau că nu există nicio asociere au fost de fapt incorecte? Și, așadar, pentru a încerca să înțelegem acest lucru, ceea ce necesită este ca dimensiunile eșantionului să fie prea mici pentru a detecta asocierea, ceea ce înseamnă, la rândul său, că asocierea trebuie să fi fost o asociere slabă sau un efect modest. Așa că am estimat efectele pentru toate aceste asociații și prin punerea în comun a tuturor datelor. Și astfel opt dintre ele s-au replicat. Și întrebarea a fost, care a fost dimensiunea efectului? Și practic toate cele opt au crescut riscul de îmbolnăvire cu mai puțin de două ori. Iar unele dintre ele au reprezentat doar un risc crescut de boală cu 10% asociat cu alela. Și pentru 10%, de exemplu, aveți nevoie de mii de cazuri și controale. Și aproape niciunul dintre studiile pe care le-am analizat nu avea așa ceva. Așa că aproape toate studiile au fost insuficiente pentru aproape toate asociațiile pe care le-am analizat. Deci lipsa de putere este răspândită în acest domeniu. Și un studiu negativ în sine, cu excepția cazului în care are multe mii de oameni, într-adevăr nu poate fi considerat ca valorând mult decât de la sine. Poate merita mult în contextul altor studii. Un ultim lucru pe care vreau să-l explic din nou, deoarece este o problemă importantă când ne gândim la interpretarea literaturii de specialitate, când am făcut această estimare a efectului genetic real și apoi am comparat aceste riscuri mai puțin de două ori cu ceea ce a fost raportat în primul rând. susținuse, aproape întotdeauna, că primul raport pozitiv supraestimase efectul genetic real. Și am vrut să știm dacă este în concordanță cu un fenomen numit blestemul câștigătorului. Deci blestemul câștigătorului este cel mai bine descris pentru teoria licitațiilor și merge așa. Imaginați-vă că există o grămadă de oameni care licitează pentru un articol. Și toate au o estimare exactă... Îmi pare rău, da, o estimare imparțială a valorii acelui articol. Dar nu este atât de precis. Așadar, oamenii sunt la fel de probabil să-i supraestimeze valoarea, precum să o subestimeze. Și toți fac oferte. Și, prin urmare, aceste oferte imparțiale vor... și să presupunem că licitează ceea ce cred ei că valorează de fapt articolul . Aceste sume licitate imparțiale vor fluctua în jurul valorii reale. Și apoi unul dintre aceștia va fi fluctuat cel mai mult și aceasta va fi oferta câștigătoare. Deci oferta câștigătoare, condiționată de faptul că aceasta este oferta câștigătoare, aproape întotdeauna va fi supraestimat valoarea. Și cea mai bună descriere a acestui lucru este un articol Samuelson numit „Am câștigat licitația, dar nu vreau premiul”. Așa că ai grijă pe eBay. Dar, în studiile de asociere, practic, oferta câștigătoare este echivalentă cu prima persoană care obține un rezultat suficient de interesant încât să îl poată publica rapid și într-un jurnal proeminent și așa ceva. Și, cu condiția ca aceștia să fi găsit ceva interesant, este probabil să fi supraestimat adevărata valoare. Și adevărata valoare ar putea fi fie un efect slab, un efect mai slab , fie chiar niciun efect. Și doar timpul poate spune. Și așa am constatat că a fost consecvent - că gradul în care au supraestimat a fost în general în concordanță cu fenomenul de blestem al câștigătorului. Deci, acestea sunt mesajele luate acasă pentru citirea literaturii de studiu a asociației. Deci, dacă ridici o hârtie și scrie că ceva este asociat cu o boală, există posibilitatea ca aceasta să fie adevărată. Dar aș spune că este cu mult sub 50%. Nici nu este 0%, dar este cu mult sub 50%. Efectele genetice pentru asociații sunt probabil să fie destul de modeste. Deci, dacă cineva pretinde un efect de cinci ori și intervalele de încredere ale acestora merg de la 1,1 la 40, probabil că este mai aproape de 1,1, dacă nu de 1. Și apoi, din cauza acestor efecte modeste, aveți nevoie de site-uri mari de studiu pentru a le detecta în mod fiabil și, de asemenea, pentru a le restrânge. intervalele de încredere în jos. Acum, vă voi da doar un exemplu, exemplul nostru preferat, pentru asocierea unui polimorfism missens, sau credem că acesta este polimorfismul cauzal. În diabetul de tip 2, există o genă numită PPAR, care este importantă pentru diferențierea celulelor adipoase și este un receptor hormonal nuclear. Probabil leagă acizii grași. Deci primul studiu care a fost publicat este chiar aici. Deci fiecare linie este un studiu. Punctul este estimarea punctuală a efectului asupra diabetului. Și de fapt, în acest caz, orice din stânga acestei linii este o asociere cu diabetul. Iar linia din jurul punctului reprezintă intervalul de încredere din jurul acelei estimări. Deci, de exemplu, acest studiu de aici, deși arată că tendința de asociere a fost considerată negativă, deoarece această linie se încrucișează, încrederea de 95% va trece ca 1. Deci, acesta este primul studiu pe care îl puteți vedea câștigătorul blestemul în acțiune aici. Supraestimările este cea mai puternică estimare a riscului. Și a fost urmat, cred, de aceste trei și de o grămadă de alte studii, toate considerate negative, deoarece intervalele lor de încredere de 95% au depășit 1. Apoi am făcut un studiu destul de mare în care am arătat o asociere. De fapt, am subliniat că toată literatura de până acum a fost în concordanță cu o asociere undeva în acest interval. Mult mai slab decât a fost descris inițial, dar suficient de modest încât aceste studii nu au avut puterea de a-l detecta. Și, de fapt, pe măsură ce obțineți eșantioane din ce în ce mai mari, ceea ce puteți vedea este că intervalele de încredere-- este că lucrurile tind să se concentreze cu adevărat. Și puneți toate datele împreună, obțineți un interval de încredere destul de îngust. Și acum, valoarea p pentru asociere este de la 10 la minus 9. Deci este real, dar a fost nevoie de 20.000 de alele de la persoanele cu diabet și martori pentru a ajunge acolo. PUBLIC: Sunt toate studiile în același [INAUDIBIL].. Le poți pune pe toate împreună și să faci totalul? JOEL HIRSCHHORN: Deci, pentru diabet, definiția diabetului este destul de clară. Există un consens OMS. Și sunt mai mult sau mai puțin aceeași definiție. Aș spune destul de aproape. Alela în sine este în mod clar aceeași variantă. Și presupunând că calitatea genotipării a fost bună, probabil că se uitau la același lucru acolo. Evident, populațiile sunt diferite. Așa că am vorbit despre diferențele populației. Așadar, se dovedește, de asemenea, unul dintre cele mai bune exemple de eterogenitate între populații este pentru acest polimorfism, nu atât în ​​diabet, deși nu a fost cu adevărat privit bine, ci de fapt, obezitatea. Deci, acest lucru a fost analizat mult pentru obezitate și rezultate extrem de divergente. Se dovedește că câți acizi grași trans mănânci, sau acizi grași saturați până la acizi grași nesaturați, afectează dacă acest polimorfism are efect asupra obezității. Nu-mi amintesc acum în ce direcție merge. Practic, la o singură dietă, care este mult mai comună în țările occidentale, cred că nu există niciun efect. Iar pe o altă dietă, care este mult mai frecventă în țările asiatice, există un efect asupra obezității. Așa că vă puteți imagina că acolo - și de fapt, dacă vă uitați, se dovedește că acești trei sunt toți în populații asiatice. Deci s-ar putea să existe o anumită eterogenitate acolo, deși este statistic marginal semnificativ dacă vreunul dintre aceste studii este diferit de oricare dintre celelalte. Deci, acestea sunt în cea mai mare parte în concordanță cu dacă ați luat săgeți și le-ați aruncat pe toate la aceeași cotă, ați putea ajunge la puncte care arăta mai mult sau mai puțin așa. Deci, dar s-ar putea foarte bine să existe diferențe. Pentru lucruri ca-- pentru mai puțin bine-- deci pentru boala Alzheimer, uneori există puțină mai multă dezbatere dacă este confirmată de patologie sau nu și așa ceva. Deci în regulă. Deci ce să crezi este întrebarea. Deci ar trebui să crezi? Aș spune că scepticismul inițial este justificat. Replicarea, în special cu valori p scăzute -- și poate putem discuta despre ce înseamnă asta -- este încurajatoare. Dimensiunile mari ale eșantioanelor sunt cruciale. Deci, dacă ai de gând să iei ceva acasă, gata. Așa că vreau să vorbesc rapid -- deci aceasta este o clasă orientată cantitativ -- despre aplicarea teoremei lui Bayes la interpretarea studiilor de asociere. Deci teorema lui Bayes este una dintre teoremele fundamentale ale probabilității. Și în acest caz, ceea ce am făcut este că am înlocuit în cuvintele cauzal cu probabilitatea de a observa asociere. Și cauzal este probabilitatea ca varianta la care te uiți să fie de fapt cauzală. Deci, dacă treceți prin simpla conectare la teorema lui Bayes, aceasta este ceea ce obțineți. Și ceea ce te interesează este, practic, având în vedere că am văzut o asociere, care este probabilitatea ca aceasta să fie adevărată? Asta vrei să știi când ridici hârtia. Deci asta are de-a face cu trei termeni. Una este probabilitatea ca ceva să fie asociat, dat fiind că a fost cauzal. Deci asta este puterea studiului. Deci ați vedea o asociere dacă ar fi cauzală? Aș fi văzut aceste date de asociere dacă nu ar fi fost cauzale? Ei bine, aceasta este valoarea p, probabilitatea de a observa datele întâmplător. Și apoi probabilitatea ca este cauzal pentru început, care este probabilitatea ta anterioară. Deci, aceasta este cheia teoremei lui Bayes, care este că trebuie să specificați prioritățile, ceea ce este, desigur, întotdeauna partea cea mai grea. Este foarte ușor să scrieți teorema lui Bayes, dar apoi să specificați distribuția anterioară poate fi uneori destul de dificilă. În regulă. Așa că vă voi prezenta cum cred că arată distribuțiile anterioare în câteva ordine de mărime. Deci care sunt probabilitățile anterioare? Așa că voi spune că există aproximativ 600.000 de variante comune independente și are de-a face cu gradul de redundanță care a fost determinat de harta hap și chestii de genul ăsta. Sunt 10 milioane în total. Unele dintre ele nu sunt atât de obișnuite, așa că o să le bag puțin sub covor. Și din restul, există suficientă corelație încât am să spun că există aproximativ 600.000 de variante pe care le poți tasta. Cealaltă presupunere este că cel puțin câteva dintre acestea vor fi cauzale. Deci presupun că variantele comune joacă un rol în boală. Așa că o să spun undeva între 6 și 60. Poate fi mai mult, dar aș spune cauzal într-o măsură în care aveți orice putere de a le detecta, deoarece evident, dacă nu au puterea de a le detecta, s- ar putea De asemenea, nu există din punctul de vedere al acestui studiu pentru că dacă conectați 0 pentru puterea dvs., atunci totul începe să se anuleze. Deci probabilitatea ta anterioară este de la 1 la 10.000 la 1 la 100.000 mai mult sau mai puțin. Ce zici de genele candidate? Să zicem, ei bine, eu nu studiez... tu spui că această lucrare nu studiază vreo variantă împuțită aleatorie. Aceasta este cea mai mare genă candidată din întreaga lume. Ei bine, așa că am trecut prin exercițiul de a scrie toate genele candidate despre care credem că sunt gene candidate grozave pentru boli. Și de obicei vii cu undeva între, să zicem, 100 și 500 de gene, așa că să zicem 300 cu care ai venit. Și aș spune că ai putea spune o poveste la fel de frumoasă despre aproape toate cele 300 de gene, odată ce știi post-hoc că există o asociere. Deci poți spune, oh, desigur. De aceea, protein kinaza C theta este cheia diabetului. Și tu scrii povestea ta. Așa că voi spune că există 300 de gene candidate, toate la fel de probabil să fie asociate. Din nou, folosind unele lucruri despre există aproximativ trei sau patru blocuri de dezechilibru de legătură per genă, aproximativ trei sau patru haplotipuri per genă. Am să spun că există aproximativ 12 variante independente per genă. Deci există aproximativ 3.600 de variante candidate pe lista ta de 300 de gene pe care tocmai le-ai creat. Să presupunem... și asta cred că este oarecum generos, dar să presupunem că toată acea biologie care a intrat în a face această listă merită și că jumătate din toate variantele cauzale sunt în genele candidate. Ei bine, atunci dacă faci toată înmulțirea, probabilitatea anterioară este de aproximativ 10 ori mai mare pentru o genă candidată ca și pentru o genă aleatorie, de la 1 la 100 la 1 la 1.000. Și atunci care sunt probabilitățile pe care le-ați sugerat să căutați sub un vârf de legătură? Să mergem să facem toate genele sub un vârf de legătură. Ei bine, care sunt probabilitățile anterioare acolo? Ei bine, să spunem că nu 200 de gene. Să presupunem că există doar 100 de gene sub un vârf de legătură. Din nou, aceleași 12 variante per genă. Dar de data aceasta, există doar una - presupunerea este că există o singură genă sau o variantă care se află sub acel vârf de legătură care contribuie de fapt. Deci, din nou, probabilitatea anterioară se dovedește a fi aproximativ aceeași cu o genă candidată, 1 din 1.000. Așa că aș spune că probabil că, în acest moment, ar trebui să fii agnostic dacă îți concentrezi tot efortul sub un vârf de legătură sau pe o listă de gene candidate pe care le-ai găsit prin biologie. Deci, să presupunem că acum vă faceți studiul și obțineți o valoare p magică de 0,05. Care este probabilitatea ca a existat o asociere corectă? Deci, cea mai mare genă candidată din lume. Deci asta este de fapt... Îți voi oferi de 10 ori mai multe șanse ca asta să fie corect decât gena ta candidată tipică. Probabilitate anterioară de 0,01. Valoarea p, 0,05. Probabilitate posterior. Acest lucru presupune și puterea perfectă de a vă detecta asocierea, ceea ce înseamnă că ați făcut acest lucru într-un studiu amplu. Dacă o faci într-un studiu mic, acest număr scade pentru că acest lucru crește cu putere. Deci posterior probabil, șansa să ai dreptate, aproximativ 15%. Deci, poate e puțin descurajant. Ce zici de o genă candidată tipică? Acesta este studiul tipic de asociere care se face. Există aproximativ 1% șansă ca o valoare p de 0,05 să reprezinte o asociere adevărată. Candidat sau vârf de legătură, deci Calpain-10, 1% șansă cu o valoare p de 0,05. Acum, valoarea lor p era mai mică, dar totuși, aceasta nu este cu mult mai mică. Genă aleatorie în genom. Practic, garantat că este greșit cu o valoare p de 0,05. Deci, ce fel de valori p aveți nevoie pentru a avea de fapt o problemă posterior destul de bună? Pentru că, din nou, aceasta presupune o putere bună. Deci, practic, ceea ce aveți nevoie sunt valorile p care sunt undeva în intervalul de la 10 la minus 4 la 10 la minus 6. Și acesta ar putea fi un singur studiu sau toate studiile la un loc. Deci, practic, majoritatea asociațiilor de raportare sunt probabil incorecte, dar nu toate. Unele se vor dovedi a fi corecte. Și aș spune că dacă aveți valori p scăzute replicate sau există un motiv cu adevărat, foarte, foarte , foarte bun pentru plauzibilitate, atunci asta face mult mai probabil să fie corect. Și apoi tocmai în acest ultim punct, genele aflate sub vârfurile de legătură sunt aproximativ la fel ca orice alt tip de candidat. Evident, dacă aveți un candidat care se află într-o cale bună și se află sub un vârf de legătură, probabil crește probabilitatea anterioară. Oh scuze. PUBLIC: [INAUDIBIL] nu te uiți doar la starea în care [INAUDIBIL] SNP-uri independente sunt prezente, contribuind la [INAUDIBIL]. JOEL HIRSCHHORN: Da. Așa că nu am vorbit deloc... Am făcut doar aluzie pe scurt la interacțiunea mediului genetic cu PPARgamma și chestia cu dieta. Și nu am vorbit deloc despre interacțiunea genă-genă. Deci, există o dezbatere fierbinte în domeniu, aș spune, despre dacă ar trebui să se caute interacțiunea genă-genă fără nicio dovadă că oricare dintre gene este implicată, ceea ce implică, practic, realizarea tuturor perechilor cel puțin, dacă nu în trei căi sau combinații în patru sau n căi. Și provocarea pentru asta devine evidentă când spui că există de fapt 600.000 de variante independente în genom. Deci, chiar dacă faci doar perechi, asta înseamnă de 6 ori 10 la al cincilea. Așadar, ajunge să fie de 3,6 ori 10 a 11-a variante-- scuze, combinații pe perechi pe care trebuie să le cauți. Și așa știți că veți obține de fapt o valoare p de 10 la minus 11 pentru interacțiune la un moment dat doar pentru că atâtea perechi ați testat. De fapt, puteți obține 3,6 dintre ele. Deci, devine din nou o problemă de putere, în sensul că pentru a corecta toate ipotezele diferite pe care le-ați testa, aveți nevoie de o dimensiune enormă a eșantionului sau trebuie să sperați că efectul de interacțiune este atât de enorm încât obțineți de fapt o valoare p. care supraviețuiește acelei corecții pentru testarea de ipoteze multiple , ceea ce ar putea fi cazul. Dar atunci întrebarea este, dacă acea interacțiune este atât de enormă, trebuie să desenați modele foarte ciudate pe care să nu le înțelegeți și pe cel puțin unul dintre cele două ca fiind cauzal. Acum, ceea ce ar trebui făcut, dar nu este, este că odată ce ai ceva în care crezi cu adevărat, deci, de exemplu, lucrăm în domeniul diabetului și credem cu adevărat că oamenii sunt gama Pro12Ala. Dar, totuși, încă nu - și ar trebui -- testăm interacțiunile în perechi pentru fiecare lucru pe care îl genotipăm în Pro12Ala, deoarece puteți desena o mulțime de modele rezonabile în care ați detecta doar unul dintre cele două lucruri care interacționează. Iar celălalt ar fi complet mascat sau în mare măsură mascat. Deci nu facem asta și ar trebui. Și, dar aș spune că dacă... din nou, dacă ridicați o hârtie care spune că nu am văzut nimic cu nici una dintre aceste variante, dar apoi am făcut testul pe perechi și vedem o interacțiune, Gândește-te la probabilitatea ta anterioară ca acel test în perechi să fi fost de fapt asociat. Numărul de perechi din genom față de numărul care vor fi de fapt cauzal, probabilitățile tale anterioare sunt probabil cu câteva ordine de mărime mai mici. Deci, dacă nu există, din nou, un motiv foarte bun să știm că aceste variante genetice interacționează. Deci, acesta este răspunsul meu incredibil de părtinitor la acea întrebare sau nu părtinitor, dar cu opinie . Nu voi explica de ce primești același tip de blestem al câștigătorului și lucruri de genul ăsta în legătură. Dar doar pentru a vă duce prin studii de asociere de variante rare , din nou, în cazul în care veți ridica literatură despre asta. Deci, acesta este studiul tipic de asociere a variantelor rare, așa cum este practicat în 2004. Genele sunt resecvențiate la indivizii afectați pentru a încerca să găsească, să zicem, variante greșite. Și apoi acele variante greșite sunt apoi luate și introduse în indivizi neafectați. Deci este secvențierea aici, genotiparea aici. Și ceea ce se observă adesea este că nu sunt acolo. Așa că vă voi ghida printr- un posibil studiu de asociere de resecvențiere. Haideți să re-secvenționăm gena dvs. preferată, gena X. 200 de indivizi diabetici și, iată, găsiți de fapt 10 variante rare de greșeală, fiecare văzută la o persoană cu diabet. Tastați apoi 200 de indivizi sănătoși. Acele variante nu se văd deloc. Deci, ați concluzionat că variantele rare din gena X provoacă diabet. Așa că acum o să vă conduc printr-un studiu de resecvențiere la fel de posibil. Gena X resecvențializată la 200 de fani Red Sox. Veți identifica -- dacă aceasta este o genă care se întâmplă să tolereze variații rare, veți identifica 10 variante rare. S- ar putea să găsești câteva variante comune, dar s-ar putea să nu. Multe gene nu au variante comune missense. Dacă apoi luați acele 10 variante missense și le introduceți în alte 200 de persoane, spun fanii Yankees, nu veți vedea acele variante. Deci acest lucru este foarte plauzibil. Și veți concluziona că variantele rare din gena X vă fac să rădăcini pentru Red Sox, ceea ce, desigur, nu este răspunsul corect. Iar motivul pentru aceasta are de-a face cu faptul că în identificarea acestor variante rare, trebuie să mergi la o profunzime foarte mare în a face resecvențierea. Deci obțineți variante comune dacă secvențați doi cromozomi. Așa că asta v-am arătat chiar la începutul discuției. Deci dacă doar compari doi cromozomi și apoi te uiți, sunt acele variante comune în restul populației, răspunsul este aproape întotdeauna da. Și frecvența medie al alelelor este de aproximativ 1 din 5. Deci media este de 20% pentru alela minoră și 80% pentru cealaltă alele. Dar dacă apoi ordonezi un grup mare de oameni, evident că găsești toate aceste variante comune. Le găsești în primii patru cromozomi pe care îi faci. Practic, parcurgeți toate variantele comune. Dar, de fapt, continui să găsești variante pe măsură ce mergi din când în când, iar asta are de-a face cu genetica populației și care sunt distribuțiile de frecvență și chestii de genul ăsta. Dar majoritatea variantelor pe care le găsești, dacă faci deep resequencing, ajung să fie aceste variante rare. Ele nu reprezintă cea mai mare parte a heterozigozității, deoarece sunt atât de rare. Și de fapt, frecvența lor medie este de aproximativ 1 din 10.000. Deci, dacă le tastezi în 200 de persoane, nu vei mai vedea niciodată niciuna dintre ele. Deci, ceea ce trebuie făcut este, practic, trebuie să resecvențați și controalele. Există și alte moduri de a face asta. De exemplu, dacă aveți familii, puteți vedea că variantele rare se segregă de fapt cu boala. Este un fel de echivalent cu controlul resecvențierii. Deci, asta este o cale de ocolire. Dar practic asta trebuie să faci. Și, în plus, ceea ce am spus acolo în acel slide anterior a fost că ați identificat 10 variante missense. Ei bine, ce se întâmplă dacă ai identificat 11, dar unul dintre ei era comun? Și ați spus, ei bine, acesta este unul obișnuit și este prezent în cazuri și controale, deci probabil că nu este funcțional. Probabil că... și mă voi concentra doar pe cele care sunt prezente doar în cazuri. Ei bine, asta înseamnă că, evident, rezultatele sunt manipulate în prealabil. Deci, dacă te limitezi doar la acele variante care sunt prezente în cazuri și spui că acestea sunt singurele care contează, evident că vor fi prezente doar în cazuri. Așadar, trebuie să aveți o modalitate de a grupa aceste variante rare pentru analiză înainte de a cunoaște rezultatele studiului de asociere, care sunt în cazuri și care sunt în controale, așa că ceva de genul fie mă voi uita doar la schimbările de cadre sau la prostii. mutații, sau mă voi uita doar la lucruri care au această proprietate funcțională in vitro sau ceva de genul acesta. Deci doar în ultimele câteva minute... sau sunt cu mult înainte. PUBLIC: Șapte minute. JOEL HIRSCHHORN: Oh, nu. Nu cu mult înainte. Bun. 12:30. Bun. Pentru un minut, am crezut că mai am 37 de minute. Am spus că am vorbit mai mult de atât. BINE. Deci ce am putea învăța? Și cred că acest lucru este, de asemenea, important să ne gândim la care sunt obiectivele și care sunt rezultatele probabile? Există o mulțime de hype în jurul întregului domeniu al genomicii și al SNP-urilor și al bolilor comune și doar pentru a încerca să aruncăm o privire la ceea ce este și ce nu este probabil. Deci nu știu dacă a văzut cineva filmul Gattaca. Deci, Gattaca, cred că oamenii chiar îl au pe Gattaca în spatele minții lor când se gândesc la asta, și anume că ar trebui să putem spune prin genotipizare, dacă am putea secvența genomul cuiva, vom putea prezice... dacă te uiți la scena de deschidere din acel film, este ca, probabilitate de boală coronariană, 98%. Probabilitatea de accident vascular cerebral, 100%. Așa ceva. Deci știm deja că variația genetică, de fapt, chiar dacă am avea informații perfecte, explică doar 30% până la 50% din bolile comune. Dar care este probabilitatea ca să obținem o predicție atât de bună? Cred că probabil că nu este atât de grozav, deoarece probabil că sunt o mulțime de alele care vor interacționa în moduri complexe pe care s-ar putea să nu le putem înțelege pentru o perioadă foarte lungă de timp. Dar, cu toate acestea, există unii gânduri că putem fi capabili să identificăm persoanele cu risc crescut sau, în special, persoanele care ar putea fi cu risc scăzut. Dacă acesta ar fi cazul -- și am arătat aici probabil un scenariu foarte optimist, și anume că ați putea îmbogăți atât de mult pentru persoanele cu risc ridicat -- ați putea spune că acești oameni ar primi o măsură preventivă de intervenție mai agresivă , iar acești oameni ar putea primi standardul de îngrijire sau chiar ar putea fi capabili să obțină intervenții puțin mai puțin agresive, în funcție de modul în care a evoluat raportul risc-beneficiu. Acest lucru necesită evident că există măsuri preventive eficiente și lucruri de genul acesta. Dar vă puteți imagina, pentru lucruri precum diabetul, ați putea spune că sunteți cu adevărat expuși unui risc ridicat de a face diabet. Chiar trebuie să faci exerciții fizice și să slăbești, și poate că ar fi ceva-- ai putea conecta acea persoană cu un nutriționist și cu antrenorul personal și tot felul de chestii. Și s-ar putea să nu fie ceva pe care noi, ca societate, ne- am putea permite pentru toată lumea, dar poate cel puțin pentru oamenii care prezintă cel mai mare risc, ne-am putea permite dacă am putea ajunge acolo. Dar nu cred că aici se află neapărat adevărata promisiune. Există o altă posibilitate. Aceasta se numește farmacogenomică, care practic reclasificarea indivizilor pentru a ghida terapiile. Deci, aveți acest amestec de oameni care au o anumită boală, cum ar fi diabetul de tip 2, dar se dovedește că de fapt este tipul 2A, 2B, 2C și 2D. Și poate le-am putea clasifica după secvența ADN sau profilul de expresie sau vreo metodă genomică. Și am putea spune, ei bine, acești oameni se vor descurca cel mai bine cu tratamentul A, acești oameni cu B, aceștia cu C și aceștia cu D. Și din nou, asta se poate întâmpla sau nu și, cu siguranță, oamenii se uită la asta. . Și cred că se va întâmpla parțial. Vă voi da doar un exemplu din viața reală care de fapt nu este încă în clinică, dar nu știu sigur de ce nu. Deci, există o genă numită CYP2C9, care metabolizează de fapt warfarina, care este folosită în mod obișnuit pentru a trata afecțiunile implicate cu tromboză sau coagularea sângelui. Acesta este un agent anti-coagulare , de fapt, vitamina K. Și asta nu... Îmi pare rău. Albul pe galben nu este o schemă de culori bună. Dar, practic, cea mai mare parte a populației are zero alele cu activitate scăzută. 20% din populație are o alele cu activitate scăzută, iar 5% din populație are două alele cu activitate scăzută. Și dacă te uiți la doza medie la care ajung oamenii în funcție de genotipul lor, deci această doză nu se bazează pe genotipul lor. Este ca și cum ar fi încercare și eroare din partea medicului și ei descoperă, oh, dintr-o dată, ai o sângerare nazală care nu se va opri. Poate că doza de warfarină este prea mare sau valoarea PT este prea mare. Trebuie să reducem doza. Vedeți că aici există o corelație foarte bună dintre alele și doză, astfel încât dacă aveți două alele cu activitate scăzută și vi se pune o doză tipică de 5 miligrame, veți avea probleme cu sângerarea. Și, de fapt, vei avea un risc de șase ori mai mare de complicații grave. Deci, personal, dacă aș merge pe warfarină, probabil aș dori să știu care este genotipul meu CYP2C9. Dar nu este încă o practică standard. Unul dintre singurele cazuri despre care știu că este, de fapt, dacă ai cancer și primești șase purine [INAUDIBILE] sau medicamente înrudite, există o genă numită TPMT, care din nou metabolizează asta într-un intermediar toxic. Și asta a devenit acum aproape standardul de îngrijire, deoarece, din nou, riscul de deces este mai mare dacă aveți genotipul greșit. Deci moartea atrage atenția oamenilor destul de... PUBLIC: Și asta e... JOEL HIRSCHHORN: --viguros. PUBLIC: Doza medie, nu? Deci... [VOCI INTERPUSE] JOEL HIRSCHHORN: Da. Deci există o gamă largă. PUBLIC: --histogramă pe... JOEL HIRSCHHORN: Oh, absolut. Da. Deci, trebuie să spun că ar fi trebuit să pun bare de eroare aici. Mă uitam la asta și doar am observat că nu le am. [VOCI INTERPUSE] PUBLIC: --pentru că chiar dacă ai făcut o histogramă-- JOEL HIRSCHHORN: Corect. Dar-- PUBLIC: --nu se schimbă neapărat-- [VOCI INTERPUSE] JOEL HIRSCHHORN: Ah. Deci corect. Deci, dacă asta ar fi... dacă ai putea spune, ei bine, medicii pot face asta fără să știe dinainte, atunci acest lucru nu ar trebui să se întâmple, nu? PUBLIC: Oh, da. JOEL HIRSCHHORN: Da. Deci da. Deci, acesta este argumentul este oh, ei bine, oricum medicii vor fi buni la asta. Ei nu sunt. Ei sut la asta. Deci, dar cred că celălalt lucru care este potențial util, așa că dacă te uiți la cel puțin două alele de risc cele mai bine stabilite pentru diabetul de tip 2 , se dovedește că ambele sunt în ținte de medicamente. Acum, acest lucru este, desigur, puțin circular, deoarece motivul pentru care au fost priviți a fost pentru că se știa dinainte că erau ținte de droguri. Deci aveau sens ca fiind gene candidate bune. Dar este interesant că două dintre medicamentele majore care sunt utilizate pentru a trata diabetul de tip 2, există variante în țintele lor care afectează susceptibilitatea genetică la diabet. Și, desigur, promisiunea aici este că, dacă ai putea găsi toate celelalte căi genetice, chiar dacă au avut doar un efect de 1,1 ori asupra bolii - deci PPARgamma este doar un efect de risc de aproximativ 25% asupra riscului de boală. Dar vă puteți imagina cu ușurință că veniți cu o intervenție farmacologică care face mult mai mult decât face polimorfismul genetic. Deci, există doar atât de multă toleranță pentru cât de multă variație genetică va lăsa evoluția să se întâmple. Dar s-ar putea ca administrarea de tiazolidindione să fie ca și cum ar avea un efect de 10 ori mai mare decât a avea o alanină. Deci, ideea este că, sperăm, prin identificarea genelor responsabile - și acest lucru este valabil și pentru formele severe ale bolii - ați putea identifica țintele medicamentului. Și, în cele din urmă, desigur, acest lucru ajută la înțelegerea biologiei umane, iar acesta este întotdeauna un obiectiv demn. Așa că ar trebui să vorbim despre potențialele dificultăți din toate acestea-- din toate aceste progrese. Există, evident, preocupări cu privire la confidențialitatea datelor genetice. Și nu prea am timp să intru în asta, dar, evident, marea teamă are de-a face cu discriminarea în asigurări și cu faptul că angajatorii știu despre bolile genetice. Și există proiecte de lege care continuă să ajungă aproape până la Congres și nu se ocupă tocmai de asta. Așa că faceți lobby pe congresmanul dvs. Există mentalitatea Gattaca despre interpretarea necorespunzătoare a informațiilor predictive, cât de predictivă este informația genetică . Există companii care vor încerca să vă vândă că ar trebui să țineți dieta A sau dieta B bazată pe tipuri de gene SNP care se află în acele asociații ireproductibile. Pot exista efecte psihologice ale dacă spuneți că aveți alela cu risc ridicat pentru diabet, asta s-ar putea... fără a înțelege că aceasta este o măsură corelativă mai degrabă decât o măsură perfect predictivă, care ar putea avea un rău semnificativ, precum și un impact asupra opțiunilor de reproducere. , din nou, în funcție de cât de predictivi cred oamenii că sunt lucrurile. Există interacțiuni uriașe cu conceptele de rasă și etnie. Am făcut aluzie puțin la asta cu diferite frecvențe de alele și diferite populații. Cele mai multe alele sunt prezente în întreaga lume și, în general, nu puteți folosi nicio variantă pentru a deosebi diferitele grupuri etnice, dar există cu siguranță diferențe în frecvențele alelelor între populații. Și asta are implicații semnificative. Și apoi, în sfârșit, cu siguranță nu studiez genetica performanței, dar vă puteți imagina că dacă oamenii ar începe să intre în asta, asta ar putea fi destul de șocant. Și chiar dacă știința ar fi perfectă din punct de vedere tehnic, ar putea crea multe probleme. Deci, David Altshuler este un colaborator cu mine în munca de diabet și, de asemenea, foarte implicat în harta hap cu munca care a fost făcută de Stacey Gabriel, Mark Daly, Steve Schaffner pe blocurile haplotip. Grupul de diabet este și Noelle Lake, Cecilia [INAUDIBLE] a făcut niște chestii de expresie. Și Kirk și Lee și Eric au participat la studiul de asociere de meta-analiza. Și există o mulțime de lucruri de tip proiect genom care, evident, ne oferă toate instrumentele pentru a face acest lucru. Deci mulțumesc.