ISAAC SAMUEL KOHANE: Deci, privirea de ansamblu asupra clasei de azi... Am să încerc să vă conving că viitorul este acum, că toate aceste discuții despre revoluția geniculată nu sunt chestii de plăcintă pentru capitaliștii de risc pentru următorii 10 ani. , dar sunt lucruri care sunt de practic imediată astăzi. Voi petrece puțin timp pentru a face distincția între genomic și genetic mai mult pentru edificarea ta taxonomică și pentru orice motiv de fond. Trebuie să ne referim la ereditate și despre ce este vorba. Și apoi trebuie să vorbim despre elementele fundamentale ale resecvenționării procesului de diagnosticare care este pus în aplicare prin disponibilitatea în prezent a tuturor acestor date genomice și apoi voi termina despre modul în care toate acestea au ca rezultat accelerarea activării consumatorilor. Și pentru cei dintre voi care sunt practicieni ai medicinei și există un subgrup dintre voi care sunt, acest lucru ar trebui să fie alarmant - nu că ar fi rău că consumatorii se implică, ci că sunt înaintea noastră în cunoștințele și aplicarea acestor cunoștințe. . Deci viitorul este acum. Așa că doar pentru că unii dintre noi, de fapt, susțin că nu au luat nicio biologie, vreau doar să trec în revistă câteva elemente de bază. Aceasta va fi o pălărie veche pentru unii dintre voi, dar din moment ce este posibil să nu aveți acea pălărie veche, o voi revizui. Aceasta este vechea dogmă, iar această dogmă este defectuoasă. Și nu este chiar adevărat. Hei, bine ai venit. Doar prezentați-vă. PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Și ești student la? PUBLIC: Oh, îmi pare rău. Sunt student la MIT. student HST. ISAAC SAMUEL KOHANE: student la HST , studii la chimie. În regulă. Todd, ai avut vreodată un curs de genetică de bază în viața ta? pun întrebări simple. Da? PUBLIC: Da. ISAAC SAMUEL KOHANE: Bine. PUBLIC: Licență. ISAAC SAMUEL KOHANE: Licență. În regulă. Așadar, doar revizuiesc dogma de bază , care este că ADN-ul dă naștere ARN-ului transcris, care dă naștere proteinei traduse. Așa că permiteți-mi să pun o întrebare clasei și încep să vă spun pentru că încă nu îmi amintesc numele voastre. Este ADN-ul din fiecare celulă din corpul nostru același? PUBLIC: Nu. ISAAC SAMUEL KOHANE: De ce este diferit? PUBLIC: Pe măsură ce celulele se diferențiază, făcându-l de fiecare dată. ISAAC SAMUEL KOHANE: Bine pentru că tocmai ai afirmat neînțelegerea pe care o au majoritatea oamenilor. De fapt, cu excepția spermei sau a ovulelor, tot genomul întregului corp este exact același. Genomul complet este disponibil. De fapt, motivul pentru care poți clona un animal din orice celulă somatică din corp în teorie este pentru că, cu unele avertismente în care nu vreau să intru acum, este, de fapt, același genom al naibii. Excepție fac gameții, care au jumătate din genom, și globulele roșii, care nu au nucleu. Acum de ce este asta important? Și mai sunt câteva lucruri precum metilarea și vârfurile cromozomilor despre care nu vreau să vă dau detalii. Dar de ce este asta important? Pentru că, de fapt, ceea ce face o celulă hepatică diferită de un globul alb din sânge nu este ADN-ul, ci ARN-ul care este transcris și, de asemenea, ce proteină este tradusă din ARN. Și motivul pentru care aduc în discuție acest lucru este pentru că, pe măsură ce măsurăm ADN-ul folosind secvențierea sau genotiparea sau măsurăm ARN-urile folosind profilarea transcripțională sau măsurăm traducerea folosind proteomică, trebuie să începem să ne gândim acum, chiar și cei dintre noi care nu suntem medici. În calitate de clinicieni, de unde putem obține efectiv acest material biologic? Și dacă faci un studiu ADN, orice este bine. Puteți obține celule albe din sânge. Puteți obține o probă de sânge. Dar dacă ai vrea să studiezi, de exemplu, creierul și să înțelegi ce anume face pe cineva susceptibil la tumori cerebrale, nu ai putea obține o probă de ARN fără a obține efectiv o bucată din creierul cuiva. Și asta vă spune imediat câteva limitări ale acestor tehnologii. Deci, dacă doriți să faceți profiluri de ARN sau proteine pentru a analiza probabilitatea cuiva de a face o boală, de exemplu, trebuie să obțineți țesutul potrivit și asta vă spune tipul de limitări cu care ne confruntăm atunci când facem studii clinice. Adică, cu siguranță, putem scoate creierele de la șoareci sau drosophila, dar nu putem face asta cu ușurință cu oamenii. Și totuși, este frustrant pentru că din acest punct de vedere, suntem mai aproape de funcționare decât suntem în acest scop. Acesta este codul principal, dar acesta este ceea ce duce la funcționarea efectivă a interacțiunii proteinelor. Și astfel oamenii sunt foarte încântați de proteomică, de exemplu, pentru că este foarte aproape de funcționare. Dar când te uiți despre ce vom măsura de fapt proteinele, suntem destul de limitati la lucruri precum ser și urină. Nu putem lua bucăți de țesut din ființe umane. Și putem vorbi într-o altă zi despre cum să ocolim aceste obstacole. Deci, care este amploarea sarcinii? Dintr-o perspectivă, pare relativ îngrăditor. Adică, există, până la urmă, 46 de cromozomi, iar acești cromozomi sunt aceste mici lucruri microscopice, lucruri stufoase ale ADN-ului hiper spiralat. Și pare destul de discret. Și știu că știți că sunt 3 miliarde de baze, dar vreau să vă dau o apreciere pentru cât de mult sunt 3 miliarde de baze. Deci, să presupunem că avem un colier de mărgele. Fiecare dintre aceste margele reprezintă o pereche de baze. Pot să consider de la sine înțeles că știți care sunt perechile de baze ? ACTG, corect. Bun. Deci, dacă ai luat o grămadă de aceste coliere și ai dat un colier tuturor celor din Shea Stadium, tot va fi nevoie de 1.000 de stadii pentru a obține suficiente coliere pentru a obține toate bazele pe care le avem în genomul uman. Deci sunt o mulțime de mărgele și vă oferă o oarecare idee despre provocarea de codificare și provocarea de descifrare. Dar tocilarii tehnologiei vor spune următoarele. Unii spun că muzica Madonnei este, de fapt, mai multă informație decât persoana Madonna pentru că -- și am auzit asta de la -- cineva din Microsoft a spus asta într-o discuție [INAUDIBILĂ] pentru că a spus, uite. Un DVD cu videoclipul ei muzical are 4,7 gigaocteți, în timp ce genomul ei, 3 miliarde de perechi de baze la doi biți pe bază, deoarece există patru baze și 8 biți pe octet, este doar 3/4 dintr-un gigabyte. Deci despre ce facem marea afacere? Și, de fapt, au continuat să spună corect că fiecare om este în medie doar cu mai puțin de 0,1% diferit de orice alt om. Așa că am putea să vă stocăm pe toți ca doar un fișier de diferență al tuturor celorlalți. Așa că puteți, se dovedește că dacă ați făcut asta, vă puteți comprima până la dimensiunea care ar putea încăpea bine pe o dischetă învechită. Dar asta este întrebarea pe care vreau să o ridic. Este Madonna secvența ei de ADN? Și răspunsul, sper că îți dai seama, este nu, pentru că ceea ce o face pe Madonna în special pe Madonna nu este doar felul în care s-a dezvoltat în pântecele ei, chiar și fără influențele de mediu, așa cum a fost programat, ci toate influențele de dezvoltare pe care le- a avut de-a lungul vieții ei - bătăile bune, lovituri proaste, toate acele experiențe, expuneri la mediu care aduc starea ei, starea ei de organism, în starea actuală de megastar în care este. Și există multe alte state care ar fi putut depinde de care au fost acele influențe ale mediului. Și dacă vrei cu adevărat să captezi o stare, nu este doar -- este, prin urmare, evoluția stării ei fizice, nu doar genomul ei, ci și toate splicing-ul alternativ. După cum veți auzi despre următoarea prelegere, genele pot fi îmbinate în mai multe moduri pentru a crea ARN. Deci, în medie, aproximativ trei per genă. Proteinele care sunt derivate din ARN pot avea o multitudine de modificări diferite - adăugare de glucoză, glicozilare, adăugare de fosfor, fosforilare. Și de fapt, acest lucru este subestimat pe care ți-l dau. Aceasta este de ordinul a 100 până la 1.000 de modificări. Deci, asta crește foarte mult complexitatea. Și apoi, într-un organism multicelular, fiecare dintre acele produse genetice poate fi în orice compartiment anume al celulei și apoi poate pluti în orice celulă din corp de ordinul a trilioane. Deci Madonna este acum cu câteva ordine de mărime mai mare decât muzica ei, așa cum suntem cu toții. Și aceasta este doar o avertizare pentru a reține că, deși este cu adevărat impresionant că putem secvența un întreg genom, tot ceea ce arătăm este codul principal care poate duce la una dintre multele destine potențiale și pentru a evita reducționismul care se întâmplă adesea, trebuie să- ți reamintești care au fost influențele mediului. Și vom reveni la asta din nou. Acum luând, din nou, o notă tehnologică mai optimistă, este totuși adevărat că acum putem măsura astăzi cu tehnologia mărfurilor o mare parte din genomul dumneavoastră pentru prețurile mărfurilor. Și ce vreau să spun cu asta? Să ne uităm la micromatricele ARN și știu unele despre acestea și unii dintre voi nu. Dar vreau doar să vă reamintesc de ele. Dacă iei un șervețel... să zicem, ficat. Sau șervețele... apropo, permiteți-mi să mă întrerup și să spun că toate aceste prezentări PowerPoint... vă mulțumesc. Toate aceste prezentări PowerPoint și videoclipul vor fi disponibile pe site-ul MyCourses. Dacă nu aveți încă un cont prin MyCourses, puteți obține cu siguranță unul. Și astfel, toate PowerPoint-urile și toate videoclipurile vor fi disponibile. Așa că nu te simți obligat să dai jos totul și fii mai sigur că pui întrebări în carne și oase. Deci, luați ficatul sau, să spunem, ficatul sub influența , poate, a insulinei. Îl luați. Îl macină. Etichetați ARN-ul care a fost extras din acel ficat măcinat cu un compus fluorescent. Asta înseamnă că atașezi un compus fluorescent la acel ARN marcat. Și apoi cumperi. Și spuneam cumpără sau face, dar asta devine din ce în ce mai puțin adevărat. A devenit cu adevărat o marfă, iar companii precum Affymetrix sau Agilent vă vor vinde aceste cipuri și probabil că o pot face cu o calitate mai bună, din păcate, decât putem noi în mod homebrew, chiar dacă accesați site-ul web Stanford, microarray. site-ul web, vă vor spune cum să vă construiți propria unitate de producție de microarray din piese RadioShack pentru mai puțin de 10.000 USD. Cu toate acestea, este mai ușor și mai standardizat în acest moment să îl cumpărați, din păcate, de la acest monopol asemănător Microsoft numit [? Affymetrix, ?] de exemplu. În orice caz, cumperi acest cip și pre-poziționați pe fiecare loc de pe acest cip-- și voi avea o prelegere întreagă dedicată microarray-urilor, așa că nu vă faceți griji prea mult pentru detalii. Prepoziționată la fața locului pe acest microarray este o secvență de ADN corespunzătoare genei pe care o căutați. Deci aceasta ar putea fi secvența de ADN corespunzătoare hormonului de creștere, o secvență de ADN corespunzătoare insulinei, o secvență de ADN corespunzătoare receptorului de insulină. Și ceea ce se va întâmpla este prin reacția de hibridizare pe care ați învățat-o cu toții în genetica de bază, ARN-ul pe care îl extrageți din țesut se va hibridiza cu secvența de ADN care este prezentă pe acest cip. Și dintr-o dată, jetoanele nu sunt mai mari decât acestea, dacă nu mai mici. Și apoi îl scanați folosind un scaner HP simplu de calitate nu mai mare decât cel pe care îl scanați în fotografiile de familie. Scanați imaginea unui cip și acesta are fluorescență proporțional cu cantitatea de ARN fluorescent din orice punct dat. Și deci ceea ce aveți este o citire acum în fiecare punct a cât de mult din acel ARN a fost prezent în acea probă. Iar densitatea actuală a cuptorului cu microunde Affymetrix este acum pe un singur cip. Au observat... și asta folosește, de fapt, un proces fotolitografic. Ei au observat fiecare genă din genomul uman - de fapt, atât de multe încât de fapt pun altele suplimentare, cum ar fi diferite îmbinări alternative. Deci, mai mult de 30.000 de gene pe un singur cip și îl puteți cumpăra prin prețul Harvard pentru aproximativ 250 USD. Deci puteți măsura expresia a 30.000 de gene pentru 250 USD. Acum, din punct de vedere academic sună un lucru interesant, dar cum se traduce asta în medicina genomică? Așa că permiteți-mi să vă ofer copilul meu poster pentru un studiu ciclului pulsului care a lansat 1.000 de jetoane -- cipuri, dar și cipuri. A lansat câteva milioane de cipuri. Acesta a fost un studiu care a fost făcut din Stanford. Și au făcut următorul lucru. Au avut pacienți cu limfom cu celule B mari. Limfomul cu celule B mari este un tip de cancer care are un fel de boală de gravitate medie - nu la fel de rău ca boala pulmonară, nu la fel de benign ca boala tiroidiană, cancerul tiroidian. Și aceasta este o boală care înainte era monolitică. Cu alte cuvinte, pacientul a venit la tine și te uiți la microscop și ai spus, ah , ai limfom cu celule B mari și ai avut o estimare aproximativă a cât timp va trăi și le-ai oferi tot același tratament pentru că nu puteai distinge între subclase ale acestor pacienți. Deci, ceea ce au făcut prin tehnici despre care veți afla în această clasă a fost că au efectuat analize de grupare pe acești pacienți atunci când au luat ARN extras din limfomul de la câteva zeci de pacienți. Și când au făcut un experiment de grupare, au putut să vadă că existau două grupuri de pacienți bazate exclusiv pe profilul lor de expresie genetică, că există un grup de pacienți care au un profil de expresie genică și un alt grup de pacienți care au avut o genă diferită. profilul de expresie. Atunci și abia atunci, s-au întrebat după fapt ce este diferit la acești pacienți. Și, în mod foarte satisfăcător, ei au descoperit că, corespunzător unui profil de expresie a genei, cu alte cuvinte, un set de gene pornit sau oprit, a fost acest grup de pacienți în roșu, unde aici pe axa x sunt ani de supraviețuire. Aici pe axa y este probabilitatea de supraviețuire. Și, așadar, ceea ce vedeți aici este un grup de pacienți care mor foarte repede, cei mai mulți dintre ei, cu doi ani și un grup de pacienți care au o supraviețuire mai bună de 50% în rezultatul de 12 ani . Și asta a fost remarcabil pentru că ne-a spus că anterior, acolo unde nu am avut un sub-diagnostic, avem acum un nou diagnostic - limfom cu celule B mari cu risc ridicat și risc scăzut . Doi, avem un nou prognostic. Putem spune pacienților, din păcate, acest profil, sunteți expuși unui risc mult mai mare decât le-ați fi spus anterior. Trei, ai o nouă oportunitate clinică, o nouă oportunitate terapeutică, pentru că, fără a descoperi medicamente noi, le vei lovi pe acestea mult mai tare cu agenții chimioterapeutici pe care îi ai deja pentru că știi că, în esență, au o substanță mult mai periculoasă. un fel de cancer. Și apoi, în al patrulea rând, aveți o nouă oportunitate de cercetare. De ce mor acești pacienți? Pompează... au un transportor care pompează agenți chimioterapeutici din celulă? Nu este clar, dar știm deja că folosesc asta ca cercetare pentru... de exemplu, se dovedește că acesta este un marker de celule B. Acest grup este îmbogățit cu markeri de celule B. Celulele B sunt un tip de celulă imunitară și, de fapt, folosesc o terapie îndreptată împotriva acelei celule B pentru a trata efectiv acești pacienți. Deci este destul de remarcabil. Dintr-un experiment trivial de cercetare clinică care folosește acest cip de marfă, avem un nou diagnostic, un nou prognostic, o nouă oportunitate terapeutică și o nouă oportunitate de cercetare. Și acest lucru a fost reprodus de mai multe ori pentru cancerul pulmonar, pentru cancerul de sân. Acum puteți achiziționa efectiv un test în Țările de Jos pe baza biopsiei cu ac a sânului. De fapt, vom stratifica femeia în funcție de prognosticul ei, pe baza biopsiei cu ac. Și nu este doar pentru cancer. Acum s-a făcut pentru o varietate de afecțiuni inflamatorii - boala inflamatorie a intestinului, artrita reumatoidă, o grămadă de afecțiuni în care de fapt obțineți o perspectivă mult mai largă asupra fiziologiei analizând 30.000 de gene decât am fost doar când un pacient a întrebat. câteva întrebări și măsurând doar una sau două variabile din sângele lor. Deci asta ne aduce la acest desen animat care spune că nu ești încă bolnav, domnule [? Blondel,?] dar ai potenţial. Și, desigur, aceasta este motivația din spatele multor medicinei genomice pe care o vom putea realiza, având acești markeri de prognoză înalt, acești markeri predictivi, ne vom putea îndepărta de acute și costisitoare și nu foarte eficiente. intervenții la tehnici de prevenire mult mai rentabile, mai ieftine și mai eficiente . Și nu este teoretic. În prezent, unul dintre cele mai mari grupuri... apropo, cum este concepută chimioterapia de fapt ? Deci, cum sunt concepute aceste [INAUDIBILE]? Deci, există aceste mari grupuri cooperative de oncologie, literalmente zeci de spitale și centre medicale care cooperează pentru a stabili cât de mult cisplatină, câtă Adriamicină, câtă azatioprină să le administreze diverșilor pacienți cu diferite protocoale de chimioterapie? Și tratează acești mii de pacienți, văd cum fac și apoi emit un nou protocol bazat pe rezultat. Foarte mult finanțat de ordinul a sute de milioane de dolari pe an. Și astăzi, pentru că acum fac parte din grupul B de cancer și leucemie , unul dintre aceste grupuri de cooperare este acum... întregul grup vine acum cu noi protocoale care sunt toate bazate pe înțelegerea expresiei la nivelul genomului. Cu alte cuvinte, te vor pune într-o categorie de tratament diferită, în funcție de profilul tău de expresie genetică. Și acest lucru ar trebui să vă îngrijoreze pentru că, așa cum ați învățat în această clasă, sunt multe despre această analiză, această analiză de grupare -- ți-am spus povestea grozavă strălucitoare despre ea. Dar chiar și acea analiză inițială pe care ți-am arătat-o despre limfomul cu celule B mari este eronată. Și totuși oamenii avansează foarte repede pentru a le transforma în diagnostice de utilizare clinică. Și pentru că nu înțeleg în mod fundamental limitările tehnicilor lor de grupare, de exemplu, și limitările platformelor de măsurare, cum ar fi analiza microarray, de fapt vor face un deserviciu pacienților luând pacienți care nu au nevoie de terapie. și puneți-le într-o clasă de risc ridicat și invers. Deci cred că este extrem de important. Unul dintre lucrurile pe care vreau să le înveți la această clasă este cum să citești cu sceptic literatura de specialitate, deoarece, de fapt, te va ajuta să devii lideri mai buni în această zonă a medicinei de înaltă dimensiune. Ce vreau să spun prin dimensiune mare? Ei bine, te uiți la mii și mii de variabile. Ei bine, aici, ne uităm doar la expresie. Dar, așa cum vom ajunge la mai târziu în curs, este, desigur, să ne uităm la toate SNP-urile diferite de pe genomul tău - diferitele variații, ar trebui să spun -- și starea ta proteinelor. Deci, acesta este stadiul actual al tehnicii pentru cei dintre voi nu medici. Este stadiul cancerului, unde se află în corpul tău, gradul, cât de urât arată celulele la microscop și ce tip de celulă sunt, de obicei, motivează diagnosticul astăzi. Dar chiar și astăzi, acum începe să fie condus în protocoale reale care sunt implementate pentru pacienții reali prin profilarea expresiei. Și asta ne ridică întrebarea care cred că se află acum asupra noastră, și anume, suntem acum în pragul unei noi taxonomii a bolilor umane? Boala umană a fost clasificată în funcție de manifestare și, de fapt, nu cu mult timp în urmă obișnuiam să ne gândim la febră mai degrabă la o boală decât la un simptom. Și dacă te uiți foarte atent la majoritatea bolilor precum bolile inflamatorii precum artrita, ele se bazează, în cea mai mare parte, pe fenomenologie și nu pe o etiologie sau o cauză mecanicistă profundă. Și așa cum a subliniat Thomas Lewis în 1944, diagnosticul majorității bolilor umane oferă doar concepții nesigure și temporare, deoarece, de fapt, ceea ce descriem este întotdeauna vârful aisbergului, lucrurile de care se plâng pacienții. Și există doar atâtea lucruri de care te poți plânge. Asta doare, asta doare, asta doare, și pot sau nu pot face asta. Și există un set limitat de toate modurile în care se poate manifesta. Dar de fapt reflectă o multitudine mult mai mare de lucruri posibile care pot merge prost în acest mecanism foarte complex care este ființa umană. Și, de fapt, dintre principalele boli comune doar bolile infecțioase au o nomenclatură cu adevărat bazată pe mecanisme . Vedeți cum oamenii numesc boli infecțioase. Se duce până la organismul care o provoacă. Restul este destul de lejer, deoarece se referă la mecanism. Și aici avem o parte a provocării în medicina genomică este că, dacă măsurăm în mod cuprinzător întreaga fiziologie a stării pacientului, putem de fapt să venim cu o nomenclatură mult mai obiectivă și universală , care este un lucru netrivial pentru studenții la medicină care sunt... pentru cei dintre voi... sunt studenți la medicină aici? Da, care sunt atacați de... Mi s-a spus odată la facultatea de medicină că trebuie să învăț de ordinul a 20.000 de termeni noi și puteți vedea că sunt deja depășiți. Există, de asemenea, un motiv pentru care astăzi ar trebui să ne gândim la schimbarea utilizării medicamentelor de zi cu zi. Aici este prezentată o proteină care codifică un canal de potasiu; este o proteină care permite intrarea sau ieșirea potasiului într-un mod selectiv în și din celule. Și se dovedește că dacă aveți o greșeală de ortografie sau un polimorfism al uneia dintre nucleotidele dvs. aici, atunci va avea ca rezultat un nou aminoacid într-un singur loc și asta va schimba proprietățile electrice ale acestui canal de potasiu, astfel încât indivizii sunt mult mai predispuși. la aritmii cardiace, ritmuri proaste ale inimii lor, dacă li se administrează un medicament sulfa. Acum, medicamentele sulfa, pentru cei pe care nu le cunoașteți, sunt o gamă largă de antibiotice, iar în pediatrie, de exemplu, le dăm aproape tuturor copiilor medicamente sulfa. Bactrim are o parte din el un medicament sulfa. Și ceea ce spunem aici este că există un subgrup de copii care au această mutație. Și dacă le dai medicamente sulfa azi, îi vei expune riscului de moarte, ceea ce pare o decizie proastă pentru doar tratamentul durerii de urechi. Acum, dacă încă ești treaz, ar trebui să te întrebi următoarele. Ei bine, Zack, îmi spui despre asta, dar de ce ar trebui să-mi fac cu adevărat griji pentru asta? Este evident un lucru rar. Probabil este mai puțin de 1 din 10.000. Și de ce ar trebui să fac această reproiectare costisitoare a procesului medical pentru a putea evita să rănesc acești copii? Așa că am să vă pun o întrebare. Cât crezi că într-un laborator cu randament ridicat, cum ar fi Laboratorul Channing de vizavi, cât crezi că costă să vezi dacă genomul tău are acest polimorfism și, prin urmare, ar trebui să avem grijă să te tratăm cu sulfa? Cât crezi că ne-ar costa să-ți procesăm sângele și să obținem ce ortografie aveai pentru acel polimorfism? Și am întrebat asta întregii clase și am întrebat asta de nesfârșite pentru oameni foarte în vârstă și oameni foarte juniori. Și dacă nu cunoști cu adevărat răspunsul, atunci nu răspunde. Dar să mergem pentru asta. Regulile „Prețul este corect” funcționează. PUBLIC: Ei bine, presupuneți că aveți deja o probă de sânge acolo? Doar costul rulării testului? ISAAC SAMUEL KOHANE: Da, nu vă cer să plătiți pentru extragerea de sânge. Dreapta. Cât costă? PUBLIC: 30 de dolari [INAUDIBIL]. ISAAC SAMUEL KOHANE: Mai puțin de un dolar. PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: 130 de dolari. PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: 5 dolari? PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Cât de mult? PUBLIC: 1 USD ISAAC SAMUEL KOHANE: 1 USD. PUBLIC: 50? ISAAC SAMUEL KOHANE: Ce? 50? PUBLIC: Cred că [INAUDIBIL]. ISAAC SAMUEL KOHANE: 100? PUBLIC: Nu, mai puțin de 1 USD. ISAAC SAMUEL KOHANE: Mai puțin de 1 dolar. Deci haideți să vă dăm realitate. Astăzi, ai fi taxat... taxa, care nu este întrebarea pe care ți-am pus-o. Veți fi taxat cu aproximativ 500 USD până la 1.000 USD. Costul real dacă executați testul la timp al tehnicianului și al materialelor dvs., deci costul total este, dacă sunteți extrem de ineficient, de 0,50 USD. Dacă ești un foarte eficient, 0,10 USD. Deci, este important de realizat, deoarece astăzi ne aflăm într-o cameră de urgență care declanșează în mod obișnuit SMA 20, care este 20 de lucruri diferite, cum ar fi sodiu, potasiu, clorură, dioxid de carbon, BUN, creatinina și alte câteva teste. Și ești taxat la ordinul de... sau asigurarea ta, sperăm că este taxată la ordin de 100 până la 200 de dolari pentru a face asta. Costul marginal al acestui lucru nu este mai mare decât al producerii acelor electroliți. Deci, ceea ce ne spune acest lucru este că astăzi, este posibil să rulăm, pentru boli neobișnuite, 1.000 de teste de tăiere diferite la un mod rentabil. Deci, chiar dacă polimorfismul tău este rar, dacă are semnificație clinică, putem găsi 1.000 de polimorfisme rare diferite care, în total, pot ajunge să fie o mulțime de oameni. Și nu sunt singurul care a recunoscut acest lucru, iar acum există o grămadă de companii care înțeleg asta. Așadar, companiile care percepeau anterior 1.000 de dolari pe teste sunt supuse unei presiuni asupra costurilor și, pentru a vă oferi un fel de sentiment bazat pe realitate, probabil ceea ce veți vedea în următorii 5 până la 10 ani ca această tehnologie, deoarece... înțelegeți, această tehnologie este de fapt un nivel de mărfuri -- este că prețul va fi zdrobit de la nivelul 1.000 la un 10. Desigur, vor rezista la fiecare pas și vor încerca să încarce până la ultimul dolar de-a lungul În felul acesta, dar este un fel de efect de internet, deoarece costurile adevărate sunt banale și percepem guvernului aceste prețuri în vrac tot timpul pentru studiile noastre de asociere umană. Deci, aceasta este o înțelegere extrem de importantă . Și de ce este atât de important de înțeles? Pentru că dacă te uiți la numărul de publicații ale diferitelor polimorfisme care au avut loc în timp, acesta este 1980. Acesta este 2005. Și ceea ce vezi aici este că a crescut constant și nu atât de încet în fiecare an, astfel încât acum suntem aproape de 8.000 de publicații pe an despre raportarea diferitelor polimorfisme. După cum veți auzi în două sau trei prelegeri de acum încolo, peste 50% dintre acestea sunt rapoarte greșite, iar unul dintre lucrurile pe care trebuie să le învățați la această clasă este ceea ce constituie un raport bun versus unul rău, un factor de protecție bazat pe pe un polimorfism. Cu toate acestea, vă spune că există mii de polimorfisme acolo. Chiar dacă 50% dintre rapoarte sunt greșite, mii de polimorfisme sunt asociate cu boli clinice care sunt raportate în literatură pe an. Deci este un număr mare. Și așa cum vom ajunge la scurt timp, genomica nu se referă la boli cu o singură genă. Dar, cu toate acestea, numărul bolilor despre care se constată că au o bază monogenă crește și mai rapid exponențial din 1981 până în Mileniu. Și așa că ceea ce ți-am spus până acum a fost cifra de 0,05 USD, am vrut să mă asigur că ai înțeles că asta este adevărat. Următoarele nu sunt într-un viitor atât de îndepărtat. De fapt, este realizabil acum, dar este doar pe bază de cercetare. Acesta este un cip mare. Este un cip format din multe cipuri Affymetrix vândute de o companie numită [INAUDIBLE], care este o subsidiară deținută în totalitate de Affymetrix. Și vă voi spune mai multe despre acest cip două sau trei prelegeri de acum înainte. Dar este suficient să spunem că, în loc să interogheze pentru o genă diferită în fiecare loc, se interoghează fiecare greșeală de ortografie posibilă a întregului genom uman sau-- și cred că asta este-- da, întregul genom uman de pe această colecție de cipuri, așa că că dintr-o singură lovitură -- asta este de fapt doar pentru cromozomul 21 -- poți de fapt genotip complet întregul cromozom al unui individ în două ore. Și asta este disponibil astăzi. Este tehnologia mărfurilor. Este prea scump să vă pot oferi același sentiment de realitate ca și eu pentru genotiparea SNP unică. Și vreau să spun, asta arată doar că sunt capabili să arate cuprinzător frecvențele de distribuție a diferitelor SNP-uri la acești indivizi dintr-o singură lovitură. Și asta îmi reamintește că, în ziua următoare, voi începe să încarc pe site-ul Cursurile mele -- vă voi ajunge într-o secundă -- pe site-ul web Cursurile mele PDF-uri cu toate lecturile cursului. Așa că astăzi, o voi completa cu lucruri care ar fi relevante pentru prelegerea de astăzi. Cu toate acestea, pentru prelegerile viitoare, veți avea PDF-urile pentru prelegerea din ziua respectivă anterioară acelei zile. Deci... ai de gând să pui o întrebare. PUBLIC: Da, [INAUDIBIL] fă-o [INAUDIBIL].. Deci acestea sunt doar identificarea unei secvențe de gene, sau aceasta iese din proiectul genomului și se bazează pe [INAUDIBIL]? ISAAC SAMUEL KOHANE: Deci se bazează este că este o confluență a mai multor industrii... ei bine, ce este? Fiecare mică secvență de pe acest microarray corespunde... numele de pe tablă. Fiecare secvență corespunde unei întinderi de ADN, iar centrul acelei mici întinderi de ADN acea întindere a întregii nucleotide, 20 de baze. În mijlocul acestuia se află polimorfismul. Și deci să presupunem că vrem să surprindem toate cele patru polimorfisme posibile. Pentru acea porțiune de ADN, veți avea patru nucleotide corespunzătoare ACE sau C sau T sau G care sunt diferite pe acea bază centrală. Așadar, aici sunt toate polimorfismele diferite care sunt cunoscute pentru cromozomul 21. Deci, cum obțin asta? Este o combinație a SNP-urilor verificate de la Proiectul Genomului Uman , a SNP-urilor verificate de la Celera pentru care au trebuit să plătească cash-- dar sunt o companie, nu au nicio problemă cu asta. Și au licențiat și SNP-uri de la ABI, de la [INAUDIBLE] Biosystems. Și, în cele din urmă, și-au făcut propria resecvențiere, astfel încât să știe care sunt toate SNP-urile, SNP-urile comune, pentru această regiune. Deci, puteți, dintr-o singură lovitură, să evaluați direct prin hibridizarea ADN-ului acum, nu a ARN-ului, care sunt genotipurile celor care sunt cunoscute. Acum, dacă nu era cunoscut, atunci nu ar apărea aici. AUDIENTĂ: Deci, doar ca o întrebare ulterioară, văzând cum acestea sunt SNP-urile care sunt cunoscute și luate din surse și știm că acele surse sunt practic câțiva subiecți eșantion. ISAAC SAMUEL KOHANE: Da. PUBLIC: --o să vorbim cât de cât în ​​curs [INAUDIBIL]. ISAAC SAMUEL KOHANE: Clasa. PUBLIC: --cursul despre implicațiile unui grup foarte mic de indivizi și comparație cu [ INAUDIBILĂ] a altor oameni? ISAAC SAMUEL KOHANE: Cu siguranță suntem... deci la ce vă referiți este, de exemplu, proiectul genomului uman și proiectul Celera s-au bazat pe mai puțin de 20 de indivizi fiecare. Și așa am două coloane. Prima, o coloană cu care nu mă simt prea confortabil, dar totuși adevărată este că, dacă este un SNP obișnuit, va apărea de obicei într- unul dintre acele 20 mai mult sau mai puțin. Pericolul este opusul, este că o mulțime de mutații private - cu alte cuvinte, puteți împărtăși un SNP cu și familia dvs. imediată, de oriunde ați veni, asta nu este prezent în nimeni. Dar dacă sunteți unul dintre cei 20, acesta are acum această reprezentare majoră în această bază de date și, probabil, este cealaltă direcție pentru care trebuie să ne îngrijorăm. Cu toate acestea, răspunsul la acesta este foarte simplu acesta - este o resecvențiere masivă a multor mai mulți indivizi. Și pe măsură ce această tehnologie devine marfă, această problemă va dispărea. Deci, proiectul hărții HapMap , de exemplu, este un proiect despre care veți auzi în timpul acestui curs. Și este un proiect de definire a structurii SNP-urilor pentru populații mai mari și populații diverse din punct de vedere etnic, deoarece, așa cum v-am sugerat în acel termen, mutații private, vă puteți imagina sau veți fi învățat că există diferite subpopulații care au aceste SNP care sunt prezent doar într-o subpopulație fie într-o subpopulație numită familia ta, fie într-o subpopulație numită oameni care au venit de pe acel continent din care ați venit inițial. Deci răspunsul scurt este că este o problemă și este o problemă mai mult pe o parte și pe cealaltă. Cu alte cuvinte, din moment ce... permiteți-mi să reformulez asta. Există o anumită frecvență de SNP-uri comune, aproximativ unul pe kilogram de bază. Dar dacă te uiți la SNP-urile rare, au o frecvență mult, mult mai mare. Cu alte cuvinte, am o grămadă de SNP-uri care sunt doar unice pentru mine și câteva mii de oameni care au o moștenire comună cu mine. Și probabil că acestea nu au, apropo, în cea mai mare parte, nicio semnificație clinică. Dar dacă aș fi unul dintre cei 20, ar fi suprareprezentat în acel eșantion dacă nu este o tăietură obișnuită. Ah. Deci, acest lucru face următorul punct simplu. De ce... răspunde la următoarea întrebare. De ce este calculul o parte atât de centrală pentru medicina genomică? Și pur și simplu asta-- aceste două curbe bursiere stil 1999 , curbe bursiere, corespund următoarelor două procese. Această curbă mai superficială reprezintă numărul de publicații din „Medline”, depozitul online de articole, și merge până la un secol, Index Medicus. Și este [INAUDIBILĂ], să zicem, curbă exponențială. Dar, din cauza industrializării secvențierii genelor, numărul de secvențe a crescut la o curbă exponențială mult mai mare. Și ce vă puteți gândi despre asta, ca un proxy pentru decalajul de cunoștințe. Dacă considerați că acestea sunt date genomice, secvențele genomului fiind date genomice și acestea fiind un proxy pentru cunoștințele noastre, acest decalaj este. Crește și crește chiar mai repede decât este descris aici, deoarece nu este doar secvența ADN. Sunt hărți genetice fizice, hărți, polimorfism, informații despre structură, modele de transcripție genetică, activitatea de translație a proteinelor. Și toate acestea ajung în baze de date. Și dacă sunteți ca mine în mijlocul unui centru medical, veți descoperi că sunt foarte, foarte puțini oameni care sunt pregătiți ca medici și care au abilitățile necesare de calcul. Deci am un doctorat în informatică, dar asta nu este calea medicală obișnuită, mulți dintre voi din această sală aveți de fapt un set bun de abilități comune, dar sunteți în minoritate. Și, în consecință, pentru că toate aceste tipuri de date ajung într-o bază de date, încercarea de a transpune acest lucru în medicină este în mod fundamental transferată în responsabilitatea indivizilor care pot atât să înțeleagă problemele biologice, cât și să traducă printr-o varietate de tehnici de calcul toate aceste date în mai multe cunoștințe. Deci orgoliul, îngâmfarea de [? bioinformaticienii?] este că într-un fel putem folosi tehnici de calcul pentru a ridica acest nivel la acel nivel. Am făcut deja [INAUDIBILUL]. Așa că acum să vorbim despre ce este genomic versus genetic pentru că auziți acești termeni foarte des ca și cum ar fi interschimbabili. Și cam vor fi, dar nu sunt încă deloc. Și depinde de perspectiva ta. Așa că lasă-mă să spun această glumă. Sper că crezi că este o glumă. Un inginer, un fizician, un matematician, un informatician și un statistician sunt într-un tren care se îndreaptă spre nord și tocmai trecuseră granița în Scoția. Se uită pe fereastră și văd pentru prima dată o oaie neagră. Exclamă inginerul, uite. Oile scoțiene sunt negre. Fizicianul strigă, nu, nu, niște oi scoțiene sunt negre. Matematicianul pare iritat și spune că există cel puțin un câmp care conține cel puțin o oaie din care cel puțin o latură este neagră. Informaticul spune, oh, nu, un caz special. Și, de fapt, așa vedeți genomica și genetica corespunde de fapt cu locul în care vă aflați în acest spectru. Deci asta vă va informa probabil de ce există o confuzie globală. Și în sfârșit, statisticianul, am uitat, spune că nu este semnificativ statistic. Deci, iată o viziune a genomic versus genetic. Așadar, medicina genetică, genul de medicament care există pentru noi de mult timp, are de-a face cu frecvențele joase ale genelor cu penetranță ridicată, ceea ce mă refer la gene care, dacă aveți acea mutație specială în acea genă, vă vor da un nivel ridicat. probabilitatea de a avea acea boală. Și există mii de aceste boli relativ neobișnuite. Cea mai comună dintre acestea, hemocromatoza, care este depunerea de fier în ficat, are o frecvență în populație de aproximativ 1 până la 300. Și anterior aceste boli au fost în mare parte evaluate indirect sau concentrate pe gene individuale prin care se leagă indirect - de exemplu, legături în cadrul unei familii. În schimb, medicina genomică nu se referă la o boală rară, ci doar la boli comune. Este diabet, cancer, boli de inima, boli inflamatorii. Și, prin urmare, aproape prin definiție, riscul geniculat pentru boli comune se va datora adesea zonelor producătoare de boli cu frecvențe relativ ridicate - adică mai mare de 1%. Și toate aceste gene din această perspectivă pot fi cauzatoare de boli. Și nu sunt pentru boli neobișnuite. Sunt pentru tulburări comune și se datorează interacțiunilor mai multor gene și factori de mediu. Și din cauza industrializării medicinei genomice, facem acces experimental direct la întregul genom în modul pe care tocmai am ilustrat-o. Altcineva, [INAUDIBLE] și [INAUDIBLE], au făcut o distincție similară între genetic și genomic. În genetică, te uiți la o structură de gene, secvența. În medicina genomică, te uiți la funcția acestor gene. În bolile genetice, te uiți la genomica. Te uiți la ADN. În medicina genomică, ne uităm la mai mult decât la genă. Ne uităm la ARN și la proteine. La asta m-am referit deja. Descoperirea genelor bazată pe hărți - cu alte cuvinte, legătura probabilistică între loci și descoperirea genelor bazată pe secvență directă. Adică, acum, bolile sunt descoperite computațional. Nu știu dacă o să o rezolv, dar există un exemplu grozav acum al modului în care oamenii descoperă genele factorului de risc al colesterolului pe baza atributelor noastre comune în genomul nostru între om și șoarece. Fără să fi turnat vreodată un pahar, oamenii sunt de fapt capabili să identifice computațional noi factori de risc în acest mod. Dar poate voi ajunge la asta. Tocmai mi-a trecut prin minte că nu mai țin prelegeri despre genomica comparativă, care este modul în care profităm de fapt de genomul altor specii pentru a ne informa despre medicina umană. Poate ar trebui să încadrez asta retroactiv. Și din nou, în genetică, sunt tulburări monogenice. În genomică, este vorba despre tulburări multifactoriale. Și există un diagnostic specific de ADN în boala genetică. Ai boala asta. Spre deosebire de genomica, este mai mult riscul pentru următorii factori, deoarece nu este, de fapt, o boală cu penetranță ridicată. Și vă uitați la acțiunea genelor și la bolile genetice și vă uitați mai mult la reglarea genetică în medicina genetică. Și etiologie, mutație specifică versus... pentru că o mutație doar îți spune că există o eroare care este asociată cu o boală, în timp ce în medicina genomică, spui, cum a ajuns această eroare să dea naștere acestei boli? Și în genetică, este o singură specie. În genomică, sunt mai multe specii. Acum cred că ați putea susține cu bună-credință că există o mulțime de suprapuneri în aceste două, dar în general așa pare să fie împărțită lumea. Și cred că asta se va estompa în curând. Dar cred că mesajul important de luat acasă este că în medicina genomică, analizăm cu adevărat toate tipurile de date. Și, practic, vedeți pacientul, dacă doriți să-i priviți într-o manieră reducționistă, ca pe următorul tip de matrice. Analizăm date de mediu, polimorfisme de un singur nucleotide , măsurători proteomice, măsurători ale expresiei genelor și măsurători clinice, cum ar fi istoricul, examenul fizic, studiile de laborator și studiile imagistice de-a lungul timpului. Dar, deși lipsesc date și deși acestea sunt incomplete, acum putem vedea pacientul ca această mare serie de timp în care puteți aplica o mulțime de tehnici de învățare automată pentru a grupa pacienții împreună, pentru a crea noi tehnici de diagnosticare și modelare predictivă pentru a afla unde se află. acest spațiu de posibilități ale acestor atribute este pacientul probabil să fie în viitor. Și această comprehensiune cred că caracterizează medicina genomică. După cum vom ajunge mai târziu în curs, voi identifica cât de din păcate aceasta devine o marfă. Doar măsurătorile genomice sunt ieftine, așa cum tocmai v-am ilustrat. Dar această parte, pentru că avem de-a face cu acești doctori proști, este foarte scumpă pentru că necesită forță de muncă. Încercarea de a evalua fenotipul pacientului este un proces intensiv în muncă, la fel cum este îngrijirea medicală, la fel cum este educația. Și de ce trebuie să fim cuprinzătoare? În afară de faptul că ne place să fim cuprinzătoare, care este motivația noastră? Și răspunsul este foarte simplu. Ea vine din înțelegerea faptului că fenotipul nu este doar legat direct probabil doar de o genă. Deci, în vechea medicină genetică, te- ai uita la o genă, un marker, un polimorfism pe o genă și să spui, ah, această genă are un G în poziția 291, ori de câte ori această persoană are un risc de boală cardiacă. Și ceea ce ați spune cu adevărat este că atunci când această genă are această ortografie, este asociată probabil cu o altă genă despre care nu știți că provoacă direct o schimbare a fenotipului. Deci, în medicina genomică, dorim să măsurăm această genă, dar și orice altă genă care ar putea contribui la acest fenotip, deoarece, după cum știm bine, chiar dacă ai bloca în aceeași cameră cei trei indivizi cu același polimorfism al acelei gene, ei ar au de fapt diferite boli. Dacă te uiți la boala Huntington, boala Huntington este această boală îngrozitoare în care îți pierzi controlul asupra membrelor la 40 de ani și devii dement din cauza unui număr în creștere de [? CG?] se repetă în gena lui Huntington. Cu cât acest număr se repetă mai mult , cu atât este mai mare numărul de repetări, cu atât debutul este mai acut, cu atât debutul este mai devreme. Dar dacă luați în medie, dacă luați un set de indivizi cu aceeași lungime a repetărilor și le studiați, aceștia au o distribuție largă pentru acea perioadă dată de repetare și debutul bolii. De ce, mă rog? Ei bine, pentru că au un fundal genetic diferit, iar aceste alte gene, aceste alte gene care implică neurotransmițătorii, genele structurale care au legătură cu structura sinapselor și așa mai departe, o influențează și ele. Și, prin urmare, acțiunea acestei gene asupra fenotipului este condiționată de toate aceste alte gene. Și, în plus, să nu uităm de mediul comun și de mediul individual și de factorii culturali care pot influența în continuare acest lucru. Și o să vă subliniez în scurt timp că acest lucru este prea real. Deci, în genetică, doar ca să vă reamintesc, medicina genetică, practic, studiul a ceea ce era probabilitatea ca un anumit fenotip să se întâmple având în vedere un anumit genotip, iar medicina genomică ar încerca să evalueze direct toate genele și să captureze acești alți factori și să vadă cum aceștia. interacționa. Și asta creează o problemă fundamentală, iar întrebarea pe care ți-o poți pune este, de ce în medicina genomică biostatisticienii nu sunt în centrul atenției ca parte a procesului? La urma urmei, în ceea ce privește analiza cantitativă a rezultatelor clinice, de exemplu, acestea au fost destul de omniprezente. Și răspunsul este pur și simplu acesta. Într-un studiu clinic tradițional, cum ar fi Studiul de sănătate a asistentelor sau Studiul Framingham Heart, ați avea de ordinul a zeci de mii de pacienți și cel mult sute de variabile. Și există o mulțime de modele autoregresive încercate și adevărate -- de exemplu, teste T, teste parametrice și neparametrice -- care funcționează extrem de bine pentru acest tip de set de date. Din păcate, în genomică, avem exact invers. Avem 10.000 sau sute de mii dacă ai variabile proteomice și avem doar, într-o zi bună, sute de pacienți, mai ales dacă te uiți la ceva din creier. După cum ți-am explicat la început, vei avea doar câteva sute de creier, să spunem, cu cancer la creier. Și așa că permiteți-mi să pun asta într-un fel de termeni de școală generală. Dacă aveți o variabilă, de câte întrebări aveți nevoie pentru a o rezolva? unu. Dacă aveți două variabile, de câte ecuații aveți nevoie pentru a le rezolva? Două. Și dacă aveți 10.000, de câte aveți nevoie pentru a o rezolva? Mult. Dacă aveți mai puține ecuații decât atât, atunci este nedeterminat. Cu alte cuvinte, există multe soluții posibile pentru relațiile dintre variabile decât aveți la dispoziție. Și acest lucru este atât de nedeterminat încât toate aceste tehnici statistice tradiționale chiar nu au funcționat bine. Și prin urmare, sincer, comunitatea statistică până de curând nu era interesată de acest domeniu. În timp ce comunitatea informatică, probabil pentru că nu sunt suficient de deștepți pentru a înțelege cât de dificilă a fost aceasta problemă, tocmai a început să aplice o grămadă de tehnici pe care le-au aplicat pentru alte seturi de date de înaltă dimensionalitate, cum ar fi vederea, recunoașterea feței, pt. exemplu, și recunoașterea auzului, care au și un număr mare de caracteristici, au aplicat aceleași tehnici acestor seturi de date. Și asta vă oferă doar un motiv cultural pentru care informaticienii sunt bioinformaticienii chiar acum centrul medicinei genetice, mai degrabă decât statisticienii, deși acum intră în joc. Așa că permiteți-mi să vă dau un sentiment pentru noua farmacologie. Acesta a fost un studiu pe care l-am făcut cu un Atul Butte acum patru ani. Institutul Național al Cancerului are 60 de linii de celule canceroase numite NCI 60, pe care le testează pentru eficacitate o varietate de medicamente diferite. Și au, în băncile lor, mii de produse farmaceutice. Și au mii de bucăți de murdărie, frunze care au fost adunate în întreaga lume pe care le testează -- literalmente o frunză în pădurea tropicală, o bucată de praf în China -- pe care le testează pentru a vedea cât de eficient este în inhibarea acestora. 60 de tumori diferite. Și așadar, ceea ce am făcut atunci în colaborare cu unul dintre foștii mei stagiari, Todd Golub, am extras ARN-ul din aceste 66 de linii de celule canceroase și am măsurat cât de mult din ARN era exprimat în aceste 60 de linii de celule canceroase. Și am obținut de la Institutul Național al Cancerului, pentru un subset din cei 50.000 de compuși pe care i-au testat, 5.000 -- să văd cum mă descurc pentru un timp -- 5.000 de medicamente care au fost testate împotriva celor 60 de linii de celule canceroase și cum mult inhibiseră creșterea celulelor. Voi ajunge la detaliile acestui experiment în... detaliile comune ale celulei într-o altă prelegere. Dar este suficient să spunem că aceasta este imaginea de ansamblu. Ai 60 de linii celulare comune , 6.000 de gene, 5.000 de agenți anticancerigen. Deci aveți 11.000 de variabile cu doar 60 de linii celulare. Pare un lucru mizerabil de făcut. Și totuși, ceea ce am putut face este următorul. În această diagramă cu aspect complicat, am ales un coeficient de corelație între toate -- dacă am calculat toate corelațiile posibile între toate cele 11.000 de variabile, asta ne-a dat de ordinul a 68 de milioane de corelații diferite. Și dacă alegeți pragul coeficientului de corelație de 0,8, am găsit 202 rețele care se alăturau 834 de variabile - cu alte cuvinte, doar 7% din cele 11.000 - și doar 1.200 de legături din cele 68 de milioane. 1.200 de coeficienți de corelație din cei 60 de milioane au fost peste prag. Doar o legătură a fost peste pragul dintre o genă și un agent anticancer. Și lasă-mă să-ți pun o întrebare rapidă. De ce am găsit o mulțime de corelații între efectul medicamentului asupra liniilor de celule canceroase și un alt efect al medicamentului asupra liniilor de celule canceroase? Deci, de ce am găsit o mulțime de corelații mari medicament-medicament, o mulțime de corelații ridicate între efectul inhibitor al unui medicament și efectul inhibitor al altui medicament? De ce am găsit multe corelații, corelații mari? PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Ce? PUBLIC: Erau similare din punct de vedere chimic? ISAAC SAMUEL KOHANE: Erau asemănătoare din punct de vedere chimic, deoarece, în felul în care sunt create, multe medicamente sunt prin descoperirea unor medicamente imitatoare, făcând mici permutări ale unui medicament existent. Deci, desigur, au reacții similare. De ce au existat multe corelații genă-genă? PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Ce? PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Nu chiar. Este o perspectivă mai fundamentală decât atât. PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Corect, pentru că practic, pentru ca celula să trăiască, genele trebuie să aibă acțiune coordonată. Deci nu toate genele, dar genele care formează ribozomul, care formează complexul de transcripție care rulează oxidarea, toate trebuie sintetizate în ARN aproximativ la fel. Timp. În caz contrar, nu veți avea acțiuni coordonate. Există o mulțime de excepții de la asta. Dar, în general, este adevărat. Și, de fapt, întreaga zonă a grupării analizei expresiei, așa cum voi ajunge într-o altă prelegere, nu ar funcționa dacă acea intuiție nu ar fi adevărată. Dar Dumnezeu sau evoluția nu au dezvoltat gene și compuși chimioterapeutici împreună. Deci, nu există un motiv anterior special pentru care modelul inhibitor al unui medicament și profilul de expresie genică ar trebui să fie legate. Și așa am fost al naibii de norocoși să găsim chiar și unul, dar am făcut-o. Și s-a dovedit că legăturile erau această genă și acest medicament. Înainte să vă explic care sunt acestea, permiteți-mi să rezumam ce înseamnă. Înseamnă că în toate aceste 60 de linii de celule canceroase - și acestea au fost diferite linii de celule canceroase foarte diferite . Erau cancer de ficat, cancer de sân, cancer de piele, cancer de sânge, 60 de tipuri de cancer diferite. Cu cât această genă a fost exprimată mai mult în cancer, cu atât linia de celule canceroase a fost mai sensibilă la acest agent chimioterapeutic. Și se dovedește că această genă este L-plastina, cunoscută și sub denumirea de LCP1 sau Lymphocyte Cytosolic Protein. Drogul este acest lucru impronunciabil. Adică, multe dintre acestea sunt doar medicamente pe care le-au obținut, în esență, cu ridicata de la companiile farmaceutice. Dar se dovedește că este un derivat de acid carboxilic [INAUDIBIL]. Cei dintre voi care știu ceva despre diabet știu că alți derivați ai acidului carboxilic [INAUDIBILI] sunt cunoscuți că inhibă creșterea celulelor tumorale. Și apropo, acestea sunt aceeași clasă de medicamente ca și agenții hipoglicemianți orali, pastilele pe care le vor lua diabeticii de tip doi. Și rolul nostru pentru această genă în [? tumorigenicitatea, ?] generarea de tumori, au fost postulate anterior. Și, de fapt, după publicarea noastră a acestei lucrări în [INAUDIBLE], de fapt, un grup de la Institutul Național al Cancerului a reușit să arate răspunsul la doză pe care l-am calculat, de fapt . Da. PUBLIC: Deci, dacă înțeleg descrierea experimentului [INAUDIBIL] și rezultatele... ISAAC SAMUEL KOHANE: Da. PUBLIC: - este sigur să spunem ca generalizare că ori de câte ori găsiți o legătură între o anumită [INAUDIBILĂ] și o genă care [INAUDIBILĂ] în liniile celulare [INAUDIBILĂ], acestea sunt gene care de obicei vor avea o conservare ridicată. rata peste [INAUDIBIL]? ISAAC SAMUEL KOHANE: Nu. PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: De fapt, dacă ar fi fost adevărat că gena a avut o rată mare de concentrare în toate cele 60 de linii de celule canceroase-- AUDIENTA: [INAUDIBIL]. Cu alte cuvinte, cum ar fi datele acestei gene [INAUDIBILE]---- ISAAC SAMUEL KOHANE: Da. Publicul: - că acest medicament acționează asupra diferitelor linii celulare, acționează asupra acestei gene. Dar probabil că există diferențe în [INAUDIBIL].. ISAAC SAMUEL KOHANE: Să avem conversația noastră [INAUDIBIL] pentru restul clasei. Nu știm cum se comportă. Tot ce observăm acum este o corelație. PUBLIC: OK, corect. ISAAC SAMUEL KOHANE: Nu? Dar tot cred că aveți o întrebare acolo, care este încă adevărată, indiferent de ceea ce tocmai am spus. Deci, cu cât această genă este exprimată mai mult , linia de celule canceroase va fi probabil mai sensibilă la agenții chimioterapeutici. Deci mai aveai o întrebare. PUBLIC: Corect. Ei bine, a fost că nu a avut de-a face cu concentrarea genei, ci doar că... doar de dragul argumentelor, să spunem că de fapt acționează pe [INAUDIBIL]. ISAAC SAMUEL KOHANE: Bine, bine. Da. Dreapta. PUBLIC: [INAUDIBIL]. Deci, să presupunem că acționează asupra produsului genetic și peste liniile celulare, atunci ar fi o presupunere sigură că produsul genetic ar fi foarte asemănător. Cu alte cuvinte, ar exista acest [INAUDIBIL]. Ei bine, nu există... în timp ce cu alte produse genetice, unde nu există nicio corelație între un agent terapeutic... ISAAC SAMUEL KOHANE: Da. PUBLIC: - aveți o mare variabilitate a diferitelor tipuri în interiorul acestor celule. ISAAC SAMUEL KOHANE: S-ar putea să vă înțeleg greșit întrebarea și vă voi întoarce exact ceea ce cred că este neînțelegerea mea. Și poate că este al tău și îl vom lămuri chiar acum. Pentru o anumită genă, ceea ce măsurăm este un produs genetic, care este cantitatea de ARN care este exprimată. Și, practic, ceea ce știm este că produsul genetic este același pentru fiecare linie de celule canceroase. Doar că nu au o nouă genă. Au același complement de gene. Dar doar din punctul de vedere al acestui experiment, singurul lucru care diferă între cele 60 de linii de celule canceroase dintr-un punct de vedere foarte reducționist, doar privind expresia genelor, este cât de mult din fiecare dintre acele gene sunt. re face. PUBLIC: Deci nu există niciun [INAUDIBIL].. ISAAC SAMUEL KOHANE: Nu, te adresezi unui alt nivel de complexitate care poate fi foarte, foarte adevărat. Dar pur și simplu nu am măsurat. PUBLIC: În regulă, pentru că am crezut că unul dintre mesajele de luat acasă a fost acela pentru un fel de produse genetice fundamentale dintr-o cale. ISAAC SAMUEL KOHANE: Da. PUBLIC: Acestea sunt ceea ce vei găsi legături cu agenți terapeutici mai mult decât, să zicem, ceva, știi... ISAAC SAMUEL KOHANE: Ei bine, am ieșit din asta. Deci răspunsul nu este în felul în care îl concepeți, pentru că dacă o faceți -- și apropo, este un punct bun pentru că ne amintește din nou de distincția pe care am făcut-o la început, unde este o diagramă foarte simplă despre ADN , ARN și proteine. Ar exista un studiu în care te-ai uita la genotip și ai spune-- făcând același studiu și te-ai uita la toate genotipurile posibile și ai spune, care genotipuri sunt cele mai predictive pentru acest tip de expresie? Dar aici, nu ne facem griji cu privire la diferențele individuale ale genelor, ne uităm doar la cantitatea de genă care este exprimată. Cu toate acestea, dacă a existat, de exemplu, un efect direct - cu alte cuvinte, dacă cu cât această genă este exprimată mai mult, cu atât cancerul este mai sensibil, fără a merge și a înțelege biologia, care este răspunsul corect, tot pune-ți o întrebare. Deci, dacă fac această genă mai puternic exprimată cu un vector pentru a o face mai exprimată, această linie celulară va deveni mai rezistentă, mai sensibilă la chimioterapie? Aceasta devine o terapie în sine. Dar mulțumesc pentru întrebarea. Așa că tocmai acum-- și asta ți-ar da o idee de ce în The Economist tocmai a apărut în ultimele două săptămâni următorul desen animat care făcea parte dintr-un articol numit „Malign [? Mass,”?] unde ei susțin că de fapt, vine cu aceste modele cuprinzătoare, din care acesta este un exemplu foarte simplu de susceptibilitate a cancerelor la tratament și riscul la cancer, a devenit de fapt atât de matematic încât putem avea de fapt o clasă complet nouă de cercetători care vor profita de aceste modele pentru a găsiți noi agenți terapeutici. Deci, să trecem la... am vorbit despre cât de multe dintre aceste tehnici de măsurare a datelor sunt disponibile astăzi la scară largă. Am discutat despre genetica [INAUDIBILĂ]. Să vorbim acum despre ereditare... mai degrabă ereditară. Așadar, modul în care un genetician al populației gândește despre ereditate în așa-numitul sens larg cu H majusculă este următorul. Ereditatea include toate influențele genetice asupra fenotipului, fie că se datorează efectelor aditive, dominante sau interactive. Deci, când auziți într-o lucrare tehnică ereditatea, ceea ce înseamnă este raportul dintre variația datorată genotipului față de varianța totală a fenotipului, unde varianța genotipului este varianță aditivă, varianță dominantă și varianță interactivă între gene. Aceasta este definiția tehnică a eredității. Deci, să ne gândim la asta într-un mod concret. Nu mănâncă unii oameni și nu se îngrașă? Nu este adevărat? Nu este în genele lor? Cu alte cuvinte, acești oameni săraci care , oricât de puțin ar mânca, vor să se înalțe? E doar greu. Și chiar problema lor este că au acest fond genetic care îi face să fie expuși riscului de această obezitate. Deci avem o mare problemă. Deci modul de a gândi este un experiment pe care am îndrăznit să-l fac doar acum patru ani la MIT. I-am rugat pe toți elevii asiatici din clasă să ridice mâna. Au ridicat mâna și le-am spus să plece. Sunt supărați pe mine și ies din cameră. Apoi, dintre studenții rămași din clasă, care, din moment ce acesta era MIT, a mai rămas aproximativ 30%, zic, ia-ți pulsul. Și ne-am luat pulsul și am găsit un tocilar în cameră. Și am spus, porniți Excel și toată lumea a strigat pulsul. Și l-am pus pe tocilar să ia media și abaterea standard. I- a salutat înapoi pe studenții asiatici și au trecut prin același proces cu ei. Toată lumea își ia pulsul. Ne calculăm, adică, abaterea standard. Și apoi le arătăm tabla. Și, de fapt, există o separare de peste două deviații standard între asiatici și non-asiatici. Și le explic, după cum bine știți, ritmul cardiac bazal al non-asiaticilor este destul de mai mic decât cel al asiaticilor. Și par nedumeriți. Am știut asta? Într-adevăr? Într-adevăr? Pot fi. Nu știu. Și apoi spun, ei bine, chiar este corect? Și apoi, dintr-o dată, se știe ce s-a întâmplat aici. Nu vorbim despre gene. Despre ce vorbim? Ce? PUBLIC: Munca. ISAAC SAMUEL KOHANE: Muncă... vorbim despre mediu pentru că, practic, i-am enervat făcând un lucru potențial rasist. Așa că catecolaminele le curgeau prin vene și i-am făcut să se ridice. Și așa am făcut doi stimuli majori de mediu care le-au schimbat fiziologia. Dar dacă nu știai asta, acea variabilă ascunsă, ai putea ajunge în mod legitim la concluzia că există o anumită stratificare rasială în jurul acestui fenotip și, prin urmare, este cu reducerea la gene. Și ați putea întreba același lucru despre persoanele supraponderale. Poți spune, uite, ei mănâncă la fel de mult ca și mine și, cumva, se îngrașă și eu nu. Deci, obezitatea este doar o epidemie masivă și acesta este ideea. Este o epidemie. Aceasta este prevalența obezității, rețineți, doar din ultimii 40 de ani. Creștere exponențială. Acum te sfid să găsești orice model evolutiv evolutiv genetic posibil care să explice modul în care genomul nostru s-a schimbat atât de repede în 30 de ani. Și rețineți, apropo, acesta a fost în același timp în care cantitatea de calorii din grăsimi a scăzut constant. De fapt, unii susțin că aceasta este cauza, apropo, pentru că am înlocuit acele calorii de grăsimi cu calorii de carbohidrați. PUBLIC: Dar sunt doar SUA. ISAAC SAMUEL KOHANE: Sunt doar SUA. Apropo... dar există o întârziere. Chiar și țările din lumea a treia încep acum -- în momentul în care devin suficiente calorice, de fapt arată asta. Și, în mod evident, nu este genetic și este de fapt condiționat de o schimbare semnificativă în mediul nostru care, cel mai probabil, are de-a face cu combinația dintre modelele noastre de exerciții și compoziția noastră alimentară. Și totuși, dacă n-ai înțelege asta, ai fi doar ciocan pe genomul. Și este acel gen de reducționism, pe care trebuie să-l evităm. Dar dacă tu... în termeni de medicină genetică, nu de medicină genomică, unde gândești cu adevărat cuprinzător, ai putea întâlni cu ușurință acest tip de eroare. Și cum definim mediul, dieta, obiceiurile zilnice, insultele mediului, îngrijirea medicală? Și astfel genotipul nu surprinde stările individuale ale pacientului . Este ceea ce v-am spus mai devreme, dar cred că este un exemplu grafic despre cum este adevărat. Deci, trebuie să surprindem și să cuantificăm influențele mediului. Trebuie să surprindem efectul genotipului și efectele mediului asupra fenotipului. Și acestea două cuprind-- istorie, studii fizice, studii de laborator, imagistică, pe care, de fapt, toți veți recunoaște că cei dintre voi care sunt pregătiți medical este istoricul medical de bază. Și așa că, dacă vrem cu adevărat să facem genul cuprinzător de studii de care avem nevoie pentru a putea diseca interacțiunile de mediu și genetice, trebuie să avem aceste elemente de date. Și de aceea aceasta face parte din medicina genomică - pentru că aceia dintre voi care vor fi doctori sau cercetători clinici sau cercetători care studiază fenomenul clinic, cumva va trebui să puteți obține acest lucru cu acuratețe și la scară largă. Și asta e cam plictisitor, sincer, dar netrivial. Și deci asta repet ceea ce am spus, dar vreau doar să subliniez asta. Există mai mult în descrierea stării decât genomul. Având în vedere necesitatea de a surprinde atât starea genetică a mediului, cât și interacțiunea, abia atunci vom putea elucida variația mediului datorită genomului și prin interacțiunea dintre mediu și genom. De exemplu, vă veți da seama de efectele de risc ale fumatului asupra cancerului pulmonar doar dacă puteți cuantifica bine mediul, care este atât fumatul, cât și expunerea la alte substanțe chimice dăunătoare din mediu. Și este necesar pentru noi terapii eficiente. Este necesar pentru o înțelegere mai profundă a mecanismului și necesită capturarea interacțiunii menționate mai sus, iar cu cât captăm mai puțin, cu atât mai nedeterminat, în sensul pe care vi l-am dat , este sistemul. Ei bine, rămânem fără timp. Un lucru pe care vreau să-l fac adevărat pentru această clasă este că termin mereu la timp. Așa că vom vorbi doar despre ultimul punct, iar altădată, vă voi vorbi despre accelerarea activării consumatorilor. Iată o întrebare pediatrică standard. Aveți aici curbele standard de creștere în înălțime și în greutate. Și aveți un pacient care cade din curba de înălțime și cam cade din curba greutății. Și pentru a le diagnostica, aveți înălțimi și greutăți și antecedente familiale. Le puteți face o radiografie la încheietura mâinii. Puteți măsura dezvoltarea sânilor sau dimensiunea testiculelor. Și tulburările arată modele caracteristice pe o diagramă de creștere. Dar dacă ai doar ghinionul de a-i trimite la clinica mea, vom face și alte analize. Ne vom uita la funcția tiroidei. Ne vom uita la o proteină numită IGF1, care este produsă ca răspuns la hormonul de creștere. Căutăm inflamația, ne uităm la hemograma și așa mai departe. Și dacă încă avem dovezi că într-adevăr nu mergeți bine, atunci vă aducem la spital unde vă expunem la insulină și la glucagon. Și asta face un copil hipoglicemic. Așa că leșin și se simt neplăcut, apoi devin greață din cauza glucagonului. Așa că vomită și apoi plătesc 2.000 de dolari pentru plăcerea de a fi fost cu noi dimineața. Și interpretarea rămâne totuși controversată, deoarece există o rată semnificativă de fals pozitive și există o rată semnificativă de fals negativ. De ce, mă rog? Pentru că cu adevărat nu surprindem procesul de bază. Și, de exemplu, pacienții obezi uneori nu prea secretă suficient hormon de creștere. Dacă ești înainte de pubertate, uneori dacă nu ai deloc suficienți hormoni sexuali, s- ar putea, de fapt, să nu secreti niciun hormon de creștere, chiar dacă în cele din urmă vei secreta hormonul de creștere. Și vom rata cu totul următorul lucru. Aici, în vârful cromozomului X și Y se află o genă numită SHOX, Short Stature Homeobox. Și cei dintre voi care sunteți doctori sau studenți la medicină, știți ce este sindromul Turner? Știți ce este sindromul Turner? PUBLIC: [INAUDIBIL] ISAAC SAMUEL KOHANE: Aproape. Ai categoria potrivită. X nu Y și arată ca niște fete. Și sunt scurte. Ce [? gât? ?] Excelent. Sunt scunzi. Au doar un X și nu un Y. Și după oră, îți voi da întregul sindrom Turner ca să pot termina la timp. Și sunt scurte. De ce sunt scurte? Pentru că au o singură doză de SHOX. Acum se dovedește... pentru că nu au doi cromozomi X. Se dovedește că cel mai frecvent cromozom este, desigur, de statură mică la bărbați și s-a întâmplat la 2,5% dintre cei idiopati, adică fără o cauză cunoscută, copiii mici au mutații SHOX, ceea ce îi face să fie scunzi. Și acești mutanți au hormon de creștere perfect normal. Dar dacă le tratezi cu hormon de creștere, vor crește la o dimensiune normală. Și acest lucru este cunoscut în literatură și pur și simplu nu a fost testat. De fapt, am testat asta din cauza acestui curs al naibii. M-am asigurat că sunt pe deplin familiar. Dar, așa cum am spus, în propria mea clinică, acum probabil mai puțin de 25% dintre medici comandă asta. Și totuși, aceasta este o cauză complet tratabilă de statură mică. Și spre deosebire de... și nu este la fel de scump ca testul mare de insulină glucagon pe care ți l-am dat. Și este mult mai sigur rezultatul. Dacă ai această mutație, cu siguranță vei fi scund și cu siguranță vei răspunde. Așadar, acesta este doar un pic de prezentare pentru a vă arăta cum astăzi, la îndemâna mea, pot comanda testul astăzi și fac asta. Doar că nu sa făcut. Deci asta ne aduce la cealaltă problemă, care este educația. Dacă pot exista mii de mutații care sunt semnificative clinic, cum naiba le vom învăța studenților noștri la medicină care sunt deja supraîncărcați? Și răspunsul, cred, și dacă nu poți veni cu o soluție mai bună , este unul sau dublu. Fie creați o grămadă de experți a căror singură sarcină este doar să privească pacientul ca pe un medic și să spună, au X, Y sau Z, sau trebuie să aducem tehnologia informației în fața procesului, astfel încât, pe măsură ce dvs. introduceți caracteristicile pacienților, toate posibilitățile genetice încep să se actualizeze. Și asta este o problemă pentru că acesta este un arbore de decizie pentru tratamentul cancerului de prostată bazat pe un vechi test proteomic, și anume antigenul specific de prostată. Și, practic, ce-i faci cuiva care are practic o umflătură mare la prostată? Și problema este că dacă te uiți la literatură... am făcut asta anul trecut. Adică 7.325 de articole, 7.000 de articole-- îmi pare rău pentru culoare sau lipsă. 7.000 de articole spun, care este ordonarea corectă a deciziilor pe baza acestui singur test? Deci, în funcție de diferitele niveluri de PSA. Acum, acesta este doar un test proteomic pentru o genă. Ce naiba o să facem cu acești arbori de decizie atunci când trebuie să măsurăm... sau vom măsura, așa cum putem astăzi, mii de niveluri de expresie genetică sau niveluri de proteine compensează un arbore mult mai complex și noi" Apropo, nu voi avea niciodată destui pacienți pentru a încerca toate posibilitățile diferite. Dar aceasta este o provocare fundamentală a medicinei genomice. Așa că la asta s-a făcut aluzie și, doar în interesul timpului, îl voi scurtcircuita, deși acest slide va fi pe web în curând. Dacă ai avea doar 10 boli, 10 ipoteze și ai avea cinci teste binare... deci nu există un antigen specific prostatic . Nu sunt diferite niveluri într- un mod continuu și spuneți doar că este normal sau anormal. Deci cinci teste binare -- analiza necesită cunoașterea a 63.000 de probabilități pentru a putea calcula probabilitatea tuturor rezultatelor posibile la toate testele diferite. Și este foarte greu de imaginat cum vom face asta în mod cuprinzător. Și, de fapt, numărul de boli este mult mai mare decât acesta. Numărul de teste pe care le putem face este mult mai mare decât atât. Deci, aceasta este o provocare metodologică fundamentală pentru noua medicină. Și în același sens, voi face doar... acum acestea vor fi ultimele mele diapozitive. Medicina bazată pe dovezi este o mișcare mare în medicină care spune, să ne uităm la literatura de specialitate și să încercăm să aflăm care este cea mai bună practică. Și au făcut asta pentru o serie de domenii diferite de boală și există literalmente mii de medici și cercetători care completează aceste baze de date de medicină bazată pe dovezi, cea mai mare fiind colaborarea Cochrane. Dar dacă te uiți la secțiunea genetică, este vorba doar de câteva boli genetice foarte penetrante. Există foarte puține lucruri de ghidat-- de fapt, nu există nimic care să-l ghideze pe practician pentru nimic din aceste boli genomice pentru aceste boli foarte comune, care este locul în care opresc cursul de astăzi pentru că am rămas fără timp. Și pentru altă dată, vă voi spune despre problemele pacienților care sunt capabili să selecteze teste, să comande teste pe web astăzi. De fapt, puteți trimite propriile mostre pentru a fi secvențiate și vi se oferă o interpretare dubioasă sau o interpretare dubioasă . Și apoi apari în cabinetul unui medic, iar el nu știe sau ea nu știe ce să facă cu asta. Dar asta va fi pentru altă dată. Bine, orice problemă administrativă, nu ezitați să...