ATUL BUTTE: Deci săptămâna trecută am vorbit despre... despre ce am vorbit? Am vorbit despre o introducere în biologia moleculară pentru aproximativ 10 sau 12 diapozitive. Și apoi mergeam destul de repede, am acoperit o mulțime din acest material despre tehnicile de măsurare a genelor. Și așa că am avut deja o întrebare, sau o solicitare, să vorbim despre ceva pe care de fapt am răsfoit destul de repede , acest concept de SAGE și cum este folosit SAGE pentru a măsura microarray-urile. Și, de fapt, este o măsură a ARN-ului și este destul de important să vorbim de fapt despre SAGE, cred. Dar voi începe discuția cu SAGE vorbind din nou despre microarray pentru o secundă. Așa că am vorbit despre microarrays, despre cum acestea sunt făcute grile de ADN. Fiecare punct din grilă caută un anumit ARN. Și, de fapt, mai multe puncte ar putea fi hibridizate într-un singur ARN. Nu trebuie să fie unul la unu. Ar putea fi mai mulți la unu. Și vreau doar să vorbesc despre diferențele dintre cele două tehnologii pentru microarray și apoi să vorbesc despre modul în care aceasta duce de fapt la discuția SAGE. Deci, în ultimii 10 ani, au existat două tehnologii pentru a face microarray. Există abordarea cu oligonucleotide și abordarea ADNc. Analogia pe care îmi place să o folosesc este aceasta. Dacă te gândești la un microarray ca, să zicem, Manhattan cu toți zgârie-norii. Dacă ar trebui să reconstruiești Manhattan-ul, există două moduri în care ai putea face asta. Ai putea să iei câte un zgârie-nori și să-i pui la loc, sau ai putea doar să construiești toate etajele întâi, toate etajele al doilea, toate etajele trei, toate etajele patru. Și acestea sunt în esență diferențele dintre aceste două tehnologii. Deci matricele de oligonucleotide sunt într-adevăr realizate de Affymetrix. Sunt făcute-- fiecare dintre zgârie-nori-- echivalentul, fiecare dintre firele de ADN, are doar 25 de nucleotide lungime, dar sunt construite câte o pereche de baze la un moment dat. Deoarece au doar 25 de nucleotide și genele sunt mult mai lungi decât atât, de aceea au mai multe sonde care merg împotriva unei anumite gene. ADNc-ul, pe de altă parte, sunt în esență fire de ADN care se vor hibridiza cu ARN, dar catenele de ADN care sunt doar puse în aplicare folosind în principal ceva de genul unui observator robot. Deci s-ar putea să ridice patru la un moment dat, sau 16 la un moment dat, sau doar unul la un moment dat, dar așa sunt făcute aceste două. Și dincolo de diferența tehnologică aici, există o diferență majoră în ceea ce măsoară exact aceste micromatrice. Matricele cADN măsoară cantități relative de expresie. Așa că trebuie să puneți două mostre acolo, dintre care una ARN-ul ar putea fi colorată în roșu, alta dintre care ARN-ul ar putea fi colorată în verde. Și te vei uita la... ceea ce vor face oamenii este după ce l-au hibridizat, au luat o imagine TIFF a acestui lucru, se vor uita la raportul relativ dintre cât de mult roșu este acolo și cât de mult verde. Deci, ai întotdeauna un nivel de expresie relativ. În teorie abordarea oligonucleotidelor este diferită. Acum, acest lucru este relativ, deoarece fiecare dintre catenele de ADNc are propriile sale proprietăți. Fiecare dintre fire ar putea avea un set diferit de gene și As și Ts și Cs, temperaturi de topire diferite. Și de aceea nu poți folosi asta ca măsură absolută. Și intensitatea ar putea fi mai mică pe una dintre aceste matrice, nu pentru că există mai puțină genă prezentă, doar pentru că ADNc-ul real avea proprietăți biochimice puțin diferite și nu hibridiza eficient. Pe de altă parte, rețelele de oligonucleotide sunt, în teorie, proiectate astfel încât fiecare dintre sonde să aibă caracteristici similare în ceea ce privește temperatura de topire și unele dintre aceste alte caracteristici. Deci, teoretic, puteți compara un loc cu altul. Și din această cauză, acestea sunt făcute - acestea sunt hibridizate folosind o singură mostră. Așa că puneți un eșantion pe o matrice aici, iar dacă doriți să faceți o diferență relativă, utilizați două matrice. Acum, din nou, în teorie, aceasta este o cantitate de expresie absolută. Dacă oamenii vor să ajungă la măsurarea cea mai absolută, cum ar fi câte fire de ARN sunt prezente, atunci există o altă tehnologie numită SAGE și așa am vrut doar să introduc această discuție aici. SAGE înseamnă analiza în serie a expresiei genelor. Cred că lucrarea originală despre asta a fost în Science. Era o lucrare de una sau două pagini în 1995. de... era Victor Velculescu de la Hopkins. Și astfel, acesta a fost de fapt dezvoltat în aceeași perioadă cu microarray-urile, dar de fapt a câștigat multă popularitate înainte ca microarrays-urile să devină atât de comune disponibile. Dar, în esență, modul în care funcționează SAGE este că vă oferă un nivel absolut de expresie pentru o anumită genă, dar măsoară expresia genei prin secvențiere. Și secvențierele automate tocmai apăreau la acea vreme, iar oamenii și-au dat seama că puteți folosi această tehnică pentru a le folosi pentru a măsura nivelurile de expresie a ARN. Așadar, modul în care funcționează asta este că, în teorie, fiecare ARN-- sau să spunem fiecare secvență, fiecare genă-- are ceea ce ei numesc, este o etichetă SAGE aici. Și tot eticheta SAGE este, să spunem, 10 nucleotide care, sperăm, identifică în mod unic acea genă. Dar problema este că trebuie să fie după un CATG și vom vedea de ce într-o clipă. Deci te uiți la o genă, cauți un CATG, iar cele mai în aval 10 nucleotide vor fi eticheta pentru gena respectivă. Sperăm că este suficient pentru a-l face unic, dar nu va fi întotdeauna cazul. Deci modul în care funcționează acesta este acesta. Dacă începeți cu firele de ARN pe care o să le măsurați, primul lucru pe care doriți să-l faceți este să faceți o catenă de ADN. ARN-ul este foarte fragil. Vrei să-l transformi în ADN cât de repede poți. Altfel, va începe să se degradeze. Așadar, tehnicile de preluare a unui șir de ARN și de realizare a unui șir de ADN sunt disponibile în mod obișnuit. Este o transcriptază inversă. Puteți cumpăra acest lucru de la raft sau îl puteți cumpăra dintr-un magazin. Și, în esență, va începe prin a merge la un capăt. S- ar putea să-i dai un primer pentru a începe, iar apoi va merge până la capăt, până când va cădea de la capăt. Deci acum ați făcut o copie ADNc a acesteia. Și ceea ce faci acum este că poți face asta și pentru cealaltă componentă . Deci acum ați scăpat de ARN și aveți două, aveți o dublă catenă de ADN reprezentând ARN-ul pe care l-ați avut în proba originală. Acum devine puțin complicat, pentru că acum, în esență, vom folosi o mulțime de instrumente moleculare pe care le au bacteriile pentru a face de fapt acest tip de tăiere și lipire fantezie, astfel încât să putem secvența și să ne dăm seama care sunt genele și care sunt genele. nivelul expresiei genelor este. Există o anumită enzimă de restricție. Deci o enzimă de restricție este de fapt o componentă. Este o proteină cu siguranță, dar este o enzimă care este prezentă în bacterii care se ocupă de tăierea ADN-ului la anumite secvențe. Există o mulțime de enzime de restricție acolo. Dacă obțineți catalogul actual sau afișul actual, ar putea fi de ordinul a, să spunem, aproximativ 300 dintre aceste enzime de restricție. Și există multe moduri de a le defini, dar un mod în care oamenii definesc enzimele de restricție se bazează pe secvența pe care o taie. Și așa sunt unii care taie ADN-ul, dând capete absolut plate, și sunt unii care chiar tăiau lăsând capete lipicioase. Și aici, această enzimă de restricție specială numită NLA3 preia orice catenă de ADN dublu catenar și o taie la CATG, dar părăsește CATG ca o suprafață. Nu o taie plat. Așa că băieții ăștia au văzut asta și au spus, wow, am putea face niște lucruri interesante, un pic de tăiat și lipire, și de fapt să profităm de asta. Deci, pentru a fi clar, iată secvența. Iată CATG și eticheta unică. Și, practic, vom... chiar dacă șuvița ar putea fi mai lungă decât asta, va fi tăiată așa. Acum, pentru a folosi câteva părți mai elegante, amintiți-vă cum v-am spus că majoritatea ARN-ului mesager are o catenă de A la sfârșit, deoarece pe măsură ce este copiat de pe ADN, începe să se bâlbâie în anumite moduri și pur și simplu lasă un poli(A) . Și că vă puteți lega de el, sau îl puteți găsi de fapt folosind un poli(T). Folosind tehnica lor, ceea ce puteți face este, în loc să începeți doar cu T, să începeți cu Ts și ceva lipicios la sfârșit. Cu alte cuvinte, este etichetat în așa fel încât să le putem pescui după ce îi aplicăm un magnet, de exemplu. Sau unii oameni folosesc biotinilarea streptavidinei ca o modalitate obișnuită de a trage, de a pescui aceste lucruri atunci când alergi printr-o coloană, de exemplu, cu anumite margele, indiferent cum o faci. Așa că acum avem o grămadă de ADN dublu catenar, doar că avem această mică supraîncărcare aici. Avem toate As și T-uri la acel capăt. Le-am pescuit din acest mare bazin celular, din această mizerie celulară. Acum, ce vom face... începe să devină puțin complicat. Dar acum avem această etichetă aici. Fii cu ochii pe roșu. Atât pot spune aici în această tehnică. Pentru că ceea ce veți face este, în cele din urmă, veți vedea cum vom putea folosi un secvențior pentru a spune acestor ARN cât de mult din fiecare ARN este prezent. Deci avem un ARN care merge în acest sens și de fapt avem acest albastru deschis pentru un alt ARN care merge în acest fel. Și o să vezi cum vor ajunge să fie unul lângă celălalt. Deci, ceea ce trebuie să facem este să adăugăm un adaptor care are un alt capăt lipicios aici și să-l adăugăm pe această parte aici. Și vom folosi o altă enzimă de restricție care se va tăia la CATG, dar se va tăia după etichetă. Există o anumită enzimă de restricție numită BsmF1 care caută CATG, dar nu se reduce la CATG. Taie 14 perechi de baze în aval de acolo. De aceea, etichetele noastre trebuie să aibă o lungime de 10 nucleotide. O mulțime de biochimie fantezie aici pentru ca asta să funcționeze. Deci ai o etichetă aici și ai o etichetă aici și ai un mic adaptor pe care l-am adăugat pe această parte. Și apoi, în sfârșit, ceea ce vom face, l-am tăiat aici și l-am tăiat aici. Ceea ce putem face este să adăugăm ceva numit ligază care practic ia toate capetele contondente și încearcă doar să facă perechi împreună. Încearcă să aducă bucăți mici de ADN cu capete contondente și încearcă să le atașeze împreună. Deci avem un capăt contondent care a fost aici și un capăt contondent care a fost aici. Iată prima etichetă și iată a doua etichetă. Și vom avea o grămadă de astea. Și ceea ce putem face este să-l rulăm printr-un secvențior, practic. Vom face mai mult lucru de picior pentru ca acestea să fie cât mai compacte posibil. Și în cele din urmă avem o porțiune de ADN cu doar o etichetă după alta, cu niște CATG-uri în mijloc ca distanțiere, astfel încât să ne asigurăm că rămânem sincronizați. Acum ceea ce faci este să rulezi asta printr-un secvențietor automat și apoi poți doar să obții... poți citi secvența așa, unul apoi altul, apoi unul apoi celălalt și apoi să cauți baze de date pentru a vedea ce genă credem că asta este. Acum, motivul pentru care aceasta este o măsurătoare absolută a expresiei genelor , cu siguranță, este că, dacă această genă este suprareprezentată, este de două ori mai mult decât aceasta, vei vedea de două ori mai multe etichete decât aceasta, în teorie. Există eficiențe pentru fiecare dintre acești pași despre care am vorbit. Și acest lucru nu este la fel de simplu ca un microarray. Literal, puteți lua eșantionul dacă sunteți medic la Spitalul de Femei Brigham sau la oricare dintre aceste spitale și, în esență, să o luați la un nucleu și să faceți un microarray. SAGE este mult mai implicat, dar, în teorie, aceasta este o modalitate excelentă de a obține o expresie scăzută - gene cu niveluri de expresie foarte scăzute. Așa că de aceea a meritat măcar să vorbim despre SAGE. Pentru că dacă te uiți la niveluri absolute de expresie, aici se îndreaptă. Deocamdată, aceasta este o tehnologie de tip back-burner. Oamenii încă îl folosesc. Există oameni care îi sunt devotați din punct de vedere religios, dar cei mai mulți oameni ajung să folosească microarray astăzi. Da? PUBLIC: Puteți să vă întoarceți și să explicați doar un pic cum a ajuns eticheta acolo în acest fel? ATUL BUTTE: Eticheta se întâmplă să fie o secvență. Deci ceea ce numim etichetă aici nu este nimic din ce am pus acolo. PUBLIC: OK. ATUL BUTTE: Este ceva care se află lângă un CATG care se află la acest capăt al genei. Dacă nu există nimic de genul ăsta acolo, atunci nu îl vom găsi, așa că asta e o altă captură. Dacă primul este până aici, s- ar putea să nu îl înțelegem. Deci ei spun că media, dacă faci calculul, există cel puțin una dintre acestea în 256 de perechi de baze, pentru că este ca 4 la a patra. Așa că ar trebui să existe unul acolo, dar ar putea exista degenerescență, sau ar putea să nu fie acolo. Deci asta e toată tehnica. Este 10. Este CATG doar din cauza particularităților enzimelor folosite pentru a tăia aceste lucruri și apoi uitați-vă doar la etichete. Aveți întrebări despre asta? Deci, practic, acesta a fost ultimul lucru despre care vreau să vorbesc în această secțiune a tehnologiilor de măsurare a genelor sau tehnici de măsurare a genelor. Așa că acum Zack îmi sugera să vorbesc despre unele dintre lucrurile pe care le-am făcut cu diabetul, doar pentru că aceasta ar trebui să fie medicină genomică. Vă putem oferi un exemplu real al modului în care am folosit micromatrice pentru a ne ajuta cu diabetul. Deci sunt endocrinolog pediatru și mi-am petrecut cea mai mare parte a timpului la Centrul de Diabet Joslin studiind diabetul de tip 2. În prezent, afectează aproximativ 15 milioane de oameni din Statele Unite și, de fapt, CDC doar a estimat în urmă cu câteva luni că un copil născut în anul 2000 are acum un risc de 1 din 3 de a face diabet de tip 2. Deci, este de 33% probabilitatea ca un copil născut în urmă cu doar doi ani să sufere de diabet de tip 2. De ce? Din cauza problemei obezității. Așa că știm cu toții că copiii fac mai puțin exercițiu astăzi la școală, pentru că trebuie să treacă aceste teste. Și acum școlile trebuie să dea mai multe cursuri ca să treacă MCAS-urile și chestii de genul ăsta. Există mai mult televizor. Sunt mai multe canale. Există internet. Există toate aceste lucruri care îi fac pe copii să stea practic într-un singur loc. Ei nu prea fac exerciții fizice. Cred că a fost ceva la CNN săptămâna trecută despre cum chiar și copiii de unul sau doi ani nu fac atât de mult exercițiu ca înainte. Deci nu este nici măcar vârsta școlară. Acest lucru începe practic de la vârsta de unu sau doi ani. Deci întrebarea pe care am avut-o aici a fost aceasta. Știm cum să definim... diagnosticul de diabet este de fapt un fel de arbitrar. De fapt, se pare că definiția diabetului se continuă să se schimbe . Dar, de exemplu, la un moment dat, definiția diabetului zaharat a fost să ai un nivel de zahăr din sânge de dimineață, deci de 127, cred că miligramele pe decilitru te calificau pentru diabet. Dar ceea ce știm este că nu este doar un tip de lucru pornit și oprit. Dintr-o dată nu ai diabet, iar acum, dintr-o dată, ai. Pentru că diabetul este o trăsătură foarte ereditară. Este controversat, dar unii oameni spun, de exemplu, că este o trăsătură foarte genetică. Să o punem așa. Unele studii care arată că, în studiile pe gemeni, dacă ai un geamăn care are diabet de tip 2, ai o probabilitate de 98% ca celălalt geamăn să- l facă, dacă nu îl are deja. Deci te face să crezi că este incredibil de genetic, dar problema este că incidența este atât de mare. Aceasta este o boală comună. Nu este deloc ușor să găsești o anumită mutație care o provoacă. Nu am fost atât de norocoși până acum. Am descoperit... domeniul a găsit o serie de mutații care duc la diabet, dar ele ar putea explica suma totală de poate 0,01% dintre persoanele care au diabet. Acestea sunt forme foarte rare. Forma comună, care pare a fi incredibil de genetică, este încă un mare mister. Scopul pentru care urma să folosim medicina genomică aici era să încercăm să definim tiparele modului în care oamenii ar putea trece de la non-diabet la diabet. E un grup de mijloc acolo. De fapt, ADA, Asociația pentru Diabet, numește acum acest lucru pre-diabet, oameni care nu au o manipulare normală a zahărului, dar nu îndeplinesc strict criteriile pentru diabet astăzi. Întrebarea pe care am avut-o aici, folosind micromatrice, putem defini modele de expresie a genelor la subiecții umani cu diabet zaharat, în special în probele lor de mușchi , pentru a identifica pe cei care prezintă un risc ridicat nu doar pentru a defini ce gene sunt diferite între diabet și non-diabet, ci de asemenea, ce gene erau deja diferite la cei cu risc crescut de a face diabet. Mai exact, aceștia sunt descendenți ai diabeticilor de tip 2. Deci, în acest studiu special pe care l-am făcut a fost pe subiecți mexicano-americani . Avem diabet și antecedente familiale de diabet. Deci avem, practic, trei grupuri, istoric familial negativ, diabet zaharat-- deci, evident, acestea sunt control-- și apoi avem istoric familial pozitiv. Deci avem trei grupuri aici. Și vă puteți uita la subiectele pe care le-am folosit pentru acest studiu special. Am avut unul pe care îl folosim pentru matrice și am avut altul pe care am lucrat de fapt de validare, unele dintre ipotezele cu care am venit . Și astfel, majoritatea acestor caracteristici nu sunt diferite, dar sunt diferite în mai multe moduri importante. Deci glucoza a jeun este 99, 92, dar 200 la diabetici evident, pentru că au diabet. Glucoza la două ore a fost mai mare la diabetici, dar hemoglobina A1C era deja ridicată în istoricul familial pozitiv. Ce este hemoglobina A1C? Ei bine, aceasta este una dintre măsurătorile noastre pentru cât de ridicate sunt nivelurile de zahăr din sânge pe o perioadă de 120 de zile. Deci, de fapt, majoritatea medicilor care se ocupă acum de pacienții cu diabet, măsuram această hemoglobină A1C de cel puțin patru ori pe an, astfel încât să putem obține o măsurătoare a nivelului de zahăr din sânge în ultimele 120 de zile, pentru că aceasta este durata de viață. a unui eritrocit sau a unei celule roșii. Și, deoarece nivelurile de glucoză sunt mai mari în sânge, ele de fapt glicozilează hemoglobina din celulele roșii, deci este un produs secundar al acestui lucru. Dar este deja pozitiv în istoria familiei. Nu sunt exact ca negativele din istoria familiei de aici. Insulina de post deja mare. Deci problema cu diabetul de tip 2-- doar pentru a ne asigura că toată lumea este pe aceeași pagină aici-- nu este o problemă cu producerea insulinei din pancreas. Problema este că insulina este acolo, pur și simplu nu acționează așa cum ar trebui să facă în țesuturile țintă. Acum, ca să folosesc analogia mea de săptămâna trecută, tocmai am luat din nou această mâncare grozavă de la camionul chinezesc. Nivelurile mele de glucoză cresc, nivelul de insulină crește. Și așa că insulina le spune acum unui număr de țesuturi mele să facă o serie de lucruri. Îmi spune ficatului să nu mai produc zahăr. Tocmai am mâncat o masă uriașă. Nu am nevoie de ficat pentru a începe să fac mai mult zahăr, pentru că tocmai am mâncat o grămadă întreagă. Dar, mai important, spune că mușchii mei și celulele mele de grăsime să înceapă să ia zahăr. Și ceea ce se întâmplă în diabetul de tip 2 este că acel semnal de la insulină la ceea ce ar trebui să facă țesuturile este oprit dintr-un anumit motiv. Doar că nu știm exact de ce. Dar asta e problema. Insulina este acolo. De fapt, acum tipii ăștia au un nivel mai mare de insulină, pentru că deja corpurile lor realizează că aceeași cantitate de insulină nu face ceea ce ar trebui să facă. Deci, pancreasul vede că nivelul zahărului nu scade după mese, de exemplu, și spune că trebuie să măresc cantitatea de insulină pe care o produc. Dar problema principală se simte a fi în țesuturile țintă, rezistența la insulină. Deci grupurile sunt deja diferite și asta va face de fapt această analiză complicată. Deci avem cinci diabetici acolo, patru fără diabet, dar cu antecedente familiale de diabet și șase martori aici. Și când faci asta, poți compara fiecare grup cu celălalt grup. Așa că putem lua... am luat mostre de mușchi de la acești indivizi. Dacă erau pe medicamente pentru diabetici, de fapt au fost scoase pentru un număr de zile. În prealabil, nu au făcut exerciții intense. Și totul este un consimțământ informat și obțineți mostrele de mușchi. Extrageți ARN-ul. Le-am pus pe aceste micromatrice. Micromatricele când am făcut aceste experimente măsurau aproximativ 7.000 de gene. Astăzi, când faci asta la același preț, primești 44.000 de gene. Și astfel putem folosi o serie de tehnici analitice diferite despre care veți învăța în restul semestrului - exact cum facem distincția dintre genele care ar putea fi diferite, ce gene nu se schimbă. Dar dacă comparăm istoricul familial negativ cu diabetul, găsim 187 de gene care sunt diferite. Chiar dacă compari istoricul familial pozitiv cu diabetul, există 166 de gene care sunt diferite. Deci mai puține și există o oarecare suprapunere. Deci cele 55 de gene dintre... sunt 55 de gene care au fost în această listă și în această listă. Cele mai multe dintre ele au codificat pentru tot felul de proteine ​​interesante. De exemplu, proteinele mitocondriale care sunt implicate de fapt în metabolismul energetic, sau sinteza ATP, fosforilarea oxidativă, despre care vom vorbi într-un moment. Deci, acesta este un mod obișnuit de modul în care ne place de fapt să privim aceste gene. Se numește hartă termică sau chiar dendrogramă, în funcție de diferitele programe pe care le utilizați. Dar verdele indică... deci fiecare dintre rânduri indică o genă. Fiecare dintre coloane reprezintă de obicei un eșantion. Și verdele indică o genă care este mai mare decât media, iar roșul indică o genă care este mai mică decât media. Și ceea ce arătăm aici este un subset din acele 55 de gene care au de fapt ceva de-a face cu metabolismul energetic. Și, în primul rând, majoritatea genelor care au legătură cu metabolismul energetic sunt mai mari în istoricul familial negativ, sunt mai scăzute la diabetici și sunt deja scăzute în istoricul familial pozitive, deci cele care prezintă risc pentru a face diabet. Deci acum avem o bucată din acest puzzle. Vedem că transcripția unora dintre aceste gene mitocondriale, gene legate de metabolism, este scăzută. Asta ar putea cauza scăderea fosforilării oxidative. Deci, ceea ce se întâmplă este că grăsimea se acumulează în mușchi și în celulele adipoase. Și dacă aveți mai puține dintre aceste gene și probabil mai puține proteine ​​pentru care le folosim ca proxy, avem o scădere a oxidării lipidelor. Pe măsură ce grăsimea sau lipidele se acumulează în mușchi, de fapt pot cauza ca insulina să nu funcționeze la fel de bine. Deci, poate așa ajungem la rezistența la insulină din cauza creșterii lipidelor din mușchi. Dar există o jumătate uriașă din asta care este încă necunoscută astăzi și asta este partea pe care vreau să mă concentrez pentru o secundă. Oamenii arată acest diapozitiv tot timpul în tot felul de contexte diferite. Formula uriașă aici, formulă uriașă aici, miracolul are loc la mijloc. Și totuși, cea mai mare problemă cu acest tip de studiu este că acest miracol încă trebuie să se producă pentru a ne da seama de ce avem această listă de gene. Ce este special la această listă de gene? Cum ajungem la acest set de gene? Care este biologia din spatele ei? Deci, deși mulți dintre colegii mei se vor certa cu mine despre asta, nu puteți ignora biologia de aici. Devine din ce în ce mai greu să spun, iată lista mea de gene, mergi cu asta. Trebuie să știți ce este despre această listă, ce face ca această listă de gene să fie atât de specială. Și, din păcate, în acest moment, pentru informatiști, se pare că are loc un miracol, că cineva are perspicacitatea să se uite la un anumit factor și, de fapt, obțineți un lanț cauzal de evenimente și apoi puteți obține lista de gene. Aici, ceea ce ne-am dat seama este că majoritatea acestor gene sunt în aval de un factor de transcripție numit NRF-1 unul și altul numit PGC-1alpha. Ar fi grozav dacă am avea o bază de date cu aceste lucruri. Desigur, noi nu. Ar fi grozav dacă NRF-1 ar fi chiar și pe cip. Nu este. Este pe cipul de astăzi, dar nu era pe aceste cipuri de acum trei generații. Deci nicio cantitate de informatică și construirea de rețele și rețele Bayes sau oricare dintre acestea nu ne-ar fi dus la această ipoteză specială, pentru că gena nici măcar nu era măsurată în acel moment. Dar toate aceste gene pe care le arăt aici - din nou, un subset al subsetului anterior - sunt toate în aval de NRF-1. Așa că asta ne-a determinat să ne gândim la ipoteză, poate că NRF-1 este în jos și de aceea toate celelalte gene sunt în jos. Pentru că este mult mai ușor să veniți cu o explicație cauzală care necesită doar un singur lucru să fie greșit decât 50 de lucruri pentru a fi greșit. Acesta este briciul lui Occam. Explicații mai simple. Deci, când te uiți la nivelurile NRF, din nou, aceasta a măsurat o populație diferită folosind o tehnologie diferită, RT-PCR. Aveți istoricul familial negativ aici, pozitiv aici, iar diabetici. Și gena are de fapt o scădere semnificativă statistic la diabetici. Dar ceea ce este derutant este că nu scade în grupul de mijloc. Dar am văzut că acele gene se aflau în grupul de mijloc, așa că aceasta nu este deloc o explicație perfectă. O altă bucată de cunoștințe biologice ne-a făcut să realizăm că NRF este, de fapt, în aval, sau de fapt este co-activat de PGC-1alpha. Deci, atunci când măsori de fapt asta, primești și indiciu că PGC-1alpha este în jos în ambele două grupuri, precum și o altă formă, PGC-1beta, care este scăzut în aceste două grupuri. Cea mai mare problemă, totuși, deci acum ipoteza este că scăderea PGC-1alfa și NRF sunt de fapt ceea ce provoacă diferența dintre diabetici și non-diabetici și deja arată o diferență în pre-diabetici. Totuși, cea mai mare problemă cu acest studiu este că care este cauza și care este efectul aici? Vă arăt deja că nivelurile de glucoză și nivelurile de insulină sunt deja ridicate în acel grup de mijloc. De unde știu că acest lucru nu este doar un efect al nivelului ridicat de zahăr ? De unde știu că acest lucru cauzează nivelurile ridicate de zahăr? Și aceasta este problema cu acest tip de abordare. Putem obține cu ușurință mostre acum. Mostrele nu sunt partea grea. Matricele nu sunt partea grea. Analiza nu este partea grea. Informatica nu este partea grea. Există o mulțime de oameni în jur acum, o mulțime de software pe care le puteți descărca. Partea grea este interpretarea în cele din urmă. Chiar dacă avem toate aceste instrumente de scalare a genomului, încă nu avem nimic care să facă interpretarea mult mai rapidă sau atât de ușoară. Deci acum este încă o rutină. Dacă merg la Centrul de Diabet Joslin, mă uit la centrul lor principal. Am fost acolo doar acum câteva zile. Ei au construit literalmente o piramidă cu toate matricele pe care le-au făcut până acum, de ordinul a aproximativ 1.500 de aproape 2.000 de micromatrice deja făcute la Centrul de Diabet Joslin. Poate că au fost publicate aproximativ două lucrări până acum cu toate aceste date de matrice, acesta care avea aproximativ 30 de mostre și altul care avea aproximativ 10 mostre. Și totuși există mii de matrice care au fost deja colectate. Datele sunt deja acolo. Analiza a fost deja făcută. Dar oamenii nu pot face saltul la pasul următor. De ce este această listă de gene? Ce este atât de interesant la acea listă de gene? Cred că asta va fi partea grea acum în următorii câțiva ani. Acesta nu este acel roman pentru a lua mostre și a le pune pe matrice. Nu despre asta va fi vorba despre partea cu medicamente . O să încercăm să ajungem la explicații mai simple pentru ceea ce vedem aici. Deci, aceasta este o ipoteză finală aici, poate că PGC-1 este în jos și că, împreună cu NRF, de fapt determină ca această listă de gene să fie diferită. Aveți întrebări despre asta până acum? Ceva gânduri? PUBLIC: Obțineți vreo... ne uităm la activarea căii AMP kinazei în termeni de toxine? ATUL BUTTE: O întrebare grozavă. Deci întrebarea este, ne-am uitat la calea kinazei AMP ? Așa că știm, de exemplu, când oamenii fac sport, sensibilitatea lor la insulină se îmbunătățește, chiar dacă au diabet. Oamenii care fac exerciții fizice, aceeași moleculă de insulină are mai mult efect. Și asta este mediat printr- o cale diferită, prin calea AMP kinazei. Ne-am uitat la nivelurile AMP kinazei aici? Nu. Ne-am uitat la nivelurile de expresie care ar fi putut fi pe cip, dar nu erau diferite? Ne-am uitat la nivelurile de activitate sau la nivelurile de proteine? Nu. Dar poți paria pe acea grămadă uriașă de 1.000 de matrice-- Lori Goodyear și alții au făcut deja aceste matrice-- dar sunt încă blocate în același mod. Deci, ce este cu aceste liste de gene care ne va duce la o ipoteză aici? Este foarte greu de manevrat. Este foarte greu să faci față acestor liste de sute de gene. Nu mai este foarte validant. Nu este foarte distractiv să lucrezi cu aceste gene. Partea grea este să ajungem la mecanismul cauzal pentru acele gene și acolo avem cele mai puține informații acum, cum ar fi ce este în amonte de ce, de exemplu. PUBLIC: Poți să te întorci la enigma pui și ou [INAUDIBIL] Mă întrebam doar cum poți susține o scădere directă a pauzei de bou, oxidarea lipidelor. Deci ideea este că nu vă folosiți eficient glucoza. când glicemia este mare. ATUL BUTTE: Exact. PUBLIC: Nu metabolizi [INAUDIBIL] ATUL BUTTE: În primul rând, nu generezi ATP la fel de eficient pe cât ai putea într-un mușchi. PUBLIC: Da, ei bine, dacă generați ATP ineficient și acesta este echivalentul cu deconectarea cuplajului proxy sau așa ceva. [VOCI INTERPUSE] ATUL BUTTE: Exact. PUBLIC: Acesta este de fapt că nu generați ATP și în schimb... ATUL BUTTE: Da, conducta este... PUBLIC: --substrat. ATUL BUTTE: Exact. Conducta nu se umple, exact. Conducta nu este umplută la fel de eficient pe cât poate fi. PUBLIC: Corect. ATUL BUTTE: Absolut. PUBLIC: Dacă folosim asta și ne întoarcem poate la un fel de raționament invers, nu ar sugera asta practic că perturbarea inițială este în NRF și CTAR? ATUL BUTTE: Deci, există și alte moduri în care putem... există o altă informație pe care o putem aduce pentru a încerca să ne dăm seama de ordinea lor. Deci, există polimorfisme secvențiate care sunt cunoscute în aceste gene, în special în PGC-1, care merg împreună cu diabetul. Așa că ne gândim, ei bine, dacă există oameni care au o secvență anormală și fac diabet, poate că asta o cauzează. Publicul: Corect, corect. ATUL BUTTE: Asta este ceea ce pune acest lucru în amonte de a avea de fapt nivelul ridicat de zahăr. Dar în acest eșantion, fără aceste cunoștințe a priori, nu poți spune asta. Asta e problema. PUBLIC: Nu sugerează asta, totuși, sau a fost un salt uriaș? Cu alte cuvinte, dacă nivelul de glucoză a fost ridicat, dacă perturbarea inițială a fost glicemia crescută... ATUL BUTTE: OK, da, dacă ar fi asta. AUDIENTĂ: - asta nu explică de ce aveți o reglare în sus a -- sau este o reglare în jos a NRF și PGC, oricare ar fi aceasta. E în sus sau în jos? ATUL BUTTE: NRF este în jos. Tot ce spun este doar cu acest experiment, aș putea pune acest pătrat aici și să spun că duce la asta, duce la asta, duce la asta, duce la asta. Nu pot face acel salt că acest lucru este cauzal cu asta. [VOCI INTERPUSE] PUBLIC: Mai multe au sugerat că pătratul este acolo jos, sau nu mă gândesc eu corect la asta? ATUL BUTTE: Cu polimorfismele și chestiile secvențiale, mă face să cred că e aici jos. Dar doar experimentul în sine, fără cunoștințele a priori, fără să știi ce îți spune literatura, de unde ai ști asta, pentru că acești pacienți au deja un anumit grad de rezistență. Aceasta este problema aici. Trebuie să știi ce... biologia. Nu poți ignora biologia. PUBLIC: Corect, dar întrebarea este doar... [INAUDIBIL] Pentru că dacă te uiți la grupul de control, indicele de masă corporală pare să fie mult mai scăzut. ATUL BUTTE: Absolut. PUBLIC: [INAUDIBIL] ATUL BUTTE: Exact. Deci ai înțeles și asta? Indicele de masă corporală este și el diferit, pentru că este greu de găsit. Adică, asta e viața în America acum. Toți sunt obezi. Și chiar și adolescenții care sunt obezi ar putea fi acum în acest grup de mijloc. Ei vor avea o oarecare toleranță la glucoză. PUBLIC: Din acest caz în grupul de control, grupul de control a fost normal. ATUL BUTTE: Grupul de control a fost... Adică, indicele lor de masă corporală este încă 30. Asta se califică drept obez astăzi. Și grupul de istorie familială este de fapt puțin mai puțin. Dar toți sunt obezi, practic, în special controalele. PUBLIC: Dar puteți vedea distribuția pe graficele de pe pagina următoare. ATUL BUTTE: Absolut, absolut. Acesta aici. PUBLIC: Da. ATUL BUTTE: Da, exact. Aceasta este o genă față de cealaltă și puteți vedea indicele de masă corporală aici, exact. Și ai unul până aici, exact. Asta distruge mediul. Deci acestea nu sunt grupuri egale altfel. Aceasta este problema. Acum trebuie să... de ce chiar arăt toate acestea, dacă am toate aceste probleme cu această analiză și cu aceste date? Scopul acestui tip de curs nu este doar să te învețe cum să faci aceste tipuri de experimente. Pentru mine ar fi grozav dacă ai ști cum să interpretezi aceste lucruri care apar în New England Journal în fiecare zi. Pentru că în fiecare lună acum vedem o lucrare cu microarray, să zicem, în New England Journal, sau JAMA, sau în alte publicații echivalente. Și cred că trebuie să-i învățăm pe oameni să citească aceste lucruri cu un ochi critic. Pentru că pare atât de fantezist să ieși cu 44.000 de gene, iar acestea sunt cele care sunt de fapt diagnostice. Dar există de fapt probleme cu designul experimental. Și dacă experimentul nu a fost proiectat exact în așa fel încât să răspundă la întrebarea care a fost pusă, nicio cantitate de matrice fanteziste nu te va putea ajuta. Nu poți salva asta. Asta încerc să transmit, cum să fiu critic aici. Cred că același lucru... când vezi o grămadă de gene care deosebesc TOATE de AML. Să ne gândim la toate celelalte lucruri în contextul lor care ar putea face diferența aici. Când au fost achiziționate mostrele? De unde au fost achizitionate? Pacienții cu LMA sunt trimiși de preferință într-un centru, iar cei cu LLA trimiși într-un alt centru? Exemplul meu preferat pe care ador să-l dau este acesta. Să presupunem că vă uitați la o tumoare solidă și încercați să distingeți genele care sunt diferite între forma metastatică a acestui cancer și forma nemetastatică. Dacă ați petrecut ceva timp în secții, știți cum lucrează chirurgii. Dacă aveți un pacient și dacă un chirurg se uită la numărul lor de cazuri pentru ziua următoare, și are un pacient cu metastazat și pacient cu nemetastazat, pacientul metastatic, este deja metastazat. Operația va dura mult mai mult, să zicem, pentru că trebuie să meargă, să verifice asta, să verifice asta, să curețe asta, să curețe asta. Chirurgul ar putea spune, voi pune acel pacient ca primul caz al zilei. Și cazul mai simplu, îl voi pune ca un caz suplimentar sau un caz suplimentar. Țineți-i să aștepte în sala de așteptare sau în camera de recuperare gata de plecare, iar apoi le vom face după terminarea acestui prim caz. Așa că acum imaginați-vă un studiu în care vă uitați la diferența dintre formele metastatice și non-metastatice ale acestui cancer special și aveți aceste mostre de la acești chirurgi care plasează de preferință cazurile dificile dimineața și cazurile ușoare după-amiaza. Sunt endocrinolog. Știu că sunt hormoni care diferă între dimineața și seara, cum ar fi insulina, hormonul de creștere, cortizolul. Cine știe câte gene sunt în aval de acei hormoni? De unde știi că semnalul pe care îl vezi nu este din cauza acelei părtiniri sau a acelei confuzii? Acum, asta nu este o chestiune revoluționară. Dacă ne uităm la testele clinice, la studiile clinice din trecut, știam să căutăm aceste lucruri. Dar dintr-o dată acum că avem aceste ograme roșii/verzi fanteziste și avem aceste micromatrice, oamenii au uitat de toate aceste tradiționale - acești confuzi tradiționali. Măsurăm pe întregul genom măsurabil. Semnalul pe care îl primiți doar din endocrinologie, din ciclurile circadiene, ar putea fi mai puternic decât semnalul pe care credeți că de fapt îl măsurați. Acum vă întoarceți și vă uitați la ultimele trei lucrări cu microarray care sunt în New England Journal of Medicine și doar uitați-vă pentru a vedea dacă vă puteți da seama la ce oră din zi au fost obținute aceste mostre. În nici un caz. PUBLIC: Cât de sensibil este așa ceva? Ei bine, întrebare în două părți. Unul, este o chestiune de 8:00 AM, 8:30 și așa ceva. Și se știe chiar asta? ATUL BUTTE: Corect. Deci, s-ar putea să nu se știe, dar atunci ceea ce aș spune este că ar trebui să facem randomizare între acea variabilă. Ai putea aprinde luminile acolo. Ar trebui să facem randomizare pe această variabilă. Deci, de exemplu, cineva ar trebui să se uite la ceas și să spună, ei bine, toate acestea sunt dobândite-- sunt unele care sunt aici, altele care sunt aici, altele care sunt aici și să vă convingeți că nu este doar o părtinire grosolană. Fac doar o poveste falsă aici, care este credibilă. PUBLIC: Nu ai putea să faci controale normale și să faci o creștere a acestora dimineața și după-amiaza? ATUL BUTTE: Sigur. Puteți încerca să compensați într-un alt mod. Dar, probabil, va fi relativ la nivelul lor hormonal . PUBLIC: Bănuiesc că exemplul pe care l-ai dat și pur și simplu ai ieșit acolo, dar cred că este diferit decât într-un cadru de laborator, când celulele [INTERPOSING VOICES] și, în cele din urmă, mor. ATUL BUTTE: Exact. Exact. Am luat această tehnologie pe care am folosit-o în micro-- folosită în celule, în cultura celulară din linii celulare și am mutat-o ​​rapid la pacienții care există într-un context. Chiar și calea de mijloc de a le folosi doar la șoarecii de laborator, priviți aceiași șoareci, aceleași condiții, același lucru. Există gene care sunt diferite. Unul dintre șoareci era un mascul alfa în acea cușcă mică, iar unul nu era. Există diferențe între lucrurile despre care credem că sunt altfel la fel. Dar acum ne gândim la această extremă, pentru că există un curs, ești la un curs numit Medicină genomică și asta facem astăzi. Acestea sunt problemele pe care le avem cu acest tip de abordare. Nu glumesc. Reveniți la ultimele lucrări cu microarray din New England Journal, nu veți vedea la ce oră din zi, chiar dacă mergeți la materialul suplimentar. Nimeni s-ar putea să nu... Cred că oamenii nici măcar nu notează chestiile astea. Și este o problemă. Am văzut până acum o singură lucrare care a abordat această problemă. PUBLIC: Deci, care ar fi sugestia ta , vreau să spun, evident pentru noi? ATUL BUTTE: Control pentru asta. PUBLIC: Este pentru a controla , dar între timp, în timp ce există laboratoare care poate chiar nu se gândesc la asta. ATUL BUTTE: Da. Poți să faci ceea ce spune [VOCI INTERPUSE] Sunil. PUBLIC: Încetează ce faci. ATUL BUTTE: Nu, dar poți încerca să modelezi asta. Așa că luați un alt țesut care este înrudit și vedeți într-un eșantion de puncte de timp ce gene sunt diferite și poate apoi puteți scădea acel efect. Dar, mai important, ceea ce aș spune este că, dacă veți face o listă de gene despre care credeți că sunt diagnostice, va trebui să-- ca medici, va trebui să analizăm asta cu un ochi foarte sceptic. Pentru că nu poți controla totul aici. Dar măsurăm atât de multe gene și avem atât de puține mostre, încât, indiferent de ce, vom supraadapta datele aici. De asta sunt îngrijorat. Deci vom supraadapta ceea ce avem. Nicio cantitate de mostre de control nu ne va ajuta să remediem această problemă, cred. Cum ne descurcăm pentru timp? BINE. Hai să vorbim... hai să trecem puțin mai mult în diabet. Și așadar, ceea ce plănuiam să fac este să vorbesc despre încă un proiect de diabet pe care l-am făcut. Apoi voi vorbi despre câteva resurse bazate pe web pentru a face o generare de ipoteze interesante și o vom termina în acel moment. Deci toți sunteți... deci nu toți sunteți de fapt medici sau studenți la medicină, dar totuși voi prezenta acest caz al unui pacient pe care l-am văzut. Aceasta a fost o femelă prezentată cu Acanthosis nigricans, glucoză aleatoare de 162. Deci Acanthosis nigricans, știi ce este asta? Există o pată întunecată pe care o poți pune în spatele gâtului, în coate și în subrat. Și asta înseamnă că insulina ta este prea mare. Deoarece insulina le spune melanocitelor printr-un mecanism necunoscut, le spune melanocitelor să devină mai întunecate. Așa că acum te uiți la oamenii de pe stradă și te uiți să vezi dacă au o pete întunecate aici. Nu este murdărie. Nu o poți curăța. Acesta este un semn al Acanthosis nigricans, deci cineva are o problemă cu insulina. E prea sus. Am făcut mai multe studii, LDL-ul este vertiginos. LDL este mare, colesterolul total este foarte mare, trigliceridele sunt foarte mari, HDL este scăzut. Deci este un sindrom metabolic, sau altfel numit Sindrom X. Glucoza a jeun 133, care îndeplinește criteriile pentru diabet. Insulina este 27, ceea ce înseamnă că aceasta este mare, dar aceasta este foarte mare, aducând acea glucoză încercând să compenseze asta. Hemoglobina A1C este 7,3. Intervalul normal este de la 4 la 6. Și din nou, pentru a conduce întregul punct acasă, aceasta este o fată de 12 ani cu diabet zaharat la adulți. Deci acesta este indicele ei de masă corporală. Aceasta este o curbă percentilei 97 și aici se află ea, cu mult peste curba de aici. Și acum are diabet de tip 2. Ea îndeplinește criteriile pentru diabetul de tip 2. Nici măcar nu intra în clasa a șaptea când am început să fac vacanța de vară anul trecut. 1 din 3 copii va fi așa. Asta e o problema. Așa că o modalitate de a studia această problemă este să studiezi obezitatea și o modalitate de a te gândi la obezitatea legată de diabet. Așa că o modalitate de a studia obezitatea este să mă gândesc la -- în special ceea ce mă interesează să studiez este modul în care adipogeneza, sau procesul de producere a celulelor adipoase, ar putea fi legată de modul în care funcționează insulina. Și cel mai bine stabilit mod de a studia asta este să te uiți la receptorul de insulină. Așa că acum ne apropiem de unul dintre aceste țesuturi țintă-- amintiți-vă, ficat, mușchi și grăsime-- iar receptorul de insulină este o proteină care se lipește în membrana celulei. Ca orice altă proteină, are o genă care o codifică în ADN, este transcrisă, este tradusă. Proteina iese la suprafață. Sunt cunoscute mutații ale receptorului de insulină care vă pot cauza probleme cu manipularea glucozei și diabet. De fapt, există un sindrom numit spiriduș, în care acești copii arată ca spiriduși de fapt. Mor destul de repede după naștere, dar au mutații în receptorul de insulină. Se pare că te poți naște fără un receptor de insulină. A existat o persoană nulă. Cred că a existat un pacient care nu are receptori de insulină. Și, evident, nivelul de insulină a fost ridicat la acest copil la naștere, pentru că nu acționează nicăieri. Dar ceea ce se întâmplă este... ceea ce ar trebui să se întâmple este că insulina se leagă de receptorul de insulină, iar apoi aceste grupări de fosfat se adaugă la sine. Și asta schimbă forma acestei molecule în așa fel încât poate începe să interacționeze cu alte molecule. Și, de fapt, receptorul de insulină adaugă și grupe de fosfat la alte lucruri. De fapt, acestea sunt substratul 1 al receptorului de insulină, substratul 2, 3 și 4 al receptorului de insulină și există și alții aici. Deci, în colaborare cu Ron Kahn, președintele Centrului de Diabet Joslin, a creat câțiva șoareci în care practic au eliminat IRS1, 2, 3 și 4 pe șoareci separati. Deci acestor șoareci, altfel normali, le lipsește această genă. Și dacă luați celule adipoase de la acești șoareci, de fapt, dacă luați celule pre-grase sau pre-adipocite, le puteți face să intre în celulele adipoase folosind un cocktail standard de hormoni. Acest lucru s-a făcut în ultimele două decenii. Luați celule pre-grase și le transformați în celule adipoase cu un anumit cocktail. Și ceea ce se întâmplă este că dacă luați celule normale pre-grăsime și le transformați în celule adipoase și pătați pentru grăsime sau lipide, obțineți un cerc mare roșu aici. Acesta este un vas al celulelor. Dacă eliminați IRS 1 și încercați să faceți acest lucru, nu puteți face ca celulele adipoase să se formeze. Deci, din nou, pre-celule adipoase, același cocktail, nu ai celule adipoase aici. Nu este nicio pată. Abia există o pată pentru orice roșu aici. Și se dovedește că dacă eliminați IRS3, 2 și 4 la mijloc aici, obțineți o gradare a fenotipului, interesant. Deci nu este totul sau niciunul. Dacă eliminați celelalte molecule IRS, obțineți o gradare a fenotipului, în mod curios. Deci, ceea ce am făcut a fost în colaborare cu Ron Kahn, am făcut de fapt o listă de gene care s-au comportat în acest tipar. Noi nu aveți numere aici, dar încercăm doar să găsim gene care se potrivesc cu acest tipar. Așa că permiteți-mi să vă arăt un exemplu pentru unul dintre aceste lucruri. Iată o genă. Iată tipul sălbatic 1. Aici este tipul sălbatic. Iată IRS1 knockout, deci fără celule adipoase, celule adipoase ușor de făcut. Și luăm genele... luăm ARN înainte de a încerca să le transformăm în celule adipoase. Ipoteza aici este, ce gene sunt diferite înainte de a încerca să le transformăm în celule adipoase care ar putea avea un impact asupra procesului de formare a celulelor adipoase? Acum vom lua o secundă aici și probabil că mă întrebați, așteptați o clipă. Vorbeam doar despre oameni. Tocmai vorbeam despre acest copil care era obez, iar acum vorbim despre șoareci aici. O să aduc asta înapoi oamenilor într-un minut, pentru că vreau să intersectez asta cu alte seturi de date și să vă arăt unde mă duc. Dar este suficient să spunem că avem aproximativ 80 de gene care urmează acest tip de model. Sunt mari în normal. Sunt scăzute în knockout-urile IRS1 înainte de adipogeneză și sunt în acest tip de model monoton aici, sau invers, mergând în jos sau în sus. A venit cu o listă de 88 de gene care se potrivesc cu acest tip de model. Acum pune acele 88 de gene în așteptare pentru o secundă. Să vorbim despre o a doua boală. S- a întâmplat să fiu implicat în studiul acestui sindrom numit progerie. Progeria este sindromul de îmbătrânire avansată la copii. De fapt, face... este foarte rar, deci aproximativ 1 din 8.000.000 de nașteri și îi face pe copii să pară că îmbătrânesc. Cu toții am auzit de acești copii și de acest gen de poveste. Și mai ales își pierd părul. Au alopecie. Cu siguranță sunt scurte. Sunt mai scunzi decât copiii de vârstă egală. Că pielea se schimbă care le face să pară bătrâne. Ei nu trec prin pubertate. Au o creștere slabă în greutate. Și, de obicei, mor la 15 ani din cauza problemelor cardiovasculare, aterosclerozei, fac accidente vasculare cerebrale, fac atacuri de cord. Acum, deși par mai în vârstă, nu primesc totul asociat cu a fi bătrâni. Ei nu fac Alzheimer. Ei nu fac cancer. Doar ateroscleroza și aceste alte modificări de aici apar. Acum, după cum probabil știți, gena pentru aceasta a fost recent descoperită. Foarte uimitor că au găsit această genă. M-am implicat în acest sindrom doar din cauza prietenei mele Leslie Gordon, care a fost coleg de-al meu la facultate și care are un fiu cu asta. Și ea are un MD-PhD. În loc să studieze ea însăși această boală, ea a construit o fundație numită Progeria Research Foundation. L-a interesat pe Francis Collins , tipul care realizează proiectul genomului, șeful NHGRI. Și în 18 luni de la formarea acestei fundații, au găsit gena pentru aceasta. Problemă incredibil de dificilă. Există oameni cărora în prima zi nu le-ar crede că este încă un sindrom genetic. Una din 8.000.000 de nașteri este mult mai mică decât frecvența mutațiilor. Avem o grămadă de boli care la 1 la 40.000, 1 la 100.000. 1 din 8.000.000 pare că este atât de rar. Cum ar putea o mutație să fie atât de rară? Deci este foarte discutabil. Și în al doilea rând, le-a fost foarte greu să găsească familii în care doi dintre acești copii erau în aceeași familie. Așa că a fost un noroc prost că au reușit să găsească această genă, pentru că într-unul dintre indivizi... în orice moment există doar aproximativ 50 dintre acești copii pe planetă, într-adevăr. Și unul dintre acești copii, într- una dintre eșantioane, cineva cu un ochi ascuțit a văzut că o bucată de cromozom era de fapt inversată. Benzile, acele modele de bandă, erau de fapt diferite la acel individ. Și asta l-a făcut pe Francis Collins să creadă că poate e ceva de pe acel braț al cromozomului 1 și au secvențiat toate genele de acolo și au găsit mutația anume. Este o genă numită lamina A. Și nu doar lamina A o provoacă. Lamin A a fost de fapt implicat în multe alte boli, despre care vom vorbi într-o secundă. Doar această mutație a acestei gene este cea care o cauzează. Acum, destul de uimitor, în același număr al revistei Nature, cu mai puțin de un an în urmă, a fost publicat modelul de șoarece pentru aceasta. Ce zici de asta ? Pentru că acest grup de la Institutul Național al Cancerului și-a dat seama că se știe că lamina A este implicată în anumite forme de distrofie musculară. Ei au spus că au vrut să creeze un model de șoarece pentru o anumită formă de distrofie musculară. Au creat accidental un model de șoarece pentru progeria. Deci aceeași problemă... ai gena care o cauzează. Ai făcut teste de diagnosticare. Și ai un model de șoarece pentru a-l studia și doar într-o problemă de tur de forță acolo. Imaginați-vă cât timp durează pentru ca aceste lucruri să se întâmple pentru o boală. De la început până la sfârșit, 18 luni aici pentru ceva care afectează poate 50 de oameni. Deci, dacă vă puneți mintea la asta, puteți rezolva aceste boli. Este uimitor ce pot face instrumentele și oamenii astăzi. Deci, în colaborare cu Fundația Progeria, ceea ce am făcut este asta. S-a dovedit că în ultimii 20 de ani, când oamenii credeau că au copii cu progerie, că încercau să trateze copiii cu progerie, nu aveau idee ce să facă. Deci un lucru pe care l-au făcut a fost că au luat fibroblaste și le-au salvat în depozitele naționale. Deci, există un depozit de celule numit depozitul de celule Coriell, unde puteți comanda linii de celule fibroblaste de la pacienți cu tulburări extrem de rare, inclusiv progeria. Așa că am primit trei linii celulare de la pacienți care au fost stocate în colecția Coriell în ultimii 10 ani și le-am comandat de trei ori pentru a ne asigura că controlăm cel puțin numărul de treceri și lucruri de genul ăsta. Și le-am comparat cu fibroblastele normale de vârstă din același depozit Coriell. Am analizat ce gene sunt diferite între progerie și non-progerie. Și acestea sunt matrice mai actualizate. Acestea sunt rețele U-133 pe două -- întregul genom pe două cipuri -- care ne-au dat aproximativ 33.000 de gene și au folosit o anumită tehnică analitică și am primit aproximativ o listă de aproximativ 366 de gene care erau diferite între fibroblastele din progerie și fibroblaste de la martori potriviți în funcție de vârstă. Deci, dacă te uiți la unde sunt aceste gene și la ce categorii sunt implicate, vezi lucruri interesante precum dezvoltarea, transducția semnalului, aderența celulară. Singurul lucru pe care vreau să-l subliniez este acesta. Aceste tabele sunt realizate folosind un catalog numit Gene Ontology. Veți afla mai multe despre asta în viitor. Și în fiecare săptămână sau la două săptămâni, lista proprietăților cunoscute ale genelor și proteinelor este actualizată. Dar, totuși, majoritatea genelor neclasificate, 161. Indiferent cât de interesantă sau cât de cuprinzătoare credem că este Ontologia genetică, marea majoritate a genelor pur și simplu nu au -- nu avem idee unde sunt, ce fac, ce roluri joacă. Aici au loc de fapt proteinele pentru care codifică. Nucleu, membrană, neclasificat 131 din nou. Nici măcar nu am idee unde sunt aceste proteine în celulă. Asta e viața de azi. Avem aici o taxonomie grozavă a tuturor acestor termeni și a vocabularului de structură, dar nu avem... există foarte puține date pentru majoritatea genelor în acest încă. Și există o grămadă de gene care au fost reglate și care păreau să fie deja cunoscute că joacă un rol în ateroscleroză. Deci, această lucrare, din nou, vorbind despre medicina genomică, această lucrare se va încheia cu această listă, doar pentru că un număr dintre acestea sunt ținte, iar companiile farmaceutice au deja medicamente împotriva unora dintre acestea. Pentru copiii cu progerie este practic o condamnare la moarte astăzi. Nu avem medicamente. Îi tratăm cu nimic astăzi. Poate că unii oameni tratează unul sau doi copii cu hormon de creștere pentru a vedea dacă hormonul de creștere face ceva, dar practic este ca un fel de medicament voodoo. Nu avem nicio dovadă că am făcut ceva. Acum putem ajunge măcar la unele informații pentru a ne gândi chiar și la studiile clinice aici. Dar aici să fim sinceri. Acestea au fost fibroblaste care au fost înghețate ani de zile în depozitul de celule. Și acum facem o pretenție despre cum arată vasele lor de sânge. Și nu doar vasele de sânge, ci și intima vaselor lor de sânge. Aceasta nu este aceeași celulă. Fibroblastele ar fi putut fi luate de pe obraz, dar facem doar o afirmație aici pentru că nu avem acces la țesutul real. Deci, unul dintre motivele pentru care menționez progeria aici este amintiți-vă că în imaginea pe care tocmai ați văzut-o, una dintre modalitățile prin care acești copii sunt diagnosticați este că, până la vârsta de doi ani, încep să-și piardă părul. Dar și mai interesant este că își pierd toate celulele adipoase. Se pare că în progeria îți pierzi toată grăsimea subcutanată. Și după moartea la autopsie este foarte greu să găsești grăsime în corp. Te face să crezi că ceva este în regulă cu procesul real de producere a celulelor adipoase la acești copii. Într-un studiu, se știe că acești copii au o oarecare rezistență la insulină, dar este doar un studiu cu aproape 10 ani în urmă. În modelul de șoarece, ultimul paragraf al acelei lucrări Nature spune că au văzut un proces în care mușchii se rediferențiază în grăsime. Ei au spus că cred că există o problemă de dezvoltare , dar nu este foarte clar. Alte mutații ale laminei A cauzează lipodistrofie, care este un sindrom în care îți pierzi toate celulele adipoase. Deci, ne face să credem că există ceva în neregulă cu dezvoltarea celulelor adipoase la copiii cu progerie. Așa că acum ți-am spus despre... unde suntem aici? Stai. Ți-am spus despre 80 sau 90 de gene care erau în modelele de șoarece mergând împreună cu grăsimea, deci aproximativ 360 de gene care diferă între copiii cu progeria și martorii potriviți în funcție de vârstă și au unele probleme cu grăsimea. Am un al treilea set de date aici, care a fost publicat de grupul lui Gary Ruvkun de la Mass General Hospital. Acest lucru a apărut anul trecut. Și acum aceasta este într-o specie total diferită. Acesta este în vierme. Pentru a vă face o idee despre ceea ce putem face astăzi, ceea ce a făcut acest grup a fost că a eliminat fiecare genă din genomul viermilor. Deci un vierme are aproximativ 16.000, 17.000 de gene și, practic, au eliminat în serie fiecare dintre aceste gene pentru a vedea ce se întâmplă cu viermele. Acum, într-un vierme, este de fapt destul de ușor de făcut. De fapt, puteți determina bacteriile să producă o anumită secvență numită ARNi care interferează cu capacitatea viermelui de a produce acea genă. Deci nici nu trebuie să schimbi ADN-ul. Ai putea opri efectiv cantitatea din acea genă care se produce în vierme. Și practic este foarte ușor. Nici măcar nu trebuie să injectați acești viermi. În esență, ai așezat 16.700 de găleți de bacterii și doar pui viermii în ea și ei mănâncă bacteriile și practic ei înșiși elimină gena. Așa funcționează literalmente. Tot ce trebuie să faci este să faci viermele să mănânce bacteriile care produc ARNi. Este foarte usor. Elimina gena din acel vierme. Deci ceea ce au făcut acești băieți a fost... au avut documente de la Natură, spate în spate, despre acest proces. Prima a fost pe o grămadă de fenotipuri diferite, dar a doua lucrare se uita la asta, destul de uimitor. Și aici este o imagine a unui vierme, și folosesc aceeași colorație pentru lipide pe care v-am arătat acum două sau trei diapozitive, ceea ce am folosit noi pe mouse. Și practic spun că, de exemplu, dacă elimini daf-2, vei obține o creștere a grăsimii. Dacă eliminați daf-2 și daf-16, obțineți o scădere ulterioară, daf-2 și daf-3, puțin mai mult. Și pot cuantifica cantitatea de grăsime care rezultă după ce ați eliminat oricare dintre aceste gene. Și, în esență, au făcut o listă. Este disponibil pe internet, uimitor. Dacă eliminați oricare dintre aceste 112 gene, crește cantitatea de grăsime din vierme. Dacă eliminați oricare dintre aceste 305 gene, aceasta scade cantitatea de grăsime din vierme. Deci acum avem trei seturi mari de date, unul în șoarece, unul în om, unul în vierme, două micromatrice, un ARNi, care acoperă toate acestea. Dar toți au ceva de-a face unul cu celălalt, pentru că toți se gândesc la depozitarea grăsimilor. Depozitarea grăsimilor în vierme este foarte diferită de un om, dar totuși o serie de gene se intersectează de fapt. Și, de fapt, despre ce vorbim este intersectarea acestor trei seturi de date. Avem viermele, șoarecele, progeria și ne uităm la intersecția tuturor acestor trei. Deci, la asta am lucrat în ultimele șase luni, de fapt. Și asta este ceea ce numim biologie integrativă sau genomică integrativă. Deoarece aceste seturi mari de date nu sunt, nu doar există și, în mare parte, sunt de fapt disponibile public. Ați putea merge la Centrul Național pentru Informații Biotehnologice, NCBI GEO, și puteți dezactiva orice număr de astfel de seturi de date. Și ai putea să o faci azi. Este pentru proiectul tău final. Puteți descărca oricare dintre cele 600 de experimente în care microarrays-urile au fost deja colectate. Singura parte grea acum este să ai întrebarea interesantă. Nu poți să asociezi ceva cu altceva. Vrei să trebuiască să te gândești la o întrebare interesantă, deoarece resursele, după toate probabilitățile, sunt deja acolo pentru a încerca efectiv să răspundă la întrebarea ta. Indiferent dacă sunteți interesat de ritmurile circadiene, sau de dezvoltarea grăsimilor sau orice altceva, asta este partea grea acum, este să cunoașteți suficientă biologie pentru a pune de fapt o întrebare interesantă în acest fel. Deci, dacă te uiți la genele din intersecție, doar ca să-ți faci o idee, aceste gene WNT... WNT este de fapt un hormon care a fost făcut. Genele WNT sunt de fapt bine cunoscute ca fiind implicate în adipogeneza și trăiesc de fapt în intersecția acestor liste. Deci viermele egl2, care se numește WNT7B, crește cantitatea de grăsime dacă este eliminat. Soarecele WNT6 și 10A cresc cu disadipogeneza, în funcție de knockout-urile IRS. Și WNT5A și WNT7B sunt în jos în progeria. Deci acesta este un exemplu de genă care trăiește în intersecția acestor trei seturi de date. Sunt doar uimit că avem vreunul dintre aceste lucruri să se intersecteze, pentru că sunt atât de diferite. Trei specii diferite. Nici măcar nu ne uităm la celulele adipoase de aici. Cu copiii cu progerie, ne uităm la un fibroblast, care este un proxy pentru pre-adipocit, care este un proxy pentru adipocit. Dar totuși poți obține un semnal în acest fel. Poza asta este la fel. Chiar și propria mea fiică știe diferența dintre un om, un șoarece și un vierme. Deci, există avertismente la toate acestea. Deci, noi înșine facem o mare parte din această validare în grupul de bioinformatică de la Children's. Dar punctul aici este biologia integrativă. Pentru mine, aici cred că se va întâmpla multă distracție pentru mine în următorii câțiva ani. Avem o mulțime de aceste seturi de date și acum încerc să vin cu întrebări interesante, astfel încât să le pot pune împreună pentru a încerca să mă ocup de aceste procese pe care alți oameni doar le folosesc într- una dintre aceste zile și care s-ar putea să nu. să poată înțelege. Avem expresia genelor. Avem date proteomice. Am vorbit despre asta. Am făcut scanări ale genomului. Joel Hirschhorn va vorbi despre modul în care încercați de fapt să găsiți gene care sunt asociate cu un anumit fenotip folosind SNP-uri. Avem măsurătorile clinice. Avem toate aceste puncte de date care sunt colectate în toate aceste spitale. Voi vorbi despre fiecare dintre acestea separat. Mutageneza ENU este o tehnică nouă în care-- de fapt nu este atât de nouă-- dar ai putea lua șoareci și le-ai administra această substanță chimică specială, etil-nitrozureea, care provoacă mutații în gameții lor. Deci toți urmașii lor sunt practic mutanți. Și faci asta pentru câteva generații și găsești un fenotip interesant care... wow, dintr-o dată, acesta are diabet. Te întorci și vezi, ce am mutat? Practic îl modificăm pentru a vedea cât de mult poți. Caracterizezi rezultatul și apoi te întorci să vezi ce... exact unde am pus mutația? Aceasta este mutageneza ENU. Despre ARNi începem să vorbim cu viermele, unde practic poți elimina orice genă anume foarte repede. Oamenii încep să facă asta cu oameni și în special cu modele de șoareci, dar există deja o serie de companii farmaceutice pe o rază de cinci mile de aici care încearcă să vină cu astfel de medicamente. Și, desigur, cel mai important, cunoștințele biologice anterioare. Acesta este ceea ce va genera întrebări interesante aici. Aveți întrebări despre asta până acum? În regulă. O să vorbesc despre ceva doar pentru a aduce asta acasă, ca să putem vorbi despre... cel puțin poți vedea cât de ușor este să faci asta. Permiteți-mi să omit câteva diapozitive aici. Deci da, putem vorbi de fapt despre o parte din asta. Deci, să presupunem că sunteți interesat să faceți o parte din acestea pentru un proiect final, că doriți să puneți împreună unele dintre aceste seturi de date. Există un număr destul de mare de surse de unde puteți obține date de microarray și alte date despre dimensiunea genomului astăzi. Și dacă vedeți unele lucruri în descriere de care sunteți de fapt interesat din punct de vedere biologic, s- ar putea să puteți rula cu acestea pentru un proiect final. Vreau doar să subliniez câteva dintre aceste surse de date și apoi să vorbesc despre o modalitate prin care puteți pune totul împreună, chiar și doar folosind un browser web. Deci, programul de cardiogenomică este o sursă în care cred că există peste 150 de micromatrice acum. Sediul acestuia este la Beth Israel Diaconess, vizavi. Au modele de șoarece de dezvoltare cardiacă, așa că practic au embrioni și au secțiuni ale inimii lor. Și, practic, toate genele sunt activate și dezactivate în diferite părți în timpul dezvoltării. Au tot felul de componente diferite ale creșterii cardiace. Deci, de exemplu, oamenii știu că, dacă o cale sau o altă cale este implicată într-o insuficiență cardiacă, au modele de șoarece în care acele componente sunt deja eliminate. Și au o grămadă de măsuri făcute în serii cronologice. Așa că iau șoareci normali și îi pun în acest rezervor să înoate și îi fac să exerseze înotul un anumit număr de ore timp de săptămâni, apoi se uită la inimile lor. Și asta este ceea ce face înotul inima ta, de exemplu. Ei au acele liste de gene disponibile astăzi. Aceste diapozitive vor fi online, așa că nu trebuie să copiați fiecare adresă URL. Dacă chiar notați titlul, atunci pe care să îl căutați. Institutul Whitehead, evident călăria-mamă a acestor matrice. Cel puțin 12, poate 14 publicații acum. Multe tipuri diferite de cancer, acesta este punctul lor principal acolo. O mulțime de măsurători clinice cu unele. Multe dintre acestea sunt mostre clinice, dar pot avea una sau două coloane de măsurători clinice. Acesta a fost un fumător? Acesta a fost un nefumător? Acel tip de lucru. Cât timp a recidivat acest pacient , nu recidivă? Dar ai leucemii, ai tumori solide aici, cancer la creier. Lucruri de genul acesta sunt în acest set de date. DC Children's sau Centrul Medical Național pentru Copii , 500 de matrice pentru multe boli umane interesante. Distrofie musculară, dermatomiozită, deci asta e rar. O grămadă de chestii reumatologice. Insuficiență cardiacă, precum și modele de șoarece, șobolan și câine de leziuni ale măduvei spinării , dacă doriți să vedeți care sunt asemănările și diferențele acolo. Boli pulmonare, inclusiv astm și insuficiență cardiacă. Am menționat insuficiența cardiacă de două ori acolo. Deci, acesta este DC Children's și Johns Hopkins. Indicele de expresie a genelor umane cred că este al lui Brigham and Women. 121 de micromatrice doar din țesuturi normale, 19 țesuturi umane normale. Este, de asemenea, o listă interesantă la care să te gândești. Microarrays-ul Stanford este probabil cel mai mare în afară de GEO, despre care vom vorbi o secundă. Stanford are probabil aproape 4.000 de matrice acum, măsurate pe 11 specii, acoperind mai mult de 80 de publicații. Multe domenii diferite, dintre care majoritatea sunt drojdie, dar și o grămadă de oameni. National NCBI GEO, practic este chiar lângă PubMed acum. Este același site. Peste 8.000 de matrice din peste 100 de tipuri diferite de micromatrice. Nu contează câte experimente. Baza lor de date poate gestiona peste 100 de companii diferite, 100 de produse speciale de microarray care se pot integra în toate acestea. TREX este de la TiGER, care este Institutul de Cercetare a Genomului din Gaithersburg, Maryland, în afara NIH. 500, 600 de matrice pentru modele de șoarece și șobolan de somn, infecție, hipertensiune arterială, boli pulmonare. Deci, de exemplu, dacă sunteți interesat de astm și doriți să vedeți diferențele dintre astmul uman și modelul de șoarece, datele sunt prezente astăzi. Îți voi garanta că nimeni altcineva nu a făcut acea intersecție. Dacă găsiți niște gene interesante despre care credeți că ar putea codifica proteinele, care ar putea fi în sânge și le puteți folosi ca măsurătoare, puteți obține o persoană interesantă, unul dintre orice colaborator de aici din zona Longwood, care să măsoare efectiv acest lucru în sângele, asta e. Ai o descoperire chiar acolo. Pentru că datele sunt acolo. Aproape nimeni nu știe cum să intersecteze aceste lucruri. Și așadar, despre ce voi vorbi aici în ultimele minute este acest concept de portal de descoperire. Deci, ce vreau să spun cu asta? Lasă-mă să omit această parte. Începem cu experimente in vivo, făcute pe oameni și șoareci. Apoi am avut in vitro si cultura celulara. Acum avem NHTTP. Deci iată o idee. Iată cum puteți trece de la un gând real la o ipoteză destul de bine stabilită fără să părăsiți măcar browserul web, deoarece toate aceste instrumente sunt disponibile astăzi. Acum, pentru următoarele poate 15 diapozitive, o să le răsfoiesc destul de repede. Voi acoperi o serie de baze de date diferite de unde puteți obține tot felul de idei inspiraționale. Așa că voi începe cu un interes, voi trece la un model de șobolan. Vom acoperi QTL-urile cât timp suntem acolo și descoperirile fiziologice. Accesați o hartă a genomului șobolanului. Accesați datele de exprimare a mai multor specii și terminați cu ipoteza aici. Acesta este live. Ai putea să faci asta chiar azi. Vom începe de la un site web numit PhysGen. Unii dintre noi din cameră știm despre asta. Acesta este la Colegiul Medical din Wisconsin. Ceea ce fac acești tipi este că au o serie uriașă de lucruri pe care le fac șoarecilor și șobolanilor pentru a măsura lucruri, a măsura tot felul de cantități diferite. Cât de mult face pipi acest șobolan față de acel șobolan? Cât de mult respiră acest șoarece în comparație cu acest șoarece? Et cetera și cetera, și au tabele cu toate aceste date disponibile public. Deci, dacă accesați PhysGen, dacă faceți clic pe Date și dacă faceți clic pe Animal Model, câteva informații despre genotip pentru toate tulpinile. Acum, când derulez puțin în jos, văd o grămadă de șobolani. Acum s-ar putea să-mi amintesc, pentru că am fost la conferința Asociației de Diabet anul trecut, îmi amintesc că am auzit că Brown Norvegia are o problemă cu diabetul. Poate că nici măcar nu am fost la seminariile despre Brown, dar toată lumea a tot vorbit despre Brown Norway, Brown Norway. Am auzit că un Brown Norvegia are o problemă cu boala. Să facem clic pe raportul de tulpină Brown Norway. Derulați puțin în jos. Acesta este BN, sau Brown Norvegia. Și văd, da, are diabet aici, diabet QTL. Deci, ce este un QTL? Deci avem șobolanul și are propriul genom, ca orice altă creatură. Și ce QTL este un loci de trăsătură cantitativă. Deci, o anumită porțiune a unui anumit cromozom pare să fie asociată semnificativ statistic cu o anumită măsurare fenotipică. Acesta este un loci de trăsătură cantitativă. Deci, cu alte cuvinte, această regiune specială pe care o vom privi într-o secundă pe cromozomul 2 este asociată statistic cu nivelul de insulină, nivelul de insulină de jeun al unui șobolan. Așa că observați că dacă aveți o versiune a acesteia, este posibil să aveți un nivel scăzut de insulină a jeun. Dacă ai altă versiune, ai un nivel ridicat de post. Dar ceva în această regiune a unui cromozom este asociat. Nu suntem încă la nivelul genei, dar ne aflăm doar într-o regiune a unui cromozom ca punct de plecare și punct de sfârșit al acestui cromozom, și o piesă din mijloc este asociată. Există tot felul de alte măsurători aici. Ai hipersensibilitate la raze X. Ce înseamnă asta? Ei bine, ceva în această regiune a cromozomului 1 înseamnă că devii mai sensibil la razele X. Vă puteți gândi cât de ezoterice sunt aceste măsurători. Dacă sunteți interesat de efectele radiațiilor, există măsurarea dvs. chiar acolo. Severitatea artritei, tensiunea arterială, greutatea corporală, tensiunea arterială, tensiunea arterială. Toți stau acolo, așteaptă să fie implicați. Nimeni nu are suficient timp să se uite la fiecare dintre acestea, dar suntem mandatați de NIH să le punem pe internet pentru ca oamenii ca tine să studieze. Dacă sunteți interesat de tensiunea arterială, există trei QTL-uri chiar acolo la care oamenii din întâmplare, probabil că oamenii nici măcar nu s-au uitat niciodată. Să facem clic pe acest QTL special pentru a vedea cum arată. Iată numele QTL-ului, Nidd/gk2. Este în Norvegia Brown. Și iată marcatorul pentru acest vârf special. Deci, un marker înseamnă că aceasta este o secvență unică în cromozom care îmi va spune dacă am una sau cealaltă versiune a acesteia. Lasă-mă să dau clic pe acel marker, D2Wox23. Și iată testul PCR pe care ar trebui să-l fac în rack pentru a-mi spune, am o literă sau cealaltă literă? Sau, cu alte cuvinte, am versiunea cu insulină ridicată sau versiunea cu insulină scăzută a acestui vârf special? Deci chiar îți oferă testul. Ai putea să comanzi acele oligonucleotide, să găsești un șobolan care se plimbă pe Longwood Avenue noaptea și să testezi pentru a vedea, este o insulină ridicată sau insulină scăzută? O poți face azi. Din noroc, se întâmplă că au făcut deja treaba și ne-au spus că în această regiune a cromozomului știm că există o genă acolo. Nu trebuie să fie, dar există o genă acolo, S100A4. Aceasta este o genă care există în acest vârf de semnificație. Acum, ceea ce vom face este să luăm acea informație, acel nume al acelei gene și să ne uităm mai mult la acea regiune QTL, acea regiune a cromozomului. Vom merge la Centrul Național pentru Informații în Biotehnologie, faceți clic pe Biologie Genomică. Am să dau clic pe șobolan. Și voi introduce doar S100A4, numele acelei gene despre care am spus că este în acea regiune. Unde este în cromozomul șobolanului? Aici este pe cromozomul 2. Este S100A4. Dacă dau clic pe asta, dacă micșorez puțin, iată S100A4 și aici sunt toate genele învecinate. E interesant. Există o grămadă de alte gene interesante. Mai întâi, S100A4, există A3, A6, A8, A9. Această genă este una din multele familii de gene. Deci, modul în care se formează adesea genele noi este prin evenimente de duplicare ca acesta. Dar pentru mine, mai interesant, văd lucruri precum receptorul de peptide natriuretice. Peptida natriuretică este produsă dintr- o serie de surse diferite, inclusiv inima. Are de-a face cu tensiunea arterială și reglarea volumului sanguin. Acesta este un hormon interesant. Să vedem alții. Interleukin 6 acolo, ar putea fi niște lucruri interesante acolo. Dar să continuăm să alergăm cu acest S100A4 aici. Acum, ceea ce voi face este să mă uit unde se exprimă această genă. L-am prins într-un vârf statistic. Am văzut care sunt vecinii săi în genom. Acum vreau să știu, de ce această genă este asociată cu diabetul sau nivelul de insulină? Ei bine, să vedem. Unde este acea genă exprimată într-o grămadă de mostre diferite? Acesta este un motor de căutare special în care puteți doar să introduceți numele genei și să vedeți unde este această genă exprimată în aproximativ 1.200 de mostre diferite. Acesta este în special cardiovascular. Tastesc S100A4, scrie, la ce te referi? Omul, șoarecele sau șobolanul? Ei bine, am început cu șobolanul, dar să vedem doar unde se exprimă cele umane. Faceți clic pe asta. Este măsurat în 10 micromatrice de către Johns Hopkins. Nu sunt atât de mulți. Să ne întoarcem. Să ne uităm la cel al mouse-ului. Șoarecele este măsurat cu 142 de acest grup, 100 de acest grup, dar 84 de acest grup. Să ne uităm mai întâi la 84. Și putem vedea acele mostre de top. Deci acesta este nivelul de expresie. Aceasta este percentila acelei gene pe acel cip, pe fiecare cip. Muşchi, muşchi, muşchi, muşchi, muşchi, muşchi, muşchi, muşchi. Și cel puțin pentru Johns Hopkins, această genă este cel mai puternic exprimată în mostrele lor de mușchi, în special în regenerarea mușchilor. Putem căuta să vedem exact ce eșantion există, dar să continuăm. Să apăsăm butonul Înapoi și să ne uităm la cardiogenomică, deci aceștia sunt tipii de la Beth Israel. Și din nou, este foarte exprimat în mușchii netezi cu benzi. Acum scrie bandă aici. Asta spune bandă 48 de ore, bandă 48 de ore, 24 de ore. Ce au făcut mai exact? Ce sunt mai exact aceste mostre? Dați clic pe Prezentare generală, vă duce la site-ul lor. Îți spune care a fost experimentul pe care l-au făcut. De fapt, au făcut un experiment în care au luat acești șoareci, i-au deschis și au tras o mică bandă de cauciuc pe aorte. În jumătate dintre ele. Cealaltă jumătate, tocmai le-au cusut din nou. Nu au făcut nimic. Și așa au făcut o listă de gene care urcă în inimă ca răspuns la această supraîncărcare de presiune. Genele stau acolo. Vă pot garanta din nou, nici măcar o lucrare nu a fost publicată pe această listă. Deoarece suntem atât de ocupați să creăm mai multe date, nu am avut timp să publicăm nimic despre aceste date. Așa că încercau să studieze hipertrofia cardiacă indusă de suprasarcina de presiune . Deci acum iată ipoteza. Am început cu șobolanul Brown Norway, iar șobolanul Brown Norway are semne de diabet din cauza acestei gene, S100A4, deoarece S100A4 era sub acel vârf semnificativ. Dar cred că se datorează faptului că S100A4 este exprimat în mușchi într-o varietate de condiții diferite și știu că mușchiul este un țesut țintă de insulină. Așa că acum pot obține câteva indicii despre ce experiment pot face în continuare. Poate ar trebui să caut celulele musculare pentru S100A4. Dacă faci căutări PubMed, poți vedea că S100A4 este asociat - cel puțin este studiat astăzi în diabet. Acum tocmai am ales primul vârf pe care l-am văzut pe acel site. Puteți să vă întoarceți și să găsiți orice număr de gene noi acolo și să veniți cu ipoteze, iar noi nici măcar nu am părăsit browserul web. Nici măcar nu a fost nevoie să descărcați un fișier pentru a face toate acestea. Deci ai putea face asta azi. Începi doar să navighezi de la unul dintre aceste site-uri la altul de la ceva ce ai auzit pe hol până la o ipoteză reală. Avem vreo 10 minute. O să renunț acum pentru a vedea dacă aveți întrebări sau gânduri. PUBLIC: Deci, în ce moment, cu aceste diferite site-uri web care au date, în ce loc sunt puse acele date pe site-ul web? Sunt după publicare versus [INAUDIBIL] ca... ATUL BUTTE: Bună întrebare. PUBLIC: Structuri [INAUDIBILE] [VOCI INTERPUSE] ATUL BUTTE: O întrebare grozavă. Deci, NCBI GEO, le-ați putea trimite date și apoi le vor păstra ascunse până când spuneți că a fost publicat și apoi le-ar putea activa. Aceste alte site-uri web personale, cum ar fi cel Whitehead, Stanford, apar de obicei după publicare. Pentru aceste alte site-uri web din acest PGA, datele cardiovasculare pe care vi le arăt în continuare, acele date apar în termen de 60 de zile de la crearea sa, indiferent de publicare. NIH impune din ce în ce mai mult ca acesta să fie modelul acum. Pentru că dacă plătesc pentru toate aceste lucrări genomice, ei nu vor ca un singur laborator să poată rula cu adevărat cu el, pentru că există prea multe date de care să se ocupe orice laborator. Deci, pentru unele dintre granturile lor, ei insistă ca aceste date să fie disponibile cu mult înainte de publicare. Așa că acum, despre bolile cardiovasculare și pulmonare , și despre puțin somn, puteți obține o mulțime de date, 1.500 de matrice. PUBLIC: [INAUDIBIL] ATUL BUTTE: Da, aceste PGA - aceste programe și aplicații genomice. PGA a fost finanțat de Institutul pentru inimă, plămâni și sânge. Acesta, în special, are o mulțime de date care sunt deja disponibile și care nu au fost publicate.