ATUL J. BUTTE: Așa că pot și am vorbit în trecut vreo 6 ore pe acest subiect. Astăzi, vom vorbi doar despre primul dintre acestea, microbiologia pentru [? bioinformatician. ?] Și dacă avem timp, atunci putem vorbi despre tehnici de măsurare a genelor , nu doar microarrays, ci tot felul de tehnologii diferite, în funcție de cât de repede sau de încet mergem. Deci, să începem. Deci am vreo 10 diapozitive de biologie de bază, bine? Dacă văd că începi să căsci, atunci o să mergem mai repede. Sunt multe pe care le putem acoperi. Deci câți dintre voi își amintesc așa ceva? Îți amintești asta? Îți amintești asta? Îți amintești asta? OK, așa că putem merge destul de repede. Deci, evident, problema cheie în biologie sau în toată știința vieții este că organismele trebuie să producă proteine ​​pentru o varietate de lucruri diferite pe care trebuie să le facă de-a lungul vieții. Deci, scopul sunt proteinele, dar organismele trebuie să producă aceleași proteine ​​din nou și din nou într-un tip de model foarte stabilit. Unele dintre aceste proteine sunt importante. Sunt enzime care catalizează reacțiile. În caz contrar, aceste reacții ar dura 10.000 de ani. Pentru că aveți enzima [INAUDIBILĂ], poate dura 10.000 de microsecunde. Suport structural, altfel, un sac de apă s -ar prăbuși. Acestea sunt lucruri care vor ține peretele celular împreună, pentru a-i da o formă. Și cu siguranță, avem hormoni pentru a semnala de la o parte a unui organism la o altă parte a organismului sau de la un organism la alt organism. Așadar, problema cheie în știința vieții din ultimii 50 de ani este cum să codificăm instrucțiunile pentru fabricarea acestor proteine ​​specifice, deoarece au atât de multe forme disparate, lungimi și caracteristici disparate. Cum știe organismul sau cum știu celulele să producă aceste proteine? Și primul pas este evident nucleotidele. Acesta este elementul cel mai de bază al acestor planuri care intră în fabricarea proteinelor. La fel și adenina, citozina, guanina și timina, H, C, G, T. Și după cum știm cu toții, acum 50 de ani am aflat că acestea erau de fapt aranjate într-un lanț, de fapt două lanțuri anti-paralele în care As perechea de baze cu un T și Cs merg împreună cu Gs. Și acestea nu sunt doar lanțuri arbitrare, ci acestea sunt lanțuri cu polaritate. Deci ai un început și un sfârșit pentru un lanț. Este aliniat cu începutul și sfârșitul celuilalt lanț. Și acesta este dublu helix. Acest lucru formează în mod natural o dublă helix dacă îl topești la temperatura potrivită. Dacă încălziți ADN-ul, acesta începe să se denatureze. Dar dacă îl răcești din nou, va începe să se întoarcă din nou. Va re-natura. Deci este o formațiune naturală în funcție de temperatura legăturilor de aici, de temperatura necesară pentru a rupe aceste legături. Și astfel vă faceți o idee despre cum arată acest dublu helix aici. Așa că acum, să facem un pas înapoi. Avem ADN-ul. Știm că acesta va fi punctul final, dar nu a trebuit nici măcar să secvențăm As, Gs și Ts și Cs pentru a face diagnostice genomice sau genetice. Deci, chiar și în ultimii peste 50 de ani, am fost capabili să punem diagnostice genetice chiar înainte ca secvențierea să fie inventată. Cum? Ei bine, evident, poți să te uiți la structura cromozomilor. Așa că puteți obține o probă de sânge de la orice om, să izolați celulele albe din sânge , care mai are ADN, și să le colorați într- un anumit mod, să faceți o fotografie, o microfotografia, să decupați cromozomii și să le aliniați. Și așa oamenii fac asta de zeci de ani, mai bine de jumătate de secol. Și, practic, acești cromozomi au fost numerotați pe baza estimărilor originale ale mărimii acestor cromozomi. Deci se crede că cromozomul 1 este cel mai mare. Se crede că cromozomul 22 este cel mai mic, dar se dovedește că 21 este de fapt mai mic decât 22. Și mai sunt câteva perechi ratate ca acesta acum că avem lungimea exactă. Dar așa am reușit să punem diagnostice genetice. Fiecare cromozom, deci fiecare cromozom este o singură catenă dublă de ADN de la un capăt la altul. Și, evident, este înfășurat și înfășurat și rebobinat și înfășurat într-un asemenea grad, încât nu seamănă deloc cu un dublu helix doar pentru că suntem la o imagine de ansamblu aici. Suntem cu cel puțin cinci ordine de mărime mai sus în ceea ce privește mărirea de la vizualizarea efectivă a unei duble helix. Acum, așa cum am spus, am fost capabili să punem diagnostice de mai bine de 50 de ani folosind... în genomică. Vrea cineva să ghicească care este acest diagnostic? Să păstrăm acest lucru interactiv aici. PUBLIC: [INAUDIBIL] ATUL J. BUTTE: Acesta este sindromul Down sau trisomia 21. Deci, puteți vedea, evident, evidențierea aici cu săgeata mică. Dar există trei copii ale cromozomului 21 aici. Și se întâmplă să fie un fenotip viabil. Te poți naște cu asta. Și de fapt poți trăi destul de mult timp, deși ai probleme fenotipice marcate sau probleme fenotipice. Poți trăi cu asta. Aceasta este trisomia 21. Există alți doi cromozomi din care poți avea o întreagă trisomie și totuși să supraviețuiești într- un fel sau altul. Acum, avem 22 de perechi de cromozomi aici. PUBLIC: întrerupere. ATUL J. BUTTE: Da. PUBLIC: Întrebare [INAUDIBILĂ]. Explicați următorul fapt. Deci aceasta [INAUDIBIL]. Cum se face că, cu excepția cancerului testicular, persoanele cu sindrom Down nu fac cancer? ATUL J. BUTTE: OK. PUBLIC: Uită-te la gene, dă-ți seama. [INAUDIBIL] care nu fac cancer. ATUL J. BUTTE: Deci, așa cum spuneam, avem 22 de perechi de cromozomi care sunt împerecheate în mod ideal, deși putem obține trisomii rar. Avem și o pereche de cromozomi sexuali. Fie ai două X-uri, fie ai un X și un Y. Și acestea sunt condițiile normale. Există și condiții anormale, dar aceștia sunt cromozomii sexuali aici. Majoritatea lui Y se asociază cu o bucată din X, dar Y are un material unic. Și cu siguranță X-ul are o mulțime de material unic care nu se împerechează deloc. Există câteva lucruri foarte importante pe Y, de exemplu, o bucată din receptorul de androgeni și lucruri de genul ăsta. Codarea pentru aceasta este pe cromozomul Y. Deci, așa arată o fotografie reală. Și aceasta este versiunea idealizată a acestei ideograme. Benzile sunt în esență destul de specifice cu o anumită pată. Când se aplică o anumită pată, când aplicați pete diferite, obțineți modele diferite de benzi. Și se pare că aceste benzi au de fapt foarte mult de-a face cu compoziția perechii de bază a acelor regiuni. De exemplu, bogate în GC, sau regiunile care au o mulțime de G și C, se vor dovedi a fi o singură culoare față de As și T. Așa că acum, am văzut imaginea de ansamblu din cromozom. Am început cu ADN-ul și nucleotidele. Și am acoperit deja spiralele duble. Așadar, doar ca introducere, am primit doar 10 diapozitive de reîmprospătare de bază de biologie și apoi vom ajunge la niște chestii interesante. Deci, cum ajungem de la ADN la gene, nu? Pentru că, deși avem 3,5 miliarde de perechi de baze, doar 1,5% din acestea codifică proteine. Am spus că proteinele sunt scopul final. Și din cele 3,5 miliarde de perechi de baze, doar 1 și 1/2% se află de fapt într-o regiune de codificare per se. Deci, să vorbim despre ceea ce numim o regiune de codificare exact. Această linie de aici, această linie roșie de aici, reprezintă spirala dublă. Aceasta reprezintă As, Cs, Ts și Gs. Și structura unei gene este de așa natură încât există o piesă aici, care va servi drept model pentru proteina numită cadru de citire deschis. Are o inițiere de început. Are un sfârșit sau o terminare. Și această bucată din asta va fi îmbinată și îmbinată ca parte a acestui plan. Și vom vorbi despre îmbinare într-o secundă. Piesa din dublu helix care este în amonte sau înainte de aceasta, spre capătul 5 prim, se numește în amonte. Și bucata din dublu helix care se află după acest codon de terminare, se numește în aval când este pe 3 capătul prim. Acum, iată cel mai important punct. Tuturor ne place să diagramăm astfel de lucruri, dar nu există semne de punctuație în genom. Nu există iluminator. Nu există majuscule minuscule. Nu există caractere cursive îndrăznețe. Tot ce ai sunt literele, nu? Deci, una dintre cele mai grele probleme este încercarea de a descoperi această structură din litere, deoarece nu există nicio săgeată intermitentă care să spună, aici este locul unde începe gena. Tot ce aveți sunt As, Ts, Gs și Cs. Și doar informatica descifrează asta, bine? Deci avem algoritmi pe care oamenii îi folosesc în mod obișnuit acum, care au fost instruiți cu privire la experimente manuale și rezultatele de unde a început această genă și a început acea genă. Ei învață tiparele. Ei îl codifică în algoritmi, iar algoritmii rulează pe întregul genom pentru a încerca să facă predicții. Dar, în cele din urmă, ele sunt încă doar predicții despre unde sunt aceste gene și sunt încă în mod obișnuit greșite. Deci, fiecare genă, o genă, codifică instrucțiuni pentru a produce o singură proteină. ADN-ul se numește, înainte, este în amonte. Și multe dintre elementele de reglementare pentru această genă sunt de fapt în componenta din amonte. Deci, să spunem mai multe decât sunt în componenta din aval. În ceea ce privește îmbinarea, imaginați-vă dacă un arhitect a făcut o serie de schițe, dar arhitectul a spus, ei bine, dacă nu doriți jacuzzi-ul în casă, puteți scoate această pagină. Dacă doriți doar un garaj pentru o mașină în loc de un garaj pentru două mașini , puteți elimina această pagină. Asta este îmbinarea. Începeți cu un întreg set de ceea ce ar putea fi în planuri și piese ar putea fi scoase sau piese ar putea fi lăsate înăuntru. Pentru asta pot servi exonii și intronii. Intronii se desprind. Ele pot fi aruncate. Și exonii rămân să fie de fapt parte din plan, despre care vom vorbi în următoarele câteva slide-uri. Diferite țesuturi pot îmbina în și în afara diferite componente aici. Nu este întotdeauna cazul. Chiar dacă îl desenez aici ca exon, intron, exon, într-o altă parte a aceluiași organism în care ar putea fi lăsat intronul. Acesta este încă un mister cu privire la exact de ce se întâmplă asta în unele țesuturi, nu în alte țesuturi. Și chiar și mecanismul, proteinele care sunt implicate în tăierea și îmbinarea acestor lucruri, sunt destul de bine definite. Nu este clar de ce este uneori specific unui țesut față de altul. Acestea se numesc produse alternative de îmbinare. Dacă am același cadru de citire deschis de la început până la sfârșit -- așa definim un cadru de citire deschis -- dacă am exonul intron al exonului într-un plan, dar doar cei doi exoni în celălalt, acestea sunt produse alternative de îmbinare. Și pentru că sunt două modele diferite, vei obține două case diferite sau două proteine ​​diferite la sfârșit. Așa că am vorbit despre cod la început, un cod la sfârșit. Și din nou, sistemul biologic poate afla regiunile promotoare, unde este granița dintre intron și exon, unde este începutul, unde este sfârșitul folosind doar sintaxa secvenței. Nu există iluminator. Nu există litere aldine sau majuscule, litere mici. Deci avem într-adevăr 3,5 miliarde de perechi de baze, dar doar 35.000 de gene. Și motivul pentru care... aceasta a fost o estimare timpurie de 3%. De fapt, este doar 1,5% din genom, deci doar aproximativ 60 sau 70 sau 80 de megabaze sau milioane de baze din cele 3,5 miliarde de perechi de baze. Deci ce compune restul? Dacă tocmai ți-aș arăta structura genei... iată gena pe care tocmai ți-am arătat-o, să zicem. Ce formează spațiul dintre gene? Ei bine, nu o vom numi junk aici, dar 50% din regiunile dintre gene sunt elemente repetate. Deci, cu alte cuvinte, există cel puțin patru tipuri diferite de elemente repetate. Și cele patru sunt repetate de multe ori în genom. Asta reprezintă 50% din genomul în sine. Acum, aceste elemente repetate... deci secvențele repetate sunt interesante. Pentru că la început, când a trebuit să... când oamenii foloseau ADN-ul într-un mod criminalistic, numărul de repetări poate fi diferit între indivizi. Deci, ce vreau să spun cu asta? Deci iată un tip de element repetat. Aceasta este o LINIE sau un element nuclear lung intercalat. Nu contează ce este, dar aici vezi 1, 2, 3, 4, 5, poate 6, 7, 8 copii ale acestei linii dintre această genă și această genă. Deci s-ar putea să aveți 998 de repetări între aceste două părți, dar s-ar putea să am 997 dintre ele. Și dacă faci asta între o grămadă de zone diferite ale genomului, o poți măsura de fapt. De fapt, puteți găsi diferențe. Puteți face lucruri simple, cum ar fi să vă dați seama că un copil este descendent al unuia sau al ambilor părinți. Cu siguranță puteți spune, într-un anumit grad de încredere, dacă un eșantion lăsat la locul crimei este de la acest individ față de populația aleatorie. Deci doar numărarea acestor repetări este de fapt destul de utilă. Chiar dacă astăzi avem modalități mult mai precise de a ne da seama dacă o probă provine de la o persoană față de alta, aceasta este de fapt ceea ce a fost folosit pentru prima dată acum aproape 20 de ani în viziunea criminalistică a ADN-ului. Deci acestea sunt elementele repetate aici. Iar numărul de repetări poate fi diferit între indivizi. Acum, repetarea... PUBLIC: O altă idee [INAUDIBILĂ]. Uitați-vă la numărul și plasarea acestor repetări. Și pe măsură ce aflați despre [INAUDIBLE], puteți măsura în mod cuprinzător, în special aceste genomi. Avem mii de [INAUDIBILE] în public. Și de fapt determinăm care este spațierea sau numărul acestor repetări care influențează sau nu expresia. Au un scop dat fiind faptul că sunt [? maturat ?] destul de larg în întreaga specie? ATUL J. BUTTE: Deci repetările în sine sunt interesante și pentru un alt lucru. Se repetă, așa că te face să crezi că acestea sunt copii ale unui original. Și de fapt, când ne uităm la succesiunea acestor elemente repetate, putem spune cum arăta originalul și cât de deviantă este această secvență față de original. Deci cum putem spune asta? Deci, ce repetare este exact o repetare a codurilor pentru ca mașinile să facă o copie a lor. Asta e tot ce este o repetare. Așa că permiteți-mi să fiu foarte clar. Elementele repetate care alcătuiesc 50% din genom codifică mașina care se întoarce și face o copie a lui însuși. De aceea va persista în genom, nu? Dacă tot ce ai nevoie este unul sau câteva dintre aceste lucruri, în cele din urmă ele se vor întoarce și vor face copii ale lor pe măsură ce genomul merge mai departe prin evoluție. Acum, se dovedește că toate aceste elemente repetate sunt rupte astăzi la oameni. Niciuna dintre ele nu funcționează astăzi la oameni. Acest lucru nu este adevărat în alte organisme. Repetările sunt încă vii și bine la șoarece, dar nu și la oameni. De fapt, toți sunt morți la oameni. De ce? PUBLIC: Vrei să spui că nu funcționează în... ATUL J. BUTTE: Nu pot funcționa. Niciunul dintre ei nu lucrează. Ei nu mai pot să se întoarcă și să facă copii. Niciunul dintre ei nu mai codifică pentru asta. PUBLIC: OK. În general, evoluționist ceea ce vedem este prima dintre aceste clase sunt repetări care populează o anumită ramură dintr-un copac. ATUL J. BUTTE: Absolut, am o chestie întreagă despre asta dacă ajungem la asta, bine? PUBLIC: Oh, bine. ATUL J. BUTTE: Dacă ajungem la asta. Deci gândește-te la asta, bine? Deci aceste tipuri diferite de nucleare... aceste secvențe repetate diferite sunt toate modalități diferite de a codifica acea mașinărie. Asta e tot. Suntem cele mai inteligente organisme de pe această planetă sau așa ne place să credem, așa că trebuie să avem cel mai mare genom, nu? Absolut greșit. Deci avem 3,5 milioane de baze. Deci, se dovedește că, cu 3,5 milioane de baze și doar patru litere A, G, T, C, îți poți potrivi întregul genom pe un CD-ROM. Nici măcar nu aveți nevoie de un DVD pentru asta. Puteți să vă potriviți cu ușurință - fără compresie suplimentară, vă puteți potrivi întregul genom în 750 de megaocteți, ceea ce poate conține un CD-ROM obișnuit. Așa că gândește-te la asta o secundă. Deci, uitați-vă la aceste alte organisme și care sunt dimensiunile genomului lor , E. coli. Deci E. coli este o bacterie comună care trăiește în intestinul tău. Poate fi prietenos. Poate fi, de asemenea, patogen, are o bază de 4 milioane. Drojdie, care este folosită pentru a face pâine... 12 milioane de baze. Dar chiar și mazărea, mazărea de grădină... ai mazăre în salată, poate la prânz... are mai mult genom decât noi, 4,8 miliarde. Porumb și grâu... grâul are 17 miliarde de perechi de baze. Și avem 3 miliarde de perechi de baze. Deci dimensiunea genomului nu are nimic de-a face cu inteligența organismului. Deci, unde sunt diferiți acești genomi? O mare parte a diferențelor este în spațiul dintre gene. Deci aici sunt patru organisme. Iată un om, aceleași 50.000 de perechi de baze pe care tocmai ți le-am arătat în diapozitivul anterior. Și iată patru gene în 50.000 de perechi de baze și o grămadă de repetări în mijloc. Iată drojdia. Și puteți vedea câte gene sunt și foarte puține spații. Deci este mult mai compact. Aici e porumb. Și grâul ar fi același lucru. Și 50.000 de perechi de baze, există o singură genă acolo. Și iată E. coli. În 50.000 de baze, nu numai că este atât de compact, dar există de fapt gene de ambele părți ale genomului, ambele catene. Și se pot suprapune chiar și se pare. Apoi vorbim despre asta mai precis aici. Acesta este un genom pentru Plasmodium falciparum, care este organismul care provoacă... PUBLIC: Malaria? ATUL J. BUTTE: --malaria, încă ucigașul de boli infecțioase numărul unu din lume. Acesta este cromozomul 2. Și vedeți săgețile aici. Săgețile reprezintă pe ce catenă a ADN-ului se află gena. Nu trebuie să fie toți pe aceeași șuviță, ceea ce face problema și mai grea. Și se pot suprapune. Există multe cazuri de genă în care o altă genă se suprapune exact. Se pare că este greu de măsurat unul față de celălalt. Deci aceasta este dogma centrală. Vom vorbi despre dogmele centrale într-o secundă, dar acesta este practic miezul modului în care se întâmplă acest lucru. Acesta servește ca un plan. După cum știm cu toții, ADN-ul - când celula decide să producă această proteină, cumva ADN-ul se dezvăluie în așa fel încât să expună doar cea mai mică bucată din 1,5% din genom care va codifica proteina pe care dorește să o producă. . Și astfel ADN-ul este păstrat încuiat și frumos și în siguranță în nucleu, centrul celulelor. Și proteinele trebuie făcute în exteriorul celulelor. Deci se face o copie temporară a ADN-ului care se stinge. Și se va lucra pentru a face proteina. Și copia temporară se numește ARN sau, în mod specific, ARN mesager. Și astfel, atunci când dezlegați, un ARN mesager este de fapt realizat într- o secvență opusă, sau acesta este de fapt construit în complementaritatea opusă a ADN-ului. Deci, dacă există un A acolo, există un T aici, etc. Acesta este exportat în mod activ din nucleu și intră în citoplasmă, unde este transformat într-o proteină. Și pentru mine, aceasta este cea mai interesantă parte a întregului lucru. Cumva, natura și-a dat seama că nu poți face proteine ​​doar cu cele patru litere. Ai As, Ts, Cs și Gs. Și proteinele sunt formate din 21 de aminoacizi, nu 20, 21 de aminoacizi. Se pare că al 21-lea este de fapt unul care tocmai a fost descoperit cu aproximativ 10 ani în urmă. Și codarea pentru acesta încalcă toate regulile. Și am putea vorbi despre asta dacă oamenii sunt interesați. Dar există 20 de aminoacizi, să spunem. Și am patru litere. Evident, dacă aș face un aminoacid pentru o literă, nu aș putea. Dacă aș avea două scrisori, am primit patru lucruri în aceasta și patru lucruri în aceasta. Asta ar codifica 16 aminoacizi, dar am 20 din care să aleg. Așa că am nevoie de trei litere pentru a codifica cel puțin 20 de aminoacizi. Deci, acesta este ceea ce se numește cod genetic. Opresc termenul. Deci, fiecare poziție poate fi una dintre cele patru nucleotide. Și natura a evoluat utilizând trei nucleotide pentru a codifica un singur aminoacid. Deci ARN-ul mesager vine aici. Și una dintre cele mai uimitoare piese ale nanotehnologiei, acest ribozom, se uită la șuviță în timp ce intră. Și este capabil să leagă acea șuviță cu alți aminoacizi care sunt ținuți în loc de acești ARN de transfer care recunosc aceste secvențe triplete. Deci, dacă există un anume A, A, T, ARNt-ul care recunoaște A, A, T sau, mai degrabă, opusul celui care ține aminoacidul potrivit, intră în loc. Și ribozomul îl atașează pentru a construi un lanț proteic în creștere. Deci intră ARN-ul, iese proteina. Micro-mașinile pentru acest lucru sunt uluitoare când te gândești la asta. Amintiți-vă, acest lucru se întâmplă de multe ori pe secundă în toate celulele voastre. Nu trebuie să te gândești la asta. Nu eșuează aproape niciodată. Dacă a eșuat, pur și simplu nu am putea face nimic. Deci iată acest cod genetic. Deci sunt 64 de poziții diferite aici. Și așa vezi ceva de genul UUU. Deci Us sunt folosiți în ARN în loc de Ts. E doar o mică diferență acolo. UUU este codul pentru fenilalanina. Codurile UCC pentru serină. Și acesta este codul, în esență. Acum, evident, aceste patru coduri diferite codifică serină. De fapt, nu contează care este a treia pereche de bază. Primele două sunt cele specifice. Deci există degenerații în acest cod pentru că nu trebuie să alegem dintre 64. Avem doar 20 sau 21 de aminoacizi din care să alegem. Deci aceasta este de fapt dogma centrală aici. Și acestea sunt toate conceptele diferite despre care am vorbit până acum. Am vorbit despre nucleotide, care sunt ținute într-o dublă helix. O singură spirală dublă formează un cromozom. Un cromozom deține genele sau ADN-ul. Și întregul set al tuturor acestor gene se numește genom. Genele codifică ARN-ul mesager. ARN-urile de transfer aduc aminoacizii, iar ribozomul operează pe asta pentru a produce proteine. Vom vorbi despre secvența semnalului într-o secundă. Aminoacizii sunt uniți pentru a forma proteine. Și această secvență de săgeți aici se numește dogmă centrală. Chiar dacă săgețile funcționează bidirecțional acum, aceasta este dogma centrală originală. Acum, o altă parte fascinantă este aceasta. Uneori, celula trebuie să facă ceva care ar fi destul de dăunător celulei. Deci, de exemplu, există celule în pancreas care trebuie să facă lucruri pentru a digera alimentele pe care le consumăm. Tocmai m-am dus la camion. Am mâncat puțină găluște. Acum, trebuie să descompun acea proteină. Și se pare că pot descompune proteinele cu ceva numit tripsină. Tripsina mă va ajuta să descompun proteinele, precum și multe alte lucruri, dar acele lucruri sunt proteine ​​în sine. Deci, aici este dilema. Celulele mele pancreatice , cum vor produce această tripsină fără a se digera singură? Cum fac proteine care mă vor ucide dacă trebuie să le fac? Ei bine, ceea ce se întâmplă sunt primele câteva perechi de baze ale secvenței, de fapt, primii câțiva aminoacizi care sunt scuipați de ribozom, ar putea codifica ceea ce se numește peptidă semnal. Și ribozomul ar putea să vadă asta și să spună, stai. Lucrul pe care sunt pe cale să-l fac ar putea să mă omoare. Trebuie să mă opresc aici. Și ceea ce se întâmplă este cumva ribozomul se îndreaptă spre un loc mai sigur pentru a produce proteinele numite reticul endoplasmatic sau ER. Deci acesta este ribozomul. Aici vine ARN-ul. Iată un lanț proteic în creștere. Și dintr-o dată această bucată roșie de aici este recunoscută de partea accesorie a ribozomului, peptida de recunoaștere a semnalului. Se spune, stai. Nu continua aici. Pentru că dacă am doar o moleculă din asta, voi începe să degradez proteinele din celulă. Deci totul trece peste. Începe să scuipe lanțul de proteine ​​în această gaură în reticulul endoplasmatic, unde poate fi apoi construit în siguranță. Acesta este într-un compartiment separat care poate fi exportat. Este o piesă destul de sofisticată de nanotehnologie, chestia asta. Știe, pentru că i s-au dat codurile potrivite, să nu se digere singur pentru că ar putea avea nevoie să facă ceva destul de toxic pentru celulă. Există peptide de recunoaștere a semnalului ca aceasta probabil pentru o mulțime de compartimente diferite din celulă. Nu includeți acest lucru în ER. Construiește-l în altă parte. Catalogul complet al acestora este încă necunoscut, dar ar fi destul de valoros de știut. Deci, cum a decis celula să facă această genă? Acest domeniu de cercetare se numește reglare transcripțională. Deci de ce această celulă decide să producă acel ARN mesager? Nimeni nu știe sigur în niciun caz cum facem de fapt ADN-ul să se desfășoare în modul corect pentru ca aceste lucruri să fie construite, dar ne place să teoretizăm. Și ne place să desenăm astfel de imagini. Și veți vedea chiar și imagini ca aceasta în The New England Journal of Medicine acum. Acesta este un mod comun acceptat de a desena o genă. Deci iată începutul unei gene. Săgeata de aici înseamnă că aici urmează să fie scoasă gena, o copie . Și aceasta este regiunea din amonte. Și aceste casete reprezintă lucruri care se pot lega de acea regiune din amonte pentru a porni sau opri întregul proces. Deci GR aici reprezintă receptorul de glucocorticoizi. Deci, când această celulă vede steroizi, steroizii se vor lega de receptorul de glucocorticoizi, iar receptorul de glucocorticoizi se va lega aici. Și această imagine de aici arată că cu hormonul, cu steroizi, acest lucru se oprește. Au pus un mic X aici. Și aici, asta înseamnă fără, așa că fără steroizi prezenți, acești doi sunt de fapt legați în stare naturală. Dar când ai asta plus un receptor de glucocorticoizi, treaba se pornește. Așa că vă puteți imagina lucruri, de fapt alte proteine ​​- receptorul de glucocorticoizi este o altă proteină - revin înapoi la ADN și se leagă de regiunile din amonte de gene pentru a activa și opri alte gene. Deci, totul este o cascadă repetitivă uimitoare. Genele codifică proteine, dintre care unele își fac treaba, unele revin la ADN și activează alte gene sau dezactivează alte gene. Și acest ciclu continuă la nesfârșit. Și știm doar cea mai mică parte din aceste cicluri. Amintiți-vă, desenăm aici cutii frumoase și drăguțe. Nu există niciun caracter aldine, nici un iluminator, nimic în amonte care să ne spună că aici se va lega. Tot ce avem sunt literele. Și o mulțime de biologie cu mișcare lentă se implică în a afla unde sunt aceste locuri de legare. Și ne place să credem că avem algoritmi pentru a face asta. Unii funcționează și alții nu. Arie imensă de cercetare aici dacă am putea descoperi această imensă rețea de transcriere. Ce poate începe procesul, chiar dacă acestea se desfășoară la nesfârșit? Ciorchini întregi, acțiuni complet diferite asupra celulelor pot declanșa de fapt răspunsuri specifice. Deci, de exemplu, acțiunea hormonală asupra receptorilor... Tocmai am luat prânzul. Pancreasul meu produce acum insulina. Acea insulina este o proteină mică. Este exportat din celulele mele pancreatice în sânge. Acea insulina va ajunge acum la mușchi și grăsime pentru că stomacul meu ia tot zahărul din ceea ce tocmai am mâncat. Trebuie să păstrez acel zahăr undeva. Deci, insulina trece din pancreas în sânge și declanșează un răspuns în timp ce vorbesc în grăsimea din ficat și celulele musculare. Deci ar putea fi un receptor aici sus, o altă proteină. Insulina vine și se leagă și declanșează o grămadă de lucruri care să pornească și să oprească diferitele gene care sunt exprimate. Șoc sau stres pentru celulă... Tocmai am venit aici de la Children's. Este al naibii de frig acolo. O grămadă de lucruri tocmai au început să fie transcrise în genomul meu, nouă sursă sau lipsă de nutrienți. Dacă ai drojdie și pui un singur tip de zahăr, dintr-o dată începe să facă lucruri pentru a face față acestui tip de zahăr. Dacă îl schimbi cu o sursă diferită de zahăr, acele gene se reduc. Un alt set de gene crește. Deci asta ar putea începe transcrierea unei grămadă de gene. Dereglări interne ale unei celule, acestea sunt de fapt două moduri diferite de a realiza un program transcripțional. Dacă zbor de aici la San Francisco, voi fi lovit de raze cosmice. Și mai mult ca sigur, unul dintre ei o să lovească una dintre celulele mele. Și dintr-o dată, dacă lovește ceva în locul greșit, s-ar putea să încep să fac o genă pe care nu ar trebui să o produc. Dar și mai bine, dacă celula mea detectează că face ceva ce nu ar trebui să facă, s- ar putea decide să se sinucidă, scutându-mă de problema de a avea cancer. Deci, acestea sunt două moduri diferite prin care tulburările interne pot declanșa aceste lucruri. Uneori, celulele pot decide să se sinucidă în beneficiul organismului. Și acesta este un alt mod obișnuit de a porni aceste programe. Și, desigur, lista lucrurilor care pot declanșa un program transcripțional este nesfârșită. E infinit, nu? Pot să merg așa și tocmai am declanșat niște gene în mână, de exemplu. Orice ar putea începe aceste lucruri să meargă. Aveți întrebări până acum? Mai am vreo trei sau patru diapozitive despre biologie. Sunt chestii pe care le știați deja cu toții? Ai învățat ceva până acum? Poate, OK. Deci, aceasta este puțin mai ezoteric acum, această idee a programelor temporale. Deci, unul dintre cele mai importante locuri în care genele sunt pornite și oprite este în timpul dezvoltării unui organism. Așadar, în cele 10 luni de gestație, când trecem de la ovulul fertilizat la părăsirea efectivă a uterului, mănunchiuri întregi de gene sunt activate și oprite într-un program destul de bine definit. Iar imaginea pe care o arăt aici este diferența dintre dezvoltare și-- presupun-- deci termenii pe care îi folosesc aici sunt segmentare versus homeoză. Aruncă o privire la această poză, de exemplu. Acestea sunt două case construite în San Francisco în 1857. Și ambele au început cu același plan. Și amândoi au început... sunt în esență aceeași casă unul lângă celălalt. Dar după mai bine de 100 de ani, cele două case arată foarte diferit una de cealaltă. Așadar, acesta este dat ca exemplu pe această hârtie celulară, spunând, în principiu, că genele care sunt implicate în dezvoltarea unui anumit țesut ar putea să nu fie aceleași care rafinează țesutul după ce a fost construit. Deci, același țesut poate avea două programe diferite pe două scale de timp diferite în ceea ce privește expresia genelor. Acum, să vorbim despre acest proces de producere a ARN-ului mesager, deoarece acest lucru este important. Cel mai comun, cel mai impresionant mod de a măsura genele acum se întâmplă să facă multe cu ARN-ul mesager. ARNm poate fi transcris la câteva sute de nucleotide pe minut. Nu e așa de repede, de fapt. Deci, dacă aveți o genă lungă de 10.000 de perechi de baze, eu fac doar 100 pe minut, poate câteva 100 de minute. Mi-ar putea lua ore să transcriu o genă. Deci, gândindu-ne la acest proces, acest lucru îl pune de fapt într-o scară de timp real pe care o putem cunoaște și iubi aici în termeni de minute. Deci gena distrofina, distrofina este implicată în mușchi. Se dovedește că distrofina are defecte care pot duce la distrofie musculară. Distrofina este implicată în modul în care se formează și se contractă mușchii. O genă a distrofinei poate dura 20 de ore pentru a se transcrie. Deci, cum putem face suficient din asta dacă este nevoie de 20 de ore pentru a face orice idee? Dacă îmi ia 20 de ore să fac o transcriere a distrofinei și trebuie să fac o grămadă, cum o să fac? PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Trebuie să ai o grămadă întreagă de ribozomi, dar ce? PUBLIC: Copii multiple ale genei. ATUL J. BUTTE: OK, poți avea mai multe copii ale genei în genom, dar există o altă cale la care nu te-ai gândit. Uite, îți spun că durează 20 de ore la începutul țevii până la capătul țevii, nu? Acum, nu vă spun cât de repede bag lucrurile în țeavă. Pot avea unul dintre lucrurile care fac [INAUDIBIL] chiar în spatele următorului, în spatele următorului, în spatele următorului. Așa că aș putea transmite în flux mii de copii odată, nu? Nu trebuie să aștept ca unul să fie făcut pentru a începe următorul. Pot să-i pun pe toți să meargă într-o pereche de baze unul de celălalt, câteva perechi de baze unul de celălalt. Așa pot face mai multe sau mai puține. Dar încă am nevoie de toți ribozomii pentru a-i transforma în proteine. Ai dreptate. Deci, acesta este un concept important. Chiar dacă sunt lungi, nu vă spune cu adevărat câte putem face, având în vedere orice unitate de timp. Dacă celula chiar dorește să facă o grămadă de ele, probabil că ar putea găsi o modalitate de a face acest lucru prin alinierea polimerazelor pentru a face copii ale genei. Acum, se pare că o mulțime de ARN mesager se termină cu poli(A). Deci, ce vreau să spun cu asta? Așa că, pe măsură ce acea mică polimerază lucrează la fluxul de ADN dintr-o copie a ARNm, atunci când este gata, pare că se bâlbâie. Deci adaugă o grămadă întreagă de A, A, A, A, As la sfârșit. Noroc pentru noi... Sunt sigur că există un motiv biologic pentru asta, dar se întâmplă să fie foarte norocos pentru noi. Pentru că dacă avem ceva care se lipește de acest perete care este doar din T, T, T, T, T, se va lega de A, A, A, A, A. Și dintr-o dată, acum putem avea un filtru mare pentru toți ARN-urile mesageri. Tot ce trebuia să facem este să transmitem ARN-urile mesager pe lângă micuțul meu lipit de perete cu poli(T)-uri și se va lega de poli(A)-uri. Așa putem extrage toate ARN-urile mesageri din grupul general de ARN-uri care ar putea fi acolo, deoarece nu toți ARN-urile codifică de fapt proteine. Și, în general, așa detectăm ARN-urile. Puteți lua secvența de ARN-uri și puteți construi complementul invers al acesteia. Deci oriunde există un G, pune un C în detectarea mea. Și dacă există un A, puneți un T. Dacă există un C, puneți un G. Deci, putem folosi complementul invers pentru a ne ajuta să spunem dacă această secvență există sau nu, în funcție de modul în care am proiectat sonda. Și vom vorbi despre asta. Deci acesta este, cred, ultimul diapozitiv. Deci de ce încercăm să facem tot acest proiect genom? De ce a fost important să finalizam proiectul genomului? [? Eric?] [? Weiner?] folosește practic această analogie că cunoașterea tuturor genelor este echivalentă cu cunoașterea tabelului periodic al elementelor pentru biologie. Așadar, în jurul anilor 1850, 1860, 1870, Mendeleev a venit cu un mod de a alinia toate elementele în așa fel încât să poată prezice caracteristicile acelor elemente. Acum, pe atunci, cele mai multe dintre acestea erau spații goale pentru că nu văzuseră unele dintre aceste elemente rare înainte. Dar știau că trebuie să existe un element inert, de exemplu. Sau trebuie să existe un element aici care să fie magnetic. Ei pot face aceste predicții chiar dacă nu au văzut încă ce era de fapt acolo. Nu o descoperiseră. În același mod, tabelul periodic pentru biologie pentru genomică nu va fi un tabel. Ar putea fi un copac pentru că așa se formează de fapt aceste gene, prin evenimente de duplicare. Și deci ideea este că poate putem prezice că trebuie să existe ceva în genom care se leagă de asta. Deci trebuie să existe ceva în genom care este responsabil pentru asta. Acum, că avem întregul catalog, putem începe să descoperim acele lucruri. Și tot acest curs este cât de relevant este acest lucru pentru medicină. Deci majoritatea cifrelor pe care vi le-am arătat aici sunt din această carte Genomes. De fapt, există acum o a doua ediție. Ar putea fi una dintre lecturile obligatorii sau ceva pentru curs. PUBLIC: [INAUDIBIL] ATUL J. BUTTE: Dar este disponibil gratuit la NCBI. Cu siguranță știi asta. Așa că aș... și de fapt, toate cifrele sunt și ele acolo, dacă ești interesat să adaugi aceste lucruri la rapoarte și alte chestii. Recomand acest lucru mai mult decât orice altceva doar pentru că este foarte lizibil, o mulțime de cifre grozave pentru a ajuta la explicarea acestor procese și este foarte de ultimă oră, începe cu proteomică, specificații de masă, microarrays, întregul funcționează, mult mai bine decât alte cărți, relevante cărți din acest domeniu. Și Departamentul de Medicină de pe acest site web are o notă despre asta. Începe să îmbătrânească acum. PUBLIC: [INAUDIBIL]. Ați primit un alt e-mail, OK? ATUL J. BUTTE: Începe să îmbătrânească puțin, dar este încă destul de relevant. Unele dintre aceste lucruri nu vor depăși niciodată. Bine, deci am mai primit, să zicem, 45 de minute sau cam asa ceva? PUBLIC: Da. ATUL J. BUTTE: OK. Să vorbim despre tehnicile de măsurare a genelor. Voi veni cu ceva diferit pentru marți. Deci despre ce voi vorbi acum... deci vreo întrebare până acum? Da. PUBLIC: [INAUDIBIL] Scala de timp pentru transcriere? ATUL J. BUTTE: Sigur. PUBLIC: Știe cineva cum s-a spus că puteți alinia transcripții multiple [INAUDIBILE] pentru a combate aceste [INAUDIBILE] mai lente, nu? ATUL J. BUTTE: Da. PUBLIC: Și presupun că complexul de transcripție se leagă de început... ATUL J. BUTTE: Exact. PUBLIC: --și apoi mai repede decât se mișcă de-a lungul tulpinii, care este limita inferioară? Bănuiesc că [INAUDIBIL] care este cel mai rapid mișcarea acestor lucruri? ATUL J. BUTTE: Deci, care este cel mai rapid transcris acea genă? PUBLIC: Da. Vreau să spun pentru că ai primul complex de transcriere doar să te muți din drum. ATUL J. BUTTE: Absolut. Da, exact. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Probabil ai putea să faci calculul și să-ți dai seama , bine? PUBLIC: Cred că este un proiect grozav, de fapt. ATUL J. BUTTE: Corect. Deci... PUBLIC: Ajută cu... nu, serios. ATUL J. BUTTE: Absolut. Puteți modela asta, nu? PUBLIC: [INAUDIBIL] o bază solidă înțelege tot ceea ce știm despre inițierea [? transcriptual?] și trecerea mai departe și renunțarea, toate lucrurile care trebuie să se întâmple. Și există documentații destul de detaliate ale [? caracteristici ?] şi procese. Care este limita superioară pentru transcriere și traducere? ATUL J. BUTTE: Ei bine, practic, modelul, toată treaba, este o țeavă sau un canal. Și ți-am spus deja cât durează chestia asta, cât durează să faci distrofină. Trebuie doar să modelați cât de repede îl pot pune pe următorul. S- ar putea să îl modelați doar pe baza dimensiunii polimerazei și poate câte perechi de baze acoperă. Poate că trebuie să se îndepărteze înainte ca următorul să intre. Îl poți modela așa, de exemplu. Ar fi destul de interesant să vedem cum se potrivește asta cu numerele reale publicate pentru el. Pariezul meu este că probabil că nu este încă pasul de limitare a ratei în acest proces. Asta e o altă întrebare interesantă. Care este partea lentă aici? De fapt nu sunt sigur. Probabil depinde de gene, de fapt. Există câteva gene care sunt doar... există câteva proteine ​​importante care au doar 10 aminoacizi. Insulina, de exemplu, este una cu 50 de aminoacizi. Deci unele dintre acestea pot fi scuipate destul de repede. Și apoi ai unele care sunt uriașe precum distrofina și titina, unele dintre acestea altele. Alte intrebari pana acum? PUBLIC: [INAUDIBIL] în termeni de [INAUDIBIL], ce în termeni de legare [INAUDIBIL]? ATUL J. BUTTE: Deci, din nou, amintiți-vă, nu există nicio linie drăguță acolo. Trebuie să fie în secvență. Deci, există secvențe specifice despre care se știe că sunt granițe intron-exon, dar în mod clar nu sunt 100%. Pentru că în alte celule, aceeași secvență ar putea duce la o altă transcriere. Deci, există limite intron-exon despre începutul intronului și sfârșitul intronului. Și se dovedește că un capăt al acestuia completează cealaltă parte. Deci, aceste lucruri sunt de fapt scoase într-o formă de tip buclă. Deci, lucrul care decupează acest lucru aliniază ARNm-ul într-un asemenea mod încât să poată pune începutul și sfârșitul împreună și, practic, să taie totul așa. Vă pot trimite la imagini din genom exact despre asta. Dar din nou, nu este 100%. PUBLIC: [INAUDIBIL] ca GA, de exemplu, este una dintre dinucleotidele care inițiază uneori complexul de îmbinare. Dar de multe ori nu, ceea ce înseamnă că este o dinucleotidă foarte comună. Deci [INAUDIBIL] sintaxa care determină îmbinarea nu este [INAUDIBIL]. Deci avem niște euristici care funcționează uneori. Nu am realizat inginerie inversă [INAUDIBLE] codului alternativ de îmbinare. ATUL J. BUTTE: Te gândești la asta. Acesta este un efort masiv de decriptare în cele din urmă. Tot ce avem sunt As, Ts, Cs și Gs. Un nivel de codare este codonul triplet pentru aminoacizi, dar un altul mai interesant este gramatica de aici. Unde este începutul genei? Unde este sfârșitul genei? Când îl îmbin? Și când îl îmbin? Care sunt toate elementele de reglare a transcripției? Acesta este Sfântul Graal aici. Acesta este Sfântul Graal. PUBLIC: [INAUDIBIL]? ATUL J. BUTTE: Noi le știm. PUBLIC: Dar nici nu funcționează întotdeauna. ATUL J. BUTTE: Absolut. BINE. Așa că îți voi da... Îți voi spune exact de ce. Codul pentru început, există un singur cod pentru început, AUG, dar există trei coduri pentru a opri. Se pare că unul dintre coduri se oprește, dacă există un alt cod de 100 de perechi de baze mai târziu, care face cel de-al 21-lea aminoacid. Deci, cu alte cuvinte, nici măcar nu te poți uita la tripleți. Este și în contextul altor lucruri. Face lucrurile din nou dezordonate. Este atât de drăguț și îngrijit cu doar codoni tripleți. Dar această oprire plus altceva 100 de perechi de baze mai târziu dă, de fapt, cel de-al 21-lea aminoacid, selenocisteină. Asta-i viața, dezordonat. PUBLIC: Așa că oamenii au descoperit selenocisteina. ATUL J. BUTTE: Oamenii pentru viața lor nu și-au putut da seama de ce. Cum faci proteinele selenocisteinei? Există doar patru la oameni, dintre care unul este implicat în tiroida, motiv pentru care o mulțime de endocrinologi se uită la asta. Metabolizează hormonul tiroidian într-o formă în alta, tiroxina în triiodotironină. Acea enzimă are o selenocisteină. Și oamenii nu și-au putut da seama de ce codifică selenocisteină pentru că arăta ca un codon stop al lor. Ei bine, ai putea începe să-ți dai seama de aceste lucruri odată ce ai întregul genomul acum. Puteți să vă uitați la aceste excepții. PUBLIC: [INAUDIBIL] funcția [INAUDIBILĂ] a șoarecilor și a oamenilor. Ce [INAUDIBIL]? ATUL J. BUTTE: OK, să fim foarte specifici. Repetările codifică pentru o proteină care revine, caută secvența și, de fapt, integrează secvența în altă parte în genom. El repetă codul pentru proteine ​​ca orice altă genă care își găsește secvența și o pune în altă parte a genomului. Dar pentru ca acest lucru să se întâmple codul proteinei trebuie să funcționeze. Dacă este deteriorat fără reparații, lucrul nu poate funcționa. Și uneori face greșeli. Deci chestia se întoarce. Am făcut o proteină. Se întoarce. Încearcă să facă o copie a lui însuși. Uneori prinde ceva greșit pentru a face o copie. Deci, de aceea avem copii ale multor lucruri din genom. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Bună întrebare. Este capabil să-și recunoască propria secvență, dar nu este deloc perfectă. Dar ceea ce putem spune despre diferența dintre om și șoarece este că șoarecele are acele secvențe pentru acea proteină, o transcriptază inversă. Are coduri pentru el care par să fie complet funcționale. Și la un om, nu există niciunul care să fie încă funcțional. Asta spunem noi. Este foarte curios de ce este toată această zonă a arheologiei genomice pe care o poți face cu genomul acum. De fapt, ceea ce spunea Zach mai devreme este că avem atât de multe milioane de repetări încât ne putem uita să vedem cât de devianți sunt de la o copie de lucru. Și astfel putem îmbătrâni fiecare dintre repetiții. Acesta are 40 de milioane de ani. Acesta are 50 de milioane de ani. Pentru că dacă are patru locuri unde este diferit și acesta are doar două, cel cu patru este probabil mai vechi decât cel cu două, nu? Așa că putem îmbătrâni toate aceste repetări. Și se pare că o grămadă întreagă dintre ele au fost făcute la un anumit moment în timp și apoi au căzut. Din nou, nimeni nu știe de ce. Vă voi arăta graficul în al doilea aici. Publicul: Deci putem presupune că genomul crește tot timpul. Deci [INAUDIBILUL] mult mai mare decât atât. ATUL J. BUTTE: Sau mai mic, de asemenea. Există modalități de a scăpa și de aceste lucruri. Dacă faci prea multe daune, lucrul nu se poate reproduce. Si asta e. Este capătul firului. Cel mai uluitor lucru pe care Proiectul Genome l-a făcut pentru mine personal este că, acum, îmi dau seama că există o singură formă de viață pe această planetă. Este ADN-ul. Orice altceva este un efect secundar. Acest ADN face tot ce poate pentru a-și menține codul. Asta e tot ce este. Există o carte grozavă numită-- PUBLIC: The Self Machine. ATUL J. BUTTE: The Self Machine, desigur, dar există și una mai recentă numită-- este pe genom. Este un broșat. Autobiografia unui genom cred că se numește. Sunt ca 23 de capitole. Și, practic, aleg doar o genă din fiecare capitol și fac o poveste. PUBLIC: Oh, da. ATUL J. BUTTE: Este o carte grozavă. Recomand să citești asta. Este un fel de lectură laică. PUBLIC: Da, [INAUDIBIL]. ATUL J. BUTTE: A fost o vreme pe o listă de bestselleruri. PUBLIC: Așa este. ATUL J. BUTTE: Autobiografia unui genom Cred că se numește, așa ceva. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Unele capitole au fost mai greu de scris decât altele, cred, pentru acest tip. [VOCI INTERPUSE] PUBLIC: Este doar o întrebare despre vârsta [INAUDIBILĂ], știi, și vârsta [INAUDIBILĂ]. Având în vedere că poți să scapi sau să adaugi la sau... se pare că dați gene în funcție de numărul [INAUDIBIL] de mutații împotriva frecvenței mutațiilor. Și pare oarecum invalid acum că știm că există [INAUDIBIL]. PUBLIC: Vreți să spuneți că din cauza acestor tipuri de influențe doar privind, să spunem, rata de reîmprospătare a substituțiilor sinonime față de substituțiile non-sinonime , nu mai este un ceas bun? PUBLIC: Bănuiesc. Cred că fac... ceea ce conduc este că pare unul dintre principalele... unul dintre punctele de bază pe care le-ați făcut este că există multe schimbări și multe greșeli care pot fi introduse dintr-o varietate de surse, dintre care niciuna nu trebuie să fie atât de magnifică sau catastrofală. Sunt tipuri de lucruri zilnice. Și totuși, pe de altă parte, când vorbim despre, ei bine, această genă probabil sa terminat pentru că are patru mutații, nu două... ATUL J. BUTTE: Corect. Totul se bazează pe... acesta este un punct grozav. Putem îmbătrâni aceste lucruri pentru că credem că știm modele. Deci, având în vedere o rată fixă ​​de înlocuire a nucleotidelor în care oamenii au încercat să calculeze numere pentru asta, putem face o premisă. Dar dacă nu este adevărat, atunci nu va ține. PUBLIC: Deci, mai întâi, dacă aveți o transpunere pe [? caseta?] chiar în mijlocul genei, atunci asta ar fi invalid când te uiți la rata de procesare a mutației [INAUDIBIL].. Are un nou puzzle. [INAUDIBIL] ca un nou pentru a putea compara. Modelul [? este greșit. ?] Dar dacă ai o întindere, vreau să spun... ATUL J. BUTTE: Corect. PUBLIC: --o întindere, este mai mult sau mai puțin la fel, cu excepția unor [INAUDIBILE], apoi multe dintre acestea-- nu sunt catastrofale, dar trebuie să aibă loc schimbări mai violente. ATUL J. BUTTE: Totul este o chestiune de scară de timp. Aceste lucruri se fac copii de-a lungul a milioane de ani. Nu este deloc o chestie de zi cu zi . Celula din plămânul meu poate face o copie a ei însăși și o poate muta undeva în genom. În marea schemă a lucrurilor, cui îi pasă? Nu se află în spermatozoizi. Nu va continua. Deci trebuie să se întâmple în celula potrivită la momentul potrivit. De-a lungul a milioane de ani, aceste lucruri se întâmplă când te gândești la asta. Trebuie să fie și în celula potrivită. PUBLIC: Când te uiți la [INAUDIBIL] dintre gene, există ceva de spus că rata mutațiilor ar fi aproximativ aceeași în toate regiunile [INAUDIBIL]? ATUL J. BUTTE: Da. PUBLIC: De fapt, unul dintre studiul [INAUDIBIL]. [INAUDIBIL] ATUL J. BUTTE: Da, cred că ratele sunt cu siguranță diferite între diferite regiuni doar pentru că unele dintre aceste procese au rate diferite. Îți amintești modelul de bandă pe care ți l-am arătat în AT-rich? Aceasta corespunde regiunilor bogate în AT și bogate în GC. Unele procese au loc cu rate diferite între ele, deoarece există legături mai strânse acolo. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: S- ar putea, dar nu avem unde să-l modelăm. Publicul: Asta nu știm. ATUL J. BUTTE: Nu avem cum să-l modelăm. PUBLIC: [INAUDIBIL] când genomul a fost prezentat pentru prima dată în 2000 cu [ INAUDIBIL], oamenii [INAUDIBIL] au încetat să mai vadă genele din ADN-ul nedorit. Dar dacă te uiți la placa de secvențe din [INAUDIBIL] de ADN din arborele filogenetic [INAUDIBIL], procentele sunt destul de similare pentru regiunea intergenică. Asta ne spune regiunea [INAUDIBILĂ] . [INAUDIBIL] vorbind, aceste lucruri sunt importante, fie că este vorba de a păstra în mod egoist unele [INAUDIBILE] pentru a supraviețui sau pentru că este de fapt necesar pentru funcționarea organismului. ATUL J. BUTTE: Permiteți-mi să arăt acest diapozitiv pentru că puneți atât de multe întrebări despre repetări. Și acest fel rezumă multe. Deci 3 milioane de copii repetate au început ca elemente de lucru. Așa pot modela asta. Există 3 milioane de repetări în genom. Deci măsurați cât de departe sunt de o copie funcțională a acestora. Pentru că de-a lungul timpului, aceste mutații au loc aleatoriu, probabil la o rată fixă, dar nu neapărat. Cele mai multe dintre repetări sunt anterioare radiațiilor mamiferelor, deci înainte ca mamiferele să se formeze. Majoritatea acestor repetări sunt de fapt mai vechi decât cele din genom. Dar nu există dovezi pentru activitatea transpozonelor în ultimii 50 de milioane de ani de când ne-am îndepărtat de maimuțe. Niciunul dintre aceste lucruri nu a fost viu. Dar sunt încă vii și sănătoși la șoarece și șobolan. Deci nu... mergeți mai departe. PUBLIC: Asta este? Adică, ce fel de defalcare a câte specii sunt încă... Adică maimuțele mai fac asta sau sunt [INAUDIBILE]? ATUL J. BUTTE: Nu cred că știm încă, pentru că genomul maimuțelor tocmai se termină acum. Așa că putem răspunde mai bine la această întrebare în fiecare lună. Până la sfârșitul acestui curs, veți putea să răspundeți mai bine decât astăzi, deoarece acești genomi vin online. Literal, aceasta este o informație veche de doar doi ani. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Ce-i asta? PUBLIC: Sever [INAUDIBIL]. ATUL J. BUTTE: Nu veți termina niciodată de secvențial fiecare organism de pe planetă, dar cred că vom avea o estimare mai bună acum decât atunci când a apărut această lucrare dacă alegeți să faceți acest lucru. Iată graficul la care îmi place să mă gândesc. Deci diferitele bare de aici, diferitele culori reprezintă diferitele elemente repetate. Liniile, semnele, sunt doar coduri diferite. Și aici există mai puțin de 1% înlocuire dintr-o copie de lucru. Și iată o înlocuire de 34% din copie de lucru. Și puteți citi asta ca milioane de ani practic, mergând înapoi cu sute de milioane de ani. Și puteți vedea că la 7% înlocuire există un vârf. Și apoi scade și apoi un pic ușor, apoi scade. Deci acestea nu sunt deloc reparate. Te face să te întrebi ce s- a întâmplat pe planetă în acest moment și în evoluție. De ce toate aceste lucruri erau vii, de exemplu, apoi dintr-o dată au murit până la zero? Deci este uimitor când te gândești la asta doar pentru că le modelează ca copii de lucru. Și cum se deosebesc de acele copii de lucru? E fascinant. Arheologie genomică, acesta nu era un domeniu în urmă cu trei ani. Totuși, relevanța în medicină trebuie să fie determinată, motiv pentru care vom merge mai departe. OK, deci mai am aproximativ 20 de minute. Să vedem câte tehnici de măsurare a genelor pot acoperi aici. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Mă duc până la 2:00, nu? BINE. Să zicem 30 de minute. Așadar, tehnicile de măsurare a genelor despre care voi vorbi astăzi sunt... Ei bine, una, cum măsurăm ADN-ul? Cum măsurăm ARN-ul? Și cum măsurăm proteinele? Dacă puteți obține acest lucru, veți ști 95% din ceea ce aveți nevoie în acest domeniu. Să începem cu ADN-ul. Deci secvențierea ADN-ului a fost inventată la mijlocul anilor '70. Și când măsurăm ADN-ul, îl secvențiem. Deci vrem să știm succesiunea As, Gs, Ts și Cs. Și deci cum am obținut toate perechile de baze de 3 și 1/2 miliarde -- practic, doar moduri puțin mai automate decât ceea ce vă voi arăta aici. Deci, ceea ce puteți face este, dacă aveți o probă de ADN-- amintiți-vă, este As, Gs, Ts și Cs-- avem instrumente pentru a face copii ale acestora. De fapt, putem împrumuta enzimele pe care le folosește celula. Și într-o eprubetă, îmi pot lua As, Gs, Ts și Cs și pot face copii ale acestora. Procesul de realizare a copiilor este o tehnică numită reacție în lanț a polimerazei sau PCR. Tot ce face PCR este să facă copii ale lucrurilor și să le amplifice. Dacă ai unul, îl faci în două. Apoi cei doi devin patru. Patru devin opt, etc. Și devine destul de mare, ceva pe care îl poți vizualiza de fapt . Deci, acum, practic, modul în care funcționează această tehnică este acesta. În timp ce fac o copie a unei catene de ADN, să oprim reacția. Deci, pe măsură ce fac o copie, să presupunem că am 100 de perechi de baze. Să oprim reacția. Și l-am oprit după ce am o grămadă de copii disponibile. Așa că unele dintre copii vor fi 50 când l-am oprit. Unele vor fi 99. Altele vor fi 98. Altele vor fi 97. Așa că voi avea o întreagă varietate de lungimi de copii ale acelei gene ale acelei secvențe. S- ar putea să nu fie nici măcar o genă. Deci, hai să o pornim din nou, dar ultima pereche de baze pe care o voi adăuga la acea copie o voi face un fluorescent. Și îl vom face fluorescent în așa fel încât să fac patru culori, o culoare pentru A, una pentru T, una pentru C, una pentru G. Deci am patru culori fluorescente diferite pe care le-aș putea încorpora în nucleotida, ultima nucleotidă pe care o voi pune pe această secvență specială. Deci, acum, am o varietate întreagă de lungimi, iar ultima pereche de baze ar putea fi o culoare fluorescentă. Apoi, ceea ce pot face este să pun tot acel amestec de lungimi de ADN și să le pun într-un gel. Vreau să activez efectiv un curent electric. ADN-ul începe să cadă deoarece ADN-ul este tras pe baza încărcăturii sale. Dar după cum ați ghici, secvențele mai mici sunt trase mai repede, deoarece este mai ușor de mutat decât cele mai mari. Chiar și cu o pereche de baze le puteți separa astfel. Se numește electroforeză pe gel. De aceea, o diferență de o pereche de baze pe care o putem vedea pe un gel, în funcție de încărcare și de toate aceste lucruri. Deci, ceea ce faci este să pui un laser în partea de jos a gelului. Așa că obișnuiam să epuizăm gelul. Și dacă s-a stins după sfârșit, ai jura pentru că tocmai ți-ai stricat secvența. L-ai pierdut. Este în băltoaica din partea de jos a gelului. Dar acum, vrem să se întâmple așa, deoarece am instalat un laser la sfârșit care excită orice fluorescent care vine acolo. Și în funcție de culoare, putem doar să o citim. Oh, iată un vârf roșu. Iată un vârf albastru. Iată un vârf verde. Deci avem o grămadă de aceste vârfuri, apoi software-ul se uită la asta. De fapt, software-ul cel mai des folosit pentru aceasta este ceva numit phrap și phred, care este un program cu sursă deschisă, disponibil gratuit. Oamenii nici măcar nu folosesc software-ul care a venit cu chestia. Și-au scris propriile lor, și este open source. Se uită la vârfuri, apoi face apelul. Văd acest vârf aici. Cred că este un G. Văd acest vârf aici. Cred că este un C. Vor fi probleme imediate cu asta. În primul rând, în ciuda cât de frumos arată, încă nu putem face mai mult de 300 de perechi de baze cu asta. PUBLIC: [INAUDIBIL] unele defecte legate de dimensiunea [INAUDIBIL]. ATUL J. BUTTE: Toate, în teorie, ar trebui să fie la o singură pereche de baze, dar există tot felul de motive. Deci, de ce sunt unele amestecate aici și altele sunt distanțate aici? Pe măsură ce lași chestia să plece... nu este un lucru liniar, spațierea. Așa că, pe măsură ce îi dai drumul, devine din ce în ce mai larg și mai lat în general. Dar uneori procesul de copiere în sine poate avea erori. Să fiu clar. Dacă secvența cu care încep are o grămadă de G la rând, uneori devine confuză. Și se întâmplă să faci unul cu lungimea greșită. Deci, dacă am multe repetări, în secvența pe care încerc să o secvențez, o să am probleme. Și tocmai ți-am spus că 50% din genom se repetă. Nu e usor. PUBLIC: Secvențe diferite ar putea avea de fapt competențe diferite în aceste reacții. ATUL J. BUTTE: Da. PUBLIC: Și asta ar putea cauza unele schimbări ușoare. ATUL J. BUTTE: Dar, practic, nu putem face mai mult de 300 până la 400 de perechi de baze decât asta, dincolo de asta. Și acesta este stadiul tehnicii. Aceasta este stadiul tehnicii. Deci, pentru a trece de la asta la 3 și 1/2 miliarde de perechi de baze, o faci 300 la un moment dat. Asta este. Nu există mai multă magie decât asta. Mai este și o altă problemă. Ce se întâmplă dacă am două vârfuri în același loc? Tine minte? Am doi cromozomi. Pe un cromozom, ar putea fi o literă. Pe de altă parte, ar putea fi o altă scrisoare. Se întâmplă tot timpul, 1 din 1.000 se dovedește, despre care vom vorbi. Este un polimorfism. Ar putea fi asta sau asta. Așa o poți citi uitându-te și la vârfuri. Practic asta este. Încheiați lanțul cu nucleotida fluorescentă. Și le aliniați și le citiți în partea de jos. Și phred, practic, face apelurile aici. Software-ul se uită la vârfuri și face cea mai bună presupunere aici. Așa că toate aceste vârfuri, nu doar literele... Ți-am spus că literele vor încadra pe un CD-ROM. Dacă vrei să păstrezi urmele, vei avea nevoie de o mulțime de spațiu de stocare, de ordinul a sute de teraocteți pentru un singur om. Dar toate sunt stocate și toate sunt salvate pentru Proiectul Genomului Uman. Pentru că oamenii se întorc și spun, ei bine, acest vârf nu era atât de înalt. Nu cred că aceasta este scrisoarea potrivită. Dar pentru Proiectul Genomului Uman, nu numai că avem toate perechile de baze de 3 și 1/2 miliarde, dar avem și o evaluare a cât de bun a fost un apel pentru fiecare literă pe baza acestor vârfuri. Deci, cum ajungem la întregul proiect al genomului uman? Tu automatizezi procesul. Deci aceasta este o imagine a Centrului Genomului, Institutul Whitehead. Și, practic, sunt o grămadă de roboți care pur și simplu pornesc aceste lucruri. Cea mai mare parte a genomului a fost o secvență în doar 12 luni înainte de terminarea genomului. Chiar dacă procesul a durat de 10 ani, este nevoie de timp pentru a dezvolta aceste mașini, a dezvolta tehnologia și, mai important, pentru a dezvolta strategia, despre care vom vorbi într-o secundă. Și apoi au fost construite mașinile. Și, practic, ar putea face întreg genomul în 12 luni la sfârșit. Puteai vedea că numărul de gene care erau în formă de schiță a crescut exponențial până la sfârșit, chiar dacă a început la mijlocul anilor '90. Whitehead poate rula 100.000 de reacții de secvențiere la fiecare 12 ore. Înmulțiți asta cu 300 de perechi de baze pentru fiecare și puteți obține de ordinul a 3 milioane de perechi de baze. Să spunem că dacă fac 300, vor fi trei-- 30 de milioane de perechi de baze, să spunem, la fiecare 12 ore acum. Roboții aleg toate coloniile pentru că aceste lucruri sunt crescute în bacterii. OK, iată, 60 de milioane de nucleotide pe zi este estimarea actuală a ceea ce pot secvenționa. Și nu am putut să o facem nici măcar acum cinci ani. Deci, aveți toate aceste bucăți mici, mici, mici de 300 de perechi de baze. Și cumva, trebuie să puneți la loc întreg acest puzzle. Deci, există în esență două moduri în care puteți face acest lucru. Poți să începi cu o strategie și să spui, ei bine, voi lua această bucată din acest cromozom și o secvență. Apoi să trecem la următoarea piesă și să o ordonăm și să luăm asta și să luăm asta și să avem în minte o structură în ceea ce privește ordinea în care o vei face și să păstrăm fragmentul pieselor. Și apoi cum se vor întoarce. Abordarea opusă se numește secvențierea puștilor. Și asta înseamnă, practic, să ia întregul genom, să- l împărțiți în aceste fragmente de 300 de perechi de baze și să-l împărțiți din nou. Luați întregul genom și împărțiți din nou în 300 de fragmente de perechi de baze folosind alt mod. Deci locul în care îl voi tăia pentru această metodă va fi diferit de felul în care îl voi tăia pentru această metodă. Secvențiază întreaga mizerie și vezi doar ce se suprapune. Practic, această piesă din acest puzzle pare să se încadreze pe această piesă a acestui tip de puzzle. Și practic ai pus toate piesele împreună așa. Acum, asta presupune multă putere de calcul. Trebuie să păstrezi toate aceste lucruri în memorie. Trebuie să le aliniezi și să vezi care funcționează cel mai bine. Deci cea mai bună abordare până la urmă a fost un hibrid. Nu doar puneți toate piesele împreună, ci vă păstrați și o idee despre schele, de unde ați luat piesele, în loc să o faceți la întâmplare așa. Deci, ca majoritatea lucrurilor din viață, hibridul a funcționat cel mai bine. Deci, iată toate piesele tăiate într-un fel. Iată toate piesele tăiate altfel. Și asta înseamnă, practic , că de la A1 la A2 nu se suprapun, așa că suntem blocați acolo. Nu știm cum se alătură. Dar A2 și A3 ar putea avea unele suprapuneri. Și există B aici, iar apoi le-ai pus laolaltă pe baza pieselor. Și sperăm că aveți unele suprapuneri între ele. Acest A merge cu acest A, dar vedem și B și B aici. Iată că B1 se potrivește chiar aici. Și B3 se potrivește ca acolo, etc., etc. Așa se unesc aceste lucruri. PUBLIC: [INAUDIBIL] cauți suprapunere [INAUDIBIL]? ATUL J. BUTTE: Evident, vei avea nevoie de o grămadă întreagă. O să ai nevoie de o grămadă întreagă. Și deci sunt multe găuri. PUBLIC: Deci sunt doar 300 de perechi de baze [? informație. ?] ATUL J. BUTTE: Și din nou-- PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Din nou, v-am spus că 50% din genom se repetă. Deci statistic vorbind, veți obține o grămadă întreagă care arată ca și cum se potrivesc. De aceea, acest lucru nu funcționează atât de ușor imediat din cutie, deoarece aveți trei bucăți mici care seamănă atât de mult între ele. Deci, de aceea abordarea hibridă funcționează cel mai bine dacă vă amintiți că această piesă provine de la cromozomul 1 de pe această bandă , de fapt, atunci o puteți pune undeva fizic în genom. Deci, pentru un om, aveau 10 mașini cu 4 procesoare, deci 4 gigaocteți de RAM fiecare și un procesor de 16 cu 64 de gigaocteți. Asta a durat 10.000 de ore CPU. Aceasta este o cantitate uriașă de putere de calcul doar pentru a pune toate piesele împreună pentru om. Suprapunerile ocupă memorie, 600 gigaocteți de memorie RAM. Și în cele din urmă, hibridul de a-l pune pe o hartă fizică este calea de urmat. Să vedem dacă am asta acolo. Așadar, acum ne aflăm într-o stare în care puteți accesa site-uri web, cum ar fi acesta de la Universitatea din California Santa Cruz, care este probabil unul dintre cele mai populare, și puteți începe să răsfoiți genomul. Deci, dacă doar alegeți... puteți chiar să apăsați un buton pentru a vă duce într- un loc aleatoriu al genomului. Iată o regiune arbitrară a cromozomului 19. Vă arată unde sunt benzile, unde sunt regiunile bogate în GC, ce ați vedea pe un cariotip, unde sunt genele prezise, unde de fapt oamenii au văzut diferite bucăți de genă în ARN-ul mesager. . Deci, puteți începe să spuneți unde sunt intronii și exonii, unde sunt polimorfismele, totul într-un singur ecran. Și există de fapt două browsere diferite utilizate în mod obișnuit pentru asta. Și cred că următorul ecran este doar o explozie a browserului UCSC. Acesta este ca un lucru care rulează conținutul GC aici. Deci asta ne duce la asta. Așa că acum, am început deja să sugerez acest lucru. Să presupunem că, în afara secvențatorului automat, vezi vârfuri ca acesta. Sau aici, văd un pic de cocoașă aici și un pic de cocoașă aici sau aici, aici exact, două cocoașe care au exact aceeași dimensiune. Asta mă face să cred... Adică, programul pune un mic n aici pentru că nu știu care este, un A sau un T. Dar ceea ce ar putea însemna cu adevărat este că ar putea fi un polimorfism, că acel om de fapt are ambele litere, una pe un cromozom, una pe celălalt cromozom. Și așa că, dacă aveți o bucată de ADN care vă interesează să găsiți polimorfisme, puteți obține acea genă sau acea bucată de ADN, secvența în 100 de oameni și doar să vedeți care sunt diferitele litere în acea secvență. Acesta este un mod de a face asta. Dar au găsit o grămadă de aceste polimorfisme doar făcând proiectul genomului. Proiectul Genome a secvențiat aproximativ 30 de oameni. Și vor fi diferențe la 30 de oameni. Așa că o grămadă dintre ei au fost găsite și așa. Deci puteți face acest lucru în timp ce secvențați genomul. Găsești polimorfisme arbitrare. Sau dacă mă interesează această genă pentru că cred că este implicată în astm, vreau să văd dacă există polimorfisme, pot să merg după acea genă și să o secvențez în același mod. Ambele moduri vor arăta astfel pe un secvențietor automat, două vârfuri acolo. Puteți folosi, de asemenea, cuptorul cu microunde, pe care îl vom omite peste acesta. Dar puteți folosi o matrice pentru a vă ajuta să găsiți și aceste SNP-uri. Deci cred că veți avea SNP-uri de electroni. Dacă cineva... PUBLIC: Joel Hirschhorn, care este expert pentru Whitehead, v- a povestit despre SNP-uri și despre problemele de interpretare a SNP [INAUDIBIL]. ATUL J. BUTTE: Deci cred că acesta este ultimul meu slide despre măsurătorile ADN. Și voi termina doar cu utilizările clinice, deoarece aceasta este medicina genomică. Deci, din nou, SNP-urile sunt polimorfisme cu un singur nucleotid. Într-un anumit punct arbitrar din acel genom, aveți un A. Am un T, să spunem. Și de obicei este doar un lucru sau altul. Rareori, există locuri în care există trei combinații. De obicei, este una sau alta. Asta se întâmplă, în medie, o estimare aproximativă - aproximativ 1 din 1.000 de perechi de baze poate fi un polimorfism. Deci, dacă faci socoteala, asta înseamnă 3 milioane, 10 milioane de puncte diferite în genom unde ai putea avea o literă sau alta. Și descoperirea asocierii acelor litere cu diferențele de susceptibilitate la boli este un alt Sfânt Graal acum. Dacă ai diabet, eu nu am diabet. Ai aceste scrisori. Am aceste scrisori. Poate că acele scrisori au ceva de-a face cu asta este ideea de bază. Acum, iată o cifră specială dintr-un articol din The New England Journal of Medicine doar pentru a vă face o idee. Există o anumită genă numită HLA. Și acesta este în mod specific HLA-B. Este o anumită genă HLA. Și puteți avea un anumit polimorfism pe ambii cromozomi. Puteți avea o combinație dintre unul sau altul, sau puteți avea cea mai comună formă a acesteia. Deci există o formă comună a scrisorii. Aceasta este o formă rară, sau am putea avea o combinație a celor două. Și această genă anume, dacă ești infectat cu HIV, acea ortografia determină conversia ta la SIDA. De fapt, poate avea un impact uriaș. Deci, dacă aveți această formă rară a polimorfismului pe ambii cromozomi, homozigot, puteți trece de la HIV la SIDA foarte repede în 10 ani. Dacă nu îl aveți, dacă ambii cromozomi au forma mai comună, puteți continua și mai departe. Și unii oameni nu se îmbolnăvesc niciodată de SIDA la 18 ani. Și dacă ai amestecul, ești undeva la mijloc aici. Deci, asocierile SNP-urilor cu boli sunt extrem de frecvente de găsit acum. De fapt, o dată la două săptămâni în The New England Journal of Medicine, acesta este ceea ce citiți. Va fi o asociere cu această ortografie și acea boală. PUBLIC: Care este cea mai frecventă formă în acest caz? ATUL J. BUTTE: Cel mai frecvent va fi fără HLA, în cel negru. Da. Așa că lasă-mă să te întreb. Cât credeți că costă măsurarea unui SNP? Deci, dacă am un punct arbitrar în toți genomii noștri pe care vreau să îl măsurez, indiferent dacă există A, T, C sau G în orice genom arbitrar, cât crezi că costă? Nu cât costă laboratorul, cât crezi că costă măsurarea unei perechi de baze? PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Cât costă? PUBLIC: Eu deja [INAUDIBIL]. ATUL J. BUTTE: Ghici? PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Deja ghiciți? Da. Așa că venim cu răspunsul de la 0,05 USD la 0,10 USD. Probabil că va ajunge la 0,01 USD în următorii câțiva ani, destul de ieftin. PUBLIC: Ți-a furat tunetul, îmi pare rău. ATUL J. BUTTE: Mi-a furat tunetul, bine. Oh da. Ultimul lucru pe SNP, nu ai luat asta, nu-i așa? PUBLIC: Și eu. ATUL J. BUTTE: La naiba, o să încetez să-ți mai dau diapozitivele mele. Cât timp avem? BINE. Să vorbim despre expresia genelor. Să vorbim despre microarrays, al patrulea diapozitiv și apoi vom vorbi despre proteine. Așa că am recuperat ADN-ul. Acum, ne străduim să ieșim din nucleu. Acum, să vorbim despre ARN-ul mesager. Așadar, așa cum am spus, dacă celula decide să producă o anumită proteină, va începe să facă modelele pentru acea proteină, ARN-ul mesager. Se pare că este foarte ușor să le măsurați acum. Cel mai comun mod de a le măsura este utilizarea unui microarray. Tot ce este un microarray este de 2 centimetri pe 2 centimetri, aproximativ de dimensiunea miniaturii tale, este o grilă de ADN creată de om în care fiecare punct din grilă caută un anumit ARN. Și deci densitatea este de aproximativ 500 pe 500. Deci este de ordinul unui sfert de milion de puncte diferite pe aceste matrice. Și este suficient să spunem că astăzi puteți măsura întregul genom al transcrierilor cu o singură matrice. Și modul în care funcționează este să obțineți țesutul care vă interesează. Nu puteți face asta doar din sânge decât dacă sunteți interesat de sânge. Dacă sunteți interesat de creier, trebuie să obțineți țesutul creierului pentru a afla ce gene sunt activate acolo. L-ar putea expune unei anumite influențe. Ia ARN-ul, așa că izolează-l. Amintiți-vă, majoritatea sunt lipicioase cu micuțul A. Trebuie doar să luăm T-urile și să le scoatem. Faceți-le fluorescente făcând copii ale acestora. Ține minte, ți-am arătat acea tehnică. Poți să faci o copie a ceva folosind PCR și să-i pui pur și simplu cele fluorescente acolo, și va deveni fluorescent. Lăsați-l să stea pe această grilă creată de om peste noapte. Vino dimineata. Spală-l. Aprinde-l cu laserul. Laserul aprinde fluorescența și, practic, faci o fotografie. Și obțineți o imagine TIFF. Dacă scanezi imagini acasă, știi ce este o imagine TIFF. Dar acestea sunt uriașe. Acestea sunt de ordinul a 10 megaocteți, aceste fișiere. Și apoi biologia face o pauză. Intră informatica și începe să cuantifice fiecare dintre acestea. Este cantitativ până la 4 până la 5 ordine de mărime și nu este perfect. E mult zgomot. Majoritatea oamenilor le place această tehnică. Din nou, acestea sunt și mărfuri astăzi. Puteți obține unul dintre acestea pentru întregul genom pentru aproximativ 300 USD, 350 USD astăzi pe [? Longwood. ?] Cantitativ, există cel puțin două moduri diferite de a face asta. Există o tehnică de măsurare absolută și o tehnică relativă. Deci ce înseamnă asta? Cât de mult din această genă este prezentă este o tehnică. Cât de mult este prezenta această genă în raport cu acest alt țesut este o altă tehnică. Iar cel relativ folosește două culori fluorescente. Cel absolut folosește o culoare fluorescentă. Depinde de natura petelor, dar nu vom intra în aceste detalii decât dacă doriți cu adevărat. Punctul important este că genele sunt alese în mod arbitrar. Statisticienii urăsc acest aspect. Acestea nu sunt extrase dintr-o distribuție normală principală aici. Cipurile de anul acesta sunt diferite de cele de anul trecut, deoarece știm mai multe despre gene. jetoanele de anul viitor vor fi diferite de jetoanele de anul acesta . Deci, în fiecare an, aceste lucruri se schimbă. Nu va exista vreodată un genom fix aici. Și ai nevoie de țesut funcțional. Există unele boli care sunt ușor de studiat cu microarray, cum ar fi cancerul. Dacă aveți o tumoare solidă, pacientul merge la sala de operație. Tumoarea este scoasă. Ai o bucată de șervețel. Puteți extrage ARN-ul. Puteți găsi o mulțime de gene în acest fel. Și de aceea majoritatea lucrărilor cu microarray implică cancer. O boală puțin mai greu de studiat ar putea fi ceva de genul diabetului. Diabetul afectează simultan ficatul, mușchii, grăsimea, pancreasul, poate creierul. S- ar putea să doriți să obțineți toate acele țesuturi. Și permiteți-mi să vă spun, în mod normal nu facem biopsii ale acestor lucruri atunci când diagnosticăm diabetul. Ei bine, am putea folosi modele animale, etc. Boala ceva mai greu de studiat ar fi ceva de genul schizofreniei. Cunosc țesutul funcțional, dar exact ce parte a creierului o voi obține și o voi pune pe această matrice? Nu pot lua un întreg creier uman pentru a face asta. Este aceasta parte sau aceasta parte? Deci chiar știu țesutul, dar nu știu unde voi pune matricea, ce voi pune pe matrice. Și apoi o boală mai greu de studiat ar fi ceva de genul hipertensiunii. Care este țesutul funcțional în hipertensiunea arterială? Este inima? Este vasul de sânge? Este mușchiul neted al vasului de sânge? Ce anume voi pune pe matrice pentru a afla ce gene sunt în sus și în jos? Deci, acesta nu este panaceul pentru toate bolile. Dacă vrei să știi ce gene sunt implicate funcțional, trebuie să te poți gândi la țesutul funcțional de aici. Da. PUBLIC: Cât timp după moarte poți face asta [INAUDIBIL]? ATUL J. BUTTE: Modul simplu de a răspunde la aceasta este că oamenii au reușit să obțină ARN din țesuturi încorporate în parafină. Și cred că au succes, dar majoritatea oamenilor îngheață aceste lucruri. Dacă sunteți în sala de operație cu tumora fiind extirpată, majoritatea oamenilor doar o pun în [? monosodic?] chiar atunci și acolo. PUBLIC: Răspunsul puțin mai lung este că ARN-ul se degradează, spre deosebire de ADN-ul, care poate rămâne. Și de aceea pot face cascadorii asemănătoare Jurassic Park. ATUL J. BUTTE: Dar există un motiv pentru care ARN-ul se degradează, pentru că noi îl degradăm. Mulți viruși sunt doar fire de ARN. Deci ține de interesul nostru să-l degradăm. Deci avem ARN, deci emanăm ARN-aze. E mult mai greu să lucrezi... Adică, elevii de liceu lucrează cu ADN. Dacă ai făcut asta vreodată în liceul tău, unde se duc să ia sânge de la un abator... și practic iau sânge. Și te poți uita la firele de ADN. Nu poți face asta cu ARN pentru că toți avem ARN-aze. O vom degrada imediat. Deci trebuie să purtați mănuși. Trebuie să folosiți tehnici speciale, etc. PUBLIC: Dar uneori studiile [INAUDIBILE] ai ore după moarte. Și cu siguranță, un țesut muscular la patru ore după moarte are un alt factor [INAUDIBIL] [INAUDIBIL], de exemplu, [INAUDIBIL] în multe alte [INAUDIBILE].. Și deci, dacă vrei cu adevărat să o faci în mod rezonabil, atunci practic ca aproape de a obține momentul morții este locul unde vrei să fii. ATUL J. BUTTE: Așa arată de fapt aceste matrice . Acesta este întregul genom uman de la o companie numită Affymetrix care produce aceste lucruri. Și fac de fapt un format de 96 de godeuri din asta. Deci, aici sunt 96 de micromatrice într-o singură placă. Așa că vă puteți imagina câte date obțineți din asta cu câte 10 megaocteți pentru fiecare dintre aceste imagini, o cantitate imensă de date fiind colectată în acest fel. Și nu vom vorbi despre diferențe aici. Și nu vom vorbi despre asta. Deci, puteți folosi aceste micromatrice pentru a spune care gene sunt active. Deci, de exemplu, dacă am o grămadă de pacienți și jumătate dintre ei au avut un tip de leucemie și jumătate au avut un alt tip de leucemie, leucemia înseamnă că o grămadă întreagă de globule albe urcă în sânge. Deci ai acces ușor la acel țesut. Și puteți găsi gene care sunt în sus și în jos și în cealaltă sau în jos într-una și sus în cealaltă, etc., etc. În cele din urmă, puteți obține liste de gene foarte ușor. Acum, toți facem asta de obicei. Și această unitate de bază este practic în fiecare spital. Dacă sunteți clinician la Spitalul Brigham și Femei, vă puteți duce proba la centrul central și vă vor returna fișierul text -- această genă, această cantitate, această genă, această cantitate. Este doar o chestiune de a pune întrebările potrivite acum. Dar lista de gene nu este suficientă. Uneori vrei să te întorci și să confirmi că o genă este de fapt acolo unde ar trebui să fie sau ceea ce credeai că se întâmplă de fapt. Și există două moduri de a face acest lucru, hibridizarea in situ și PCR în timp real. Deci acestea sunt de obicei inserate după ce ați făcut o analiză cu microarray. Hibridizarea in situ este foarte ușoară. Iau același ARN pe care îl caut, fac exact complementul invers al acestuia și îl fac din nou fluorescent. Și voi face suficient din ea încât să pot colora apoi o probă, o probă de țesut, cu asta și apoi să o aprind pentru a face o imagine. Deci, oriunde ar fi acea transcriere, aceasta se va menține după ce o voi spăla. Și se va aprinde. Și pot face poze minunate ca asta. Așa că pot folosi culori diferite pentru a lumina un ARN față de altul. Și asta m-ar putea ajuta să spun că este în țesutul potrivit pe care am crezut că este. PCR în timp real, este chiar... de fapt, este puțin mai greu de conceptualizat, dar practic PCR în timp real folosește acea tehnică de reacție în lanț a polimerazei pentru a detecta efectiv o secvență în comparație cu o secvență de control. Deci îmi oferă o măsură mai cantitativă. Acest lucru îmi oferă o imagine frumoasă pe care o pot pune pe coperta Nature, dar RT PCR îmi oferă de fapt un număr care poate fi apoi folosit pentru a valida descoperirile microarrayului. Era de trei ori mai mare. Era de patru ori mai mare. Practic, se utilizează o tehnică PCR pentru a vedea cât de repede obțin o cantitate detectabilă folosind aspectele repetitive ale creșterii exponențiale ale PCR. Așa că acum, să intrăm în proteine pentru că ne apropiem de sfârșitul orei aici. Deci, din nou, Sfântul Graal este să ajungă la proteine. Cu toții folosim în esență microarray ca proxy pentru proteine, dar nu avem o matrice. Același tip de matrice pe care îl avem pentru microarray, pur și simplu nu îl avem pentru proteine. De ce? Pentru că proteinele sunt mult mai greu de măsurat. ARN-ul, practic, este As, Ts, Cs, Gs. Și este în esență o șuviță. Și uneori se cade și are răsuciri, dar este destul de ușor de măsurat folosind aceste micromatrice. Proteinele pot fi încărcate pozitiv, încărcate negativ. Ei pot iubi apa. Ei pot ura apa. Pot fi mari. Pot fi mici. Dacă te uiți în acest fel, arată ca un singur lucru. Dacă te uiți în acest fel, pare altceva. Deci, nu există o modalitate ușoară și consecventă de a măsura proteinele, așa cum este pentru ARN. Doar pentru a vă face o idee, iată o tehnică folosită în mod obișnuit numită 2D Polyacrylamide Gel Electrophoresis sau 2D-PAGE. Luați o probă, o bijuterie de proteine. Toate proteinele sunt radioactive și le voi răspândi astfel în funcție de dimensiune. Amintiți-vă, dacă pun o încărcare, lucrurile mai mici se mișcă mai repede în jos. Deci, iată dimensiunea. Și iată pH-ul. Iată pH-ul în care le place să stea , două lucruri diferite, două aspecte diferite ale proteinelor. Și într-o singură bijuterie, am toate aceste pete. Și dacă fac asta din nou, vor fi ușor diferite. Dacă o fac a treia oară, va fi puțin diferit. Aceasta este o fotografie. Acesta este cel mai ireductibil lucru pe care ți-l poți imagina. Gelul este fixat corect. S- ar putea să iasă într-un mod diferit. Așa că ne-am dori să ne uităm la asta și să spunem, oh, are această dimensiune și acest pH. Trebuie să fie această proteină... nu pot face asta deloc. Deci, ceea ce vom face este să tăiem una dintre aceste pete și să folosim următoarea tehnică pentru a ne da seama ce proteine ​​ar putea fi acolo. Dar, literalmente, oamenii se uită la aceste imagini și spun, ei bine, iată o poză de la cancer. Aici nu e cancer. Și o, văd acest loc aici și nu îl văd aici. Poate este o proteină de interes. Și există o întreagă informatică care încearcă să descopere și să automatizeze și să proceseze imaginile astea, dar sunt groaznice. Acest lucru nu este reproductibil. Uite cum sunt aceste pete cu dungi, nu? Adică, este doar o mizerie. Fiecare loc are zeci, sute de proteine ​​acolo. Iată o hârtie pe care am ales-o. Acești băieți s-au uitat la toate aceste pete și le-au secvențiat pe toate doar pentru a identifica toate aceste proteine ​​diferite. Deci le-au numerotat pe fiecare. Deci, în '99, acesta este... [ INAUDIBIL] de fapt în această clădire. Râd de asta, dar, vreau să spun, este o cantitate enormă de muncă să faci asta. Deci, din acel punct, am putea dori să ne dăm seama ce proteine ​​sunt acolo. Și aceasta este o tehnică pe care o folosesc majoritatea oamenilor. Este această tehnică numită spectrometrie de masă. Și așa cum funcționează asta este că obții acest mic loc. Totuși, există o grămadă de peptide acolo. Chiar dacă le-am separat foarte mult în aceste două axe, există o grămadă de proteine ​​aici. Și dacă chiar îl împușci în acest detector, deci practic, ceea ce face spectrometria de masă este că ia un loc și îl lovește cu un laser. Și lucrurile vin zburând de acolo. Și modul în care zboară de acolo depinde foarte mult de mărimea proteinei și de încărcătura proteinei. Deci, în cele din urmă, prin toate acestea, practic aveți o axă aici, masa împărțită la sarcină. Și am vârfuri, practic, care ies din detector. Oh, sunt o grămadă de chestii la asta. Acum, nu e nimic. Există o grămadă întreagă. Nu există nimic de genul ăsta, masă versus sarcină. Deci, modul în care funcționează este ceea ce puteți face este că aceste proteine ​​aici, le puteți digera. Amintiți-vă că acestea sunt proteine ​​lungi. Aceeași enzimă pe care o am în pancreas și care încă funcționează la prânz, o pot folosi în avantajul meu. Aș putea să iau un loc și să diger aceste peptide în... pentru a avea proteine ​​secvenţiale mai scurte. Deci, iată o proteină care are 40 de aminoacizi. Iată unul cu 39. Aici este 138. Aici este 137. Aici este 136. Și, practic, fac asta în așa fel încât toate aceste peptide să se descompună într-o serie de peptide mai mici. De ce fac toate astea? De ce fac toate astea? Pentru că acesta este trucul. Dacă vreau o proteină care are 30 de aminoacizi lungime și una de aceeași proteină, dar are doar 29 de aminoacizi, diferența de dimensiune este ultimul aminoacid. Apoi, pentru a trece de la 29 la 28, diferența de dimensiune este acel aminoacid. Deci, dacă practic am tăiat cu succes acest aminoacid pe rând și am o gamă întreagă de acestea, atunci am diferența de dimensiuni pentru a mă ajuta să spun care a fost ultimul aminoacid. Și așa o folosim. Ne uităm doar la diferența de vârfuri, diferența dintre vârfuri este ceea ce măsurăm aici. PUBLIC: [INAUDIBIL]? ATUL J. BUTTE: Nu, deloc. Este o mizerie, nu? PUBLIC: [INAUDIBIL] ATUL J. BUTTE: Este un raport. Deci există o grămadă de vârfuri aici, dar aceeași peptidă ar putea fi și în altă parte, dacă s-ar întâmpla să primească o taxă suplimentară. Absolut. Nu este perfect deloc. Nu este deloc perfect, o zonă cu totul nouă aici, care moare după algoritmi noi. Faceți cea mai bună lovitură. Te uiți la vârfuri aici. Există modalități naive de a face asta, dar nu sunt perfecte deloc. Și, desigur, există unele proteine cărora le place să aibă cantități variabile de sarcină mai mult decât altele. Deci unele lucruri sunt mai ușor de detectat decât altele. PUBLIC: Dar vreau să spun, tehnica în sine, există metode cunoscute despre felul în care aminoacizii [INAUDIBIL] le iau [INAUDIBIL].. ATUL J. BUTTE: Știm dimensiunea fiecărui aminoacid, fiecare dintre cei 20, 21 de aminoacizi. Deci putem spune dacă există o diferență de vârf aici. Dar amintiți-vă, există mai multe proteine. PUBLIC: [INAUDIBIL] nu este infailibil, dar există o caracteristică [INAUDIBIL].. ATUL J. BUTTE: Absolut, de aceea îl putem folosi deloc. PUBLIC: Și există biblioteci de asta. Sunt multe... ATUL J. BUTTE: Exact. De fapt, putem prezice. Putem privi fiecare proteină din baza de date și putem prezice cum ar arăta atunci când este aplicată cu tripsină pentru a o tăia. Cum ar arăta vârfurile? Și chiar poți face predicții. Și, practic, iei modelul tău și îl compari cu modelul computerului. Acest lucru ar putea fi prezis. Acesta este realul. Și computerul, algoritmul de aici spune practic, aceasta este proteina. Acum, mai este un alt punct important aici pe care vreau să-l aduc în discuție. Acest lucru nu este cantitativ. Acest lucru vă ajută să identificați o proteină dintr-o probă, dar nu este cantitativ. Nu vă spune cât de mult există. Există tot felul de tehnici mai noi, mai sofisticate, pentru a compara acest lucru cu un alt eșantion pentru a încerca să obțineți un fel de măsurare cantitativă. Dar modul în care este folosit în mod obișnuit, este doar identificator. Nu este cantitativ, [INAUDIBIL].. PUBLIC: Doar un punct, în The Science Times, în The New York Times săptămâna aceasta, a fost un articol pe care l-am văzut despre un test, un diagnostic pentru cancerul de col uterin [INAUDIBIL]. ATUL J. BUTTE: Absolut. PUBLIC: Ei nu știu cum. Este doar o tumoare. ATUL J. BUTTE: Cred că am acea poză. PUBLIC: OK. ATUL J. BUTTE: Da. Aici, iată-l pe acela. Deci iată cancerul ovarian... același lucru, nu? Deci, acești băieți folosesc un anumit cip pentru a face asta, dar cip este cea mai mică bucată din el. Practic, este încă o specificație de masă care este la sfârșit. Aici este neafectat, neafectat, cancer unu, cancer doi. Iată toate trupele diferite. Și ei spun, la naiba cu identificarea lor. Iată modelul. Oh wow. Văd o trupă aici, o trupă aici, dar nici o trupă aici. Acesta trebuie să fie diagnostic. Îți voi răspunde cu ușurință. Adică, suntem în pericol să supraajustăm datele aici. Ai sute de mii de vârfuri aici și doar patru mostre. Cât de greu este să le găsești care să răspundă la întrebarea ta? Tind să cred aceste lucruri atunci când au ceva de-a face cu biologia. Dacă mergem înainte și identificăm și există un mecanism cauzal, este grozav. Dar alții vor fi foarte mulțumiți de asta, mai ales că astăzi nu avem alt test pentru cancerul ovarian. E bine... sau cancer de col uterin. Pentru cancerul de col uterin, facem test Papanicolau. Pentru cancerul ovarian, nu avem nimic. Dacă există ceva în sânge, este mai bine decât nimic, ceea ce ar răspunde. Deci, iată, practic, diferențele de vârf aici. Așa că ei spun, iată acest vârf. Iată acest vârf. Credem că este o arginină sau... în esență așa funcționează. Folosești diferențele de vârfuri. Aceste lucruri se numesc liste de vârf. Cantitativ, nu vom merge acolo, dar, practic, puteți lua o probă și o altă probă și puteți crește o probă în apă grea. În loc de H2O, vom folosi H3O. Și acel H în plus, nu este extra-- ei bine, de fapt-- PUBLIC: [INAUDIBIL] ATUL J. BUTTE: Este... PUBLIC: Deuterium. ATUL J. BUTTE: Este deuteriu, corect. Deci nu este vorba doar de deuteriu, dar puteți folosi și alți izotopi diferiți. Dar, practic, aveți același atom. De exemplu, carbonul poate avea 12 protoni sau poți avea 12 plus un neutron. Puteți avea tot felul de alte lucruri în nucleul atomului care ar putea schimba modul în care arată pe specificațiile de masă, deoarece modificați masa doar puțin. Și apoi puteți spune de la ce probă a venit și apoi puteți încerca să cuantificați în acest fel. Dar din nou, taxa s-ar putea schimba. Deci o proteină nu este într-un singur loc. Este într-o grămadă de sloturi. Trebuie să le rezumați pe toate și se suprapun. PUBLIC: [INAUDIBIL] tripsina [INAUDIBIL] peptida unu [INAUDIBIL] atunci... ATUL J. BUTTE: OK, permiteți-mi să fiu clar. Tripsina taie în fragmente ușor de gestionat. Și există un alt fragmentator în fața mașinii care chiar îl taie în acești aminoacizi. Daţi-i drumul. PUBLIC: Aveți [INAUDIBIL] moduri diferite [INAUDIBIL].. ATUL J. BUTTE: Da. PUBLIC: [INAUDIBIL] și poate aveți un număr [INAUDIBIL] de [? taxe-- ?] ATUL J. BUTTE: Absolut. Asta e corect. PUBLIC: [INAUDIBIL] destul de mult [INAUDIBIL] despre ce anume [INAUDIBIL]. ATUL J. BUTTE: Ei bine, singura parte grea este că nu știi unde este proteina. Vedeți o grămadă de pete acolo. Și vezi că este aici, dar ar putea fi de fiecare parte a spectrului la care te uiți. Și dacă lăsați mașina să funcționeze suficient de mult, obțineți o cantitate uriașă de date de pe acea mașină, o cantitate incontrolabilă de vârfuri. Și putem privi și izola un vârf. Iată, lasă-mă... Cred că de la acest vârf, mergem la acest vârf. Din acel vârf, mergem la acest vârf. Am mărit până acum pentru a vedea diferențele, dar ar putea fi în altă parte, în funcție de încărcare. Este realizabil. Oamenii obțin rezultate grozave din asta, dar în niciun caz informatica nu este încă realizată în acest domeniu. Și pe măsură ce mai mulți oameni folosesc această tehnică, țipă după algoritmi noi. PUBLIC: O afirmație rapidă - este evident pentru toată lumea că concentrația de proteine nu este aceeași cu concentrația de ARN? Toată lumea ar trebui să știe asta. De fapt... ATUL J. BUTTE: Corect. După cum spuneam, îl folosim ca proxy. Dar să fim clari. Dacă celula are o grămadă din această proteină acolo și este mulțumită de acea cantitate și nu merge nicăieri, nu trebuie să facă mai mult. Acesta este cel mai simplu exemplu de ceva în care ar putea fi zero ARN, dar o mulțime de proteine. Dacă acea proteină se degradează foarte repede, atunci celula ar putea avea nevoie să producă mai mult. Dar există o deconectare masivă aici. Unele lucruri se vor corela, multe nu. PUBLIC: [INAUDIBIL]. ATUL J. BUTTE: Toate aceste lucruri despre proteine ​​pe care nu le știm... depind de proteină. PUBLIC: Am doar o întrebare. Doar că nu sunt sigur. Când faci molecule mici [INAUDIBIL] compară [ INAUDIBIL] elimini taxele, există vreo modalitate echivalentă prin care am putea pregăti... ATUL J. BUTTE: Pentru a elimina taxele? PUBLIC: Da. ATUL J. BUTTE: Ceri un detaliu pe care nu-l cunosc. PUBLIC: Nu, pentru că acesta este motivul pentru care [INAUDIBIL] moleculă mică [INAUDIBIL] proxy [INAUDIBIL].. ATUL J. BUTTE: Absolut. Dar treaba este că se încarcă, nu? PUBLIC: Da, desigur. Este o taxă, în cele din urmă. Dar motivul pentru care [INAUDIBIL] îl folosește ca proxy [INAUDIBIL]. ATUL J. BUTTE: Absolut. PUBLIC: [INAUDIBIL] nu este [INAUDIBIL].. ATUL J. BUTTE: Da. Cea mai mare problemă, totuși, este că acestea sunt mai lungi decât moleculele mici. Adică, acestea sunt mase mult mai mari. Aceasta este problema. Și proteinele în sine, dacă doar ai tăiat lucrul care ține sarcina sau care iubește... dacă doar ai tăiat partea polară a acestuia, va avea proprietăți diferite. Următorul vârf ar putea fi extrem de diferit. Depinde total de asta. PUBLIC: Dar pentru prelegerea mea cu microarray este, de ce, dacă ei, de fapt, așa cum explică [INAUDIBIL] , funcția proteinelor, sinteza proteinelor nu este într-o relație de 1 la 1 cu sinteza ARN [INAUDIBIL] atât de reușită în definirea bolii clasele și [INAUDIBILUL] doar bazate pe expresia ARN? De ce este... de ce ar trebui să [INAUDIBIL]? Sau ar putea? ATUL J. BUTTE: Cred că acesta este al meu... acesta sau următorul este ultimul slide aici. Acum, în ciuda faptului că este greu de măsurat aceste lucruri, cu siguranță există companii care încearcă să facă chipsuri de proteine ​​aici. O modalitate de a detecta proteinele este de a avea un anticorp împotriva unei proteine. Așa au făcut oamenii de zeci de ani lucruri precum Western blot. Și le puteți radiomarca și altele. Deci puteți face o placă aici în care fiecare godeu are un anticorp împotriva unei anumite proteine. Sau ai putea face... de exemplu, oamenii fac o matrice de citokine. Deci, această matrice practic... fiecare punct caută o citokină diferită. Puteți cumpăra aceste lucruri, dar nu puteți face acest lucru în mod cuprinzător, cum se poate cu microarray-uri. Acesta este ideea. Dacă te uiți peste toate proteinele posibile plus produse alternative de îmbinare în proteine, pur și simplu nu poți face asta astăzi. Puteți face și teste funcționale. Adică, este o matrice de anticorpi. Asta este. Deci am vorbit despre secvențiere, polimorfisme. Am sărit peste SAGE. Majoritatea oamenilor folosesc acum microarray. Nici măcar napolitane nu am acoperit. Să acoperim napolitane într-o a doua -- 2D-PAGE, matrice de proteine ​​cu specificații de masă. Lasă-mă să acopăr măcar chestia cu napolitana pentru că merită să știu asta. Toate sunt diapozitive. Așa că napolitanele îmi supără mintea. Și de aceea îmi place să închei cu asta. Așa că acele companii care produc aceste microarray, nu le fac doar una câte una. Ele le fac la fel ca cipurile de calculator. Sunt făcute câte 40 la un moment dat într-o napolitana și apoi sunt doar tăiate. Deci, există o companie numită Perlegen, care este deținută de acea altă companie Affymetrix, care spunea, de ce facem 40 din aceeași matrice? Să facem doar o napolitană o matrice mare. Și cu asta, ai atât de multe locuri. Ai 60 de milioane de pete într-o singură napolitană. Are aproximativ 5 inci. Îl desenez așa, dar e chiar atât de mic. Marimea o puteti vedea aici. Aceasta este o napolitană. Un pătrat de 5 inci are 60 de milioane de sonde. Așa că, chiar și acum doi ani , au arătat cum puteți folosi aceste napolitane pentru a resecvența un întreg cromozom. Și asta a fost o singură hârtie. Te gândești la câți ani a durat secvența primului cromozom, Proiectul Genomului Uman . Ei pot face asta acum într- un weekend, deoarece practic fiecare loc este o fereastră în mișcare de 25 de perechi de baze. Deci, ce vreau să spun cu asta? Au luat cel mai mic cromozom. Cred că a fost 22, 23. Au luat cel mai mic cromozom și au luat primele 25 de nucleotide. Și l-au pus într-un singur loc. Și apoi cel din mijloc au spus, ei bine, ar putea fi un A, T, C sau G. Deci sunt patru puncte. Acum, să trecem la următorul, la următorul. Deci au o fereastră în mișcare de 25 de nucleotide care merg de la un capăt la celălalt capăt al cromozomului printr-o serie de plachete. Și odată ce au făcut asta, pot să ia sângele oricui și, practic, să obțină întregul model acum. Și nu trebuie să spună, ei bine, cred că există un SNP aici sau un SNP acolo. Ei doar cunosc toate SNP-urile acum, pentru că este doar o chestiune de câți oameni puneți pe matrice. Și este doar sânge. Marea problemă - fiecare scanare, imaginea TIFF, durează 10 terabytes. Tocmai învățăm despre gigaocteți. Terabyte este 1.000 dintre aceștia, iar acesta este 10 dintre ei pentru doar una dintre aceste napolitane. Deci, este binecunoscut faptul că datele din știința vieții cresc mult mai repede decât această celebră lege a lui Moore. Legea lui Moore este de la Gordon Moore de la Intel care spunea că puterea microprocesorului se dublează la fiecare 18 luni. Datele din știința vieții cresc mult mai repede decât atât. Acesta este doar un exemplu în acest sens. Ei au declarat public că pot secvența toate SNP-urile la un om în 10 zile, nu doar pe cele despre care știm. Ei doar le cunosc pe toate. Și aceasta este doar una dintre multele companii. Sunt mulți în 95 Beltway aici care fac același lucru ca și concurența. Deci, îți amintești cum glumeam că îți poți încadra întreg genomul pe un CD-ROM? Este absolut de imaginat că putem avea acest lucru în următorii unul sau doi ani, dacă ne dorim. Tehnologia este acolo pentru a face asta. Cu siguranță au spațiu pe hard disk acolo la Perlegen pentru a face asta. Bine, cred că asta este. Și ar trebui să terminăm pentru că am terminat puțin.