Următorul conținut este furnizat de MIT OpenCourseWare sub o licență Creative Commons. Informații suplimentare despre licența noastră și despre MIT OpenCourseWare în general sunt disponibile la ocw.mit.edu. GEORGE CHURCH: Există o secțiune? Nu, nu există secțiuni pentru câteva zile. Secțiunile, atât secțiunile săptămânale, cât și secțiunile suplimentare, vor fi pe site. Acesta este cel mai bun loc în care să te uiți. Dacă aveți întrebări după ce v-ați uitat pe site-ul web, atunci ar trebui să vă contactați colegul de predare. Dar cu siguranță uitați-vă la site. Va fi actualizat zilnic, iar secțiunile dvs. vor fi alocate probabil până joi sau vineri, OK. OK, bine ai revenit din pauză. După cum am promis, vom discuta despre interiorul computerelor care ne vor ajuta cu biologia computațională. Avem aici o diagramă schematică , ilustrând parțial - vom avea diagrame schematice similare pentru sisteme biologice sau sisteme biochimice. Acesta este unul pentru tranzistori. Avem aceste elemente de tranzistor neliniar aici cu o tensiune de intrare și o tensiune de ieșire într-o tensiune controlată VDD și o masă aici, acest mic triunghi în stânga jos . Acești tranzistori sunt în acest circuit aici, care este cu siguranță o descriere de nivel superior. Vă permite să prezentați o descriere mai detaliată a acestei curbe de tensiune în funcție de timp. Deci, timpul este axa orizontală aici, variind până la 200 de nanosecunde, și totul se face într-un program, un simulator numit Spice. a acestui invertor de oxid de metal complementar. Și acest tip de simulator este unul dintre lucrurile despre care vom vorbi în sistemele biologice. Și este foarte util pentru proiectarea acestor circuite și puteți vedea cum tensiunea, VDD, crește în această linie dreaptă albastră de la 0 volți, care este oprit, la 5 volți, care este pornit. Obțineți acest lucru aproape totul sau niciunul, dar cu siguranță răspuns neliniar, unde tensiunea de ieșire pe axa verticală trece de la 5 volți, pornit, la 0 volți, oprit. Practic este opusul. Când este 0, este 5. Când este 5, este zero. Dar între ele, puteți vedea că există această zonă gri. Vrei să stai departe de asta în circuitele digitale. Vrei să rămâi complet saturat sau practic 0 volți. Și apoi aceste invertoare pot fi conectate împreună într-o diagramă de nivel și mai înalt în ceea ce se numește registre, care vă permit să stocați numere binare cu mai multe cifre. Acestea pot fi apoi cuplate împreună. Deci puteți lua două registre și adăugați, cifră cu cifră, conținutul acelor registre. Asta se numește sumator. Adders și o varietate de alte componente electronice de nivel superior pot fi adunate și apoi adresate de un software numit compilator. Ei bine, cum ați introdus acest software acolo în primul rând? Trebuie să comutăm hardware-ul până când ajunge într-o stare în care, într-un fel, faceți manual ca tranzistoarele să fie în setul potrivit de tensiuni de pornire și oprire , 5 și 0 volți. Odată ce obțineți primul compilator, acum puteți lucra la un nivel mult mai înalt. Un compilator este practic ceva-- tot acest cod pe care vi l-am arătat până acum, Perl, Fortran 77, Mathematica și așa mai departe, toate acestea sunt lucruri de genul, tipărirea x deasupra 1. Este ca un compilator. Este un cod pe care îl poți introduce. Este aproape engleză. Unii dintre voi ar putea spune că nu este suficient de aproape de engleză. Dar este mult mai aproape decât a face față acestor mici tensiuni, OK. Și odată ce aveți un compilator, puteți crea altul. Puteți folosi acea pseudo-engleză pentru a scrie un compilator mai complicat, care să se ocupe de un limbaj de nivel și mai înalt și apoi să îl reduceți. Apoi se ocupă de evidența contabilă sau o reduce la a spune computerului ce tensiuni să pună unde și când. Pe măsură ce urcați pe cele încă mai înalte, avem aceste programe de aplicație de nivel înalt, care ar putea avea o grafică intensă sau ceva de genul acesta, OK, astfel încât să obțineți cu adevărat o viziune asupra lumii care este mult mai în rezonanță cu simțurile noastre vizuale și auditive primate. . Acum, această idee de autocompilare și auto-asamblare este foarte interesantă, foarte autoreferențială, așa cum vor fi multe dintre lucrurile din acest curs. Avem componente biologice care au aceste suprafețe complementare foarte interesante despre care am vorbit cu câteva diapozitive în urmă, unde cele două catene de ADN care nu sunt legate covalent-- covalent înseamnă că aveți aceste legături puternice de-a lungul acestei panglici-- și conectate printr-o serie de interacțiuni de stivuire, în care plăcile, genul de baze plane se stivuesc. Și formează legături slabe de la o componentă la alta, în cazul în care regulile pe care le-am menționat înainte - acum simboluri puțin mai realiste aici pentru perechile de baze GC și AT, mai degrabă decât doar alfabetice. Dar acestea sunt încă simboluri. Aceasta nu este cu adevărat densitatea electronică, în care folosiți litere în loc de densitatea electronică a azotului, carbonului, oxigenului, hidrogenului. Dar acești hidrogeni fac din această legătură de hidrogen o legătură slabă, iar suprafețele sunt complementare, astfel încât dacă încercați să asociați un C cu un T, aveți o distanță greșită. Ai ciocniri sterice și așa mai departe. Acest proces prin care o secvență nu va face aceeași secvență imediat - replicarea nu face o secvență identică. De fapt face o suprafață complementară. Și apoi încă un ciclu, și te întorci la original, la fel ca exemplul pe care l-am dat înainte, trinucleotidei mergând la o hexanucleotidă. Și apoi asta ajută turul al doilea. Acest lucru este foarte analog, cu excepția faptului că acum aceste molecule, în loc să fie lungi de șase nucleotide, pot avea o lungime de sute de milioane de nucleotide. Deci această introducere în viața minimă, toate aceste vieți au în comun auto-asamblare, cataliză, replicare, mutație și selecție. Monomerii, adică moleculele simple luate din mediul înconjurător, mediul fiind definit de o graniță - aceasta ar putea fi o limită destul de flexibilă. Ar putea fi o limită membranoasă. Ar putea fi doar un fel de agregat. Monomerii mici, simpli , aceștia se combină pentru a face polimeri complicati. Și apoi acest proces de replicare continuă. Când trecem la sisteme mai complicate, acum aceasta este o dogmă centrală. ADN-ul, depozitul stabil pe termen lung, este accesat prin realizarea de ARN efemer, care apoi codifică proteine. Și în unele sisteme, ARN-ul se poate replica. ARN-ul poate fi transcris invers în ADN. Din păcate, virusul SIDA este unul dintre ei care face acest lucru. ADN-ul se poate replica, iar anumite cazuri patologice, sau de fapt anumite cazuri, ar trebui să spun, de proteine, pot recruta, într-un ciclu autocatalitic, alte proteine în starea lor particulară. Aceștia se numesc prioni și se bazează pe boala vacii nebune și lucruri de genul ăsta. Dar din nou, ai o limită pentru replicare, iar structurile simple apar și sunt generate structuri complicate. Când vorbim despre polimeri, vrem să cuantificăm cantitățile acestora în interacțiunile lor. Ele inițiază, se alungesc, se termină. Se pliază. Ele sunt modificate în diferite moduri. Deci nu este vorba doar de polimeri liniari simpli. Poziția lor în spațiu este importantă și sunt fie degradate, fie diluate în timpul procesului de replicare. Acest lucru devine și mai complicat când vorbim despre genomica funcțională. Aici, măsurăm rata de creștere. Măsurăm concentrația de ARN și proteine. Uneori, localizarea lor, este important să se măsoare și asta. Asta se numește expresie genică. Și interacțiunile sunt importante pentru a face parte din acest proces de măsurare. Aceste măsuri și modele despre care vorbesc sunt modul în care ajungem să definim suficient despre sistemele vii pe care să le putem modela. Deci iată un alt model. Acesta este un test Rorschach, așa cum ați putea lua. Ai intrat în cabinetul unui psiholog, poate cu mult timp în urmă, și ei ar spune, uită-te la această pată de cerneală. De ce iti aminteste? Știi, lucruri rele pe care le- a făcut tatăl tău și așa mai departe. Iată, testul Rorschach, de ce vă amintește această curbă . Dă-mi câteva indicii. STUDENT: Curbă exponenţială. GEORGE CHURCH: Curbă exponențială, grozav. Și cum obții... și asta este ca criza bursierelor dinaintea unui prăbușire al dotcom. Cum obții asta? Cum îl găsiți în biologie pentru biologi sau cum îl găsiți matematic pentru restul? Da. STUDENT: Îmi cam amintește de creșterea populației umane. GEORGE CHURCH: Creșterea populației umane. Da, acesta este un bun exemplu biologic. Poate, și Malthus și alții au spus, acest lucru nu poate continua pentru totdeauna. Dar acesta nu este un fapt. Este o speculație destul de solidă. Deci, cum obții asta? Ei bine, pentru aceia dintre voi care preferă să vadă sau se așteaptă să vadă acțiunile în scădere și în creștere, avem o curbă de decădere exponențială în magenta. Este un fel de reflectare a curbei de creștere exponențială. Acestea sunt doar e la kt, sau e la minus-- sau unde k este pozitiv. Și aceasta este cea mai simplă ecuație diferențiabilă din lume. y, axa y, este o funcție de timp, axa orizontală. Iar micile modificări ale lui y cu mici modificări ale t, timpului, t, dydt-- acesta este un fel de panta lui y pe măsură ce crește, curba exponențială albastră-- este legată de cât de mult y. Cu cât sunt mai mulți oameni, cu atât rasa umană se reproduce mai repede, OK. Și pur și simplu continuă să devină din ce în ce mai mult. Și de aceea are această curbă exponențială. Aceasta este mult mai abruptă decât pătratică. Și originile sale se întorc aici. Este similar cu dezintegrarea exponențială, așa cum ați putea obține cu substanțele radioactive. Urmează un proces invers. Și dacă integrezi acest lucru, obții o integrală foarte simplă. Despre asta am tot vorbit. Este e la kt. Deci este o funcție exponențială a timpului, y, să zicem populația umană sau stocurile dvs., unde e este acest număr pe care l-am evidențiat mai înainte, aproximativ 2,7. Dacă sunteți interesat de viața de înjumătățire, ceea ce uneori sunt oamenii, cum ar fi degradarea radioactivă sau timpul de înjumătățire al replicării bacteriilor într-o soluție, este o formulă foarte simplă care vă ia de la constanta de viteză k. Aceasta este ca o rată biochimică constantă la un timp de înjumătățire. Aceasta este creșterea și decăderea. Deci ce limitează asta? De ce nu continuă să urce? Ceea ce ne-am uitat este colțul din stânga jos al acestui grafic din diapozitivul 29, unde crește exponențial de la aproape 0, nu chiar. Și, în cele din urmă, se va stabili sau, mai rău, s- ar putea să coboare. Și ceea ce provoacă acest platou este epuizarea resurselor. Și dacă obțineți suficientă acumulare de deșeuri, sau suficientă epuizare a resurselor. Poți să scapi. Dacă doar măriți această mică parte aici, o modalitate de a o analiza, cunoscută de unii dintre voi, este să luați logaritmul lui y și să îl reprezentați în funcție de t. Deci t este axa liniară, iar axa verticală este logaritmică. Acum obțineți o linie dreaptă, cel puțin pentru început aici. Și în cele din urmă se va stabili la fel ca și acesta. Și acesta este un mod de a spune că aveți o exponențială simplă. Dacă aveți e la puterea t, sau 2 la puterea t, sau orice la puterea t, simplu. Acestea sunt toate exponențiale simple și vor da o linie când luați logaritmul. Acum, ce face Mathematica pentru a ne ajuta aici? Tu ai stabilit această ecuație. În loc să spui dydt, ai putea spune, y prim din t. Asta e doar stenografie. Este foarte des folosit în calcul. y prim al lui t prima derivată a lui t, a lui y în raport cu t, este direct proporțional cu y. Adică, panta ta de expansiune a rasei umane este direct proporțională cu y, numărul de oameni, OK. Și apoi vei începe cu timpul egal cu 0. Avem un om. Ei bine, asta probabil nu este suficient. Bine. Poate o bacterie. BINE. Ai condiții inițiale, OK. Și atunci spui doar rezolvă-l. Îi spui computerului, așa că totul în dreapta acestei ecuații este ceva pe care îl poți tasta în Mathematica. Rezolvați o ecuație diferențiabilă a acestui șir pe care l-am introdus aici, care vă spune condițiile inițiale și formula. Și bum, iese afară. Nu ai scris asta. Mathematica a venit cu asta, e la puterea t. E destul de misto. Și chiar dacă este cea mai simplă ecuație diferențiabilă din lume , a rezolvat-o. Încercați să faceți asta în celelalte limbaje de programare preferate , Excel sau Fortran, sau Perl, sau Python sau orice altceva, C. Este foarte puternic. Acum, acest lucru este analitic sau simbolic sau formal. Aceștia sunt diverși termeni pe care i-ați spune pentru acest truc. Și pe măsură ce ecuațiile devin din ce în ce mai complicate, acest lucru devine din ce în ce mai uimitor, aproape inteligent. În cele din urmă, se complică suficient de mult încât nici oamenii, nici Mathematica nu le pot rezolva. Deci, ceea ce faci atunci este să folosești o aproximare numerică în care faci pași mici și o rezolvi prin aproximare numerică. Dar ai configurat-o în același mod. Îi spui că derivata y față de t este proporțională cu y. Sau, în acest caz, proporționalitatea contează ca unul. Aceleași condiții inițiale, o bacterie inițială. Dar acum spune-i la ce interval vrei să faci asta. Nu vrei să fie nevoit să facă acești pași mici peste tot, toți depozitarea negativă a infinitului pentru timp. Vrei doar să spui, mă interesează doar timpul de la 0 la 3 minute sau ore sau orice ani, OK. Și apoi îl evaluezi, și poți reprezenta acest lucru, care se adresează sistemului vizual al primatelor, aceste parcele. Și veți vedea o mulțime de parcele în acest curs. Dar acum aici, y, o funcție a lui t, este această curbă exponențială. Și dacă am trasat logul lui y în funcție de t cu acest rezolvator numeric, ar fi o linie dreaptă. Acum, vă dau câteva unde nu este o linie dreaptă. Acestea sunt toate logaritmice pe axa y și toate sunt liniare pe axa orizontală. Și sunt tot timpul pe axa orizontală, timp liniar. Și sunt mai mult decât simple exponențiale. Urc mai repede. În loc să iasă mai încet, ceea ce credem că populația umană, populația bacteriană și așa mai departe, vor urca liniar pe o diagramă de jurnal și apoi se vor aplatiza, aceste lucruri merg din ce în ce mai repede. Ce sunt aceste lucruri? Ei bine, chiar dacă dotcom-urile tale nu au funcționat, dacă ai fi avut un portofoliu de acțiuni în comerțul din Europa de Vest în anul 1000, ai fi într-adevăr într-o formă foarte bună acum, în anul 2000. Acest lucru nu este doar exponențial, ci și mergând mai abrupt decât exponențial. Și cu toții sperăm că acest lucru va continua pentru totdeauna, că produsul intern brut al oamenilor din Europa de Vest și din lume va continua să crească. Și asta se datorează tehnologiei. Iar tehnologia continuă să se reinventeze. Și sperăm că poate continua să facă asta. Iată un alt exemplu. Acest lucru este mai mult detaliat la tehnologii specifice care au fost pe o supraexponențială sau hiperexponențială -- Nu știu prea bine care este termenul potrivit aici -- de mult timp. Acestea sunt mai mari decât liniare, mai abrupte decât liniare. Acestea sunt apropiate de pătratice. Și deci este un exponent al unui pătratic. Și acestea sunt pentru rata de transmisie în roz, a datelor din codul Morse în anii 1830 la fibre optice aici în prezent. Și apoi albastrul sunt procesarea digitală de la primul recensământ din anii 1890 până la computerele moderne. Și aceasta este în instrucțiuni pe secundă la 1.000 USD. Acum, această unitate, mica parte din aceasta, aceste circuite integrate la care legea lui Moore se referă doar de la capătul minuscul al acesteia din 1965 încolo, se referă la circuite integrate. Și acestea vor rămâne fără benzină destul de curând, ne spune toată lumea. Dar această curbă poate nu, pentru că o depășește. Este anterioară circuitelor integrate și le va posta data. Și cine știe unde duce asta. STUDENT: Întrebare. GEORGE CHURCH: Da. STUDENT: Care este r pătratul? GEORGE CHURCH: Oh, îmi pare rău. Vom ajunge la asta la sfârșitul acestei prelegeri, dar este un coeficient de corelație, adică în ce măsură există o potrivire între o curbă și alta. Cât de bine se potrivește curba calculată cu datele observate colectate? Și astfel acestea sunt în jur de 99, ceea ce este o corelație foarte bună. Și este mai bine decât diagrama liniară, dar desigur, aveți parametri mai ajustabili. BINE. Un alt semn de speranță este că datele vin mai repede. Deci viața noastră este din ce în ce mai bună. Calculatoarele noastre devin mai rapide, iar datele vin de la Proiectul Genome. Și acest mic punct de inflexiune, în care a fost log liniar pentru o vreme și apoi un nou log liniar - deci, în general, este superexponențial. Și acesta este pentru numărul de perechi de baze pe care le putem obține pe dolar, începând cu ARN-urile de transfer la sfârșitul anilor ’60 și terminând cu cine știe câte genomi umani vom avea până în anul 2010. Acum, de unde este exponențial acest lucru. cresterea merge? Unii oameni cred că în curând vom crea computere mai inteligente decât suntem. Ce ar necesita asta? Iată un exemplu frumos de analiză a sistemelor în care biologia se întâlnește cu computerele. Să ne analizăm retina. Toate retinele noastre se procesează chiar acum, sperăm. Și Hans Moravec a simulat o retină pentru imagini video în care a făcut detectarea marginilor și a mișcării și a necesitat aproximativ un miliard de instrucțiuni pe secundă pentru a se potrivi cu cele 10 ori pe secundă cu care actualizați retina. Creierul este de aproximativ 100.000 de ori mai mare decât retina și, dacă aceasta crește liniar, ceea ce este speculativ, atunci aveți nevoie de un computer care are aproximativ 100 de milioane de MIP-uri sau aproximativ 10 până la 14 instrucțiuni pe secundă de putere de calcul și un număr similar de octeți. Acum, în 1998, asta era încă destul de departe. Dar aici, în 2002, cel mai bun supercomputer -- și acest site păstrează o parte din primele 500 de supercomputere. Și crede-mă, computerul tău nu se află pe această listă. Dar oricum, cel de sus se află într-un factor de 10 din această putere de calcul. Acum, probabil, oamenii de știință de pe Pământ care dețin acest lucru nu se vor deranja să încerce să vadă dacă poate face lucruri umane obișnuite, cum ar fi vizionarea telenovelor. Dar suntem în acea zonă. Trebuie să fim conștienți de posibilitate. Iată un alt model. Am încercat să o pun în aceleași unități despre care am vorbit, această creștere exponențială. Din nou, avem constanta de viteză k. Avem y, populația umană sau bacteriană care crește exponențial. Și aici acum, încercăm să modelăm cazul în care da, deoarece aveți o populație mare, înseamnă o creștere mai mare până când se apropie de capacitatea maximă de transport, 100%, 1, maximul pe care îl poate ajunge. Și apoi se va plati. Deci ai un platou lângă 1. Și asta se numește harta logistică. Este baza acestui calcul al complexității despre care am vorbit mai devreme. Și aici, dimensiunea populației este o funcție a constantei ratei și are ambele creșteri atunci când y este mic. Pe măsură ce y crește, crește exponențial. Și apoi, în cele din urmă, pe măsură ce se apropie de maximum 1, se platește. Cu toate acestea, dacă deveniți lacom și vă creșteți rata de creștere peste, să zicem... aici, este foarte, foarte mic, foarte nelacom, doar 1,01. Este ca o dobândă de 1% în contul tău bancar, OK. Dar totuși, ai crește exponențial dacă ai suficient timp. Cu toate acestea, devii lacom și spui: vreau o rentabilitate de 300% a investiției mele. Ei bine, atunci începi să înregistrezi aceste mici cicluri ale pieței bursiere în sus și în jos, OK. Și dacă devii cu adevărat lacom acolo unde ai nevoie de o îmbunătățire de 400% în fiecare ciclu, devii haos. Și apoi puteți, în cele din urmă, să coborâți foarte aproape de 0 și să vă prăbușiți, iar populația poate dispărea deoarece a folosit ca resurse sau a făcut o utilizare neoptimă și poate produse secundare toxice. OK, grafice. Avem grafice aciclice direcționate. Doar ca exemplu, graficele sunt formate din noduri. Vă puteți gândi la acestea aici ca, nodurile sunt oameni sau organisme. Și începeți cu o bacterie aici, în partea stângă a diapozitivului 35. Și aveți o direcție. Nu poți merge înainte decât în ​​timp. Deci, nodul este individul bacteria, iar liniile care le leagă sunt margini în terminologia graficului. Și sunt direcționați. Și nu pot merge în cicluri pentru că nu poți avea o fiică care dă naștere unei mame, OK. Deci toate acestea au sens intuitiv. Dar puteți folosi acest tip de grafice pentru o întreagă varietate de lucruri interesante. Aveți nu doar pedigree-ul despre care am vorbit, ci și filogenie în general, legături străvechi între organisme. Coloana vertebrală a biopolimerului, aveți o coloană vertebrală liniară simplă sau o coloană vertebrală ramificată. Aceasta poate fi reprezentată. Nu se încrucișează covalent înapoi pe sine. Dacă vrei să știi ce se află unul lângă celălalt pe măsură ce acest polimer se pliază, ca transferul pe care ți l-am arătat în primele diapozitive, acele contacte sunt indicate. Acum începi să primești cicluri, pentru că A poate contacta B, B, C, D, înapoi la A din nou. Obțineți cicluri într-o structură tridimensională. Primești cicluri într-o rețea de reglementare. Puteți avea, pentru a menține homeostazia în corpul dumneavoastră, A poate regla B. B poate regla C și înapoi la A din nou. Dar toate acestea sunt regizate. Există modele de sistem pe care noi și alții le vom studia. Au în comun - acesta este slide-ul 37 din partea stângă - modelele de sistem. Și au fost aleși în principal pentru că în era pre-genomică, era foarte greu să obții seturi de date. Anumite sisteme erau doar tehnic mai ușor de obținut seturi mari de date, genetice sau biochimice. Acestea includ E. Coli, care se îndreaptă spre mâncare și departe de toxine. Globulele roșii sunt un sistem metabolic bun, deoarece nu are nicio sinteză de polimeri. O face mai simplă. Ciclul diviziunii celulare este cu adevărat cheie pentru înțelegerea replicării patogenului, cancerului. Ritmul circadian, un număr imens, multe, dacă nu toate organismele, au niște ritmuri circadiene care își mențin biochimia optimă și, sperăm, să ne țină treji, chiar acum, oricum, până când este timpul. BINE. Replicarea ADN-ului plasmidic este un exemplu de precizie cu o singură moleculă. Și vom vorbi despre moleculele individuale de ADN într-un moment. Așa că acesta este locul în care ne propunem acum, de la grafice și pedigree până la moleculele individuale care permit replicării să funcționeze. Această replicare se realizează prin mașini interconectate, acestea sunt oarecum modulare. „Modular” este, de asemenea, un termen de calculator în care încercați să puneți cod care funcționează împreună în ceva care este definit spațial și funcțional. Deci aveți aceste module mici care reproduc ADN-ul, fac ARN din el. Un modul diferit face sinteza proteinelor. Există o oarecare interconexiune între acestea. Acest lucru va fi discutat. acest tip de mașini complicate pe care biologii adora să le simplifice în diagrame vor fi descrise mai detaliat săptămâna viitoare. Dar ideea este această idee de module versus rețele cuplate extensiv. Așa obținem replicarea. Modul în care analizăm replicarea este undeva aici, la mijloc, unde am avut o scară aici care merge de la o rezoluție înaltă, descrieri foarte precise ale proceselor fizice, cam în intervalul de femtosecundă nanometri, în partea dreaptă a diapozitivei 40. , la lucruri care au o scară de timp foarte lungă, un fel de kilometri la scară foarte mare, ani care se întâmplă în dinamica populației, uneori dinamica globală a populației. Ar trebui să înțelegeți că toate aceste modele despre care vom vorbi sunt aproximări. Pe măsură ce coborâm scara , devine din ce în ce mai calculabil să calculăm lucruri din ce în ce mai complicate , dar cu prețul unor aproximări din ce în ce mai mari. Chiar și mecanica moleculară pe care o folosim împreună cu datele de difracție cristalografică este o chimie computațională uimitoare, dar este o mare aproximare a mecanicii cuantice, care, la rândul ei, este o aproximare a electrodinamicii cuantice, care este în sine o aproximare. Și toate aceste lucruri sunt foarte greu de calculat pe orice problemă rezonabilă a sistemului atomic cu mai multe corpuri. Marea aproximare pentru mecanica moleculară este că aveți atomi sferici, deci nu aveți distorsiunea dipolului care apare în legăturile foarte utile , cum ar fi legăturile de hidrogen și aproape toate interacțiunile fără legătură. Este puțin aproximativ aproximat, dar este cel mai bun lucru pe care îl avem și care poate fi calculat chiar acum cu majoritatea computerelor și chiar cu molecule modeste mari. Apoi, acum, pe măsură ce coborâm, ne putem gândi la ea ca la o abstracție la un nivel din ce în ce mai înalt. La fel ca limbajele de programare de nivel înalt, acum programăm sisteme chimice și ne gândim la ele. Acum, în loc să ne ocupăm de atomi unici în mecanica moleculară care au produs structura ARNt pe care v-am arătat-o, acum ne ocupăm de acel ARNt întreg ca o singură moleculă. Dar este totuși o mare profunzime de precizie, pentru că fiecare moleculă are propria viață și o urmărești pe fiecare pe computer. Și asta e simulare stocastică. Următorul nivel superior dincolo de acesta este acum, nu avem de-a face cu molecule individuale. Avem de-a face cu populații de molecule sau avem de-a face cu o concentrație în funcție de timp. Ecuațiile diferențiabile obișnuite despre care am vorbit deja, precum acea curbă de creștere exponențială, este o modalitate de a trata concentrația bacteriilor în funcție de timp. Este potrivit. Există și alte cazuri în care dorim să facem această optimizare. Vrem să studiem cât de aproape de optim este un sistem. O modalitate de a studia aceasta este cu aceste funcții economice, aceste programare liniară, să se uite la fluxuri. Acum, nu mai vorbim despre concentrație și timp, pentru că suntem interesați de ratele prin care substanțele chimice curg printr-un sistem biologic, unde orice concentrație chimică anume este la un nivel de echilibru. Și asta înseamnă că ai lucruri care intră și se ies, dar lucrurile din mijloc rămân la fel. Este o aproximare foarte utilă . Este folosit din nou și din nou. Chiar dacă acestea sunt sisteme dinamice, le puteți găsi. Într-o stare pseudo-staționară, puteți aplica aceste instrumente de calcul foarte puternice. Și apoi puteți face calcule care ar fi foarte greu de făcut în aceste metode mai precise și mai complete. Și le vom analiza mai în detaliu mai târziu, veți găsi conexiuni foarte interesante între lucrurile la scară mai mare despre care vorbim, unde vorbim despre stocastica organismelor întregi în populații mari și stocastica moleculelor individuale. . BINE. Vorbim despre molecule individuale. Acesta este ultimul nostru subiect de astăzi. Și fiecare dintre voi faceți în mod regulat manipulări cu o singură moleculă , iar strămoșii voștri o fac timp de 10.000 de dolari fără licență, fără computer. Și au făcut o treabă destul de bună. Au luat acest mic lucru asemănător buruienilor, teosinte, și l-au transformat în acest porumb care ar face 4 iulie destul de mândru. Și câini, cine știe cum arătau strămoșii lor. Dar chiar acum, ele se întind pe aproximativ trei logaritmi de masă. Și totul a fost făcut cu puterea extraordinară a tehnologiei cu o singură moleculă de ADN, practic cruci. Și ceea ce se întâmplă în fiecare dintre aceste celule din corpul tău, dacă totul merge bine, este să începi cu un cromozom de interes. Și se împarte, apoi celula se împarte. Și acel cromozom-- vom uita de toți ceilalți cromozomi de acolo pentru un moment-- acel cromozom are posibilitatea de a alege când se împarte, poate merge câte unul în fiecare dintre celulele fiice. Sau ambii cromozomi pot sta împreună, din moment ce sunt toți încâlciți sau așa ceva, și apoi una dintre celulele fiice nu primește nicio copie a acelui cromozom. Asta evident nu este un lucru bun. Chiar dacă două copii ale cromozomului sunt în regulă, dacă poți tolera acea doză suplimentară, cu siguranță nu poți tolera zero cromozomi. Ei bine, care sunt șansele să se întâmple asta? Ei bine, aceasta este o probabilitate cu adevărat elementară. O să te ușuresc în asta. Este că este vorba de 50/50 de șanse. Acestea sunt toate. Aceasta este lista exhaustivă a posibilităților. Și aproximativ 50% dintre ei au o doză greșită. Ei bine, ce se întâmplă dacă avem o situație mai realistă, celule umane cu 46 de cromozomi? Care sunt șansele ca toate să fie corecte, să obținem exact câte una din fiecare? Avem 23 de cromozomi de la mama și 23 de la pop. Care sunt șansele ca asta să meargă? Ei bine, vom face câteva diapozitive pentru a ajunge la acel răspuns. Dar mai întâi, pentru a vă motiva, acest lucru este extrem de important în sensul îngrijirii sănătății. Este cea mai comună formă de mutație, care se întâmplă tot timpul. Din păcate, la fiecare cromozom, dublarea sau pierderea este o schimbare majoră în starea umană. Și cea mai ușoară dintre toate adunările sau scăderile unui cromozom... aici, aveți doar trei copii ale cromozomului 21, totul normal. Deci 1,5 doză dintr-unul dintre cei mai mici cromozomi umani are un impact enorm. Cei mai mulți dintre voi ați văzut pe cineva cu sindromul Down, care este retard mintal sever și defecte cardiace la diferite alte organe. STUDENT: [INAUDIBIL]. GEORGE CHURCH: Da, întrebare. STUDENT: Această problemă pe care tocmai ați descris-o, în realitate, totuși, nu este întâmplătoare, deoarece există mecanisme în celulă care ar influența instrumentul pentru a nu segrega o celulă. GEORGE CHURCH: Corect. Acesta este un punct bun. Pentru asta ne pregătesc , exact acea concluzie. Nu poate fi aleatoriu. Moleculele singulare sunt supuse stocasticii. Și astfel, pentru a depăși acel proces stocastic care ar trebui să fie aleatoriu, trebuie să aveți mașini care implică mai multe molecule, pentru că numai prin mai multe molecule puteți obține statisticile pentru a depăși o singură moleculă. Și asta este un truc. Nu poți spune pur și simplu, oh, există o mașină acolo care se ocupă de asta, OK. Doar pentru a extinde acest lucru puțin mai mult, știm că, cu siguranță, ADN-ul este cazul în care o singură moleculă este întotdeauna o problemă. Trebuie să fie ajutat de mașini moleculare în care folosiți energie. Cheltuiești energie pentru a te asigura că moleculele de ADN funcționează. Vom reveni la acel calcul al șanselor la întâmplare, dar ar trebui să spun, de asemenea, ARN-urile din multe sisteme par să fie, în medie, amintiți-vă, media populației este aproape de 1 moleculă per celulă. Sunt produse în rafale, în urma exploziilor stocastice de ARN în care se leagă factorii de transcripție. Și apoi acea explozie de ARN produce explozii și mai mari de proteine. Dar, în medie, iese a fi un număr foarte mic, deoarece proteinele se păstrează. Ele persistă prin multe diviziuni celulare, în timp ce ARN-urile se pot transforma mai rapid. Pentru a reveni la întrebarea cât de multă variație este tolerabilă în sistemele biologice, iată chiar începuturile statisticilor voastre. Unii dintre voi s-ar putea să aibă deja asta, sperăm. Vor exista secțiuni în care puteți acoperi acest lucru. Dar iată câteva dintre statisticile cu adevărat utile și simple. Ce vrem să știm despre o distribuție? Făcând cele mai puține ipoteze deocamdată, vrem să-i cunoaștem media, media sa aritmetică. Care este numărul mediu de cromozomi dintr-o celulă? Dacă ar trebui să fie 1, cât de aproape de medie sunt? Asta e variația. Pentru a obține media aritmetică, practic adunați toate numerele și împărțiți la numărul pe care l-ați numărat. Adunați valorile care sunt axele. Și aici luați o sumă ponderată. Sigma înseamnă suma valorilor x ponderate cu frecvența, f de x, frecvența pe care acestea apar în eșantionul pe care îl luați. Aici, r pentru medie este doar 1. Este nevoie de primul moment pentru a obține media. Lucrul analog este că acum corectați toate valorile pe care le măsurați, aceste variabile, numărul de cromozomi, să zicem. Și scazi media. Deci acum media pentru acest x minus mu este acum efectiv 0. Media este 0 și vrei să întrebi cât de departe devii de la 0 . Pentru cromozomi, doriți ca deviația să fie foarte mică. Vrei ca diferența să fie foarte mică. Și este doar suma pătratelor. Vrem să luăm pătratele pentru că dacă se abate fie mai mult, fie mai puțin, e totuși o tragedie și vrei să păstrezi subiectul. Deci acestea sunt două lucruri. Ei nu fac nicio presupunere despre ce fel de distribuție. Distribuția poate fi orice. Puteți calcula media aritmetică și abaterea standard. Un alt concept util care începe să facă mai multe presupuneri în interpretare este, acum aveți două variabile, să spunem x și y. Și vrei să întrebi dacă covariază. Sunt înrudiți unul cu celălalt? Când faceți două experimente diferite, doriți să întrebați dacă dau rezultate similare. Dacă sunt două tipuri complet diferite de experimente, ați putea dori să știți dacă se întăresc reciproc. Vrei să știi dacă sunt redundante. Dacă observați două fapte biologice, nu știți dacă sunt legate între ele. Este o descoperire dacă covariază. Asta înseamnă asta. Covarianța folosește, din nou, acest concept de așteptare. Suma x-urilor corectată, astfel încât să scădeți mediile, mediile lor și să împărțiți la abaterile lor standard, rădăcina pătrată a varianței. Deci, practic, ajungeți cu o medie de 0 și o varianță de 1. Și apoi, ori de câte ori acestea se normalizează, când x crește și y crește, produsul se va reflecta în această sumă. Deci, acum, aceasta are o proprietate interesantă că, atunci când x și y sunt independente, fără legătură, atunci coeficientul de corelație C sau Pearson este 0. Cu toate acestea, inversul nu este adevărat. Dacă C este 0, nu înseamnă că x și y sunt independente. Un exemplu, un exemplu simplu, este curba, curba pătratică, y este egal cu x pătrat. Aici, ele sunt complet legate între ele, dar dau un coeficient de corelație de 0. Asta pentru că acesta este un coeficient de corelație liniar. Modelul pe care îl testați este că sunt legate liniar. Ele sunt fie corelate pozitiv, ceea ce înseamnă că cazul extrem al lui C va fi egal cu 1, fie C corelat negativ este egal cu minus 1. Puteți conecta această mică formulă aici, formă practică la îndemână pe care o puteți conecta pentru a calcula probabilitățile. Și aceasta este o formulă Excel. Probabilitatea ca o corelație să fie departe de 0, aceasta depinde de dimensiunea eșantionului în care ați eșantionat diferiți x și y. Știi, ar putea fi dimensiunea și greutatea capului, sau lungimea și greutatea și așa mai departe. Dacă sunt corelate, atunci această probabilitate va fi semnificativă dacă dimensiunea eșantionului este suficient de mare. Sunt niște lucruri foarte practice. Și acum să le punem în contextul unei anumite clase de distribuție. Acum, cele mai multe dintre acestea nu necesitau să precizăm ce fel de distribuții, dar există un set mare interesant care sunt curbe aproximativ în formă de clopot. Și am manipulat asta astfel încât aceste trei tipuri de distribuție extrem de diferite să dea curbe similare. Și vedeți în următoarele diapozitive cum l-am trucat, dar, în principiu, aceasta este o distribuție normală, distribuția Poisson și binomul. Binomul are o gamă limitată. n trece de la 0 la 40 în acest caz. Are un maxim n de 40. Poisson are o medie care în acest caz este 20. Distribuția normală are o medie similară. Distribuția normală poate avea orice interval, abaterea standard. Și aceasta este stabilită aici să fie, abaterea standard să fie, rădăcina pătrată a mediei distribuției Poisson. Așa le puteți instala astfel încât să fie asemănătoare între ele. Cred că timpul nu îmi va permite să parcurg toate acestea în detaliu, dar le veți acoperi în secțiunile dvs. de statistici dacă nu le cunoașteți deja. Dar este suficient să spunem că distribuția binomială este limita x. Trebuie să fie un număr întreg, iar numărul întreg este limitat la trecerea de la 0 la n. Aceasta o diferențiază de o distribuție Poisson, unde merge de la 0 la infinit, și de curba normală, unde poate merge de la infinit negativ la infinit pozitiv. Binom și Poisson sunt discrete. Ele se întâmplă la numere întregi în timp ce gaussienii sunt continui. Modul în care calculezi acest lucru este că probabilitatea ca un individ n să se întâmple are probabilitatea p, deci să spunem 0,01 în diapozitivul anterior. Și apoi obținerea exactă a x dintre acestea este p la puterea x ca primă aproximare. Dar există de fapt două cazuri aici, de unde și numele de binom. Dacă ar fi mai multe cazuri, ar fi multinomiale. Dar cele două cazuri sunt practic p și 1 minus p. Ele trebuie să însumeze la 1. Toate aceste probabilități trebuie să se însumeze la 1. Deci acum aveți probabilitatea ca să aveți exact x, iar resturile intră în 1 minus p. Dar apoi trebuie să corectați și numărul de moduri diferite în care ați putea obține acest lucru, numărul de combinații, care este numărul total de posibilități alegând x la un moment dat. Și apoi din nou, restul este n minus x. Și acesta este n factorial peste x factorial ori n minus x factorial. Acesta este numărul de combinații. Și deci acum distribuția binomială este aceasta, iar suma tuturor termenilor de aici trebuie să se adauge la 1. Aceasta este una dintre proprietățile distribuției probabilităților, adică dacă te gândești la toate posibilitățile, acestea se adună la 1. Deci suma a distribuției binomiale a tuturor x-urilor este 1. Acum, doar pentru a vă aminti că computerele sunt falibile, iată ce, atunci când luați un destul de -- știți, x este egal cu exact 300 luat dintr-o populație de 700. O probabilitate de 1 pentru un eveniment unitar. Probabilitatea de a obține exact 350 din acest tip de curbă în formă de clopot este foarte mică, dar nu 0. Și Mathematica o înțelege bine, iar Excels o ghicește la 0. Bine, dar greșită. Poisson, acum poți și trebuie să mergi la infinitul pozitiv. Și acolo, de multe ori veți face aproximarea că pentru probabilitatea mare n și mică în binomul despre care am vorbit - n este numărul total de obiecte la care vă uitați, din care alegeți x. Și t este probabilitatea unitară a fiecăruia dintre acestea. Media este acum de aproximativ n ori p, iar binomul și Poisson sunt foarte asemănătoare. De aceea arată asemănător în acel complot. Și iată o magie practică pe care o poți face cu Poisson. Dacă aveți o bibliotecă de [INAUDIBILĂ] sau chimie combinatorie, sau clone genomice și așa mai departe, și x este un număr de accesări și doriți ca acesta să fie mai mare decât 0, astfel încât teza dvs. să poată continua, doriți ca termenul de hit 0 să fie fie foarte mic, e la minus mu. Deci, doriți ca media să fie mai mare decât 1 sau 2 sau poate chiar -- dacă media este 10, probabilitatea ca pentru un anumit experiment să aveți o lovitură 0 este foarte mică. Și puteți estima acest lucru din numărul și 1 2 și 3 hit-uri pe care le obțineți. Puteți estima lovitura 0 și puteți estima dacă se potrivește de fapt cu un Poisson sau nu. Finala acestui trio este normală. Acum treci de la infinitul negativ la infinitul pozitiv. Nu este doar 0 la n sau 0 la infinit. Și este continuu. Asta înseamnă că totul durează un p. Deci acum, în loc să însumezi până la 1, integrezi până la 1, pentru că acum micile delta x sunt infinit de mici. Și acum, iată o exponențială a unui pătratic, la fel ca cele despre care vorbeam mai devreme. Deci, acesta este un pătratic negativ. Și asta îți oferă o mică curbă drăguță în formă de clopot. Și rădăcina pătrată 2 pi sigma este o normalizare, deci integrează de fapt suma la 1. Aici, o altă aproximare aplicată uneori este când de n ori p ori q este mare, normalul este foarte asemănător cu binomul. Oamenii vor abuza de acest lucru și vor folosi una dintre aceste trei distribuții în locul celeilalte atunci când nu este adecvat. Și vom da câteva exemple pe măsură ce mergem. Deci revenim la acest calcul. Dacă aplicăm binomul pe care l-am avut în diapozitivele anterioare - și vă îndemn să faceți acest lucru ca un exercițiu. Nu este în setul de probleme, ci doar fă-o. Doar obținerea pentru orice 46 de cromozomi, obțineți numărul potrivit de cromozomi, este de aproximativ 8%. Nu e prea rău. Dar este încă destul de letal, pentru că vrei cu adevărat exact 46 corect, care este de la 0,5 la a 46-a putere, ceea ce este foarte puțin probabil să se întâmple la întâmplare, ceea ce revine la punctul susținut de publicul de aici că acest lucru nu este întâmplător. Dar nu poți lupta împotriva faptului că moleculele individuale se bazează pe stocastică. Așa că trebuie să aveți o mulțime de evenimente care se adună, energia fiind aportă pentru a depăși asta. Avem o selecție care optimizează acest lucru pe perioade lungi de timp. Putem folosi numere aleatorii care stau la baza acestui lucru pentru simulările acestor evenimente stocastice și, de asemenea, pentru statisticile de permutare, că atunci când aveți niște date și doriți să știți dacă sunt semnificative sau nu, puteți să faceți o simulare Monte Carlo. . Iată cum îl codificați în câteva limbi diferite, Perl, Excel, Fortran 77, Mathematica. Chiar dacă nu o poți evalua uitându-te la aceste numere de pe ecran, ai încredere în mine. Există generatoare de numere aleatoare proaste. Există generatoare de numere aleatorii care nu sunt foarte aleatorii, OK. De unde provin ele este această operațiune de rest, operată pe numere foarte speciale. Va trebui să le căutați în această referință pentru a vă simți pe deplin. Dar acestea sunt formule deterministe care vă oferă numere aleatorii. Nu este chiar același lucru cu a arunca o monedă. De fapt, computerul îți va da... Sunt aceleași numere aleatorii din nou și din nou, dacă nu faci ceva foarte special. Și de obicei, acestea dau o distribuție uniformă între 0 și 1 sau pe un interval întreg. Și apoi o poți transforma într-o distribuție normală cu acest tip de truc aici în care faci o transformare. Există o diferență între o distribuție uniformă aleatorie și una în formă de clopot. Și le puteți genera pe amândouă doar cu acest slide . Așa că ne întoarcem complet la aceste trei curbe diferite. Au proprietăți foarte diferite care pot fi aplicate. Binom doar când ai o gamă limitată, Poisson când ești infinit pozitiv. Normal, negativ, pozitiv și continuu. Vă mulțumim pentru participarea la aceasta. Acestea sunt subiectele pe care le-am abordat. Ne vedem aici peste o săptămână. Vă rugăm să predați chestionarele, iar secțiunile ar trebui să fie alocate până joi sau vineri. STUDENT: Mulțumesc.