Următorul conținut este furnizat de MIT OpenCourseWare sub o licență Creative Commons. Informații suplimentare despre licența noastră și despre MIT OpenCourseWare în general sunt disponibile la ocu.mit.edu. GEORGE CHURCH: OK. Ne pregătim. Și să mergem. BINE. Deci, bun venit la prima clasă de BIOE101 sau biofizică 101 sau HST.508 sau Genetică 224. Puteți vedea că aceasta este o clasă cu adevărat interdisciplinară și sper că acesta va fi unul dintre punctele sale forte. A fost în trecut. Sper să-ți cunoști unii dintre colegii din această sală sau poate din cealaltă jumătate a acestei clase, care se predă în campusul școlii de medicină, pentru că ar putea fi unele dintre cele mai mari atuuri ale tale în anii următori. Acest curs -- practic, dacă nu puteți, dintr-un motiv oarecare, într-o anumită zi, să faceți această întâlnire la 5:30, aveți opțiunea de a merge la prânz în sala Canon sau aveți opțiunea de a vă conecta la videoclipul, care este destinat în principal studenților din învățământul la distanță, dar servește și ca rezervă în cazul în care unul dintre voi se îmbolnăvește sau este plecat din oraș sau așa ceva. Deci asta se întâmplă chiar acolo, este că am pus asta pe site-ul nostru de internet. Este sincronizat cu diapozitivele PowerPoint. Ar trebui să aveți fișe PowerPoint chiar acum. Acest curs, așa cum este menționat pe site și pe acest prim slide, se bazează, în esență, în întregime pe șase seturi de probleme și un proiect de curs. În trecut, studenții și cu mine ne-am distrat grozav în proiectele de curs. Vedem, într-adevăr, vârful biologiei computaționale. Iar cele șase seturi de probleme sunt cu adevărat menite să te pună la curent, astfel încât să fii cât mai aproape posibil de un proiect de biologie computațională de tip publicație , care, în general, este colaborativ, implicând două sau mai multe persoane. Dar o poți face și singur. Vor fi mai multe detalii pe site și, de asemenea, în secțiunile dvs. De asemenea, sunteți liber să lucrați cu alte persoane pentru a utiliza orice resurse doriți pentru seturile de probleme. Ți-aș cere doar să -- oricum ai răspunde la întrebare, fie că vine doar din capul tău sau din colaborare sau de pe un site web, să spui doar pentru fiecare problemă, doar pe scurt, de unde ai primit răspunsul. Aceasta este doar o disciplină academică bună pentru a vă recunoaște sursele. Acest curs se dorește a fi un curs introductiv, introductiv la aproape fiecare subiect pe care îl combină. Are premise minore. Iar cei care simt că sunt puțin slabi fie la biologie moleculară, fie la statistică, fie la informatică, pe lângă secțiunile obișnuite vor fi cursuri care le vor aborda intens, mai ales la începutul cursului. Apoi, secțiunile în sine vor fi concepute astfel încât să fie îndreptate către oameni care se simt puternici în biologie și puțin mai slabi în informatică. Deci, accentul se va pune pe punerea în funcțiune a calculatoarelor de la... mai mult sau mai puțin de la zero. Și cei care sunt mai puternici, să zicem, în calcul, atunci vor exista secțiuni pe subiecte avansate care se vor potrivi cu cursul. Până la jumătatea cursului, aproape toate secțiunile vor fi foarte aproape identice. Dar va exista totuși acea mică diferență. Vom încerca să oferim mecanisme prin care puteți interacționa cu colegi care au puncte forte diferite, dar interese similare, astfel încât să vă puteți reuni pe seturi de probleme și proiecte. Nu ar trebui să simți că este esențial. Este o oportunitate, nu o obligație. Este important să predați chestionarul imediat după curs, astfel încât să vă putem atribui secțiunile. Secțiunile vor-- secțiunile vor fi modul în care obțineți informații și modul în care interacționați cu colegul de predare care va fi responsabil pentru notarea setului de probleme. Așa că acel coleg va interacționa cu tine în toate cele șase seturi de probleme din proiectul tău și, așadar, ar trebui să cunoști acea persoană foarte bine. Și sunt foarte îndatorat acestui echipaj, apropo, care este aici sus, în vârf. Suzanne [? Camilli?] este profesorul șef anul acesta. Mulți dintre ei... a fost cadru didactic anul trecut. Și mulți dintre aceștia-- aproape toți acești colegi de predare au urmat acest curs anul trecut. Acestea sunt cele mai multe dintre aspectele birocratice ale acesteia, cu excepția cazului în care există unele întrebări. Vă rugăm să nu ezitați să întrerupeți în orice moment. Acest lucru poate fi interactiv dacă doriți să fie. Pot să aloc suficient timp pentru asta. Cu siguranță, ești binevenit să vii la mine înainte de curs, după curs și în timpul pauzei, și putem chiar stabili ore suplimentare. Întrebări? Da. PUBLIC: Secțiunile suplimentare, acestea sunt mai pline în fundal. GEORGE CHURCH: Așa este. Va fi asta... PUBLIC: Se pare că există doar unul, care este joi seara. GEORGE CHURCH: Deci întrebarea este despre sesiunile suplimentare. Va exista un program al tuturor secțiunilor care evoluează pe site în următoarele două zile. În funcție de ceea ce apar chestionarele dvs., probabil că vor exista trei sau patru secțiuni suplimentare în primele două săptămâni. PUBLIC: Și cum facem [INAUDIBIL]? GEORGE CHURCH: Prin șeful de secție. Dacă vă puneți adresa de e-mail, acesta va permite colegului șef de secție să vă contacteze sau îl puteți contacta pe oricare dintre ei dacă nimeni nu vă contactează. BINE. Așadar, prezentarea generală a cursului este constrânsă să se încadreze în calendarul Harvard și MIT. De asemenea, încearcă să atingă scopul de a menține elevii Diviziei de Educație Continuă, astfel încât aceștia să fie nevoiți să intre doar o zi pe săptămână, ceea ce reprezintă un plus considerabil. Unii dintre ei aleg să aibă secțiune în aceeași zi. Și unii dintre ei au navete considerabile. Deci asta determină momentul. Subiectele... vom avea două prelegeri introductive. De fapt, vom acoperi subiecte destul de interesante pentru introducere tematic, unul despre calcul urmat de unul despre biologie, deși ambele și întregul curs sunt despre biologia computațională și biologia sistemelor. Apoi, ca un alt mod de a ne concentra, vom avea o serie de șase prelegeri, două despre ADN, două despre ARN și două despre proteine sau proteomică, care reflectă dogma centrală a biologiei moleculare în care ADN-ul codifică ARN care codifică proteine. Dar mai mult, ne vorbește despre fluxul de informații pe care trebuie să-l stabilim experimental și în termeni de modelare, care ne permite să facem genomica funcțională și, prin urmare, biologia sistemelor și să extragem seturile de date care sunt în atenția tuturor în acest moment. . Apoi, în sfârșit, trei subiecte care se concentrează cu adevărat pe tema generală a întregului curs, care este pe rețelele și biologia sistemelor. Și acestea acoperă cu adevărat gama de analize de rețea pe celulare până la modelarea la scară ecologică pentru a vedea cum integrăm diferite tipuri de date. Apoi urmează secțiunea foarte interesantă a cursului, trei dintre aceste sesiuni de două ore în care puteți să- mi prezentați subiectele de care sunteți încântați, cum ați abordat seturile de probleme de materiale ale cursului și așa mai departe și le-ați încorporat în viziunea dvs. a ceea ce este interesant și apoi să ne prezentăm tuturor informațiile în echipă sau prezentări individuale. BINE. Aceasta este prezentarea generală a întregului curs. Povestea de azi-- Încerc să fac din asta o narațiune oarecum și cu teme. Așa că vom comuta înainte și înapoi pe parcursul prelegerii despre sistemele vii și sistemele de calcul -- asemănări, diferențe, cum putem folosi una pentru a ne spune ceva despre cealaltă. În special, ne vom concentra asupra aspectului sistemelor vii, care este destul de unic, care este auto-asamblarea și replicarea. Acestea sunt puse în contextul unei alte teme de astăzi, care este date discrete versus date continue, modelarea discretă versus continuă a datelor. Deoarece aceasta este o prelegere introductivă și vrem să vă încălziți, voi încerca să ilustrez cât mai mult posibil cu exemple minime, exemple mici, astfel încât să puteți vedea totul într-o singură pagină sau totul într-o singură linie, chiar și , exemple de viață minimă - lucruri care ilustrează aspectele minime ale replicării vieții, în principal, și programe minime, care ne permit să analizăm câteva aspecte cheie ale modelării sistemelor vii. Unele dintre aspectele cheie sunt cataliza și replicarea. Și aici vom folosi ecuații diferențiale. Aceasta va fi, cred, o abordare destul de interesantă a ei, nedureroasă și incitant modul în care se conectează la biologie. Și apoi, după ce vorbim despre acea replicare în contextul ecuațiilor diferențiale, vom introduce [? grafice direcționate?], care indică modul în care are loc creșterea într-un pedigree, nu doar creșterea în modul exponențial. Și apoi, în sfârșit, vom conecta acest lucru la problemele care înconjoară moleculele individuale, care sunt de fapt foarte semnificative în sistemele biologice și implică un alt tip de analiză decât funcțiile continue pe care le vom folosi în ecuațiile diferențiale obișnuite. Când analizăm erorile, fie în date, fie în variația populațiilor biologice, folosim statistici, în linii mari, care se încadrează în statisticile curbei clopot-- de fapt, mai mult decât atât. Și, în general, întreaga-- tema care unește toată biologia și cea mai mare parte a cursului, și această prelegere în special, este ideea că multe dintre aceste funcții din sistemele biologice pot fi sub selecție, selecție experimentală în laborator pentru a obține o rată de creștere optimă sau un alt aspect al opționalității. În general, veți face bine încorporarea sistemului biologic fie ca fiind optim, fie poate fi optimizat pentru o anumită sarcină. BINE. Acum, îmi bat joc de numărul pentru acest curs. Este, de asemenea, un simbol intrinsec important pentru 0-urile și 1-urile care apar în toate computerele noastre și care stau la baza modului în care fie ne ocupăm de date discrete, fie facem ca datele continue să pară discrete. Vom începe cu entitățile biologice cele mai asemănătoare cu 0-urile și 1-urile care vă fac să zumzeze computerele. Și acestea sunt nucleotidele ADN și ARN, A, C, G și T, sau A, C, G și U în cazul ARN. Și, desigur, toate acestea sunt simboluri. A înseamnă adenină. Și adenina, desigur, nu arată ca un A. Arată ca o anumită densitate de electroni. Și adesea îl reprezentăm cu formula chimică pe care o veți vedea în diapozitivele ulterioare. Dar aici, în diapozitivul 5, vorbim, schematic, despre A, C, G și T fiind -- A fiind reprezentat de numărul binar de două cifre 00 și C 01 și 10 și 11. Deci puteți vedea că Două cifre nu sunt suficiente pentru a codifica cele patru nucleotide care sunt înșirate împreună, unde s-ar putea să aveți 3 miliarde de astfel de nucleotide care alcătuiesc unul dintre cei doi genomi umani. Acum, lucrurile devin puțin mai complicate odată ce aceste 3 miliarde de nucleotide digitale din genomul tău încep să fie transformate în molecule care realizează de fapt munca celulei, munca corpului tău, care este ARN și proteine. Acesta este un exemplu de una dintre transcrierile primare comune tuturor organismelor vii pe care le cunoaștem. Acesta este un ARN de transfer. De fapt, am participat la rezolvarea acestei structuri complicate în anii '70. Și aceasta este codificată cu culori, secvența de ADN care codifică acest ARN particular. Și când ARN-ul este făcut, se pliază în această structură tridimensională pe care o vedeți rotindu-se aici. Aceasta este de fapt o imagine stereo, care, dacă îți încrucișezi ochii în mod corect, va părea a fi chiar mai tridimensională decât este acolo. Veți afla mai multe despre acest lucru mai târziu în curs, dacă nu știți deja. Dar ideea este că aceasta trece de la un capăt cu 5 prime în albastru până la capătul cu 3 prime în roșu. Și trebuie să se plieze în acest fel. Se pliază reproductibil în acest mod și trebuie să rămână pentru a-și îndeplini funcția, care de fapt se traduce din ADN-- scuze-- din secvențele de ARN în proteine. Dar ceea ce ilustrăm aici este relația dintre acest cod digital binar discret și ADN și codul mai continuu pe care îl aveți, care este coordonatele x, y și z ale atomilor - natura continuă a distribuției probabilităților. de electroni în jurul fiecăruia dintre acești atomi și natura continuă a poziției sale în spațiu și diferitele sale constante de legare, afinități pentru alte molecule din celulă. Permiteți-mi să iau doar aceste două exemple, secvența ADN și structura tridimensională pentru ARN-ul de transfer pe care îl codifică și să le extind puțin sau să dau alte exemple. Avem o secvență. În diapozitivul anterior, am arătat o secvență de 76 de nucleotide. În partea stângă sunt exemple de concepte discrete, concepte care sunt foarte natural codificate într-un mod digital discret și apoi cât de aproape putem ajunge la versiunea continuă a acesteia. Deci, o versiune continuă a unei secvențe ar putea fi o probabilitate a unei secvențe. Cu alte cuvinte, la prima poziție, dacă te uiți la o populație de secvențe -- numărul de ARNt-uri diferite, numărul de oameni diferiți din această cameră -- s-ar putea să nu fie întotdeauna un A la poziția 1. S-ar putea fie că are o probabilitate diferită la diferiți oameni. Deci reprezentați asta ca o probabilitate A, C, G și T. Este un vector cu patru numere în el. Asta e mai continuu. În mod similar, avem dispozitive analogice digitale în instrumentele care colectează datele cu care veți lucra în acest curs. Integrarea poate fi reprezentată, practic vorbind, ca o sumă de pași mici. Când vorbim despre, să zicem, o rețea neuronală care este responsabilă pentru unele dintre gândurile tale sau o rețea de reglementare care provoacă homeostazia în corpul tău, biologii reflectă adesea despre acestea ca fiind activate și oprite. Este o bună aproximare. Vă permite să faceți diagrame foarte simple. Dar trebuie să vă amintiți că multe dintre acestea sunt de fapt compuse din gradienți sau răspunsuri gradate. Nu neapărat toate sunt [? pornit/oprit. ?] Unii dintre acești gradienți sau răspunsuri gradate au această formă sigmoidă pe care am desenat-o ca o pictogramă la mijlocul acesteia, separând discretul de continuu. Și astfel, pentru toate intențiile și scopurile, lucrurile tind să stea fie aici în partea de jos, fie în partea de sus a limitelor de concentrație sau a limitelor de semnal dacă semnalul este electric sau așa mai departe. În mod similar, vom avea exemple în care unele celule vor fi-- vom avea un câmp de celule care sunt fie activate, fie dezactivate, efectiv extreme extreme ale acestui lucru. Dar, pentru că există un amestec dintre ele, dacă ar fi să le amestecați și să măsurați unele proprietăți ale lor, ar părea a fi undeva intermediar. Așadar, aceasta este o alarmă care ar trebui să se declanșeze de fiecare dată când vezi amestecuri din care ar putea fi compuse -- s- ar putea să aveți nevoie -- să o modelați, poate fi necesar să o modelați ca populație, fiecare individ comportându-se ca mai extrem decât medie cu foarte puține la mijloc. În mod similar cu mutațiile, ați putea spune că anumite mutații sunt esențiale pentru viață. Alții sunt neutri. Nu au niciun efect. Altele, mai mult de zonă gri, sunt condiționate. BINE. Doar un punct de orientare pentru modul în care putem descrie nu numai biții, componentele discrete sau digitale ale acestui curs. Dar, de asemenea, multe dintre aceste prefixe sunt utile și pentru a descrie continuul. Dar puteți vedea asta-- mulți dintre voi veți fi familiarizați cu acestea. Sunt sigur că toți aveți acces la computere, așa că ați folosit termeni precum kilobyte și megabyte și gigabyte. Din punct de vedere tehnic, 2 la a 10-a putere este 1.024, nu 1.000, și deci nu ar trebui să fie numită kilogram. Dar, pentru cele mai multe intenții și scopuri, acestea sunt atât de aproape de 1.000 sau un milion sau un miliard încât sunt folosite interschimbabil. Dar acesta este standardul oficial aici. Și cu siguranță pentru numerele continue despre care vom vorbi , ordinea pe care o vom avea este 10 la plus 3 va [? fie kilogram. ?] 10 la minus 3 vor fi mililitri. Mega, micro, giga, nano și așa mai departe, până în sus. [? Pentru numerele ?], molul atomic devine... zeptomolul se apropie de limita la care te apropii de molecule individuale. Petabyte se apropie de limita unde pot ajunge computerele dvs. chiar acum. De ce este important să existe măsuri cantitative definite? De ce nu putem spune în mod obișnuit, oh, da, este un timp lung, mai degrabă decât secunde, sau este o distanță foarte mare până la Piața Harvard în metri? De ce trebuie să folosim metri, kilograme, alunițe, grade, Kelvin, candela, amperi? Acestea sunt cele șapte unități de bază ale sistemului internațional din care derivă majoritatea celorlalte unități pe care le utilizați în știință . Într-un anumit sens, există o oarecare interconvertibilitate chiar și în cadrul acestora. Vom vorbi puțin despre precizie la sfârșitul orei de astăzi și pe tot parcursul cursului. De fapt, o temă astăzi este că chiar și lucrurile care sunt reprezentate digital nu sunt -- pentru a reprezenta lucrurile digital, există aproximări care sunt făcute. Și ar trebui să vă întrebați întotdeauna care sunt aceste presupuneri atunci când faceți o aproximare. Precizia pentru unele dintre aceste unități de măsură -- de exemplu, scara de timp măsurată în secunde -- poate fi la fel de precisă ca 14 cifre zecimale semnificative. Acum, s-ar putea să vă întrebați din când în când în curs de ce biologia nu are 14 cifre semnificative. Dar voi lăsa asta ca un exercițiu pentru unul dintre proiectele tale, poate, pentru a-mi da seama cum să obții asta. Dar pentru toate scopurile practice, cea mai mare parte a biologiei este trei sau patru cifre semnificative. Există limite cuantice de timp și lungime, care sunt atât de scurte încât nu trebuie să ne preocupăm. Dar unitatea cuantică pentru aluniță este de fapt de o mare importanță pentru acest curs. O alunita este de 6 ori 10 la a 23-a entitate. Aceste entități pot fi fotoni sau molecule, sau chiar avem de peste 6 ori 10 până la 23 de bacterii dintr-un ocean. Deci, ceea ce este important aici este că cuantumul acesteia este molecula și multe dintre lucrurile cu care ne vom ocupa sunt molecule individuale. Și acesta va fi ultimul subiect al prelegerii de astăzi, va fi modul în care cineva se ocupă cu moleculele individuale, spre deosebire de găleți mari de molecule. Acum, avem toate acele definiții cantitative grozave pentru toate unitățile standard utilizate în fizică și chimie, și chiar în biologie, dar cum rămâne cu definiția biologiei în sine? Cele mai multe cărți de biologie încep cu asta. Există cărți întregi dedicate acestei întrebări despre ce este viața. Cred că mai degrabă decât, în această sesiune, să întreb ce este viu sau nu-- decât să fac o dihotomie, aș prefera să spun cât de viu este ceva. Care este probabilitatea ca o anumită entitate să se repete? Avem, aici, pe diapozitivul 10, probabilitatea de replicare și nu doar cât de probabil este ca întregul lucru să se repete sau o parte din el să se repete, dar face acest lucru folosind părți simple, componente simple de mediu și creând grozavi? complexitate de aici. Cât de fidelă este replicarea? Acum, această probabilitate de replicare de la simplitate la complexitate poate fi definită pentru un mediu specific. Uneori, mediul necesar pentru replicare este, în mod necesar, foarte specific. Anumite organisme nu se descurcă bine decât în ​​mediile lor native. Grădinile zoologice descoperă acest lucru, iar noi continuăm să omorâm specii dintr-o varietate de motive, unul dintre ele fiind această specificitate. Deci, atunci când vorbim despre - deci un alt aspect al vieții - despre care fiecare dintre acestea, în principiu, poate fi cuantificat - este cât de robust este. Câte medii poate face față? Inevitabil, există medii care nu pot fi gestionate. Dar cu cât este mai robust și mai adaptabil, într-un anumit sens, cu atât este mai viu sau va fi mai viu, urmașii săi vor fi, peste milioane de ani, probabil. Acum, câteva exemple foarte provocatoare am enumerat aici. Nu am de gând să trec prin toate. Dar lucrurile care au contestat definițiile vieții oamenilor înainte sunt catârii , adică hibrizii sterili care nu vor lăsa descendenți în urmă, dar par la fel de vii ca părinții lor, dar nu se vor reproduce, în general. Deci probabilitatea de replicare este scăzută pentru întregul organism, dar poate pentru celule individuale. Incendiile se reproduc destul de bine, dar majoritatea oamenilor ar dori să le excludă din această definiție. Sau poate dacă suntem în modul de a nu exclude lucruri din viață, probabilitatea de a replica complexitatea versus simplitate ar putea afecta incendiile. Cristale - dacă nucleați o soluție suprasaturată cu un cristal, acesta va face, într-un anumit sens, copii ale ei înșiși. Cum [? dureros?] este asta? Cât de simplu este? Flori, viruși, prădători - acestea necesită medii foarte complexe. Ei au nevoie de medii adesea mai complexe decât ei înșiși pentru a se reproduce. Asta îi face mai puțin vii? Voi arăta un exemplu de ligatură moleculară ca fiind cel mai simplu caz doar pentru a ne încălzi pentru această clasă introductivă. Întrucât suntem aici, pe scurt, la subiectul biologiei generale, nu doar al biologiei terestre istorice cu care toți simțim o afinitate deosebită - dacă am avea vizitatori de pe altă planetă sau dacă am început să ne facem propriile mașini care se auto-asambla. -- și într-o oarecare măsură, fabricăm deja mașini cu auto-asamblare în fabrici. Ele necesită un mediu foarte complex care include oameni. Dar cum definim aceste lucruri? Acum, pentru a defini - pentru a ajunge la problema complexității versus simplitate și fidelitatea replicării, trebuie să definim atât replicarea, cât și complexitatea. Replicarea nu este perfect fidelă în multe dintre lucrurile pe care le-ați considera vii. O bacterie atât de simplă, deși va face o copie care face multe din aceleași lucruri -- o știm când o vedem -- se pare că este același lucru. Dacă ai număra moleculele, nu ar fi două bacterii la fel. Nu există doi oameni, cu siguranță, la fel. Dar chiar și bacteriile presupuse identice genetic vor avea un număr diferit de proteine ​​și molecule mici. Complexitatea are cel puțin patru definiții pe care le vom folosi în acest curs. Există o complexitate computațională, care are o semnificație practică în biologia computațională, așa cum vor ști informaticienii din sală , prin faptul că aceasta ne spune compromisurile de viteză și memorie pe care le avem în extinderea oricărei probleme. O problemă se extinde ca o simplă funcție liniară a numărului de intrări pe care le dați computerului? Se extinde ca un simplu polinom sau este mai rău decât atât? Este exponențial în comportament? Este ceva ce puteți demonstra că ați primit răspunsul corect în timp polinomial și așa mai departe? Vom ajunge la asta mai târziu, dar vreau doar să o introduc ca ceva în care este folosit cuvântul „complexitate”. Numărul doi sună similar, dar este de fapt destul de diferit. Este complexitatea algoritmică sau aleatorietatea algoritmică. Și acesta este practic orice șir -- nu doar un program de calculator, dar un program de calculator poate fi reprezentat ca un șir -- poate fi redus până acolo unde scapi de redundanța evidentă, iar ceea ce rămâne este aleatorietatea. Iar numărul de biți necesari pentru a codifica acel algoritm este o reflectare a complexității. Acest lucru nu vă oferă neapărat predicții despre cât timp va funcționa sau câtă memorie va avea nevoie în timpul calculului. Entropia și informațiile, numărul 3, sunt legate de elementul numărul 2 prin aceea că, cu cât șirul este mai complex - un șir este doar o serie de simboluri ca acesta și despre asta vorbeam cu aleatorietatea - cu atât este mai complex. șir sau o imagine poate fi transformată într-un șir -- acestea sunt trei imagini aici -- atunci cu atât mai mulți biți aveți nevoie pentru a o codifica pentru, de exemplu, a crea un fișier. S- ar putea să comprimați datele, dar în cele din urmă, după ce sunt complet comprimate, aceasta este cantitatea de informații de care aveți nevoie. Entropia este un termen chimic. Această definiție a informațiilor a fost susținută de Shannon -- vom reveni la ea -- și entropia de către Boltzmann și alții. Iar fuziunea acestor două într-o temă unificată este extrem de importantă atât în ​​chimie, cât și în teoria informației. Cu toate acestea, niciuna dintre acestea de mai sus nu reflectă sentimentul nostru intuitiv atunci când ne uităm la aceste trei panouri. Avem o matrice foarte ordonată, care ar fi o entropie foarte scăzută, în partea stângă. Avem, în extrema dreaptă , ceva foarte dezordonat, în esență întâmplător. Este posibil să fi fost generat de o aruncare a unei monede în care, pe măsură ce umpleți matricea, spuneți doar alb sau negru, aruncați o monedă. Cel din mijloc - și deci entropia scăzută din stânga ar putea fi ușor reprezentată ca 010101 într-o matrice simplă - foarte puțină informație, foarte puțină entropie, din punct de vedere algoritmic, nu foarte aleatoriu. La celălalt capăt, totuși, are entropie ridicată, conținut ridicat de informații . Este nevoie de o mulțime de biți pentru a-l reprezenta, deși știi că l-ai obținut doar printr-o aruncare de monede și are o aleatorie algoritmică ridicată. Dar dacă permiteți ca aruncarea unei monede să facă parte din descrierea dumneavoastră a complexității fizice a acestui tipar din extrema dreaptă, să spunem un gaz sau ceva de genul acesta generat de aruncarea unei monede, atunci îl puteți reprezenta ca un anumit tip de descriere aleatorie, ceea ce este aproape ca-- este la fel de ușor de descris ca un sistem foarte ordonat. Deci, deși are o entropie mare, are o complexitate scăzută. Și complexitatea se află undeva la mijloc, unde aveți o mulțime de tipuri diferite de simetrii, o mulțime de scări diferite de structuri și este foarte greu să o reprezentați fie ca o aruncare aleatorie de monede, fie ca un sistem foarte ordonat. Cum cuantificăm acest lucru? Încercăm cu adevărat să trecem de la definițiile mai vagi la ceva care cuprinde cu adevărat ceea ce simțim intuitiv despre complexitate. Iată un exemplu care îmi place. Aș spune că acesta nu este ceva care este adaptat în linii mari, dar vreau să vă expun la asta. Aici avem entropia sau aleatorietatea, informația... Informația Shannon pe axa orizontală a diapozitivei 12, unde entropia scăzută, care este foarte ordonată, este în partea stângă. Este 0. Și entropia mare aleatorie, foarte dezordonată, de 1 pe acest tip de scară se află în partea dreaptă. Și complexitatea, așa cum am spus, ne așteptăm să nu se coreleze perfect cu informația sau entropia, deoarece această structură foarte dezordonată din partea dreaptă are de fapt o complexitate foarte scăzută. Și complexitatea nu este nici măcar o funcție cu o singură valoare a entropiei sau a informațiilor, deoarece puteți avea mai multe structuri diferite care au aceeași entropie, dar au complexități diferite. Aceasta este ceea ce vedem aici când luați o felie sau o linie în sus de la axa orizontală în sus prin complexitate. Puteți avea mai multe valori diferite aici. BINE. Acesta a fost un exemplu de model. Da. PUBLIC: [INAUDIBIL] în ciuda modului în care este măsurată complexitatea sau a definiției [INAUDIBILĂ] -- GEORGE CHURCH: Chiar va trebui să vă referiți la acest articol. Este unul destul de complicat. Dar ideea aici a fost să luați un set complicat de date generate de o hartă logistică la care vom ajunge în doar câteva diapozitive și vă întrebați-- pe măsură ce creșteți complexitatea hărții într-un mod care atrage intuitivul definiția complexității pe care ai avut-o în cea precedentă, calculezi numărul de simetrii, simetria fizică de care ar fi nevoie pentru a reprezenta aceasta, permițând aruncarea monedelor ca parte a algoritmului de simplificare. Este doar exclus de la toate definițiile anterioare. Crutchfield și colegii de muncă au susținut acest lucru. Și aș spune că nu este larg acceptat, dar cu siguranță nici nu este respins. Și mi se pare atrăgător. Deci de ce modelăm? Acesta a fost un exemplu de complexitate a modelării. Am subliniat mai devreme modelele pe care le aveam pentru o structură tridimensională. Acest curs este în principal despre măsurători. Deci de ce model? Aș susține că atunci când măsurăm, de fapt trebuie să modelăm. Și trebuie să facem asta nu doar pentru a înțelege datele biologice și chimice pe care le colectăm. Și dacă înțeleg, putem avea diverse teste pentru înțelegerea noastră. Testele pot include, dar nu se limitează la, proiectarea unor modificări utile ale unui sistem. Cursul este în principal despre sisteme. Și prin folosirea modelelor noastre pentru a proiecta o nouă variație a sistemului și apoi obținerea de date suplimentare și modelarea acestor date noi, obținem o mai bună aproximare cu succes a ceea ce înseamnă datele de bază. Și o dovedim, adesea cu modificări utile care pot avea impact asupra societății sau asupra altor agende de cercetare. Un alt motiv pentru care modelăm este pentru a partaja date. De obicei, atunci când vă uitați într-o bază de date, cei dintre voi care v-ați uitat la baze de date biologice sau chimice , acestea nu sunt date din baza de date, în general vorbind. Sunt modele acolo. Iar lucrurile pe care le descarci sunt modele. Deci, de exemplu, secvența pe care am arătat-o la început-- adică 76 de nucleotide de A, C, G și P-- este un model care reprezintă interpretarea noastră a unor tipuri de modele fluorescente pe care le vedem când rulăm instrumentele pe amplificare. ADN prelevat dintr-o varietate de organisme. Acesta este modelul. În mod similar, ARN-ul de transfer rotativ tridimensional pe care l-am văzut a fost probabil mai evident un model. Acolo, integrăm chimia mecanicii moleculare și fizica datelor de difracție unde atomii -- densitatea electronilor dintr-o rețea cristalină difractează și formează un model. Noi integrăm acele modele și asta este ceea ce este distribuit în bazele de date. Nu numai că ne permite să partajăm date, dar și modul în care le partajăm este prin căutare. Aceia dintre voi care ați căutat fie baze de date biologice, fie pe internet cu Google sau așa ceva știu cât de puternică poate fi o căutare. De obicei, este mai ușor să cauți cu un model și mai puternic și mai precis să cauți cu un model decât să cauți prin date brute. Când îmbinăm seturile de date, le vom alinia. Vom găsi concedieri. Vom integra diferite concepte. Asta necesită modelare. Și, în sfârșit, verificarea datelor -- una dintre temele acestui curs va fi să vă îmbrățișați valorile aberante. Când modelați datele brute și găsiți date care sunt foarte departe de așteptări, acesta este un lucru bun. Vă permite să găsiți erori în modelul dvs. sau erori în datele sau descoperirile dvs. Deci verificarea este alta. În cele din urmă, integrarea -- așa cum am spus, acest curs este despre măsuri și modele. Și nu este doar un studiu al tuturor lucrurilor pe care le puteți face cu calculul în biologie și biologie computațională, ci, cel mai important, este vorba despre integrare. Avem nevoie de mai mult de un tip de date pentru a face progrese în biologie și medicină, agricultură. Iar integrarea este una dintre cele mai mari provocări pe care le avem acum. Este relativ ușor să colectați un singur set de date omogen, dar apoi să îl conectați la restul lumii este marea provocare pe care o veți avea cu toții. O temă care va merge pe tot parcursul cursului va fi această afacere despre erori, două tipuri de erori, aleatoare și sistematice. Și de fiecare dată când cineva vă înmânează niște date sau vă colectați propriile date sau aveți de-a face cu ceva din literatură, ar trebui să presupuneți imediat că există atât erori aleatorii, cât și erori sistematice. Ar trebui să știi care este care și cât de mult există. Nu ar trebui să acceptați nimic ca fiind adevărat fără calificare. Erorile aleatorii înseamnă că, dacă repeți experimentul din nou și din nou, vei obține variații ușor diferite ale tipurilor de erori. Și, într-o anumită măsură, vor avea o medie peste suficientă determinare. Erori sistematice, pe de altă parte, aveți o probabilitate mare de a obține aproape exact aceeași eroare din nou și din nou, sau un subset foarte mic dintr-o anumită clasă de erori, ceea ce înseamnă că doar dacă o faceți din nou și din nou nu vă va îmbunătăți. statistici sau îmbunătățiți acuratețea. Trebuie să schimbați paradigmele cu totul, culegând date prin mai multe metode. Deci, acestea sunt tipurile de motive pe care le modelăm. Și acum ar trebui să trecem prin tipurile de modele pe care le vom face. Acesta este un curs care se referă în esență la secvență, cum secvența duce la structuri tridimensionale sau chiar patru-dimensionale în timp, cum structurile tridimensionale duc la funcționare, cum funcția este încorporată în sisteme complicate, deci ce modele vom căuta, fuzionarea și verificarea, așa cum am spus în diapozitivul anterior. Ce modele vom ordona? Vom face ipoteza în programarea dinamică, care este doar un mod elegant de a spune căutarea și alinierea - programarea dinamică va face ipoteza că secvențele sunt legate între ele. Ei fac ipoteza în continuare că sunt înrudiți prin strămoși. Adică le-ai mutat în laborator sau poate ai fost mutat înainte de a veni în laborator. Aceasta este programare dinamică care poate alinia secvențe sau structuri tridimensionale care sunt destul de diferite unele de altele. Câteva diapozitive înapoi când vorbim despre replicare, dacă două lucruri sunt replicate -- arătând ascendența comună, să zicem -- fidelitatea acelei replici este cheia pentru -- programarea dinamică este cheia pentru a accepta că ceva este de fapt replicat. Dacă se transformă în ceva complet nou în procesul de replicare, atunci este puțin probabil că va putea menține asta. Structura tridimensională - vom vorbi despre motive, cataliză, suprafețe complementare. Vă voi oferi un exemplu frumos de suprafață gratuită în câteva diapozitive. Și toate acestea se ocupă de funcțiile continue ale energiei și cineticii în care diferite suprafețe complementare se vor lega una de cealaltă cu constante de viteză foarte specifice care acoperă multe ordine de mărime. Acest fenomen energetic și cinetic este ceea ce stă la baza genomicii funcționale. Când folosim date genomice funcționale, una dintre modalitățile în care le modelăm este să întrebăm dacă fenomenele pe care le studiem în interiorul corpului nostru sau în interiorul microorganismelor, așa mai departe - nivelurile de proteine, nivelurile de ARN și așa mai departe, unde se îndreaptă. sus și jos împreună înseamnă că sunt un grup. Au proprietăți comune. Aceste proprietăți comune reflectă încă un aspect al lor, cum ar fi funcțiile lor comune sau mecanismele lor comune, pentru a fi coreglate? În biologia sistemelor, avem aceste diagrame calitative care ne vorbesc despre tot sau nimic, sau boolean, ceea ce înseamnă zerouri și 1 logice. Sau le putem trata ca ecuații diferențiale continue sau stocastice în care aveți o parte din puterea ecuațiilor diferențiale, dar aveți de-a face cu molecule individuale sau organisme și populații individuale. Organismele pot fi stocastice. Moleculele pot fi stocastice. Și încă un lucru - din nou, această temă de optimizare - ne putem întreba dacă o rețea sau o componentă de rețea este optimă. Este optim datorită istoriei trecute a organismului sau este ceva prin care putem stabili un obiectiv al unui proces biotehnologic pentru a-l optimiza pentru o nouă funcție? Programarea liniară este instrumentul matematic pe care îl puteți folosi pentru a studia acest lucru. Este comun în algoritmii economici. Așadar, vorbeam despre modelare în tot acest tărâm, trecând de la secvențe minime de viață prin cataliza care implică interacțiuni ale structurilor tridimensionale, genomica funcțională și optimitatea pe care o obținem care este necesară, așa cum vom vedea momentan, pentru obținerea de molecule individuale. a munci. Care este lista noastră de piese? Vom încerca să începem simplu, dar să punem simplitatea în contextul imaginii de ansamblu. Imaginea de ansamblu a atomilor este tabelul periodic al celor peste 100 de elemente. Avem o listă foarte scurtă aici: sodiu, potasiu, ioni, clor, calciu, magneziu, molibden, mangan, sulf, seleniu, cupru, nichel, cobalt și siliciu, care sunt utile la multe specii. Dacă trebuie să alegeți ceva care are legătură cu noi ca un sistem biochimic minim care arată unele dintre proprietățile replicative și proprietățile evolutive ale vieții, ați spune viața bazată pe ARN. Una dintre descoperirile în știința experimentală din ultimele două decenii este recunoașterea faptului că ARN, ca și proteinele, are capacități catalitice. Are potențialul de a fi fost una dintre primele unități de replicare. Doar de dragul de a descrie un sistem simplu, să ne uităm la ceva format din cinci elemente. Nu este neapărat cel mai simplu, dar este doar ceva la care să te gândești. Aceste cinci elemente pot fi în prezența unui mediu care poate fi compus din aceleași cinci elemente. Mediul ar fi foarte simplu, acea complexitate versus simplitate. Ar fi apa, amoniu, ioni încărcați pozitiv , trifosfat de nucleotide, ionii încărcați negativ , care sunt precursori pentru a face polimeri, și apoi eventual lipide, substanțele grase care leagă membranele. Un exemplu de polimerizare a ARN catalizat este în acest articol și apoi mă voi ocupa de altul care, în loc să folosească trifosfați de nucleotide, folosește precursori de ARN puțin mai mari . Acum să începem să comutăm înainte și înapoi între sistemele vii și sistemele de calcul, astfel încât, indiferent dacă sunteți dintr- un fundal computațional sau biologic sau ambele, să vedeți câteva relații interesante. Aici am vorbit despre un sistem biologic minim cu cinci elemente. Aici vom vorbi despre câteva probleme minime cu un număr foarte mic de elemente. Practic, acestea sunt limitate la o singură linie de cod fiecare. Și fac ceva care are legătură cu subiectul de aici. Replicarea este un proces exponențial, în creștere exponențială. Dacă ceva este autocatalitic este un alt mod de a-l descrie. Așa că am folosit-o ca temă pentru programele noastre minime. Ce este această funcție exponențială? Îi dăm un argument foarte concret. Argumentul este 1. Deci acesta este e la puterea 1, e fiind acest număr aici care este reprezentat de numărul de ori, aproximativ 2,7. Cele patru limbi pe care le demonstrăm aici sunt Perl, Excel, Fortran 77 și Mathematica. În acest curs, vom folosi în principal Perl și Mathematica din motive care vor fi evidente în următoarele două diapozitive. Dar vreau doar să vă arăt pe acestea diferite. Și în tema acurateței replicării, cât de fidel este tratat un anumit șir, fie șirul de nucleotide într-o formă simplă de viață, fie șirul de cifre dintr-un număr - și puteți vedea că reprezentarea internă a matematicii care merge în interiorul computerului trebuie făcută digital, chiar dacă acestea sunt numere transcendentale care au un număr arbitrar de cifre. Și puteți vedea că unele programe sunt de obicei limitate. Și puteți chiar ghici numărul de biți care îl reprezintă intern. Aici, în partea de jos a diapozitivului 17, puteți vedea câteva dintre detaliile esențiale ale modului în care aceste lucruri sunt reprezentate ca 0 și 1 reprezentând [INAUDIBIL], exponentul și așa mai departe. Dar puteți vedea unele dintre aceste programe, când se imprimă, când se imprimă efectiv, programul nu este conștient sau programatorul nu a știut exact care este reprezentarea internă. Și deci toate aceste 0-uri finale sunt incorecte. Câștigătorul în asta, desigur, este Mathematica, aici pentru a cere puterea e la 1. Spuneți, să-i dăm... această n paranteză spune să începem să dăm o precizie arbitrară în cazul în care numărul, numărul n, este de 100 de cifre. Și aceasta pare o cascadorie în acest caz particular. Dar, de fapt, atunci când începi să faci o serie de calcule în care se pot acumula erori, capacitatea de a intra în precizie arbitrară vă va permite să preveniți o imprecizie catastrofală. Și ceea ce se întâmplă este că, într-un calcul matematic, dacă are nevoie de puțin mai multă precizie decât ați anticipat inițial, se va stinge și o va obține de la sine, ceea ce este destul de remarcabil. Încercați să faceți asta în oricare dintre aceste alte limbi. În mod obișnuit, vă vor da ceea ce se numește o eroare de depășire sau de depășire și fie să se oprească, fie să facă greșeli. BINE. Aceasta este prima mea reclamă pentru Mathematica. Puteți vedea că toate acestea sunt programe foarte simple, care neagă și se ascund sub electronicele și algoritmii foarte complicati care sunt încorporați pentru a realiza acest lucru. Îți voi da o idee despre ceea ce este în doar câteva diapozitive. Deci, înapoi la auto-replicare. Comutăm înainte și înapoi între sistemele biologice simple și cele de calcul. Avem... aici am reprezentat tri și hexanucleotide, trei nucleotide și șase. Din nou, amintiți-vă, aceste litere sunt brute-- sau ar trebui să spun reprezentări simple ale densității electronice care implică zeci de atomi sub forma unei citozine, sau a unui C, sau a guaninei sau a unui G. Este important să știți că există două catenele din ADN, de obicei, sau chiar multe ARN-- în acest exemplu special, indiferent dacă acesta este ARN sau ADN. Și pentru a indica orientarea șuviței, are o direcționalitate. Indicăm 5-prim, care este numele unui atom din riboză, dar detaliile nu sunt importante din punct de vedere computațional. Este doar o modalitate de a indica că acesta este un capăt al ARN-ului. Și un CCG nu este același lucru cu un GCC. 5-prim indică capătul 5-prim al acestuia. Luăm două dintre acestea, care sunt practic identice, și se vor liga împreună spontan dacă ați configurat corect chimia pentru a transforma aceste două trinucleotide într-o hexanucleotidă, CCG CCG. În prezența unui complement aici, care este CGG CGG, o secvență diferită-- am încercat să subliniez că făcând-o capitală și verde-- care s-ar lega de-- aceste două trinucleotide s-ar lega de aceasta, aliniată de Watson - Perechi de baze Crick. Regulile pentru perechile de baze Watson-Crick , probabil că mulți dintre voi le cunoașteți. A se împerechează cu T și C se împerechează cu G. Și asta va cataliza acest proces. Va accelera cinetica în care aceste trinucleotide [? întoarce?] [? în ?] hexanucleotide. Acum, aici devine interesant. Această hexanucleotidă scade acum aici și accelerează procesul acestei trinucleotide diferite [INAUDIBILĂ] și formând cea originală care catalizează prima reacție. Deci aceasta catalizează, accelerează prima reacție, care produce un produs care o accelerează pe a doua, care produce primul catalizator și așa mai departe. Acesta se numește hiperciclu, susținut de Eigen și Schuster. Și acesta este probabil unul dintre cele mai simple exemple ale acestuia. Și cred că vă dă o impresie despre modul în care o varietate de procese biochimice interdependente pot duce la autocataliza, unde obțineți aceste cicluri exponențiale pe care le recunoaștem ca fiind ceva foarte asemănător cu replicarea. Acest lucru ar avea o probabilitate foarte mare de replicare. Ar putea fi foarte fidel, dar complexitatea sa este scăzută. Complexitatea de intrare este scăzută, iar complexitatea de ieșire este scăzută. Așa l-am califica. Trecând înapoi la calcul și exemple simple, am dat deja câteva exemple simple de Perl în Mathematica. Dar pentru a mai oferi câteva aici pe slide 19, de ce i-am ales pe acești doi pentru acest curs? Experiența mea a fost, atât în ​​mediul nostru de laborator și de cercetare , cât și în această clasă, că acestea sunt două dintre cele mai ușor de învățat limbi. Asta nu înseamnă că sunt absolut ușoare, dar curba de învățare este foarte simplă. Este foarte rapid. Și puteți, de exemplu, să schimbați foarte repede programele care funcționează în lucruri care fac ceea ce doriți. Este o limbă de nivel înalt într-un sens - cu cât nivelul limbii este mai ridicat , cu atât ești mai aproape de conversația în engleză. Cu cât nivelul de limbaj este mai scăzut, cu atât ești mai aproape de biți, 0 și 1 sau de electronica reală din interiorul computerelor. Deci, în ierarhie, Perl și Mathematica sunt foarte sus acolo. Da. PUBLIC: De unde obțineți parola pentru a descărca Mathematica? GEORGE CHURCH: Veți obține asta de la colegele dumneavoastră de secție . Da. Deci, întrebarea este de unde obțineți parola pentru Mathematica pentru acest curs, iar colegii de predare sunt responsabili pentru asta. Și asta a fost testat. Cred că funcționează. Deci Perl este liber -- este open source. Este interesant în acest sens. Cred că mulți dintre voi veți găsi conceptul de sursă deschisă acolo unde oricine poate -- când software-ul se defectează sau trebuie extins, sau trebuie să fie înțeles, este acolo pentru inspecția dvs., mai degrabă decât ascuns în spatele unor uși corporative. Un aspect foarte interesant al lui Perl. Mathematica nu este open source din câte știu eu. Totuși, are câteva caracteristici interesante de răscumpărare. Este foarte puternic la matematică. Nicio surpriză având în vedere numele său. În special, este atât simbolic, cât și numeric și în grafică. Și vom avea câteva exemple în acest sens într-un moment. Poate face lucruri greu de făcut în Perl și în alte limbi. Perl este, de asemenea, foarte puternic pentru aplicațiile web. Multe dintre cele mai uimitoare lucruri care se fac pe web au Perl în culise. Acum, când noi... o altă comparație a... aceasta este partea întunecată a calculului și a biologiei, arătând o altă analogie, care este paraziții. Avem computere parazite și viruși biologici virali. Acesta-- în ultimii ani, am avut un mic virus de computer-- asta nu este totul. Aceasta este doar o mică bucată din ea. Este un cod destul de scurt. Și acesta a fost unul foarte urât la acea vreme, cu ceva timp în urmă. Și l-am avut în prezentarea PowerPoint. Când oamenii îl descărcau, apoi îmi trimiteau un e-mail. Îmi pare rău să vă informez că aveți un virus în PowerPoint. Și astfel, anul acesta, am actualizat PowerPoint-ul. Deci aceasta este de fapt o imagine mai degrabă decât textul real. Și astfel detectorii tăi virali nu vor detecta asta decât dacă sunt mult mai inteligenți decât cred că sunt. Acesta este, pe de altă parte, costurile acestor viruși. Aceasta nu este o chestiune de râs. Acesta este de 4 ori mai mare decât costul întregului proiect al genomului uman pe an. Proiectul Genome ne-a luat aproximativ 20 de ani să pornim. În fiecare an, cheltuim de patru ori această sumă pe viruși informatici, care sunt, din câte îmi dau seama, complet frivoli. Și mai grav este asta. Acum, acesta este text real. Aceasta nu este o imagine. Ți s-a părut o imagine. E foarte grav. Și sper sincer că unii dintre oamenii din această clasă să contribuie la căile intelectuale care vor duce în cele din urmă la înfrângerea virusului SIDA și a diferitelor alte viruși și bacterii ca ei care provoacă atât de multă suferință în lume. 20 de milioane au murit. Acest lucru este mai rău decât Ciuma Neagră și epidemia de gripă din 1918 . Și analogia aici între această parte a virusului... aceasta este o mică parte din codul viral în simbolurile codului cu o singură literă de 20 de aminoacizi. Aceasta este o mică bucată din virusul informatic. Și am evidențiat aici comanda copie în virusul informatic. Aceasta este doar o parte din ceea ce face pentru a introduce acest script VBS special , lucrul pe care îl vedeți aici, într-o altă parte a directorului dvs. Și aceasta, în esență, face parte din comanda de copiere a virusului SIDA. Aceasta este polimeraza. Proteina este responsabilă pentru realizarea de copii ale codului virusului. Și evidențiate cu roșu, aici sunt câteva dintre mutațiile care fac acest virus special SIDA rezistent la medicamentele care au fost esențiale, în unele cazuri, în îmblânzirea SIDA temporar și cu costuri mari. În mod clar, vaccinurile și, sperăm, alte măsuri de sănătate publică, vor fi răspunsul. Iată și alte conexiuni conceptuale. Acestea nu sunt menite să fie dogme sau să vă limiteze în vreun fel, ci sperăm să extindă modul în care gândiți aceste lucruri. Evident, ca și în cazul altor analogii, acestea se vor defecta. Dar să urmăm doar pentru o clipă. Ceea ce numim set de instrucțiuni, conceptul de set de instrucțiuni, în computere este un program, în organisme este un genom. Am spus deja biți, deci 0 și 1, A, C, G și T. Memoria stabilă, lucru de care poți depinde, dar este puțin lent pentru acces, sunt discuri și benzi din computere, și ele. re ADN sau, în unele cazuri, genomi ARN. Atunci, îl scoți din memoria lentă, din memoria stabilă și îl muți în ceva mai activ, mai volatil, care este memoria cu acces aleatoriu în computere și ARN-ul în organisme. Mediul pentru calculatoare tinde să fie complex -- sunt prizele de internet și oamenii care lovesc de tastatură -- în timp ce organismele pot fi foarte simple. Am dat câteva exemple mai devreme unde este complex, dar poate fi la fel de simplu ca apa și sărurile, în care pot reproduce structuri foarte complicate. Intrarea și ieșirea pot fi -- intrarea poate fi analogică și convertită în digital în acest proces, analogă digitală pentru ieșire -- analogul, să zicem, al ecranelor dvs. Și input-output este guvernat de aceste proteine la sfârșitul dogmei centrale în organisme. Când facem aceste sisteme complicate din lucruri simple, ele pleacă de la așa-numiții monomeri, care într-adevăr se combină în polimeri, care nu trebuie să fie polimeri liniari, deși adesea sunt în sisteme biologice - practic, treci de la minerale la cipuri în computere. . Acestea sunt reproduse în fabrici. Fabricile sau celulele pot fi la fel de mici ca femtolitru. Amintiți-vă, acest prefix, acest femto, este de la 10 la -15. Adică aproximativ 1 micron cub. Fabrici foarte mici, productivitate și complexitate foarte uimitoare. Din nou, intrare-ieșire ca mai sus. Iar comunicarea este extrem de rapidă în computere, mai lentă, dar foarte bogată în organisme. După o pauză foarte scurtă - ne putem întinde - ne vom întoarce și vom vorbi mai detaliat despre cum sunt făcute computerele și cum sunt făcute sistemele biologice. Mulțumesc.