Următorul
conținut este furnizat
de MIT OpenCourseWare sub
o licență Creative Commons.
Informații suplimentare
despre licența noastră
și despre MIT OpenCourseWare
în general
sunt disponibile la ocu.mit.edu.
GEORGE CHURCH: OK.  Ne
pregătim.
Și să mergem.
BINE.
Deci, bun venit la
prima clasă de BIOE101
sau biofizică 101 sau
HST.508 sau Genetică 224.
Puteți vedea că aceasta este o
clasă cu adevărat interdisciplinară
și sper că acesta va
fi unul dintre punctele sale forte.
A fost în trecut.
Sper să-ți cunoști unii
dintre colegii din această sală
sau poate din cealaltă
jumătate a acestei clase, care
se predă în
campusul școlii de medicină,
pentru că ar putea fi unele
dintre cele mai mari atuuri ale tale
în anii următori.
Acest curs -- practic, dacă
nu puteți, dintr-un motiv oarecare,
într-o anumită zi, să faceți
această întâlnire la 5:30,
aveți opțiunea de a merge la
prânz în sala Canon
sau aveți opțiunea de a vă
conecta la  videoclipul,
care este destinat în principal
studenților din învățământul la distanță,
dar servește și ca rezervă în
cazul în care unul dintre voi se îmbolnăvește sau este
plecat din oraș sau
așa ceva.
Deci asta se
întâmplă chiar acolo,
este că am pus asta
pe site-ul nostru de internet.
Este sincronizat cu
diapozitivele PowerPoint.
Ar trebui să aveți
fișe PowerPoint chiar acum.
Acest curs, așa cum este
menționat pe site
și pe acest prim slide,
se bazează, în esență, în
întregime pe șase
seturi de probleme și un proiect de curs.
În trecut, studenții
și cu mine ne-am distrat grozav
în proiectele de curs.
Vedem, într-adevăr,
vârful biologiei computaționale.
Iar cele șase
seturi de probleme sunt cu adevărat
menite să te pună la curent,
astfel încât să fii cât mai aproape
posibil de un proiect de
biologie computațională de tip publicație
, care, în
general,
este colaborativ, implicând
două sau mai multe persoane.
Dar o poți face și singur.  Vor
fi mai multe
detalii pe site
și, de asemenea, în secțiunile dvs.  De
asemenea, sunteți liber să
lucrați cu alte persoane
pentru a utiliza orice resurse
doriți pentru seturile de probleme.  Ți-aș
cere doar să --
oricum ai răspunde la
întrebare, fie că
vine doar din
capul tău sau din colaborare
sau de pe un site web, să
spui doar pentru fiecare problemă,
doar pe scurt, de unde ai
primit răspunsul.
Aceasta este doar o
disciplină academică bună
pentru a vă recunoaște sursele.
Acest curs se dorește a
fi un curs introductiv,
introductiv la aproape fiecare
subiect pe care îl combină.
Are premise minore.
Iar cei care simt
că sunt puțin
slabi fie la
biologie moleculară, fie la statistică, fie la
informatică,

pe lângă
secțiunile obișnuite vor fi cursuri care le
vor aborda
intens, mai ales la
începutul cursului.
Apoi, secțiunile
în sine vor
fi concepute astfel încât să fie
îndreptate
către oameni care se simt puternici în
biologie și puțin mai slabi
în informatică.
Deci, accentul se va pune pe
punerea în funcțiune a calculatoarelor de la...
mai mult sau mai puțin de la zero.
Și cei care sunt
mai puternici, să zicem, în calcul,
atunci vor exista secțiuni
pe subiecte avansate
care se vor potrivi
cu cursul.
Până la jumătatea cursului,
aproape toate secțiunile
vor fi foarte aproape identice.
Dar va exista totuși
acea mică diferență.
Vom încerca să
oferim mecanisme
prin care puteți interacționa
cu colegi care
au puncte forte diferite,
dar interese similare,
astfel încât să vă puteți reuni pe
seturi de probleme și proiecte.
Nu ar trebui să simți că
este esențial.
Este o oportunitate,
nu o obligație.
Este important să predați
chestionarul
imediat după curs, astfel încât să
vă putem atribui secțiunile.
Secțiunile vor--
secțiunile vor fi modul în
care obțineți
informații și modul în
care interacționați
cu
colegul de predare care va fi responsabil
pentru notarea setului de probleme.
Așa că acel coleg
va interacționa cu tine
în toate cele șase
seturi de probleme din proiectul tău
și, așadar, ar trebui să
cunoști acea persoană foarte bine.
Și sunt foarte îndatorat
acestui echipaj,
apropo, care este
aici sus, în vârf.
Suzanne [?  Camilli?] este
profesorul șef anul acesta.
Mulți dintre ei... a fost
cadru didactic anul trecut.
Și mulți dintre aceștia--
aproape toți acești
colegi de predare
au urmat acest
curs anul trecut.
Acestea sunt cele mai multe dintre
aspectele birocratice ale acesteia,
cu excepția cazului în care există unele întrebări.
Vă rugăm să nu ezitați să
întrerupeți în orice moment.
Acest lucru poate fi interactiv
dacă doriți să fie.
Pot să aloc
suficient timp pentru asta.  Cu
siguranță, ești binevenit
să vii la mine înainte de curs,
după curs și
în timpul pauzei,
și putem chiar
stabili ore suplimentare.
Întrebări?
Da.
PUBLIC:
Secțiunile suplimentare, acestea sunt mai
pline în fundal.
GEORGE CHURCH: Așa este.
Va fi asta...
PUBLIC: Se pare că există doar
unul, care este joi seara.
GEORGE CHURCH: Deci întrebarea
este despre sesiunile suplimentare.
Va exista un program al
tuturor secțiunilor care evoluează
pe site în
următoarele două zile.
În funcție de ceea ce
apar chestionarele dvs.,
probabil că vor exista
trei sau patru secțiuni suplimentare
în primele
două săptămâni.
PUBLIC: Și cum
facem [INAUDIBIL]?
GEORGE CHURCH: Prin
șeful de secție.
Dacă vă puneți
adresa de e-mail, acesta
va permite
colegului șef de secție să vă contacteze
sau îl puteți contacta pe oricare dintre
ei dacă nimeni nu vă contactează.
BINE.
Așadar, prezentarea generală a cursului
este constrânsă să se încadreze în
calendarul Harvard
și MIT.  De
asemenea, încearcă să
atingă scopul
de a menține elevii Diviziei de
Educație Continuă,
astfel încât aceștia să fie nevoiți să
intre doar o zi pe săptămână,
ceea ce reprezintă un
plus considerabil.
Unii dintre ei aleg să
aibă secțiune în aceeași zi.
Și unii dintre ei au navete
considerabile.
Deci asta determină
momentul.
Subiectele... vom avea
două prelegeri introductive.
De fapt, vom acoperi
subiecte destul de interesante
pentru introducere
tematic, unul despre calcul
urmat de unul despre
biologie, deși ambele
și întregul curs
sunt despre biologia computațională
și biologia sistemelor.
Apoi, ca un alt mod
de a ne concentra, vom
avea o serie de șase prelegeri,
două despre ADN, două despre ARN
și două despre proteine
sau proteomică, care
reflectă
dogma centrală a biologiei moleculare
în care ADN-ul codifică ARN
care codifică proteine.
Dar mai mult,
ne vorbește
despre fluxul de
informații pe care
trebuie să-l stabilim experimental
și în termeni de modelare, care
ne permite să facem
genomica funcțională
și, prin urmare,
biologia sistemelor și să extragem
seturile de date care sunt în
atenția tuturor în acest moment.  .
Apoi, în sfârșit, trei
subiecte care se
concentrează cu adevărat pe tema generală
a întregului curs, care
este pe rețelele și
biologia sistemelor.
Și acestea acoperă cu adevărat
gama de analize de rețea
pe celulare până la
modelarea la scară ecologică
pentru a vedea cum
integrăm diferite tipuri de date.
Apoi urmează
secțiunea foarte interesantă
a cursului, trei dintre
aceste sesiuni de două ore
în care puteți să-
mi prezentați subiectele de care sunteți
încântați,
cum ați abordat

seturile de probleme de materiale ale cursului și așa mai departe
și le-ați încorporat în
viziunea dvs.  a ceea ce este interesant
și apoi să ne prezentăm tuturor
informațiile în echipă
sau prezentări individuale.
BINE.
Aceasta este prezentarea generală
a întregului curs.
Povestea de azi-- Încerc să fac din
asta o narațiune oarecum
și cu teme.  Așa că vom

comuta înainte și înapoi
pe parcursul prelegerii
despre sistemele vii
și sistemele de calcul --
asemănări,
diferențe, cum
putem folosi una pentru a ne spune
ceva despre cealaltă.
În special, ne vom concentra
asupra aspectului sistemelor vii,
care este destul de unic, care este
auto-asamblarea și replicarea.
Acestea sunt puse în contextul unei
alte teme de astăzi, care
este date discrete versus
date continue, modelarea discretă
versus continuă
a datelor.
Deoarece aceasta este o
prelegere introductivă
și vrem să
vă încălziți,
voi încerca să
ilustrez cât mai mult posibil
cu exemple minime,
exemple mici,
astfel încât să puteți vedea totul
într-o singură pagină
sau totul într-o singură linie, chiar și  ,
exemple de viață minimă -
lucruri care ilustrează
aspectele minime ale
replicării vieții, în principal,
și programe minime,
care ne permit să
analizăm câteva aspecte cheie
ale modelării sistemelor vii.
Unele dintre aspectele cheie sunt
cataliza și replicarea.
Și aici vom folosi
ecuații diferențiale.
Aceasta va fi, cred,
o abordare destul de interesantă a ei,
nedureroasă și incitant
modul în care se conectează la biologie.
Și apoi, după ce vorbim
despre acea replicare
în contextul
ecuațiilor diferențiale,
vom introduce
[?  grafice direcționate?],
care indică modul în care are loc creșterea
într-un pedigree, nu doar creșterea
în modul exponențial.
Și apoi, în sfârșit,
vom conecta acest lucru
la problemele care înconjoară
moleculele individuale, care
sunt de fapt foarte semnificative
în sistemele biologice
și implică un alt
tip de analiză
decât
funcțiile continue pe care le
vom folosi în
ecuațiile diferențiale obișnuite.
Când analizăm
erorile, fie în date, fie în
variația
populațiilor biologice,
folosim statistici, în linii
mari,
care se încadrează în
statisticile curbei clopot-- de fapt,
mai mult decât atât.
Și, în general, întreaga--
tema care unește toată
biologia și cea mai mare parte a cursului,
și această prelegere în
special, este ideea
că multe dintre aceste funcții
din sistemele biologice
pot fi sub selecție,
selecție experimentală
în laborator pentru
a  obține o rată de creștere optimă
sau un alt
aspect al opționalității.
În general, veți face bine
încorporarea sistemului biologic
fie ca fiind optim, fie poate fi
optimizat pentru o anumită sarcină.
BINE.
Acum, îmi bat joc de
numărul pentru acest curs.
Este, de asemenea, un
simbol intrinsec important
pentru 0-urile și 1-urile care
apar în toate computerele noastre
și care stau la baza modului în care fie ne
ocupăm de date discrete,
fie facem ca datele continue
să pară discrete.
Vom începe cu
entitățile biologice cele mai asemănătoare
cu 0-urile și 1-urile care vă
fac să zumzeze computerele.
Și acestea sunt
nucleotidele ADN
și ARN, A, C, G și T, sau A,
C, G și U în cazul ARN.
Și, desigur, toate
acestea sunt simboluri.
A înseamnă adenină.
Și adenina,
desigur, nu arată
ca un A. Arată ca o
anumită densitate de electroni.
Și adesea îl reprezentăm
cu formula chimică pe care o veți
vedea în diapozitivele ulterioare.
Dar aici, în diapozitivul 5,
vorbim, schematic, despre
A, C, G și T fiind --
A fiind reprezentat de
numărul binar de două cifre 00
și C 01 și 10 și 11.
Deci puteți vedea că
Două cifre nu sunt
suficiente pentru a codifica
cele patru nucleotide care
sunt înșirate împreună,
unde s-ar putea să aveți
3 miliarde de astfel de
nucleotide care alcătuiesc
unul dintre cei doi genomi umani.
Acum, lucrurile devin puțin
mai complicate
odată ce aceste 3 miliarde de
nucleotide digitale din genomul tău
încep să fie transformate în
molecule care
realizează de fapt munca celulei,
munca corpului tău, care
este ARN și proteine.
Acesta este un exemplu de una
dintre transcrierile primare
comune tuturor
organismelor vii pe care le cunoaștem.
Acesta este un ARN de transfer.
De fapt, am
participat la rezolvarea
acestei
structuri complicate în anii '70.
Și aceasta este codificată cu culori,
secvența de ADN care
codifică acest ARN particular.
Și când ARN-ul este
făcut, se pliază
în această
structură tridimensională pe
care o vedeți rotindu-se aici.
Aceasta este de fapt o
imagine stereo, care,
dacă îți încrucișezi
ochii în mod corect,
va părea a fi chiar mai
tridimensională decât
este acolo.
Veți afla mai multe despre
acest lucru mai târziu în curs,
dacă nu știți deja.
Dar ideea este că aceasta
trece de la un capăt cu 5 prime
în albastru până
la capătul cu 3 prime în roșu.
Și trebuie să se plieze
în acest fel.
Se
pliază reproductibil în acest mod
și trebuie să rămână pentru a-și
îndeplini funcția, care de
fapt se traduce din ADN--
scuze-- din
secvențele de ARN în proteine.
Dar ceea ce ilustrăm
aici este relația dintre
acest cod digital binar discret
și ADN și
codul mai continuu pe care îl
aveți, care este coordonatele x, y
și z ale atomilor -
natura continuă a
distribuției probabilităților.
de electroni în jurul
fiecăruia dintre acești atomi
și
natura continuă a poziției sale
în spațiu și diferitele sale
constante de legare, afinități
pentru alte molecule din celulă.
Permiteți-mi să iau doar aceste două
exemple, secvența ADN
și
structura tridimensională pentru ARN-ul de transfer pe
care îl codifică și să
le extind puțin
sau să dau alte exemple.
Avem o secvență.
În diapozitivul anterior, am arătat
o secvență de 76 de nucleotide.
În partea stângă sunt
exemple de concepte discrete,
concepte care
sunt foarte natural
codificate într-un mod digital discret
și apoi cât de aproape
putem ajunge la
versiunea continuă a acesteia.
Deci, o
versiune continuă a unei secvențe
ar putea fi o probabilitate
a unei secvențe.
Cu alte cuvinte, la
prima poziție,
dacă te uiți la o
populație de secvențe --
numărul de ARNt-uri diferite,
numărul de oameni diferiți
din această cameră --
s-ar putea să nu fie
întotdeauna un A la poziția 1.
S-ar putea  fie că are
o probabilitate diferită
la diferiți oameni.
Deci reprezentați asta ca o
probabilitate A, C, G și T.
Este un vector cu
patru numere în el.
Asta e mai continuu.  În mod
similar, avem
dispozitive analogice digitale
în instrumentele care
colectează datele cu care veți
lucra în acest curs.
Integrarea poate fi reprezentată,
practic vorbind,
ca o sumă de pași mici.
Când vorbim despre, să
zicem, o rețea neuronală care este
responsabilă pentru unele
dintre gândurile tale
sau o rețea de reglementare
care provoacă homeostazia
în corpul tău, biologii
reflectă adesea despre acestea
ca fiind activate și oprite.
Este o bună aproximare.  Vă
permite să faceți
diagrame foarte simple.
Dar trebuie să vă amintiți
că multe dintre acestea
sunt de fapt compuse din
gradienți sau răspunsuri gradate.
Nu neapărat toate
sunt [?  pornit/oprit.  ?]
Unii dintre acești gradienți
sau răspunsuri gradate
au această formă sigmoidă pe
care am desenat-o ca o pictogramă
la mijlocul acesteia,
separând discretul
de continuu.
Și astfel, pentru toate
intențiile și scopurile,
lucrurile tind să stea
fie aici în partea de jos, fie în partea de
sus a
limitelor de concentrație
sau a
limitelor de semnal dacă semnalul
este electric sau așa mai departe.  În mod
similar, vom avea exemple în
care unele celule vor fi-- vom
avea un câmp de celule
care sunt fie activate, fie dezactivate,
efectiv extreme extreme
ale acestui lucru.
Dar, pentru că există
un amestec dintre ele,
dacă ar fi să le amestecați și să
măsurați unele proprietăți ale lor,
ar părea a fi
undeva intermediar.
Așadar, aceasta este o alarmă
care ar trebui să se declanșeze
de fiecare dată când vezi amestecuri din care ar
putea fi compuse -- s-
ar putea să aveți nevoie -- să
o modelați, poate fi necesar să
o modelați ca
populație, fiecare individ
comportându-se ca mai extrem
decât  medie cu foarte
puține la mijloc.  În mod
similar cu
mutațiile, ați putea
spune că anumite mutații
sunt esențiale pentru viață.
Alții sunt neutri.  Nu
au niciun efect.
Altele, mai mult de
zonă gri, sunt condiționate.
BINE.
Doar un punct de orientare
pentru modul în care putem descrie
nu numai biții,
componentele discrete sau digitale
ale acestui curs.
Dar, de asemenea, multe dintre
aceste prefixe sunt
utile și pentru a descrie
continuul.
Dar puteți vedea asta--
mulți dintre voi veți fi
familiarizați cu acestea.  Sunt
sigur că toți
aveți acces la computere,
așa că ați folosit termeni
precum kilobyte și megabyte
și gigabyte.
Din punct de vedere tehnic, 2 la a 10-a
putere este 1.024, nu 1.000,
și deci nu ar trebui să fie
numită kilogram.
Dar, pentru cele mai multe intenții
și scopuri,
acestea sunt atât de aproape de 1.000
sau un milion sau un miliard
încât sunt folosite
interschimbabil.
Dar acesta este
standardul oficial aici.
Și cu siguranță pentru
numerele continue despre
care vom vorbi
, ordinea pe care o vom
avea este 10 la plus
3 va [?  fie kilogram.  ?] 10
la minus 3 vor
fi mililitri.
Mega, micro, giga, nano
și așa mai departe, până în sus.
[?  Pentru numerele ?],
molul atomic devine...
zeptomolul se
apropie de limita la care
te
apropii de molecule individuale.
Petabyte se apropie de
limita unde
pot ajunge computerele dvs. chiar acum.
De ce este important să existe
măsuri cantitative definite?
De ce nu putem
spune în mod obișnuit, oh, da, este
un timp lung, mai degrabă decât secunde,
sau este o distanță foarte mare
până la Piața Harvard în metri?
De ce trebuie să folosim metri,
kilograme, alunițe, grade,
Kelvin, candela, amperi?
Acestea sunt cele șapte unități de bază ale
sistemului internațional
din care derivă majoritatea celorlalte
unități pe care le utilizați în știință
.
Într-un anumit sens, există o
oarecare interconvertibilitate chiar și
în cadrul acestora.
Vom vorbi
puțin despre precizie
la sfârșitul orei de astăzi
și pe tot parcursul cursului.
De fapt, o temă astăzi este
că chiar și lucrurile care sunt
reprezentate digital nu sunt --
pentru a reprezenta
lucrurile digital,
există aproximări
care sunt făcute.
Și ar trebui să vă întrebați întotdeauna
care sunt aceste presupuneri
atunci când faceți o aproximare.
Precizia pentru unele dintre
aceste unități de măsură --
de exemplu,
scara de timp măsurată în secunde --
poate fi la fel de precisă ca 14
cifre zecimale semnificative.
Acum, s-ar putea să vă întrebați din
când în când în curs
de ce biologia nu are
14 cifre semnificative.
Dar voi lăsa asta
ca un exercițiu
pentru unul dintre proiectele tale, poate,
pentru a-mi da seama cum să obții asta.
Dar pentru toate
scopurile practice, cea mai mare parte a biologiei
este trei sau patru
cifre semnificative.
Există limite cuantice
de timp și lungime,
care sunt atât de scurte încât
nu trebuie să ne preocupăm.
Dar
unitatea cuantică pentru aluniță
este de fapt de o mare
importanță pentru acest curs.
O alunita este de 6 ori 10
la a 23-a entitate.
Aceste entități pot fi
fotoni sau molecule,
sau chiar avem de peste
6 ori 10 până la 23
de bacterii dintr-un ocean.
Deci, ceea ce este important aici
este că cuantumul acesteia
este molecula și multe dintre
lucrurile cu care ne vom ocupa
sunt molecule individuale.
Și acesta va fi ultimul
subiect al prelegerii de astăzi,
va fi modul în care cineva se ocupă
cu moleculele individuale,
spre deosebire de
găleți mari de molecule.
Acum, avem toate acele
definiții cantitative grozave
pentru toate unitățile standard
utilizate în fizică și chimie,
și chiar în biologie, dar cum rămâne cu
definiția biologiei
în sine?  Cele
mai multe cărți de biologie
încep cu asta.
Există cărți întregi
dedicate acestei întrebări
despre ce este viața.
Cred că mai degrabă decât, în
această sesiune, să întreb ce este viu
sau nu--
decât să fac o
dihotomie, aș prefera
să spun cât de viu este ceva.
Care este probabilitatea ca
o anumită entitate să se repete?
Avem, aici, pe diapozitivul 10,
probabilitatea de replicare
și nu doar cât de probabil
este ca întregul lucru
să se repete sau o
parte din el să se repete,
dar face acest lucru
folosind părți simple,
componente simple de mediu
și creând grozavi?  complexitate
de aici.
Cât de fidelă este replicarea?
Acum, această probabilitate
de replicare
de la simplitate la
complexitate poate fi definită
pentru un mediu specific.
Uneori, mediul
necesar pentru replicare
este, în mod necesar, foarte specific.
Anumite organisme
nu se descurcă bine decât
în ​​mediile lor native.
Grădinile zoologice descoperă acest lucru,
iar noi continuăm să omorâm
specii dintr-o varietate
de motive, unul
dintre ele fiind această specificitate.
Deci, atunci când vorbim despre -
deci un alt aspect al vieții -
despre care fiecare dintre acestea, în
principiu, poate fi cuantificat -
este cât de robust este.
Câte medii
poate face față?
Inevitabil, există
medii care nu pot fi
gestionate.
Dar cu cât este mai robust
și mai adaptabil,
într-un anumit sens, cu atât
este mai viu
sau
va fi mai viu, urmașii săi
vor fi, peste milioane de
ani, probabil.
Acum, câteva exemple foarte provocatoare
am enumerat aici.
Nu am de gând să trec
prin toate.
Dar lucrurile care au contestat
definițiile vieții oamenilor
înainte sunt catârii
, adică
hibrizii sterili care
nu vor lăsa
descendenți în urmă, dar par la fel de
vii ca părinții lor, dar
nu se vor reproduce, în general.
Deci probabilitatea
de replicare
este scăzută pentru întregul organism,
dar poate pentru celule individuale.
Incendiile se reproduc destul de
bine, dar majoritatea oamenilor
ar dori să
le excludă din această definiție.
Sau poate dacă suntem în
modul de a nu exclude lucruri
din viață, probabilitatea
de a replica complexitatea
versus simplitate ar putea
afecta incendiile.
Cristale - dacă nucleați
o soluție suprasaturată
cu un cristal, acesta va
face, într-un anumit sens,
copii ale ei înșiși.
Cum [?  dureros?] este asta?
Cât de simplu este?
Flori, viruși,
prădători - acestea necesită
medii foarte complexe.
Ei au nevoie de medii adesea
mai complexe decât ei înșiși
pentru a se reproduce.
Asta îi face mai puțin vii?
Voi arăta un exemplu
de ligatură moleculară
ca fiind cel mai simplu caz
doar pentru a ne încălzi
pentru această clasă introductivă.
Întrucât suntem aici, pe
scurt, la subiectul biologiei generale,
nu doar al
biologiei terestre istorice
cu care toți simțim o
afinitate deosebită -
dacă am avea vizitatori
de pe altă planetă
sau dacă am început să ne facem
propriile mașini care se auto-asambla.  --
și într-o oarecare măsură,
fabricăm deja mașini cu
auto-asamblare
în fabrici.
Ele necesită un
mediu foarte complex
care include oameni.
Dar cum
definim aceste lucruri?
Acum, pentru a defini - pentru a
ajunge la
problema complexității versus simplitate
și fidelitatea
replicării,
trebuie să definim atât
replicarea, cât și complexitatea.
Replicarea nu este perfect
fidelă în multe dintre lucrurile
pe care le-ați considera vii.  O
bacterie atât de simplă,
deși
va face o copie care face
multe din aceleași lucruri -- o
știm când o vedem --
se pare că este același lucru.
Dacă ai
număra moleculele,
nu ar fi două bacterii la fel.
Nu există doi oameni,
cu siguranță, la fel.
Dar chiar și
bacteriile presupuse identice genetic
vor avea un număr diferit de
proteine ​​și molecule mici.
Complexitatea are cel
puțin patru definiții pe care le vom
folosi în acest curs.
Există o
complexitate computațională,
care are o semnificație practică

în biologia computațională, așa cum vor ști
informaticienii din sală
, prin faptul că aceasta ne
spune compromisurile de viteză și memorie pe care le
avem în
extinderea oricărei probleme.
O problemă se extinde ca
o simplă funcție liniară
a numărului de intrări pe care le
dați computerului?
Se extinde ca
un simplu polinom
sau este mai rău decât atât?
Este exponențial în comportament?
Este ceva
ce puteți demonstra că
ați primit răspunsul corect în
timp polinomial și așa mai departe?
Vom ajunge la asta
mai târziu, dar vreau doar
să o introduc
ca ceva în care
este folosit cuvântul „complexitate”.
Numărul doi sună similar, dar este
de fapt destul de diferit.
Este complexitatea algoritmică
sau aleatorietatea algoritmică.
Și acesta este practic
orice șir --
nu doar un program de calculator,
dar un program de calculator poate fi
reprezentat ca un șir --
poate fi redus până acolo unde
scapi de redundanța evidentă,
iar ceea ce rămâne
este aleatorietatea.
Iar numărul de biți
necesari pentru a codifica acel algoritm
este o reflectare
a complexității.
Acest lucru nu
vă oferă neapărat
predicții despre
cât timp va funcționa
sau câtă memorie va avea
nevoie în timpul calculului.
Entropia și informațiile, numărul
3, sunt legate de elementul numărul 2
prin aceea că, cu cât
șirul este mai complex -
un șir este doar o serie
de simboluri ca acesta
și despre asta
vorbeam cu
aleatorietatea - cu atât este
mai complex.  șir
sau o imagine poate fi
transformată într-un șir --
acestea sunt trei imagini aici --
atunci cu atât mai mulți biți
aveți nevoie pentru a o codifica
pentru, de exemplu, a crea un fișier.  S-
ar putea să comprimați
datele, dar în cele din urmă,
după ce sunt complet
comprimate, aceasta este
cantitatea de
informații de care aveți nevoie.
Entropia este un termen chimic.
Această definiție a informațiilor
a fost susținută de Shannon --
vom reveni la
ea -- și entropia
de către Boltzmann și alții.
Iar fuziunea acestor
două într-o temă unificată
este extrem de importantă
atât în ​​chimie, cât și în
teoria informației.
Cu toate acestea, niciuna
dintre acestea de mai sus nu
reflectă sentimentul nostru intuitiv
atunci când ne
uităm la aceste trei panouri.
Avem o matrice foarte ordonată, care
ar fi o entropie foarte scăzută,
în partea stângă.
Avem, în extrema dreaptă
, ceva foarte
dezordonat, în esență întâmplător.
Este posibil să fi fost
generat de o aruncare a unei monede
în care, pe măsură ce umpleți
matricea, spuneți doar
alb sau negru, aruncați o monedă.
Cel din mijloc -
și deci entropia scăzută din
stânga ar putea fi ușor
reprezentată ca 010101
într-o matrice simplă -
foarte puțină informație,
foarte puțină entropie, din punct de vedere
algoritmic,
nu foarte aleatoriu.
La celălalt capăt, totuși, are
entropie ridicată, conținut ridicat de informații
.
Este nevoie de o mulțime de
biți pentru a-l reprezenta,
deși știi că l-ai
obținut doar printr-o aruncare de monede
și are o
aleatorie algoritmică ridicată.
Dar dacă permiteți ca
aruncarea unei monede să facă
parte din descrierea dumneavoastră a
complexității fizice
a acestui tipar
din extrema dreaptă, să
spunem un gaz sau ceva de genul
acesta generat de aruncarea unei monede,
atunci îl puteți reprezenta
ca un anumit tip
de descriere aleatorie,
ceea ce este aproape
ca-- este la fel
de ușor de descris
ca un sistem foarte ordonat.
Deci, deși are o
entropie mare, are o complexitate scăzută.
Și complexitatea se află
undeva la mijloc, unde
aveți o mulțime de
tipuri diferite de simetrii, o mulțime
de scări diferite
de structuri
și este foarte greu să
o reprezentați fie ca o aruncare aleatorie de monede,
fie ca un sistem foarte ordonat.
Cum cuantificăm acest lucru?
Încercăm cu adevărat să trecem
de la definițiile mai vagi
la ceva care cuprinde cu adevărat
ceea ce
simțim intuitiv despre complexitate.
Iată un exemplu care
îmi place.
Aș spune că
acesta nu este ceva
care este adaptat în linii mari, dar
vreau să vă expun la asta.
Aici avem entropia sau
aleatorietatea, informația...
Informația Shannon pe
axa orizontală a diapozitivei 12,
unde entropia scăzută,
care este foarte ordonată,
este în partea stângă.
Este 0.
Și entropia mare aleatorie, foarte dezordonată,

de 1 pe acest tip de scară
se află în partea dreaptă.
Și complexitatea, așa cum
am spus, ne așteptăm să
nu se coreleze perfect
cu informația sau entropia,
deoarece această
structură foarte dezordonată
din partea dreaptă are de fapt o
complexitate foarte scăzută.
Și complexitatea nu este nici măcar
o funcție cu o singură valoare
a entropiei sau a
informațiilor, deoarece
puteți avea mai multe
structuri diferite care
au aceeași entropie, dar
au complexități diferite.
Aceasta este ceea ce vedem aici când
luați o felie sau o linie în
sus de la axa orizontală în
sus prin complexitate.
Puteți avea mai multe
valori diferite aici.
BINE.
Acesta a fost un exemplu de model.
Da.
PUBLIC: [INAUDIBIL] în ciuda
modului în care este măsurată complexitatea
sau a definiției [INAUDIBILĂ] --
GEORGE CHURCH: Chiar va
trebui să vă referiți la acest articol.
Este unul destul de complicat.
Dar ideea aici a fost să
luați un set complicat de date
generate de o
hartă logistică la care vom
ajunge în doar
câteva diapozitive și vă
întrebați-- pe măsură ce creșteți
complexitatea
hărții într-un mod care
atrage intuitivul
definiția complexității pe care ai
avut-o în cea precedentă,
calculezi
numărul de simetrii,
simetria fizică de care
ar fi nevoie pentru a reprezenta aceasta,
permițând aruncarea monedelor ca
parte a algoritmului de
simplificare.
Este doar exclus de la toate
definițiile anterioare.
Crutchfield și colegii de muncă
au susținut acest lucru.
Și aș spune că
nu este larg acceptat,
dar cu siguranță nici nu este
respins.
Și mi se pare atrăgător.
Deci de ce modelăm?
Acesta a fost un exemplu de
complexitate a modelării.
Am subliniat mai devreme
modelele pe care le
aveam pentru o
structură tridimensională.
Acest curs este în principal
despre măsurători.
Deci de ce model?
Aș susține că
atunci când măsurăm,
de fapt trebuie să modelăm.
Și trebuie să facem
asta nu doar
pentru a înțelege
datele biologice și chimice pe
care le colectăm.
Și dacă înțeleg,
putem avea diverse teste
pentru înțelegerea noastră.
Testele pot include,
dar nu se limitează la,
proiectarea unor
modificări utile ale unui sistem.
Cursul este în principal
despre sisteme.
Și prin folosirea modelelor noastre
pentru a proiecta o nouă variație
a sistemului și apoi
obținerea de date suplimentare
și modelarea acestor date noi,
obținem o mai bună
aproximare cu succes a ceea ce
înseamnă datele de bază.
Și o dovedim, adesea
cu modificări utile
care pot avea impact
asupra societății sau
asupra altor agende de cercetare.  Un
alt motiv pentru care modelăm
este pentru a partaja date.
De obicei, atunci când vă
uitați într-o bază de date, cei
dintre voi care v-ați uitat
la baze de date biologice sau chimice
, acestea nu sunt
date din baza de date, în
general vorbind.
Sunt modele acolo.
Iar lucrurile pe care le
descarci sunt modele.
Deci, de exemplu,
secvența pe care am arătat-o
la început--
adică 76 de nucleotide
de A, C, G și P--
este un model care
reprezintă interpretarea noastră
a unor tipuri de
modele fluorescente
pe care le vedem când rulăm
instrumentele pe amplificare.
ADN prelevat dintr-o
varietate de organisme.
Acesta este modelul.  În
mod similar, ARN-ul de
transfer rotativ tridimensional pe
care l-am văzut a fost probabil
mai evident un model.
Acolo, integrăm
chimia
mecanicii moleculare și
fizica
datelor de difracție unde atomii --
densitatea electronilor
dintr-o rețea cristalină
difractează și formează un model.
Noi integrăm acele
modele și asta este
ceea ce este distribuit în bazele de date.
Nu numai că
ne permite să partajăm date,
dar și modul în care
le partajăm este prin căutare.
Aceia dintre voi care ați căutat
fie baze de date biologice,
fie pe internet cu Google
sau așa ceva
știu cât de puternică
poate fi o căutare.
De obicei, este mai ușor
să cauți cu un model
și mai puternic și mai
precis să cauți cu un model
decât să cauți prin date brute.
Când îmbinăm seturile de date,
le vom alinia.
Vom găsi concedieri.
Vom integra
diferite concepte.
Asta necesită modelare.
Și, în sfârșit, verificarea datelor --
una dintre temele
acestui curs va
fi să vă îmbrățișați valorile aberante.
Când modelați
datele brute și
găsiți date care sunt foarte
departe de așteptări,
acesta este un lucru bun.
Vă permite să găsiți erori
în modelul dvs. sau erori
în datele sau descoperirile dvs.
Deci verificarea este alta.
În cele din urmă, integrarea --
așa cum am spus,
acest curs este despre
măsuri și modele.
Și nu este doar un
studiu al tuturor lucrurilor pe
care le puteți face cu calculul
în biologie și
biologie computațională, ci, cel mai important, este vorba
despre integrare.
Avem nevoie de mai mult de un
tip de date pentru a face progrese
în biologie și
medicină, agricultură.
Iar integrarea este una
dintre cele mai mari provocări pe
care le avem acum.
Este relativ ușor să colectați
un singur set de date omogen,
dar apoi să îl conectați
la restul lumii
este marea provocare pe care o
veți avea cu toții.
O temă care va merge pe
tot parcursul cursului
va fi această afacere despre
erori, două tipuri de erori,
aleatoare și sistematice.
Și de fiecare dată când
cineva vă înmânează niște date
sau vă colectați propriile date sau
aveți de-a face cu ceva
din literatură, ar
trebui să
presupuneți imediat că există atât
erori aleatorii, cât și erori sistematice.  Ar
trebui să știi care este
care și cât de mult există.
Nu ar trebui să acceptați
nimic ca fiind
adevărat fără calificare.
Erorile aleatorii înseamnă că, dacă
repeți experimentul din nou
și din nou, vei obține
variații ușor diferite
ale tipurilor de erori.
Și, într-o anumită măsură,
vor avea o medie
peste suficientă determinare.
Erori sistematice,
pe de altă parte,
aveți o probabilitate mare
de a obține aproape exact
aceeași eroare din nou și din
nou, sau un subset foarte mic
dintr-o anumită clasă de erori,
ceea ce înseamnă că doar dacă o faceți din nou
și din nou nu
vă va îmbunătăți.  statistici
sau îmbunătățiți acuratețea.
Trebuie să schimbați paradigmele
cu totul, culegând date
prin mai multe metode.
Deci, acestea sunt tipurile
de motive pe care le modelăm.
Și acum ar trebui să trecem prin
tipurile de modele pe care le vom face.
Acesta este un curs care se referă în
esență la secvență,
cum secvența duce la structuri
tridimensionale sau chiar
patru-dimensionale
în timp,
cum structurile tridimensionale
duc la funcționare, cum funcția
este încorporată în
sisteme complicate,
deci ce modele vom
căuta,  fuzionarea
și verificarea, așa cum am spus
în diapozitivul anterior.
Ce modele vom ordona?
Vom face ipoteza
în programarea dinamică, care
este doar un mod elegant de a spune
căutarea și alinierea -
programarea dinamică
va face ipoteza
că secvențele sunt
legate între ele.
Ei fac ipoteza în continuare că
sunt înrudiți prin strămoși.
Adică le-ai mutat
în laborator
sau poate ai fost
mutat înainte de a
veni în laborator.
Aceasta este programare dinamică
care poate alinia secvențe
sau
structuri tridimensionale care sunt destul de
diferite unele de altele.
Câteva diapozitive înapoi când
vorbim despre replicare,
dacă două lucruri sunt replicate --
arătând ascendența comună, să zicem --
fidelitatea
acelei replici
este cheia pentru --
programarea dinamică
este cheia pentru a accepta
că ceva este de fapt
replicat.
Dacă se transformă în
ceva complet nou
în procesul de
replicare, atunci este
puțin probabil că va
putea menține asta.  Structura
tridimensională - vom

vorbi despre
motive, cataliză,
suprafețe complementare.
Vă voi oferi un
exemplu frumos
de
suprafață gratuită în câteva diapozitive.
Și toate acestea se ocupă
de funcțiile continue
ale energiei și cineticii în care
diferite
suprafețe complementare se vor lega una de
cealaltă cu constante de viteză foarte specifice care
acoperă multe
ordine de mărime.
Acest fenomen energetic și
cinetic
este ceea ce stă la baza
genomicii funcționale.
Când folosim
date genomice funcționale, una
dintre modalitățile în care le
modelăm este să întrebăm
dacă fenomenele pe
care le studiem
în interiorul corpului nostru sau în interiorul
microorganismelor, așa mai departe -
nivelurile de proteine,
nivelurile de ARN
și așa mai departe, unde se
îndreaptă.  sus și jos
împreună înseamnă că
sunt un grup.  Au
proprietăți comune.
Aceste proprietăți comune
reflectă încă un aspect
al lor, cum ar fi
funcțiile lor comune
sau mecanismele lor comune,
pentru a fi coreglate?
În biologia sistemelor, avem
aceste diagrame calitative care ne
vorbesc despre tot
sau nimic, sau boolean,
ceea ce înseamnă zerouri și 1 logice.
Sau le putem trata ca ecuații
diferențiale continue
sau
stocastice în care
aveți o parte din puterea
ecuațiilor diferențiale,
dar aveți de-a face cu
molecule individuale
sau organisme
și populații individuale.
Organismele pot fi stocastice.
Moleculele pot fi stocastice.
Și încă un lucru - din nou,
această temă de optimizare - ne
putem întreba dacă o rețea sau o
componentă de rețea este optimă.
Este optim datorită
istoriei trecute a organismului
sau este ceva prin care putem stabili
un obiectiv al unui proces biotehnologic
pentru a-l optimiza pentru
o nouă funcție?
Programarea liniară este
instrumentul matematic pe
care îl puteți folosi
pentru a studia acest lucru.
Este comun în
algoritmii economici.
Așadar, vorbeam despre
modelare în tot acest tărâm,
trecând de la
secvențe minime de viață
prin cataliza
care implică interacțiuni
ale
structurilor tridimensionale, genomica funcțională
și optimitatea pe care o
obținem care este necesară,
așa cum vom vedea
momentan, pentru obținerea de
molecule individuale.  a munci.
Care este lista noastră de piese?  Vom
încerca
să începem simplu,
dar să punem simplitatea în
contextul imaginii de ansamblu.
Imaginea de ansamblu a
atomilor este tabelul periodic
al celor peste 100 de elemente.
Avem o listă foarte scurtă aici:
sodiu, potasiu, ioni,
clor, calciu, magneziu,
molibden, mangan, sulf,
seleniu, cupru, nichel,
cobalt și siliciu, care
sunt utile la multe specii.
Dacă trebuie să alegeți
ceva care are
legătură cu noi ca un
sistem biochimic minim care arată
unele dintre
proprietățile replicative
și
proprietățile evolutive ale vieții,
ați spune viața bazată pe ARN.
Una dintre descoperirile
în știința experimentală
din ultimele
două decenii este
recunoașterea faptului că
ARN, ca și proteinele,
are capacități catalitice.
Are potențialul
de a fi fost una
dintre primele unități de replicare.
Doar de dragul de a
descrie un sistem simplu, să ne
uităm la ceva
format din cinci elemente.
Nu este neapărat cel
mai simplu,
dar este doar ceva la care să te
gândești.
Aceste cinci elemente
pot fi în prezența
unui mediu care poate
fi compus din aceleași cinci
elemente.
Mediul
ar fi foarte simplu,
acea complexitate
versus simplitate.
Ar fi apa,
amoniu, ioni încărcați pozitiv
, trifosfat de nucleotide, ionii
încărcați negativ
, care sunt precursori
pentru a face polimeri,
și apoi eventual lipide,
substanțele grase
care leagă membranele.
Un exemplu de
polimerizare a ARN catalizat
este în acest articol
și apoi mă voi
ocupa de altul
care, în loc să
folosească
trifosfați de nucleotide,
folosește precursori de ARN puțin mai mari
.
Acum să începem să
comutăm înainte și înapoi
între sistemele vii
și sistemele de calcul,
astfel încât, indiferent dacă sunteți dintr-
un fundal computațional
sau biologic sau
ambele, să vedeți
câteva relații interesante.
Aici am vorbit despre un
sistem biologic minim
cu cinci elemente.
Aici vom vorbi
despre câteva probleme minime
cu un număr foarte mic
de elemente.
Practic, acestea sunt limitate la
o singură linie de cod fiecare.
Și fac ceva care
are legătură cu subiectul de aici.
Replicarea este un
proces exponențial, în creștere exponențială.
Dacă ceva este autocatalitic
este un alt mod de a-l descrie.
Așa că am folosit-o ca
temă pentru programele noastre minime.
Ce este această
funcție exponențială?  Îi
dăm un
argument foarte concret.
Argumentul este 1.
Deci acesta este e la puterea 1,
e fiind acest număr aici
care este reprezentat de
numărul de ori, aproximativ 2,7.
Cele patru limbi pe care le
demonstrăm aici
sunt Perl, Excel, Fortran
77 și Mathematica.
În acest curs, vom folosi în principal
Perl și Mathematica
din motive care vor fi evidente
în următoarele două diapozitive.
Dar vreau doar să
vă arăt pe acestea diferite.
Și în tema
acurateței replicării,
cât de fidel este tratat un anumit
șir, fie
șirul de nucleotide
într-o formă simplă de viață,
fie șirul de
cifre dintr-un număr -
și puteți vedea că
reprezentarea internă
a matematicii care merge
în interiorul computerului
trebuie făcută digital,
chiar dacă acestea
sunt numere transcendentale
care au un
număr arbitrar de cifre.
Și puteți vedea că unele
programe sunt de obicei limitate.
Și puteți chiar ghici
numărul de biți care îl reprezintă
intern.
Aici, în partea de
jos a diapozitivului 17,
puteți vedea câteva dintre
detaliile esențiale
ale modului în care aceste lucruri
sunt reprezentate
ca 0 și 1 reprezentând
[INAUDIBIL],
exponentul și așa mai departe.
Dar puteți vedea unele dintre aceste
programe, când se imprimă,
când se imprimă efectiv,
programul nu este conștient
sau programatorul
nu a știut exact care
este reprezentarea internă.
Și deci toate aceste
0-uri finale sunt incorecte.
Câștigătorul în asta,
desigur, este Mathematica,
aici pentru a cere
puterea e la 1.
Spuneți, să-i dăm...
această n paranteză spune să începem să
dăm o precizie arbitrară în
cazul în care numărul,
numărul n, este de 100 de cifre.
Și aceasta pare o cascadorie
în acest caz particular.
Dar, de fapt, atunci când începi să
faci o serie de calcule în
care se pot
acumula erori, capacitatea
de a intra în precizie arbitrară

vă va permite să preveniți o
imprecizie catastrofală.
Și ceea ce se întâmplă este că, într-un
calcul matematic,
dacă are nevoie de puțin mai multă
precizie decât ați
anticipat inițial, se va
stinge și o va obține
de la sine, ceea ce
este destul de remarcabil.
Încercați să faceți asta în oricare dintre
aceste alte limbi.  În mod
obișnuit,
vă vor da ceea ce
se numește o
eroare de depășire sau de depășire
și fie să se oprească, fie
să facă greșeli.
BINE.
Aceasta este prima mea reclamă
pentru Mathematica.
Puteți vedea că toate acestea sunt
programe foarte simple, care neagă
și se ascund sub
electronicele
și algoritmii foarte complicati care sunt
încorporați pentru a realiza acest lucru.  Îți
voi da o
idee despre ceea ce
este în doar câteva diapozitive.
Deci, înapoi la auto-replicare.
Comutăm înainte și înapoi
între sistemele biologice simple și cele
de calcul.
Avem... aici am reprezentat
tri și hexanucleotide, trei
nucleotide și șase.
Din nou, amintiți-vă, aceste
litere sunt brute--
sau ar trebui să spun
reprezentări simple
ale densității electronice care
implică zeci
de atomi sub forma unei
citozine, sau a unui C, sau a guaninei
sau a unui G. Este important să
știți
că există două
catenele din ADN, de obicei,
sau chiar multe ARN--
în acest exemplu special,
indiferent dacă acesta este ARN sau ADN.
Și pentru a indica
orientarea șuviței,
are o direcționalitate.
Indicăm 5-prim,
care este numele
unui atom din
riboză, dar detaliile nu
sunt importante din
punct de vedere computațional.
Este doar o modalitate de a indica că
acesta este un capăt al ARN-ului.
Și un CCG nu este
același lucru cu un GCC.
5-prim indică
capătul 5-prim al acestuia.
Luăm două dintre acestea, care
sunt practic identice,
și se vor liga
împreună spontan
dacă ați configurat
corect chimia
pentru a transforma aceste două trinucleotide
într-o hexanucleotidă, CCG CCG.
În prezența
unui complement aici,
care este CGG CGG, o
secvență diferită--
am încercat să subliniez că
făcând-o capitală și verde--
care s-ar lega de--
aceste două trinucleotide
s-ar lega
de aceasta, aliniată de
Watson  - Perechi de baze Crick.
Regulile pentru perechile de baze Watson-Crick
, probabil că mulți dintre voi le cunoașteți.
A se împerechează cu T
și C se împerechează cu G.
Și asta va
cataliza acest proces.
Va accelera cinetica
în care aceste trinucleotide
[?  întoarce?] [?  în ?]
hexanucleotide.
Acum, aici devine interesant.
Această hexanucleotidă
scade acum aici
și accelerează procesul
acestei trinucleotide diferite
[INAUDIBILĂ] și formând
cea originală care
catalizează prima reacție.
Deci aceasta catalizează,
accelerează prima reacție, care
produce un produs
care o accelerează pe
a doua, care produce
primul catalizator și așa mai departe.
Acesta se numește
hiperciclu, susținut
de Eigen și Schuster.
Și acesta este probabil unul dintre cele
mai simple exemple ale acestuia.
Și cred că
vă dă o impresie despre modul în care
o varietate de
procese biochimice interdependente
pot duce la
autocataliza, unde
obțineți aceste cicluri exponențiale
pe care le recunoaștem ca fiind ceva
foarte asemănător cu replicarea.
Acest lucru ar
avea o probabilitate foarte mare
de replicare.  Ar
putea fi foarte fidel,
dar complexitatea sa este scăzută.
Complexitatea de intrare este scăzută, iar
complexitatea de ieșire este scăzută.
Așa l-am califica.
Trecând înapoi la calcul
și exemple simple,
am dat deja câteva exemple simple
de Perl în Mathematica.
Dar pentru a mai oferi
câteva aici pe slide 19,
de ce i-am ales pe acești
doi pentru acest curs?
Experiența mea a fost, atât
în ​​mediul nostru de laborator și de cercetare
, cât
și în această clasă,
că acestea sunt două dintre cele
mai ușor de învățat limbi.
Asta nu înseamnă că
sunt absolut ușoare,
dar
curba de învățare este foarte simplă.
Este foarte rapid.
Și puteți, de
exemplu, să schimbați foarte repede programele
care funcționează
în lucruri care
fac ceea ce doriți.
Este o limbă de nivel înalt
într-un sens - cu
cât nivelul limbii este mai ridicat
, cu atât
ești mai aproape de
conversația în engleză.
Cu cât nivelul
de limbaj este mai scăzut, cu atât
ești mai aproape
de biți, 0 și 1
sau de electronica reală din
interiorul computerelor.
Deci, în ierarhie,
Perl și Mathematica
sunt foarte sus acolo.
Da.
PUBLIC: De unde
obțineți parola
pentru a descărca Mathematica?
GEORGE CHURCH: Veți obține
asta de la colegele dumneavoastră de secție
.
Da.
Deci, întrebarea este
de unde obțineți
parola pentru
Mathematica pentru acest curs,
iar colegii de predare
sunt responsabili pentru asta.
Și asta a fost testat.
Cred că funcționează.
Deci Perl este liber --
este open source.
Este interesant în acest sens.  Cred că
mulți dintre voi veți găsi
conceptul de sursă deschisă
acolo unde oricine poate --
când software-ul se defectează sau
trebuie extins,
sau trebuie să fie înțeles,
este acolo pentru inspecția dvs.,
mai degrabă decât ascuns în spatele
unor uși corporative.  Un
aspect foarte interesant al lui Perl.
Mathematica nu este open
source din câte știu eu.  Totuși,
are câteva
caracteristici interesante de răscumpărare.
Este foarte puternic la matematică.
Nicio surpriză având în vedere numele său.
În special, este atât
simbolic, cât și numeric
și în grafică.
Și vom avea câteva exemple
în acest sens într-un moment.
Poate face lucruri
greu de făcut
în Perl și în alte limbi.
Perl este, de asemenea, foarte puternic
pentru aplicațiile web.
Multe dintre cele mai uimitoare lucruri
care se fac pe web
au Perl în culise.
Acum, când noi... o
altă comparație a...
aceasta este partea întunecată a
calculului și a biologiei,
arătând o altă analogie,
care este paraziții.
Avem
computere parazite și
viruși biologici virali.
Acesta-- în ultimii ani, am avut un
mic virus de computer--
asta nu este totul.
Aceasta este doar o
mică bucată din ea.
Este un cod destul de scurt.
Și acesta a fost unul foarte urât
la acea vreme, cu ceva timp în urmă.
Și l-am avut în
prezentarea PowerPoint.
Când oamenii
îl descărcau,
apoi îmi trimiteau un e-mail.
Îmi pare rău să vă informez că
aveți un virus în PowerPoint.
Și astfel, anul acesta, am
actualizat PowerPoint-ul.
Deci aceasta este de fapt o imagine
mai degrabă decât textul real.
Și astfel detectorii tăi virali
nu vor
detecta asta decât dacă sunt mult
mai inteligenți decât cred că sunt.
Acesta este, pe de altă parte,
costurile acestor viruși.
Aceasta nu este o chestiune de râs.
Acesta este de 4 ori mai mare decât costul
întregului proiect al genomului uman
pe an.
Proiectul Genome ne-a luat
aproximativ 20 de ani să pornim.  În
fiecare an, cheltuim de
patru ori această sumă
pe viruși informatici, care
sunt, din câte îmi dau seama,
complet frivoli.
Și mai grav este asta.
Acum, acesta este text real.
Aceasta nu este o imagine.
Ți s-a părut o imagine.
E foarte grav.
Și sper sincer că unii
dintre oamenii din această clasă să
contribuie la
căile intelectuale care
vor duce în cele din urmă la
înfrângerea virusului SIDA
și a diferitelor alte viruși și
bacterii ca ei care provoacă
atât de multă suferință în lume.
20 de milioane au murit.
Acest lucru este mai rău decât
Ciuma Neagră și epidemia de gripă din 1918
.
Și analogia aici între
această parte a virusului...
aceasta este o mică parte din
codul viral în simbolurile
codului cu o singură literă de 20 de aminoacizi.
Aceasta este o mică bucată
din virusul informatic.
Și am evidențiat
aici comanda copie
în virusul informatic.
Aceasta este doar o parte din ceea ce
face pentru a introduce acest script VBS special
, lucrul pe care îl
vedeți aici,
într-o altă parte
a directorului dvs.
Și aceasta, în esență, face parte
din comanda de copiere a
virusului SIDA.
Aceasta este polimeraza.
Proteina este responsabilă
pentru realizarea de copii
ale codului virusului.
Și evidențiate cu
roșu, aici sunt câteva
dintre mutațiile care
fac acest virus special SIDA
rezistent la medicamentele
care au fost esențiale,
în unele cazuri, în îmblânzirea SIDA
temporar și cu costuri mari.  În mod
clar, vaccinurile și, sperăm,
alte măsuri de sănătate publică,
vor fi răspunsul.
Iată și alte
conexiuni conceptuale.
Acestea nu sunt menite să fie dogme
sau să vă limiteze în vreun fel,
ci sperăm să extindă modul în care
gândiți aceste lucruri.
Evident, ca și în cazul
altor analogii,
acestea se vor defecta.
Dar să
urmăm doar pentru o clipă.
Ceea ce numim
set de instrucțiuni,
conceptul de
set de instrucțiuni, în computere este un program,
în organisme este un genom.
Am spus deja biți, deci
0 și 1, A, C, G și T.
Memoria stabilă,
lucru de care poți depinde,
dar este puțin
lent pentru acces,
sunt discuri și benzi din
computere, și ele.  re ADN
sau, în unele cazuri, genomi ARN.
Atunci, îl scoți din
memoria lentă, din memoria stabilă
și îl muți în
ceva
mai activ, mai
volatil, care
este memoria cu acces aleatoriu
în computere
și ARN-ul în organisme.
Mediul pentru calculatoare
tinde să fie complex -- sunt

prizele de internet și oamenii care
lovesc de tastatură -- în timp ce
organismele pot fi foarte simple.
Am dat câteva exemple
mai devreme unde este complex,
dar poate fi la fel de simplu ca
apa și sărurile, în care
pot reproduce
structuri foarte complicate.
Intrarea și ieșirea pot fi --
intrarea poate fi
analogică și convertită
în digital în acest proces,
analogă digitală pentru ieșire --
analogul, să zicem,
al ecranelor dvs.
Și input-output este
guvernat de aceste proteine
la sfârșitul
dogmei centrale în organisme.
Când facem aceste
sisteme complicate din lucruri simple,
ele pleacă de la așa-numiții
monomeri, care într-adevăr se combină
în polimeri, care
nu trebuie să fie polimeri liniari,
deși adesea sunt
în sisteme biologice -
practic, treci de la
minerale la cipuri în computere.  .
Acestea sunt reproduse
în fabrici.
Fabricile sau celulele pot
fi la fel de mici ca femtolitru.
Amintiți-vă, acest prefix, acest
femto, este de la 10 la -15.
Adică aproximativ 1 micron cub.
Fabrici foarte mici,
productivitate
și complexitate foarte uimitoare.
Din nou, intrare-ieșire ca mai sus.
Iar comunicarea este
extrem de rapidă în computere, mai
lentă, dar foarte
bogată în organisme.
După o pauză foarte scurtă - ne
putem întinde - ne vom întoarce
și vom vorbi
mai detaliat despre cum
sunt făcute computerele
și cum
sunt făcute sistemele biologice.
Mulțumesc.