Următorul conținut este furnizat de MIT OpenCourseWare sub o licență Creative Commons. Informații suplimentare despre licența noastră și despre MIT OpenCourseWare în general sunt disponibile la ocw.mit.edu. PROFESORUL: Gata? BINE. Ei bine, bun venit la a treia prelegere. Revizuire rapidă a ceea ce am făcut ultima dată - primul diapozitiv. Am vorbit despre purificare, practic la fiecare nivel al ierarhiei în complexitate, de la elemente până la organisme și, în special, purificarea minunată pe care o poate obține prin diluare în serie până la molecule individuale - molecule de ADN recombinant , în acest sens. caz, încorporat în celulele E. coli-- și cum această purificare a dus la o revoluție, mai întâi în biochimie, apoi în ADN-ul recombinant. Biologia moleculară a condus apoi la Proiectul genomului și la biologia sistemelor, care ne aduce la modele de interconexiuni. Și pentru a începe cu algoritmi care sunt utili în biologia sistemelor, începem cu unul dintre cei mai simpli și mai robusti, care este acest cod genetic, afișat aici în colțul din dreapta jos. Dar, pe măsură ce te uiți la uriașa diversitate din arborele vieții, găsești exemple de excepții la aproape tot ce poți găsi, inclusiv codul genetic. Și am vorbit despre cum să prețuim excepțiile, ca de obicei, aici. Și apoi, revenind la biologia sistemelor, în ceea ce privește modul în care se creează modele calitative și cantitative din datele genomice funcționale și se stabilește dovezi. În cele din urmă, am încheiat cu mutații și selecție, așa cum vom face în toate cele trei prelegeri de aici. Această prelegere se va concentra în special pe mutații și selecție. Deci care este meniul de azi? Vom începe cu tipurile de mutanți și modul în care sunt reprezentați în scopuri bioinformatice. Vom vorbi despre cele trei metode principale prin care apar mutații, derivă și selectează, astfel încât să puteți determina frecvența diferitelor alele în populații. Pentru a face asta, ne vom baza pe prietenul nostru din prima prelegere, distribuția binomială, în contextul unei populații în creștere exponențială. Apoi, vă oferim aici o pregătire foarte practică despre studiile de asociere, unde îl ilustrăm cu un exemplu foarte important de rezistență la HIV și o statistică foarte utilă , ușor la fel de utilă ca binomul și gaussianul - statistica chi pătrat. Și apoi, vom continua să vorbim despre asociere în contextul alelelor cauzale și despre importanța obținerii de haplotipuri, și apoi despre tehnologiile necesare care au fost utilizate pentru a obține primul genom cadru și cum s-ar putea schimba strategia de obținere a genomilor ulterioare în pentru ca aceste studii de asociere foarte mari să fie rentabile. Și, în sfârșit, în contextul acestui lucru, vom vorbi despre erorile aleatoare și sistematice mai detaliat, astfel încât să obțineți o mulțime de exemple și moduri de a le gestiona computațional. Așadar, pentru a pleca de la scurta noastră discuție despre prietenul nostru, identitatea secvenței de ADN 100% sau identitatea secvenței de aminoacizi pe care le-ați putea găsi în proteina cristalinului și enzima enolază, putem vedea că, chiar și la 100%, puteți găsi diferențe. în funcțiune. Și astfel măsurile funcționale sunt un bun adjuvant pentru identitatea ADN-ului sau a aminoacizilor. La o identitate de 99,9%, vorbim despre nivelul de polimorfisme cu o singură nucleotidă care ar putea exista între oricare două poziții ale mamei tale și cromozomii tatălui tău din corpul tău sau despre diferențele dintre unul dintre genomii tăi și unul dintre genomul meu. Cam o dată la fiecare kilobază, va exista un polimorfism, o diferență. Este adesea o singură nucleotidă, un A pentru un G. Apoi, pe măsură ce trecem la diferențe de 98%, atunci vorbim despre diferențele dintre unul dintre genomul nostru și genomul unui cimpanzeu - cu alte cuvinte, un gen complet diferit și specii. Cu toate acestea, după criteriul pe care l-am menționat într-o prelegere anterioară despre definițiile bacteriene ale speciilor, acestea ar fi aproape identice și ar trebui să mergeți la identități mai mici de 70% pentru a o numi o nouă specie bacteriană. Deci puteți vedea că acesta este un număr foarte slab, foarte dependent de context și de ramura arborelui vieții cu care lucrați. Apoi, avem omologie de secvență și omologi foarte îndepărtați care sunt detectabili doar, așa cum vom vedea când vom ajunge la secțiunea de proteomică a acestui curs, prin structuri tridimensionale, nu prin secvență. Și acea schimbare-- omologie de secvență va fi subiectul prelegerii următoare, iar cea foarte îndepărtată în structurile 3D va fi mai târziu, în proteomică. Dar asta se întâmplă la aproximativ 25% până la 30%. Acesta este doar un memento și un diapozitiv introductiv pentru următorul diapozitiv. Avem efecte fenotipice diferite datorită diferitelor tipuri de mutații. Și ignorând fenotipurile despre care am vorbit înainte, aveți tipurile de mutații. Clasele sunt mutații nule, dozare, mutații condiționate, câștig de funcție, specificitate modificată a ligandului. Acum, asta în termeni largi, colocvial. Dar cum se realizează acest lucru la un nivel mai molecular și cum îl reprezentăm compact pentru discuțiile bioinformatice? Deci avem substituții unice. Acestea pot fi un singur par de bază, o pereche de baze AT, la o pereche de baze CG sau o pereche de baze GC la o pereche de baze TA și așa mai departe. Pot exista ștergeri și duplicari. Acestea pot varia. Delețiile și dublările sunt la fel de mari ca un cromozom sau la fel de mici ca o singură pereche de baze. Puteți șterge acel A în loc să îl schimbați într-un C și ar fi o pereche de baze. Deci, când ștergi un cromozom întreg, asta se numește aneuploidie. Exemplul din diapozitivul anterior a fost trisomia 21. Dacă eliminați acel cromozom 21 în loc să aveți trei copii ale acestuia, ar fi monosomie. Și acestea sunt consecințe uriașe, chiar dacă sunt modificări destul de subtile ale dozei. Acum, o clasă specială de ștergere și duplicare apare atunci când aveți o repetare în tandem a unei secvențe. Când aveți oriunde de la o singură bază repetitivă, AAAAA, sau dinucleotidă, trinucleotidă, până în sus, acestea au o tendință foarte mare atât pentru mutație directă, cât și inversă , atât deleții, cât și duplicări, pentru că la nivel foarte mic, aveți polimerază alunecarea și alte evenimente microscopice. Și apoi, la nivel mai larg, aveți un fel de recombinare, adesea o recombinare omoloagă, care are loc care provoacă ștergeri și dublări ale repetărilor tandem. O inversare aici. Reprezentăm un eveniment chimic complicat, care implică ADN-ul dublu catenar care trece de la 5 prim la 3 prim pe catena superioară, de la stânga la dreapta, și de la 5 prim la 3 prim pe catena inferioară, mergând de la dreapta la stânga. Și luați o mică bucată din asta și o răsturnați astfel încât să rupeți niște legături și să le refaceți. Toate cele 3 prime sunt conservate, dar ați făcut o completare inversă a firului de sus și a firului de jos. În acel complement invers, practic transformi Cs în G și schimbi ordinea. Aceasta este uneori abreviată pentru descrierea genetică simplă. Să presupunem că am inversat CDE. S- ar putea să schimbați carcasa sau să îi adăugați numere prime, să o colorați. Într-un fel sau altul, indicați că acum este un complement invers și, desigur, ordinea genelor sau ordinea segmentului ADN este inversată pentru a indica acea inversare. Translocațiile, inserțiile și recombinarea au în comun că vei face o pauză undeva și apoi vei aduce o nouă bucată de ADN, la fel ca inversarea, în care te-ai inversat în loc. Aici, implică ceva care acționează mai mult de la distanță. Vei rupe între B și C și X și Y și, în acest caz, vei face o translocare reciprocă în care vei conserva tot ADN-ul, iar A și B sunt acum lângă Y și Z. O inserție este așa. , dar acum ADN-ul nu trebuie să fie reciproc în niciun sens. Poate veni, mai mult sau mai puțin, din spațiul cosmic. Aici, a venit din Grecia. Poate fi un element transposabil care a venit de la cine știe unde și s-a introdus între A și B. Recombinare. Aici, am ilustrat această recombinare omoloagă. Și puteți avea o combinație non-omologă, dar aceasta este de departe cea mai comună și interesantă. Chiar și unele recombinări non-omoloage implică regiuni scurte de omologie în care practic aveți fie doi cromozomi surori, fie omologi de la mamă și tată sau paralogi în genom în care trebuie să duplicați o genă care ar putea fi chiar pe același braț de cromozom. Și acum, la fel ca și în cazul ștergerilor și duplicării, în cazul în care aveți repetări în tandem, dacă aveți repetări oriunde în genom, puteți lua o mică diferență. Subliniem asemănările aici, dar au câteva mici diferențe care vă permit să le urmăriți. Acestea pot fi schimbate prin ADN monocatenar sau dublu catenar, diverse chimie și puteți fie să faceți un schimb reciproc frumos aici, în care păstrați tot ADN-ul și micul C înlocuiește cel mare C printr- un fel de încrucișare între D. și E, undeva între C și F, sau poți avea un schimb non-reciproc în care iei un pic de C și îl dublezi, iar acum nu mai rămâne nici un C mare și doar un C mic. Se numește conversie genică. Dar înțelegi ideea. Acestea sunt o listă destul de exhaustivă a tipurilor de mutații simple și elementare pe care le puteți avea. Acum, le puteți strânge în diferite combinații unele cu altele și, pe perioade lungi de timp, puteți obține secvențe complet noi. Există chiar modalități prin care puteți obține sinteza de novo a ADN-ului, cum ar fi mecanismele transferazei terminale, care este folosită... da? PUBLIC: Care sunt [INAUDIBILE]? PROFESORUL: Oh, vom ajunge la asta puțin mai târziu, dar vă pot oferi o previzualizare. În genomul uman, aceste mutații punctuale au avut loc aproximativ 10 până la minus 8 per pereche de baze per generație. Ștergerile și dublările, în special în regiunile în tandem, pot fi cu până la șase ordine de mărime cu o frecvență mai mare decât aceasta. Deci, există o variație uriașă de la poziție la poziție și tipurile de alele care vor determina rata de mutație și ar trebui să fiți destul de conștienți de asta pe măsură ce treceți prin diferite exerciții de calcul. Aceasta este doar un pic de nomenclatură acceptată în mod obișnuit. Mutațiile și polimorfismele sunt practic același lucru. Sunt diferențe între tine și mine. Ele devin polimorfisme, adică atunci când sunt alele comune, când frecvența lor este mai mare de 1% într-o populație. Acest lucru este comun în comunitatea genomului uman. Poate diferi pentru altele. Dar cam aici o mutație care este rară -- mai puțin de 1% -- devine un polimorfism, care este frecvent -- mai mult de 1%. Ca contrapunct la aceasta, aș spune că există șanse mari ca fiecare posibil polimorfism mononucleotidic care ar putea exista într- o populație la fel de mare ca a noastră și rate de mutație care sunt modeste, dar totuși, pe perioade lungi de timp, permit acumularea de mutații astfel încât, în loc să avem aproximativ 3 milioane de polimorfisme comune cu o singură nucleotidă , sau SNP-uri, am putea avea 12 miliarde -- unul la fiecare poziție. Și într-un diapozitiv ulterioar, vom trece de fapt și vom calcula brut de ce frecvența ar trebui să fie în jur de 10 până la minus 5 și de ce ar trebui să fie aproximativ 10.000 de noi reprezentând fiecare dintre aceste așa-numite alele rare. Sunt rare individual, dar sunt comune ca grup. Va face o diferență dacă vorbim despre dacă aceste polimorfisme sunt legate de trăsătura ta preferată sau dacă o cauzează de fapt, dacă fac parte din cauză. Nu se poate spune că nimeni anume este 1-la-1 cu o cauză. Totul este o colecție de mutații și mediu. Acum, haplotipuri. Ce înțelegem prin haplotipuri? Am introdus SNP, polimorfisme cu o singură nucleotidă . Dacă aveți un SNP care, să spunem, este implicat în cauzarea unui APOE4, vom introduce într-un moment, o alelă care este asociată cu risc crescut de apariție a bolii Alzheimer - și să spunem că proteina are o schimbare cunoscută în proteină. structură tridimensională și puteți numi asta alela rea sau alela asociată. Acum, dacă acea proteină a fost exprimată la un nivel scăzut -- de exemplu, dacă ați avut o mutație de promotor sau o mutație de amplificator -- atunci acel haplotip, acea combinație de mutație de promotor și mutație de proteine, este un predictor mai semnificativ decât oricare dintre ele separat. . Și faptul că sunt pe același cromozom este important pentru că dacă promotorul sau amplificatorul care determină nivelul proteinei în cis, adică pe același ADN, sau în trans, face o diferență uriașă. Deci despre asta se referă haplotiparea. Este determinarea ce mutații sunt în cis pe același ADN pentru a face asocieri semnificative din punct de vedere biologic și, în ceea ce privește biologia sistemelor, interpretarea lor, în ceea ce privește ceea ce știi despre elementele de reglare și elementele proteice. Aceste haplotipuri pot fi deduse indirect din datele diploide din modul în care alelele se segregă în familii mici sau în frați și așa mai departe. Or, mai ușor de gândit și probabil mai precis, în general, mai ales cu seturi limitate de date, este observarea directă. Cea mai extremă observație directă este că scoateți o moleculă de ADN care are, să zicem, mutația dvs. de promotor în mutația dumneavoastră presupusă a proteinei, sau doar o serie de polimorfisme legate. Prin clonarea sau prin izolarea fizică a acelei molecule de ADN, o puteți secvența și puteți determina. Prin definiție, dacă toate sunt în aceeași secvență, atunci sunt pe aceeași moleculă. Dar trebuie să fii atent la metoda de secvențiere pe care o folosești acolo și la metoda specifică de clonare și/sau separare fizică , deoarece există anumite metode prin care poți obține o secvență himerică fie datorită clonării a două specii împreună, fie dezasamblarii cumva. ei prin bioinformatică. De asemenea, îl puteți observa direct atunci când treceți prin procesele genetice ale mitozei, despre care am vorbit mai înainte, și anume că, pe măsură ce celulele se divid, ele despart cromozomii sau meioza, care este procesul prin care ajung. pregătit pentru recombinare, la care vom reveni peste puțin timp. Deci, atunci când doriți să faceți acest lucru prin legătură, doriți să faceți o observație directă. Și cel mai bun mod de a urmări haplotipul este, dacă există o diferență la fiecare poziție atât în părinți, cât și copilul moștenește acele diferențe, atunci se numește informativ. Dacă părinții se întâmplă să împărtășească un polimorfism cu o singură nucleotidă, chiar dacă copilul este un heterozigot pentru unul dintre ei, s- ar putea ca părinții să aibă alele suplimentare care pot încurca lucrurile și nu este informativ. Dar ideea este că, dacă aveți suficiente polimorfisme cu o singură nucleotidă , puteți face un studiu caz-control în care aveți o mulțime de copii care sunt afectați pentru orice trăsătură care vă interesează și, sperăm, un număr aproape egal. care sunt în grupul de control care nu o au. Un exemplu în acest sens - și încerc doar să vă ofer o aromă pentru asta și unde să căutați, mai degrabă decât să vă împuternicesc complet în acest sens, pentru că ar fi un curs complet separat -- dar puteți căuta asociere. Și trebuie să vă faceți griji pentru lucruri precum structura și amestecul, unde ați avut populații care s-au dezvoltat independent în diferite părți ale lumii și s-au amestecat aleatoriu, ceea ce face parte din modelul acestor populații separate. Dar apoi, îi reuniți foarte recent, iar acum nu mai este corect să o modelați ca și cum ar fi o populație care se amestecă uniform. Și ne vom referi pe tot parcursul cursului la ipoteza nulă, care este lucrul pe care încercați să îl excludeți, iar probabilitatea se referă la probabilitatea ca să puteți respinge această ipoteză nulă. Și în acest caz, încercați să respingeți faptul că frecvențele alelelor din locusul candidat, indiferent de ce ați ales, nu depind de fenotipul din subpopulații. Și așa se ocupă ei de aceste studii de caz. Acum, care sunt unele dintre motivațiile pentru a studia fie polimorfismele individuale, fie haplotipurile - combinațiile de polimorfisme pot afecta activitatea unei proteine? Acum, aș putea folosi sute de exemple diferite de exemple bine stabilite și utile. Dar iată unul care, sperăm, va atinge o coardă rezonantă, în sensul că acestea sunt de fapt utilizate acum în anumite situații clinice și, cu siguranță, în cercetarea clinică, pentru a se întreba dacă o populație de pacienți, fie în procesul de dezvoltare a unui nou medicament, fie utilizând un medicament stabilit pentru a menține toxicitatea pacientului în jos și eficacitatea crescută. Și astfel, în coloana din stânga extremă, este afectată gena sau enzima? Și apoi, la mijloc sunt exemplele noastre de medicamente care interacționează cu această enzimă. Și apoi, efectul cantitativ este în extrema dreaptă. De exemplu, tiopurin metiltransferaza este ceva care, dacă aveți o cantitate mare de activitate, fie că aveți, de exemplu, o enzimă foarte activă și/sau un element promotor foarte activ care provoacă niveluri ridicate ale acesteia, atunci aceste diverse chimioterapice care sunt utilizate pentru combaterea cancerului - cantitatea acestora trebuie ajustată. Deci aveți o mulțime de metiltransferază. Asta înseamnă că trebuie să administrați o mulțime de medicament, altfel studiul dumneavoastră de droguri va eșua, sau pacientul dumneavoastră va ceda cancerului, deoarece este ineficient. Nu ai adăugat suficient. Tiopurin metiltransferaza depășește medicamentul. Pe de altă parte, dacă aveți niveluri foarte scăzute ale enzimei modificatoare, doriți să reduceți doza, altfel veți avea toxicitate. Deci acesta este un exemplu care este de fapt folosit în situații clinice în care puteți utiliza informațiile pentru a ajusta nivelurile de medicamente sau pentru a stratifica populația de pacienți, astfel încât să plasați pacienții în diferite clase sau să- i excludeți din studiu pentru că știți că medicamentul va avea vreun efect rău. Și asta, sperăm, scade costurile. În dezavantajul dezvoltării farmaceutice, dacă vă stratificați populația de pacienți și treceți prin studiul de droguri cu această avertizare, atunci FDA vă va cere să puneți această condiție, ceea ce face ca dimensiunea populației care va cumpăra medicamentul mai mic, deoarece costurile de dezvoltare a medicamentului sunt destul de fixe. Scade profitul. Acum, am subliniat că poate exista un număr foarte mare de polimorfisme rare cu o singură nucleotidă . Dar în ceea ce privește cele comune, suntem destul de aproape de a le satura pe cele comune. Și există baze de date cu acestea, la fel cum există baze de date cu aproape tot ce vă puteți imagina, unele dintre ele mai bune decât altele. Cele comune vor fi, desigur, cele care fie sunt neutre, în ceea ce privește efectul lor fenotipic. Adică, nu contează cu adevărat dacă sunt o alelă comună sau cealaltă. Una dintre alele ar putea fi la 30% și cealaltă la 70%, dar ambele sunt destul de neutre în ceea ce privește funcționarea. Sau ar putea fi că ambele oferă avantaje diferite în scenarii diferite. Sau heterozigotul, unde ai unul față de celălalt, oferă un anumit avantaj, iar asta îl menține în populație. Dar este puțin probabil ca acestea să fie foarte dăunătoare, deoarece alelele extrem de dăunătoare vor fi rare. Vor fi selectați împotriva lor. Și o vom modela pe deplin într-un moment. Acum, să spunem că, într-un fel, oricine și-a dorit genomul și- ar putea avea genomul mâine. Ai putea avea secvența ta completă a genomului. Cum, atunci, ca biologi computaționali, ați da prioritate polimorfismelor cu o singură nucleotidă pe care le găsiți acolo, în raport cu întreaga secvență a genomului, care se află în GenBank? Acum, acesta ar fi un proiect excelent pe care să-l faci pentru proiectul pe termen lung. Dar ce ați putea spune, în primul rând, ce polimorfisme cu o singură nucleotidă ați arunca, de exemplu, sau ați pune jos pe lista dvs. de priorități? Sau pe care le-ați pune în fruntea listei dvs. de priorități? Da? PUBLIC: Intronii ar avea prioritate scăzută. PROFESORUL: Bine, introni. PUBLIC: Poate că acesta este un lucru foarte simplist de spus, dar cred că [INAUDIBIL] contează dacă sunt diferiți unul de celălalt. [INAUDIBIL] PROFESORUL: E bine. Fiecare are propria parte din genom care nu-i place. Intronii aproape au scufundat Proiectul Genome. Ei au spus, de ce vom ordona 98% din genom care nu codifică proteine? Din fericire, am mers înainte și am ordonat-o oricum. Un alt lucru preferat pe care oamenii îl menționează este ADN-ul repetitiv. Asta a fost o altă parte a genomului. Dar ei nu l-au secvențat de fapt din Drosophila, ADN-ul repetitiv. Și se consideră că nu codifică proteine. Și o să vă dau câteva exemple, pe măsură ce vom parcurge aici, pentru a ilustra alte puncte, dar și pentru a ilustra faptul că regiunile repetitive care nu sunt în regiuni care codifică proteine , fie introni sau alte regiuni necodificatoare, pot fi important. Și iată un exemplu. Acesta este unul dintre cele mai repetitive elemente din genomul uman. Se numește repetiție Alu. După cum își dau seama aceia dintre voi care au făcut bioinformatică înainte, acesta este nenorocirea existenței noastre, în ceea ce privește asamblarea și căutarea și așa mai departe. Dar iată un exemplu de mutație de bază unică în această repetare. Există aproximativ 500.000 de copii ale acestuia în genomul uman împrăștiate. Se numește o repetare intercalată ca o consecință. Și această transmisie de la A la G se găsește în amonte de gena care codifică enzima mieloperoxidază . Deci, cum aflăm dacă acest lucru este important în vreun sens? În primul rând, observația este că este asociată cu o activitate transcripțională de câteva ori mai mică. Această poziție specială creează sau distruge site-uri de legare pentru aceste elemente de transcripție și acesta ar putea fi motivul pentru care are activitate transcripțională mai scăzută. Și, în sfârșit, este suprareprezentat într-un anumit tip de cancer. Și vom trece prin modalitățile prin care luăm o observație, ca un polimorfism, trecem la o asociere, ca aici, cu cancerul, apoi o ducem la un mecanism, cum ar fi aici, cu regulatorii transcripționali. Cred că despre asta este vorba. Nu este suficient să observați polimorfismul. Nu poți spune, a priori, dacă este important sau nu, dacă repetele Alu nu sunt conservate. Acesta este un alt lucru pe care îl spun oamenii. Aruncă toate polimorfismele de o singură nucleotidă neconservate . Nu este conservat. Nu este prezent în mouse, de exemplu. Este non-coding și este repetitiv. Acum, pe lângă tipurile de mutații, avem și modurile de moștenire, adică diferitele moduri în care poate fi transmisă o schimbare, un polimorfism . Și includ asta pentru a-ți lărgi perspectiva. În loc să ne concentrăm în totalitate pe cele 3 milioane de SNP-uri ADN, haideți să lărgim puțin discuția aici. Puteți avea nu numai polimorfisme de ADN, ci și polimorfisme de ARN, care sunt ereditare. De exemplu... și folosesc asta într-un caz extrem... ARNi... 22 de nucleotide sau cam asa ceva. Probabil o varietate de mecanisme. Biți de ARN pot fi induși în diferite moduri. Și odată induse, ele se pot replica, în esență, în interiorul unei celule și între celule. Ele se pot răspândi în întregul organism și probabil se pot propaga de-a lungul generațiilor între diferite generații de organisme. Deci asta este moștenit. Și îl poți considera epigenetic sau polimorfism genetic, în funcție de nomenclatura pe care o adopti. Chiar și o conformație proteică poate fi considerată un polimorfism care este ereditabil. Dogma centrală ne spune că această proteină este codificată de un acid nucleic și, cu siguranță, există încă cazul - chiar și aceste polimorfisme și proteine ​​ereditare. Dar are o conformație diferită și acea conformație recrutează alte conformații și, prin urmare, este moștenită nu numai în interiorul unei celule, ci și între celule și între organisme și este cauza unor lucruri precum boala vacii nebune și așa mai departe. Și, în sfârșit, pot apărea modificări ale biopolimerilor, cum ar fi metilarea. Și aceasta nu este în mod oficial o schimbare a secvenței ADN, ci este o schimbare ereditară care poate avea efecte foarte semnificative asupra unor lucruri precum cancerul și expresia genelor în general. Acum, aceasta este o lărgire a definiției polimorfismelor. Și acum să vorbim pe larg despre modurile în care poate fi moștenit ca orizontal sau vertical. Orizontal înseamnă de obicei între specii, dar într-un anumit sens, ar putea reflecta unele dintre lucrurile care se întâmplă aici cu moștenirea de ARN și proteine, în sensul că este transmisă orizontal între diferite celule din cadrul aceluiași organism. Dar, în general, este un mecanism care nu implică mitoza sau meioza genomilor nucleari sau organici. Iar procesele naturale sunt transducția și transformarea, distingându-se prin-- transducția implică de obicei un strat viral sau proteic pentru acidul nucleic, iar transformarea implică ceva mai aproape de acizii nucleici goi. Transgenic este o versiune complet bazată pe laborator a acestor două metode mai naturale. Cred că verticală despre care am vorbit deja. Aceasta este ceea ce gândim în mod normal despre moștenire. Orizontal, am văzut în arborele vieții, este foarte comun, chiar și în ramurile târzii și ramurile timpurii. Pe verticală, totuși, ne gândim în mod normal când facem cruci în laborator. Unele dintre acestea sunt moștenite materne, cum ar fi mitocondriile și cloroplastele, dar este încă același tip de proces - mitoză, segregarea ADN-ului. Așa că acum avem tipuri de mutații despre care vrem să vorbim, deriva și selecția mutațiilor, ca sursă principală a frecvențelor pe care le găsim în populații. Vrem să știm, de unde provin frecvențele alelelor? Și voi susține că, în general vorbind, în aproape toate sistemele vii, fie că sunt celule din organisme care sunt mutante sau organisme întregi, fie că fac recombinare sau nu, ele vor face selecția mutațiilor și derive. Acum, pentru a dezvolta aici un model destul de riguros, dar simplu, avem câteva presupuneri. Avem întotdeauna presupuneri în modele. Dacă oamenii vă spun că nu există presupuneri, atunci trebuie să săpați puțin mai departe. Ipotezele pe care le vom face aici pentru puțin timp -- și apoi, vă voi da un exemplu frumos pentru a le submina pe toate -- dar este dimensiunea constantă a populației n. Ai împerechere aleatorie. Amintiți-vă, am vorbit despre amestec înainte. Fiecare membru al populației se poate împerechea aleatoriu. Sunt generații care nu se suprapun . Aceasta este o comoditate. Nu facem nicio presupunere că frecvențele alelelor populației sunt la echilibru. Aceia dintre voi ați urmat cursuri de biologie cu... Hardy-Weinberg presupune această presupunere. Aici, acesta este un model mult mai general. Include non-echilibru, iar echilibrul poate fi un caz special. Deci aceasta este o non-asumare relativ minoră. Dar presupunem că nu avem un număr infinit de alele și nici un număr infinit de mărimea populației. Așa că acum ignorați totul de pe slide, cu excepția colțului din stânga sus al slide-ului 15 aici. Acest lucru ar trebui să pară familiar. Aceasta ar trebui să semene oarecum cu harta logistică în care am avut creșterea progresivă, lentă exponențială a unei alele dintr-o populație față de alta, sau a unui organism față de altul, pe baza diferiților coeficienți de selecție ai acelor organisme. Și aceasta ar putea fi o diferență foarte mică. Să spunem, o creștere de 1% pe generație va domina după o mie de generații sau cam asa ceva, cu siguranță. Și asta este ceea ce vezi -- curba exponențială -- și apoi se platește pe măsură ce ajunge la frecvența alelelor 100%. Acesta este intervalul complet pe axa verticală, este frecvența alelelor de la 0% la 100%. Și generația trece de la 0 la 1.400. Acum, ceea ce reprezintă de fapt în acest caz particular este strâns legat, puțin mai complicat decât doar o alelă care înlocuiește alta, pentru că aici avem diploide - adică nu un haploid care are doar o alelă, ca în bacteria bacteriană. specii despre care am vorbit implicit. Dar poți avea, aici, acum, trei combinații de alele. Puteți avea, să zicem, genotipul de referință al capitalului A, capital A, pe care l-am numi doar 100% fitness. Deci avem coeficientul de fitness și de selecție, care sunt termeni interschimbabili care sunt o relație matematică foarte banală între ei. Deci vom folosi w și s în contexte diferite aici. Are doar populație [INAUDIBIL].. Apoi, puteți avea A mare, A mare, a mic, a mic și A mare, a mic ca heterozigotul. Și presupunem aici un model aditiv, în care obțineți puțin mai multă selecție cu o alele de mic a și apoi două alele de mic a rezultă în 2s-- 1 plus 2s. Și aceasta are o curbă foarte asemănătoare cu harta logistică, dacă ai avea înlocuire simplă de alele. Și ceea ce ai tendința de a avea în această populație - o mie de generații, în marea schemă a lucrurilor, ți se poate părea mult. Dar în schema mare, este o perioadă foarte scurtă de timp și, deci, ai tendința de a avea alele la frecvența de 0% și 100%. Pe de altă parte, dacă aveți modul supradominant, unde heterozigotul are cea mai mare fitness dintre cele trei posibilități, unde 1 plus s este mai mare decât 1 sau 1 plus t, atunci urmăriți echilibrul. Indiferent dacă începeți de la aproape 0% sau aproape de 100%, frecvența alelelor va converge către un anumit punct de echilibru - în acest caz, undeva în jur de 0,6 pentru o alele și 0,4 pentru cealaltă. Și ar putea fi oriunde. Depinde de aptitudinile relative, s și t. Acesta este doar un diapozitiv de memento care combină două diapozitive de înainte. Acest slide conectează harta logistică de la cursul 1 la coeficienții de selecție despre care am vorbit în prelegerea 2 la diploizii despre care vorbim în principal în această prelegere, deoarece oamenii sunt diploizi. Și aici, conectați acest lucru la faptul că acești coeficienți de selecție, s, sau fitness, w, sunt relevanți pentru diferite medii și timpi diferite pe care organismele le petrec în acele medii diferite. Și toți mutanții sunt marcați de ADN-ul lor și sunt reuniți și selectați și îi puteți citi într-o varietate de metode. Așa că acum să cercetăm de unde provin frecvențele alelelor , pe baza mutației sau migrației, pe care le vom aduna aici ca M, selecție și deriva. Acum, mutația va avea o constantă de viteză directă și o constantă inversă. Acest lucru ar trebui să vă reamintească de conversația pe care tocmai am avut-o despre diferitele tipuri de alele -- dublările și ștergerile -- cum pot avea rate diferite. Dacă sunt duplicate în tandem, atunci aceasta are o mare tendință de a se șterge. Dacă se șterge până la o singură repetare, acum nu mai există nicio repetare și, prin urmare, șansa de a genera duplicatul exact este scăzută. Deci frecvența mutației directe și inverse este reprezentată de f și, respectiv, r. Acum, ce vom vedea... vom trece prin asta. Începând cu o frecvență, t sub i, unde i este numărul de mutanți dintr-o dimensiune a populației n. Deci, aici, în partea de jos, sunt mutanții i într-o populație de mărimea n. Și vom vedea că aplicarea mutației, aplicarea selecției și aplicarea derivei sunt toate aplicații ale distribuțiilor binomiale atunci când vorbim despre această populație discretă de n indivizi. Vă amintiți cele trei curbe în formă de clopot [INAUDIBILE]? Curbe care pot fi în formă de clopot. Aici, este în mod clar o populație discretă, deoarece avem n indivizi, luând i mutanți la un moment dat. Deci binoamele pe care le vom folosi -- toate cele trei procese au aceeași formă, unde aveți o combinație de o populație, n, și o subpopulație, i. Și, desigur, restul este n minus i. Și diferitele combinații sunt de ori mai multe probabilități, deoarece probabilitatea este ultimul parametru din binom aici. Un binom este o funcție de n, i și p - mărimea populației, dimensiunea subpopulației și o anumită frecvență. Poate fi o frecvență de mutație directă sau inversă. Poate fi o probabilitate de selecție sau poate fi o probabilitate de deriva. Și vom vedea cum funcționează fiecare dintre acestea. Deci începem cu o frecvență. Puteți avea i variază de la 0 la Dacă i este 0, atunci frecvența este 0 peste n, sau 0. Dacă i este n, este n peste n, sau frecvența este 100%. Doar aceeași axă verticală pe care am avut-o pe toate diapozitivele anterioare. Frecvențele de pornire au o anumită distribuție, t sub i, pentru i mergând de la 0 la n. Și acum vrem să derivăm un nou vector de frecvențe, care ar fi m. Și tot ce facem este să aplicăm distribuția binomială pentru procesul direct sau mutația directă. Și apoi, odată ce am terminat cu asta, acum folosim m-urile și o ajustăm. Așa că acum, dă-i șansa de a face mutația inversă, pentru că vei genera această distribuție binomială înainte și apoi le vei da șansa de a reveni. Apoi, aplicați selecția. Un nou binom. Acum, aici, probabilitatea unei tranziții de la mutanții tăi, începând cu t-- apoi, treci la m. Acum, pentru a ajunge la s, probabilitatea de tranziție este o funcție a acestei aptitudini. Amintiți-vă, w și s, fitness și selecție. Aici, fitness-ul determină probabilitatea unei tranziții într-o distribuție binomială. Si sunt doua ecuatii usor diferite pe care le folosesti, in functie de faptul ca fitness-ul este mai mare de 1 sau mai mic de 1, daca are tendinta de a creste in timp, datorita selectiei, sau de a scadea acea alela cu timpul, ca functie. de selecție. Și asta sunt aceste două cazuri aici. Și apoi, în sfârșit, după ce ați aplicat mutația și selecția înainte și inversă, indiferent dacă este mai potrivită sau mai puțin potrivită, atunci aplicați deriva. Acum, deriva înseamnă doar că... gândește-te. Dacă aveți o populație mică de indivizi... să presupunem că sunt un set de bile colorate într-un borcan în fața noastră, aici. Este un număr mic, și scot o mână, pentru că în fiecare generație, vei duplica populația. Dar ne amintim de ipoteza unei mărimi constante a populației. Dacă scot noua generație și uit de restul duplicatelor, ar putea fi toate de aceeași culoare. Și aceasta este șansa că ai putea trece la fixare, unde unul dintre ei domină acum, nu pentru că este superior, din punct de vedere al selecției, nu pentru că a fost mutat într-un mod direcționat până la acel punct, ci doar din cauza derivei aleatoare pe care o ai. o populație constantă. Și astfel puteți vedea cum asta ar depinde de câți sunt în borcan. Dacă scot jumătate dintre ele din borcan, iar borcanul are doar cinci în el, atunci este o șansă mult mai mare să trecem la fixare rapid decât dacă borcanul are milioane în el. Dacă scot jumătate de milion, e foarte probabil să fie tot mai mult sau mai puțin aceleași rapoarte. Și exact așa se întâmplă când te uiți la deriva genetică aleatorie. Depinde foarte mult de mărimea populației. Așadar, aici sunt simulări care merg la, să zicem, 150 de generații pe axa orizontală și frecvența alelelor, ca de obicei, mergând de la 0% la 100%. Și începem cu o populație cu raport 50/50 de două alele. Și ceea ce vezi este că dacă populația, numărul de indivizi este de doar 25, atunci rezolvi rapid. Poate 30 de generații, poți-- și asta este anecdotic-- să fii fixat. Pe măsură ce se ridică la o populație de 2.500, puteți vedea că, pentru toate intențiile și scopurile, este plată. Se va repara în cele din urmă. Vă asigur că această simulare-- dacă o rulați suficient de mult, una dintre cele două alele va ajunge la zero, iar cealaltă va ajunge la 100%. Și faci o altă simulare, și ar putea fi cealaltă, pentru că aceasta este o deriva aleatorie, nu o selecție. Deci, puteți vedea că frecvențele finale vor fi o funcție complicată a ratelor de mutație și a ratelor de selecție și a ratelor de deriva, care, în ultima, este o funcție de dimensiunea populației. Când dimensiunea populației este foarte, foarte mare, puteți vedea că va fi suficient de constantă. De aceea, puteți vedea diferențe foarte subtile în coeficientul de selecție. Acum, vom reveni la mutația, selecția și deriva în contextul geneticii umane într- un moment. Dar mai întâi, vreau să vă spun ultima componentă a geneticii populației despre care vom vorbi, care este recombinarea. Acum, acest lucru nu se întâmplă în fiecare sistem biologic. Am argumentat înainte că mutația, selecția și deriva au loc în fiecare sistem biologic, de la celule la organisme de toate tipurile. În acele sisteme biologice în care ADN-ul poate fi schimbat prin transducție, transformare, fuziune meiotică și așa mai departe, atunci puteți obține recombinare. Și aceste două cifre ilustrează asta. În partea stângă a diapozitivului 19 este scenariul de non-recombinare , iar în partea dreaptă este schimbarea sexuală sau mediată de recombinare a combinațiilor de gene. Deci, să ne uităm la asta. Timpul merge pe orizontală. Și puteți vedea, în partea stângă, începutul fiecăruia dintre aceste scenarii, obțineți o anumită rată de apariție a mutațiilor. Aceasta se bazează pe rata de mutație directă din ecuațiile noastre anterioare. Și apar foarte devreme. A, B și C apar toate. Dar ei tind să se stingă din cauza derivării. Iar dimensiunea populației este suficient de mică încât jumătate dintre ei să dispară și unul dintre ei să se repare. Și A este destinat să se repare, dar este nevoie de ceva timp pentru a se remedia. Începe la o frecvență apropiată de 0 și, în momentul în care este de 50% până la 100%, este gata să înceapă să preia o a doua mutație la aceeași frecvență în care au avut loc înainte. Și acum poți prelua mutația B în timp ce C moare. Vine și pleacă din cauza derivării. Și apoi, în sfârșit, odată ce AB remediază, atunci puteți ridica C și obțineți ABC. A fost un proces în serie lung și lent. În partea dreaptă, vedem ce se poate întâmpla în cazul schimbului de material genetic într-o populație cu adevărat amestecată, acum că A, B și C apar toate la aceeași frecvență ca și în stânga. Dar acum, pentru că fac schimb de informații foarte devreme, înainte ca B să aibă șansa de a muri din cauza derivării, își combină ADN-ul cu A și obții AB. Și o parte din populația mică A este destinată oricum să fie remediată, dar se întâmplă să se combine cu C. Și din nou, înainte ca deriva să le poată șterge, selecția foarte mică pe care o aveți și care nu a putut depăși deriva în mâna stângă. Panoul le rezolvă acum pe toate, combinația cu adevărat favorabilă de A, B și C, foarte devreme. Și așa că există o serie întreagă de argumente și contraargumente în literatura de genetică a populației despre de ce există sex. Desigur, știm cu toții că avem propriile noastre motive. Dar aici, se spune că este un cost uriaș. Contraargumentul este că există un cost uriaș de a avea două sexe-- poate până la 50%, posibil mai mare-- pentru că au morfologii și capacități diferite și așa mai departe. Dar apoi, există acest beneficiu. Acesta este riscul, iar beneficiul este recombinarea mai timpurie. Dar apoi există contraargumente și așa mai departe în care nu vom intra. Da? PUBLIC: Revenind la deriva. Derivarea este de fapt aleatorie. Ce anume face ca oricare alele să se repare? Dacă aveți două alele diferite [INAUDIBILE] zero pentru o alelă, de ce nu s-ar întoarce pur și simplu [INAUDIBLE] ? PROFESORUL: Ei bine, se poate. Puteți vedea aici că începe să se îndrepte astfel încât se fixează pe o alelă și își schimbă direcția și o fixează pe cealaltă. Deci poate merge până la aproape zero și apoi să revină în sus. Acestea sunt doar câteva simulări tipice aici. Dacă faci destule dintre acestea, vei găsi orice comportament posibil. PUBLIC: Deci ceea ce spui... practic, în cele din urmă, dacă îi dai suficient timp, se va rezolva. PROFESORUL: Se va repara. Nu poți prezice neapărat pe care se va repara. Dacă nu există selecție, jumătate din timp, se va rezolva pe unul, jumătate pe celălalt dacă pornesc la frecvența de 50/50. Dar trebuie să te gândești la asta și în contextul mutației și selecției, pentru că toți acționează acolo. Și când spui că ceva este neutru selectiv, ceea ce vrei să spui cu adevărat... totul are un coeficient selectiv foarte, foarte mic. Dar dacă este suficient de mic și dimensiunea populației este suficient de mică, atunci deriva te va orbi și nu o poți vedea. Dar dacă obțineți populații cu adevărat mari, atunci veți avea o derive mică și apoi veți vedea o selecție mai subtilă. Populația umană este foarte mare. Unele dintre speciile oceanice sunt cu adevărat enorme. Deci trebuie să vă gândiți la asta ca la o posibilitate. Deci acum să vorbim despre bolile comune. Întrebarea este, sunt bolile comune într-adevăr - în ce măsură sunt cauzate de variante comune? În mod clar, unele dintre ele sunt cauzate de variante comune. Și am spus, ei bine, variantele comune chiar nu ar trebui să fie dăunătoare, deoarece ar fi șterse prin selecție. Ele pot fi foarte, foarte ușor dăunătoare, astfel încât deriva le va face să se fixeze sau să persistă, dar nu pot fi cu adevărat vizibile. Coeficienții de selecție de la 10 la minus 4 -- efecte foarte, foarte mici -- pot fi șterse în populațiile de dimensiuni normale. Așadar, iată trei exemple de variante comune care aproape sigur sunt asociate cu boli comune. Deci, de ce sunt aceste cazuri speciale, în opinia mea, mai degrabă decât cazul general? APOE4 la care am făcut aluzie mai devreme este asociat cu demența Alzheimer. Este implicat în transportul și metabolismul lipidelor. Și această alelă specială, alela E4, este prezentă în proporție de 20% la oameni. Aproximativ 80% este cealaltă alela, a doua cea mai frecventă alela este alela E3. Și așa ați putea spune, ei bine, această alelă proastă, acest E4, este cea care ar trebui să fie prezentă în strămoșii comuni ai oamenilor. E3, cel bun, ar trebui să fie prezent în strămoșii comuni, iar acest E4 este o aberație recentă. Intră cumva în populația umană. Dar, de fapt, E4 este cel ancestral, probabil din cauza unor diferențe de dietă sau a altor efecte selective. E4, care în prezent este rău pentru noi, credem, a fost foarte bun pentru unele dintre speciile noastre înrudite. Așa că trebuie să ne gândim foarte atent înainte de a face ceva drastic cu privire la eliminarea acestei alele din, să zicem, populația umană. Celula falciformă a hemoglobinei, alela celulelor falciforme, este probabil cea mai veche și mai faimoasă dintre alelele caracterizate molecular. Zuckerland și Pauling au făcut acest lucru celebru cu multe decenii în urmă. Și există în 17% din populația umană, iar acesta este responsabil pentru transportul oxigenului în celulele roșii din sânge . Și ați văzut într-una dintre diapozitivele anterioare de astăzi acele celule în formă de seceră , care au un efect uriaș asupra hemodinamicii celulelor roșii din sânge . Ei bine, o altă componentă a celulelor roșii din sânge , o enzimă, G6PD, care este implicată în menținerea funcției redox în celulă, este de până la 40%. Mutantul, oricare vrei tu... sunt atât de aproape de 50%. Sunt doar două alele, iar una dintre ele este dăunătoare, într-un anumit sens, biochimic. Dar ambele au un avantaj heterozigot de a fi rezistente la malarie. Și probabil că acesta este motivul pentru care este comună în populație. Și probabil că aceasta se dovedește a fi regula conform căreia acestea sunt exemple ale acelei convergențe pe care le-am văzut în cazul polimorfismelor echilibrate în care heterozigotul are un oarecare avantaj și astfel obțineți un punct echilibrat, mai degrabă decât unul sau altul care domină prin deriva sau selecție. . Iar al treilea exemplu, pe care îl vom dezvolta mult mai detaliat, este CCR5. Există o ștergere a 32 de perechi de baze care conferă rezistență la una dintre cele mai mari plăgi din istoria rasei umane, care este virusul SIDA. Și frecvența sa este de 9% la caucazieni. Cred că ne dorim să fie 100% atunci când ne facem griji pentru HIV, dar trebuie să ne întrebăm de ce nu este 100%. Poate exista un alt motiv pentru care este o versiune neștersă la atât de mulți oameni și trebuie să înțelegem asta. Și din câte știu eu, noi nu înțelegem asta. Acum, acesta este ultimul slide înainte de pauză. V-am promis că vom lua acel simplu tratament matematic al selecției mutațiilor și al derivării și vom arăta că de fapt are un anumit impact, că este de fapt folosit în genetica umană. Acum, trebuie să vă avertizez că aceasta nu este o viziune de consens. Aceasta este o viziune care mi se pare atrăgătoare, în diapozitivul 21, pe care Jon Pritchard a scris-o. Și l-a intitulat într- un mod provocator: Variantele rare sunt responsabile de susceptibilitatea la boli complexe? Și acesta este un citat. Este obișnuit în lucrările teoretice referitoare la boli complexe ca frecvențele alelelor să fie tratate ca parametri ai modelului. Și, de obicei, în modele, veți avea valori și parametri derivati, care sunt introduși, lucruri pe care utilizatorul este așteptat să le ofere. Și nu vrei să fii nevoit să ghicești frecvențele alelelor și să ai acești parametri. Deci, ceea ce este nou aici este că, folosind un proces evolutiv, care include -- ați ghicit -- selecția, mutația și deriva genetică, putem învăța sau, după cum am spus, să modelăm frecvențele alelelor subiacente. Ele pot fi derivate mai degrabă decât să fie necesare ca intrare. Și acest lucru este ilustrat aici cu un model. Acest lucru este în întregime teoretic, dar parametrii care sunt utilizați se bazează pe unele studii genetice care au fost făcute, de exemplu, asupra autismului. Așadar, permiteți-mi să definesc unii dintre termeni aici. Acest raport de risc este legat, într-un anumit sens, de coeficienții de selecție și fitness despre care vorbeam înainte. Acum, coeficienții de selecție și fitness se referă la fitnessul reproductiv. Și în genetica umană, avem interese mai ample în tot felul de lucruri care fie nu afectează capacitatea de reproducere, fie nu știm cum afectează reproducerea. Dar afectează un fel de aspect medical sau doar o trăsătură de interes. În acest caz, raportul de risc înlocuiește coeficientul de selecție. Și asta înseamnă, practic, că fratele sau sora mea are autism-- dacă ar avea-- atunci aș avea o șansă de 75 de ori mai mare de a-l avea decât cineva selectat la întâmplare din aceeași populație din care provin eu. Deci, creșterea de 70 de ori este o ereditabilitate foarte mare pentru acest exemplu special. Tot în acest exemplu, prin unele genetice pe care nu le vom discuta, părea rezonabil ca numărul de loci implicați să fie un număr mare, de ordinul a 100 și ceva. Și vă puteți gândi la o mulțime de boli comune. Când începeți să enumerați cele bine caracterizate, începem să enumeram numărul de gene care fie sunt cunoscute, fie sunt plauzibile, cum ar fi cancerul sau mersul pe stradă sau orice altceva. Aceste trăsături cu adevărat complicate implică un număr foarte mare de tipuri de celule, un număr mare de componente celulare și, prin urmare, un număr mare de gene. Deci aici, au presupus un model cu 100 de loci, 100 de gene diferite. Și au efecte multiplicative ale polimorfismelor din acele gene între loci. Adică, trebuie să aveți gena 1 funcțională și gena 2 și gena 3, deci este multiplicativ. Dar apoi, polimorfismele pe care le-ai introdus într-o genă-- ai putea crede că sunt implicate o mulțime de gene și există o mulțime de poziții diferite în cadrul genei care ar putea fi implicate și fiecare dintre acestea este aditivă. Ai o mică reducere a activității din cauza primei mutații și apoi a unei a doua mutații, a treia. Fiecare dintre acestea este aceasta sau aceasta sau aceasta sau aceasta, și deci acesta este un efect aditiv. Și astfel au diverse justificări istorice pentru a avea penetranță aditivă în genă și multiplicativă în diferiți loci, diferite gene din genom. Acum, pentru acești 100 de loci, vor exista primii cinci care afectează cel mai mult riscul relativ și asta este ceea ce a fost reprezentat aici, unde avem... curba zero, vedeți, este în absența oricăruia dintre aceste efecte multiplicative. . E ca și cum nu ai avea loci care să afecteze frecvența alelelor de susceptibilitate. Și astfel, ca în majoritatea populațiilor neselective, veți avea majoritatea alelelor fie la frecvență zero, fie la 100%. Practic, zero reprezentând absența celorlalte alternative. 100% este acolo. Dar dacă aveți aceste cinci locuri de top din 100 care contribuie la raportul de risc, atunci acestea sunt reprezentate de aceste patru curbe. Frecvența alelelor de susceptibilitate, care variază de-a lungul axei orizontale acum, de la 0 la 100%, are ceea ce el numește o densitate de probabilitate. În mod clar nu este o densitate de probabilitate, pentru că nu se va integra la 1, dar aici, este probabilitatea, histograma rapoartelor de risc. Deci, să luăm o pauză și vom analiza studiul de asociere într-un caz foarte interesant. Orice set de probleme de predat le poate pune aici în pauză. PUBLIC: Deci am înțeles despre modelarea selecției mutațiilor.