Următorul conținut este furnizat de MIT OpenCourseWare sub o licență Creative Commons. Informații suplimentare despre licența noastră și despre MIT OpenCourseWare în general sunt disponibile la ocw.mit.edu. GEORGE CHURCH: OK, gata. BINE. Deci, bine ați venit la a treia fază a discuției noastre despre omic. Cineva a subliniat că ar trebui să subliniez [? această cămașă?] spune omics, nu benzi desenate. Așa că am abordat genomica și transcriptomica ultima dată, iar astăzi prezentăm un subiect foarte important, cu totul inclusiv, de proteomică. Îl vom conecta cu cel de săptămâna trecută prin vehiculul concentrării asupra motivelor care sunt implicate în interacțiunile proteinelor cu cele două macromolecule de acid nucleic . Așa că vom acoperi, la fel cum am introdus ARN-omics cu structură ARN, vom petrece toată această clasă vorbind despre structura tridimensională a proteinei, cum o ajungeți experimental și computațional și implicațiile sale pentru legarea de proteine. molecule mici, cum ar fi medicamentele. Vom ajunge în scurt timp la molecula înfricoșătoare asemănătoare dovleacului . Deci legătura cu săptămâna trecută a fost această diagramă care arată palindromicitatea în trei cazuri și o repetare directă în al patrulea caz. Și am oferit că acest lucru ar putea reflecta simetria proteinelor - a structurii tridimensionale a proteinelor și a structurii tridimensionale a acidului nucleic și aceste elemente de simetrie s-ar alinia. Acum, pentru a introduce aceste elemente de simetrie și posibilitatea de a avea coduri pe care să le poți programa cel puțin, chiar dacă s-ar fi putut modifica în timpul unei evoluții, întrebarea este în ce măsură putem pune mâna pe acest tip de proteine ​​și motive de acid nucleic care interacționează. Pentru a ajunge la această problemă a locului în care există un cod - și consider că una dintre modalitățile de a face față complexității incredibile a proteinelor este de a oferi acesteia o temă care să o conecteze la ultima clasă și să conecteze, eu Gândiți-vă, pentru multe dintre sentimentele oamenilor din acest tip de public interesați de biologia computațională sunt modalități de a avea coduri simple. Și, desigur, un mod de a descompune proteinele și de a ne gândi la ele este aceste ABC-- elica alfa, foaia beta și bobina. Fiecare dintre acestea poate fi caracterizată prin legăturile de hidrogen care îl țin împreună. Legăturile slabe dintre hidrogeni, azoți și oxigeni. Și helixul alfa, toate acestea sunt păstrate în helix cu o repetare de 3,6 reziduuri pe tură. În foaia beta, ei tind să aibă lanțuri mai lungi, mai drepte, unde există legături de hidrogen nepereche, inevitabil, până când formați suficiente lanțuri pentru a forma o structură ciclică, în timp ce helixul alfa este imediat elicoidal. Există multe tipuri diferite de bobine. Este o expresie generală care include totul, cu excepția alfa și beta, dar un tip de bobină deosebit de bine format are propria nomenclatură și parametrii este turnul, iar turnul este ilustrat aici la sfârșitul unei foi beta. Foaia beta este practic în colțul din dreapta jos, în direcția săgeții. Săgețile indică în mod obișnuit de la capătul n la capătul c, așa cum în acizii nucleici este de la cinci prim la trei prim. Și iată că merge în săgeată, se întoarce foarte strâns și iese din nou. OK, acum cum putem folosi aceste motive de bază? Acestea sunt cele mai mici unități semnificative ale structurii tridimensionale a proteinelor. Cum le putem folosi pentru a recunoaște alte macromolecule, alte proteine ​​și acizi nucleici? Deci haideți să conectăm acest lucru cu motivele din ultima clasă. Avem aceste motive pe care le-am putea găsi, matrice de greutate pentru ele prin alinierea multor secvențe. Acum, în loc să aliniem secvențele, să vedem ce putem face prin mutarea atât a părții proteice, cât și a părții de acid nucleic. Și pentru a face acest lucru, doar ca ilustrație, să presupunem că avem trei degete de zinc. Aceasta este o adevărată proteină care leagă ADN-ul uman și șoarece, cu trei degete de zinc la rând. Deci acesta este un exemplu de tip de simetrie cu repetare directă sau în tandem . Amintiți-vă, există repetarea directă și repetarea inversă. Și în acest tandem repetă, să ancorăm cele două capete și să schimbăm mijlocul. Faceți fiecare secvență de peptide posibilă în mijloc sau eșantionați aleatoriu spațiul vast care ar putea apărea în schimbarea câtorva, de exemplu, șase sau mai mulți aminoacizi cheie. Și apoi știm din structura tridimensională că interacționează în principal cu cele trei nucleotide din mijloc, așa că haideți să schimbăm acele trei nucleotide din mijloc cu fiecare secvență de trinucleotide posibilă și să vedem cantitativ cât de mult afectează diferitele secvențe din proteină diferitele secvențe din nucleotide. acid. Așadar, acest lucru nu se va întâmpla dacă ne uităm la aliniamentele secvențe lungi unde vom obține matricele de greutate. Le putem obține prin măsuri experimentale reale ale legării in vitro. Și ce se întâmplă atunci când faci acest exercițiu, tipul sălbatic, acum aceasta... secvența tip sălbatic este ceva care ar putea dori să recunoască o familie de secvențe. Nu știm exact care este secvența de tip sălbatic pentru această proteină care leagă ADN-ul, acest deget de zinc de la om și șoarece. Dar succesiunea finalului afacerii, subsecvența de aminoacizi a acelei elice alfa de recunoaștere care se leagă de ADN-ul canalului major este afișată în stânga sus, [? RSVHLTT. ?] Și secvența de care se leagă în principal... amintiți-vă că aceasta este o matrice de greutate. Nu este o secvență de consens, acest TGG. În mod evident, recunoaște o varietate de alte secvențe. Așa că nu uitați, există aproximativ trei nucleotide de ambele părți ale acestuia de care se leagă celelalte două degete de zinc. Când încerci toate cele 64 de trinucleotide posibile -- amintește-ți din codul genetic, aceasta este pură coincidență că acestea sunt triplete la fel ca și codul genetic. Aceasta se întâmplă să fie cantitatea de bucată de ADN pe care o va acoperi un deget de zinc. Dar nu este o coincidență că 4 la al treilea este tot 64, la fel ca codul genetic. Și dacă parcurgeți toate secvențele de nucleotide posibile pentru acest tip sălbatic, veți descoperi că câștigătorul este TGG și are acea constantă specială de legare. Constanta de legare este măsurată în molaritate, aproximativ unde obțineți jumătate maximă sau legarea de echilibru. Adică 10 până la minus 9 moli pe litru. Acum puteți mutageniza peptida și selectați peptidele care se leagă la GCC. Amintiți-vă, flancurile sunt menținute constante. Obțineți două peptide, ambele se leagă de GCC. Ambele dau matrice foarte asemănătoare cu aceasta, cu foarte-- acestea sunt constante de legare cu afinitate foarte mare, la fel ca tipul sălbatic. În esență, ați creat prin selecție o nouă specificitate și două moduri diferite de a o obține. Dacă acum mergi pentru ceva radical diferit, acum nu GC-- primul era GC mare, al doilea era GC pur, iar apoi al treilea este AT pur. Și obțineți o altă secvență de peptide care se leagă de aceasta și obțineți o altă matrice de greutate. Acum amintiți-vă, această matrice de greutate nu este o aliniere a secvenței. Acestea sunt constante de legare în care ponderea celor 64 de secvențe diferite se bazează pe cât de multă legare obțineți pentru fiecare dintre cele 64. Și apoi, pentru unele secvențe, toate aceste trinucleotide diferite au ca rezultat o selecție destul de slabă pentru orice tip de peptidă din tot numărul mare de peptide pe care le aveți. Niciuna dintre ele nu se descurcă în mod deosebit de bine, iar rezultatul este o matrice de greutate aici, care are foarte puțin conținut de informații. Deci aceasta este o modalitate. Nu este singura modalitate, dar aceasta este o modalitate de a obține un set de date empirice foarte bun, pe care, în principiu, îl puteți combina cu funcții similare pe cele de flancare și puteți apela orice secvență a unei interacțiuni cu proteine ​​de acid nucleic, cel putin cu aceasta clasa de proteine. Alții sunt puțin mai problematici. Dar puteți vedea cum acest lucru poate genera un cod, chiar dacă interacțiunea detaliată a nucleotidelor aminoacizilor nu este atât de simplă. Deci acestea sunt rezultatele studiului. Apoi vă voi arăta doar un instantaneu al unei scheme a modului în care sunt efectuate experimentele reale. Și apoi, în sfârșit, vă voi arăta o mică matematică în spatele modului în care am obținut acele constante de legare aparente. Amintiți-vă, în acele mijloace mai mici de legare, puteți obține legarea la o concentrație mai mică, ceea ce înseamnă o legare mai puternică. Deci, modul în care faceți legarea aici este să luați o matrice de acid nucleic, similar cu cele despre care am vorbit în clasa trecută. În loc să fie monocatenar, gata să lege acidul nucleic fluorescent, este dublu catenar, gata să lege un complex proteic fluorescent. Complexul proteic în acest caz este un bacteriofag, care prezintă cele trei degete de zinc în roșu. Cel din mijloc este cel din trecutul diapozitiv a fost mutagenizat. Și, în mod similar, matricea este combinatorică - fiecare secvență de ADN posibilă de care ești interesat este prezentă. Și ceea ce faceți este să cuantificați fluorescența proteinei deget de zinc indirect prin legarea fagului atașat covalent de anticorpi, care sunt marcați fluorescent prin fluorescență [INAUDIBILĂ]. Cantitatea... cum relaționezi fluorescența, cu cât se leagă mai mult, cu atât mai multă fluorescență. Dar modul în care raportați asta la constanta de legare pe care am avut-o în diapozitivul anterior este subiectul acestui diapozitiv numărul opt. Acum o numim constantă de asociere a echilibrului aparent, deoarece aceste experimente, la fel ca multe legături în celulele vii, nu sunt la echilibru. Este un proces dinamic în celulă și in vitro. Există modalități prin care puteți măsura constantele de echilibru, dar ceea ce este evident în sensul că trebuie să spălați excesul de fluorescență pentru a detecta semnalul destul de scăzut pe care îl obțineți de la legarea specifică, mai degrabă decât să aveți fluorescență. Îl faci baie cu 10 până la sixford în exces de fluorescență. Și așa că, în timp ce faci acea spălare, evident că nu ești la echilibru. În cele din urmă, faci un instantaneu înainte de a spăla totul. Deci, ceea ce măsori -- ceea ce măsori practic este -- încercarea de a măsura este constanta de echilibru dintre proteina P din stânga sus aici, ADN-ul D, dublu catenar care merge la produs, care este această biomoleculară asociată cu P.D. produs. Și aceasta este chimia fizică de bază și algebră, astfel încât... așa că rearanjați asta pentru a obține constanta de asociere. Asta e ceea ce vrei. Și fracția de molecule de ADN cu legături de proteine ​​poate fi găsită din aceasta. Este doar prin definiție, fracția de molecule de ADN legată de proteină este... proteina legată este numărătorul. Parantezele înseamnă concentrația în moli pe litru, așa cum am afirmat. Și apoi împărțiți complexul la cantitatea de fracție, care este ADN-ul total, care este ADN-ul prezent în complex și ADN-ul este liber. Acesta este D plus PD. Și apoi doar înlocuiți în această definiție a constantei de asociere. Definiția este produs peste reactanți și apoi obțineți acest termen intermediar. Care acum anulați toate concentrațiile acestora, iar apoi ajungeți cu ultimul termen în extrema dreaptă, care este locul în care dacă țineți proteina - dacă concentrația de proteine ​​este cunoscută, atunci totul este constant, cu excepția faptului că Asociatia. Astfel încât una peste constanta de asociere este direct legată de fracția de molecule de ADN cu proteină legată, care este direct proporțională cu intensitatea semnalului și fluorescența. Deci, așa obțineți numerele care erau pe acel slide. Acum să revenim la întrebarea care a legat această discuție cu ultima, care a fost simetria interacțiunilor proteinelor ADN. Am ilustrat deja unul dintre aceste trei complexe de degete de zinc , așa cum este ilustrat în partea stângă aici. ADN-ul dublu catenar este în albastru, iar cele trei degete de zinc urmează de-a lungul canelurii majore, canelura mare a ADN-ului. Și motivul pentru care manualul este greșit, în primul rând, subliniază partea nehelicoială a degetului de zinc. Abia se vede elica cu fundalul acolo. Și, de asemenea, modul în care trece prin ADN, dacă te uiți cu atenție la asta în manualul tău, acesta este de fapt [? Cartea Mount ?], de fapt se interdigitează cu o legătură fosfodiesterică, trecând practic prin perechile de baze, ceea ce nu este deloc ceea ce se întâmplă. În mod similar, fermoarul cu leucină, aceasta este, din nou, recunoașterea cu o spirală în canelura majoră a ADN-ului. Aici, puteți vedea că helixul care provoacă dimerizarea proteinelor - vă puteți gândi la acesta ca fiind cel mai elementar cod de interacțiune proteină-proteină . Una foarte fundamentală care vine iar și iar, așa-numita bobină-bobină, două elice alfa care interacționează. Extinderea directă a acesteia, aproape coaxială cu o bobină-bobină [? sau ?] interacțiune proteină-proteină , ele coboară și ating ADN-ul. În schimb, manualul în care se întoarce mâna dreaptă ascuțită și într-un fel slab schematizat acolo, merge coaxial cu ADN-ul. Nu asta se întâmplă. Helicile sunt prelungiri mai mult sau mai puțin directe în jos de la regiunea de dimerizare a proteinei menținându-se aproape perpendicular pe axa ADN-ului. Dar din nou, deci în stânga sunt cele trei repetiții în tandem, iar în dreapta este o axă a diadei, unde simetria dublă de 180 de grade - gândiți-vă că se rotește exact cu 180 de grade. Aceasta nu este o oglindă. Aceasta este o rotație. A ADN-ului pe sine coincide perfect cu simetria dublă a asocierii proteinei cu sine. Acestea sunt cele două clase majore de simetrie și este uimitor câte interacțiuni ale proteinelor de acid nucleic se încadrează într-una dintre aceste două clase - repetare directă sau repetare inversă. Și acesta este cel pe care îl găsești repetări directe și inversate în secvențele de acid nucleic, te entuziasmezi puțin. Celălalt motiv sunt structurile ac de păr pe care le-ați găsit în ARN despre care am vorbit în ultimele clase, acestea fiind și ele indicate prin repetări inversate. Deci avem acum un mod semi-empiric de a calcula - într-un anumit sens, prezicerea noilor interacțiuni reglatoare ale ADN-ului proteinelor cu ADN-ul dublu catenar. Putem extinde acest lucru la ARN? Aceasta este o situație mult mai complicată cu ARN, deoarece nu mai aveți aceste elice duble lungi și perfecte . Aveți aceste elice de ARN foarte scurte pe care le-am arătat în ultimele două clase. Acesta este ARN de transfer, una dintre moleculele noastre preferate aici, cu anticodonul în partea de jos a fiecărei structuri roz. Și acceptorul de aminoacizi trei capătul principal al acelei 70 de nucleotide... 70 până la 80 de nucleotide de acid nucleic. Deci, rozele sunt toate ARNt-urile și există cel puțin 20 de tipuri diferite de aminoacizi și au 20 de tipuri de -- cel puțin 20 de tipuri de ARN de transfer și 20 de tipuri de proteine ​​care adaugă aminoacidul la cele trei capete principale ale transfer ARN. Acestea se împart în două clase majore. Acestea pot fi recunoscute la nivel structural. Clasa 1, care este codul aminoacizilor cu o singură literă [? CEL, ?] și așa mai departe, cisteină, glutamat și așa mai departe. Aceasta este o clasă, care sunt similare structural. Clasa 2 este structural diferită de clasa 1, dar sunt similare în cadrul clasei. Oricum, ideea este că ei recunosc toate părțile diferite ale acidului nucleic, nu doar anticodonul, care este codul în sine, codul trinucleotid. Nu doar capătul de aminoacid unde aveți nevoie de aminoacidul de recunoaștere, ci diferite puncte de-a lungul ARN-ului de transfer. Dacă ați dori să creați un cod nou, așa cum au făcut acești autori, sau să creați hibrizi între aceste diverse lucruri, ar trebui să găsiți omologie între proteine ​​sau domeniile grafice de recunoaștere dintre fiecare sau să mutagenizați anumite regiuni despre care se știe că interacționează. cu nucleotidele pe care doriți să le contactați și asta s-a făcut. Puteți aranja să faceți un nou aminoacid sculptând buzunarul pe care aminoacidul îl recunoaște și altoind nucleotidele adecvate - aminoacizii corespunzători ar recunoaște, să zicem, un codon stop. OK, ați avut o experiență de programare care, sperăm, vă va pregăti pentru lumea reală a interacțiunii cu intrare și ieșire de la diferite dispozitive. Subiectul de astăzi este proteinele și acesta este într-adevăr contactul principal între mecanismele de reglare rafinate , care va fi subiectul [? network?] pe care am atins- o deja, dar va fi într-adevăr subiectul unora dintre analizele noastre de rețea în ultimele trei prelegeri. Aici avem nevoie de senzori pentru a detecta mediul. Avem nevoie de dispozitive de acționare pentru a livra apoi înapoi în mediu ceea ce celula vrea să facă sau pentru a interacționa cu alte celule. Trebuie să aveți feedback, sincronism, astfel încât să puteți programa practic lumea aproape digitală a acidului nucleic din interiorul celulei, dar prin intrări și ieșiri clar analogice. Așa că, din moment ce aceasta este prelegerea de Halloween și mă prefac ca Omul- Lup, am enumerat și unele dintre cele mai înfricoșătoare proteine ​​la care m-am putut gândi. Și vom vorbi despre trei dintre ele. Una dintre ele în diapozitiv, care este proteinele care sunt de fapt implicate în cauzarea simptomelor care apar atunci când ești îngrijorat de antrax. Și apoi vom vorbi din nou despre HIV, de data aceasta, mutanții polimerazei care provoacă rezistență la medicamente. Și apoi ApoE încă o dată, așa cum am făcut în trecut, de data aceasta vorbind în mod specific despre modul în care structura proteinei ne spune haplotipul. Deci, cu antraxul, începeți cu aceste două componente simple - două domenii de proteine ​​aici. Se leagă de o celulă... ceva de pe suprafața celulei tale. Sper că nu a ta, ci suprafața celulei umane. Și apoi unul dintre domenii dispare. Iar cel rămas acum se auto-asambla într-o simetrie de șapte-mer, de șapte ori. Amintiți-vă, vorbeam despre o simetrie de rotație dublă pentru interacțiunea proteinelor ADN. Aceasta este acum o simetrie de rotație de șapte ori. Asta permite acum factorului letal, LF, să se lege... încă nu în interiorul celulei. Dar întregul complex este interiorizat. Totuși, din punct de vedere topologic, este ca și cum ar fi în afara celulei când se află în interiorul acestei mici vezicule. Trebuie să treacă prin acea membrană. Dar acum, schimbarea pH-ului care are loc atunci când această veziculă intră în celulă, o parte din procesele biologice naturale ale celulei provoacă un act -- un act nefericit în care, acum, complexul de proteine ​​de șapte-meri face încă o schimbare conformațională și se transformă în aceasta. fiară păroasă care permite factorului letal să intre în celula ta și să o omoare. Deci, puteți vedea că atunci când vorbim despre structura tridimensională a proteinelor , fie că o anticipăm, fie că o rezolvăm, proteina nu este un obiect static. Aici, se asociază cu un singur factor. Asociază șapte dintre ele. Interacționează cu factorul letal. Deschide un canal complet nou în membrană, etc. Trebuie să vă gândiți la acestea ca la sisteme dinamice cu multe stări diferite. De asemenea, trebuie să ne gândim la intervalele de timp. Multe dintre... mecanica moleculară despre care vom vorbi, scala de timp de relevanță este femtosecunda. Trebuie să fii capabil... ei bine, două nanosecunde. Deci 10 la minus 15, 10 la minus 9 secunde. Aceasta este mișcarea atomică. Cifra de afaceri a unei enzime, care este timpul necesar pentru ca o moleculă mică, de exemplu, să găsească și să lege enzima, să treacă eventual printr- o etapă catalitică și să se disocieze ca produs. Este de ordinul microsecundelor până la milisecunde. Iar al doilea interval este timpul în care îi ia moleculei -- medicamentul sau molecula mică -- pentru a atinge suprafața celulei, poate difuza prin celulă și pentru a-și găsi ținta. Transcripția despre care am vorbit, toate mecanismele de reglare ale transcripției data trecută, rata constantei pentru acel proces este de aproximativ 50 de nucleotide pe secundă. Nu tocmai întâmplător, asta este viteza cu care este tradus în proteine. Acestea sunt numere importante, deoarece o bucată tipică de dimensiunea genei , să zicem, după îmbinarea ARN-ului în organisme superioare sau în mod natural, ar putea fi o kilobază. Deci este aproximativ o jumătate de minut pentru a transcrie și a traduce. Acesta ar putea fi folosit ca temporizator într-un circuit al acestor intervale de timp mai lungi, cum ar fi ciclul celular, ritmul circadian, intervale de timp foarte lungi în sistemele ecologice cu bambus și diverși dăunători, care nu pot fi nici măcar anual, și apoi dezvoltarea și îmbătrânirea, care poate fi de ordinul a sute de ani, cel puțin pentru oameni, țestoase și balene. Deci, pentru ce credem că sunt bune proteinele depinde de precizie. Și acuratețea depinde de metodă. În dreapta jos, avem o abordare foarte atrăgătoare, care este predicția de novo, a priori sau ab initio a structurii tridimensionale secundare a proteinelor din secvență, pe care o primim în găleți din genom. proiecte. Dar, din păcate, acuratețea de până acum - și vom aprofunda acest lucru în detaliu într-un moment - este de ordinul a șase angstromi de diferență între structura prezisă și ceea ce este de fapt prin metodele mai precise de mai sus. . Axa y aici, axa verticală, este, în esență, identitatea secvenței pe măsură ce începeți să faceți, să zicem, o modelare comparativă aici, pe măsură ce obțineți -- în loc de predicția ab initio sau de novo, nu necesită nicio asemănare de secvență. Dacă vrei să-l construiești pe baza unor structuri rezolvate anterior, ai nevoie de cel puțin 30%, dar ești încă foarte departe -- să zicem, la 3 până la 4 angstrom-- de structura nativă. Pe măsură ce ajungeți la 1 Angstrom sau mai bine în acuratețe, așa cum puteți obține din cristalografia RMN și cu raze X, sunteți acum în măsură să studiați mecanismul catalitic și să proiectați și să îmbunătățiți liganzii, cum ar fi medicamentele. Aici chiar vrem să fim. Poate exista o zi în care putem face toate acestea din predicții ab initio sau modelări la distanțe foarte mari. Dar, deocamdată, modelarea la foarte scurtă, să zicem, 80% până la 90% similaritate cu aminoacizi, este importantă. Amintiți-vă, există o... la fel cum există o varietate de structuri diferite de proteine. Acesta este doar un exemplu de literatură vastă care există în care puteți utiliza unele dintre metodele pe care le vom discuta în această clasă despre efectuarea mecanicii moleculare a proteinelor și prezicerea structurii lor tridimensionale în complex cu diferitele medicamente. Vom contrasta acest lucru sau vom arăta interacțiunea biologiei computaționale, care poate fi ajutată de măsurători reale ale legării medicamentelor, la fel cum am avut măsurători reale ale legării degetului de zinc la ADN-ul dublu catenar. Și modalități prin care puteți descoperi moleculele mici printr-o utilizare inteligentă a părților din ea pe care știți că se leagă și a părților din ea despre care știți că ar putea fi variabile în sens chimic. Acum, asta este ceea ce... așa cum există această competiție dinamică între agenți patogeni și gazdele lor, există acest joc letal similar care se joacă între agenți patogeni și industria farmaceutică. Și aici, HIV, pentru care acum există multe medicamente care vizează fie protează, fie polimerază -- unele dintre primele au fost vizate de polimerază, așa că avem o colecție mare. Aceasta este una dintre cele mai secvențiate molecule de pe Pământ, care este gena HIV care codifică polimeraza de transcriptază inversă . Și a fost secvențial de multe ori, deoarece pe măsură ce un pacient ia medicamente, populația sa de virusul SIDA se schimbă. Și fiecare dintre aceste mici site-uri de substituție în formă de romb grupate în jurul situsului de legare în proteină - locul de legare aici a indicat că substratul se află în umplerea spațiului, care este trifosfatul din stânga sus și că șablonul se curbe în jurul partea dreaptă a spațiului care umple structura verde strălucitor. Proteina este în roșu. Și aceste mici diamante indică substituții, unde nomenclatura este codul cu o singură literă pentru tipul sălbatic, poziția în aminoacizi de la capătul final este numărul, iar apoi a treia sau ultima literă din dreapta este noile aminoacizi. . Deci, de exemplu, D67N înseamnă un [? sparcade ?] la poziţia 67 şi tipul sălbatic se transformă într-o asparagină. Și asta provoacă o rezistență la medicamente la HIV, cu consecințe nefericite pentru pacient. Putem lua... acum, producerea de mutații în polimeraze nu are în totalitate consecințe negative. Și am să vă arăt un exemplu foarte frumos în care o ADN polimerază -- un tip foarte asemănător de dinamică, în care ADN polimeraza, doriți să o schimbați astfel încât să poată face față a ceea ce ar fi în mod normal un inhibitor al ADN polimerazei. , o clasă de nucleotide care este incapabilă de a se extinde - capabilă de a fi încorporată în genomul de replicare în creștere , dar nu este capabilă de extindere. Este un inhibitor puternic și este, de asemenea, un reactiv de secvențiere puternic, acești dideoxi. Și astfel, unul dintre lucrurile care au fost observate în timp ce secvențele unora dintre aceste polimeraze erau studiate și unii dintre mutanții de rezistență și așa mai departe, s-a observat că complexul dintre nucleotide, indiferent dacă este vorba de o deoxinucleotidă, prezentat aici cu o 3 prim hidroxil, care ar putea fi apoi extins prin introducerea următorului 5 fosfat. Acest hidroxil este aproape în spațiu de poziția pe o fenilalanină sau o tirozină, poziția 762 a acestei polimeraze, care poate fie -- dacă este o tirozină, are un OH acolo. Și dacă este o fenilalanină, pierzi O și ai doar hidrogen acolo. Și când aveți fenilalanina acolo, există un spațiu care-- un spațiu adecvat care găzduiește destul de bine 3 hidroxil primar. Dar dacă introduci acum un inhibitor dideoxi, acum ai prea mult spațiu acolo și începi să încerci să umpli acel spațiu cu alte molecule voluminoase, cum ar fi apa. Și, practic, constanta de legare, devine mult mai puțin favorabilă legare atunci când îți lipsesc ambii oxigeni. Așadar, aceasta a prezentat o oportunitate de a proiecta niște polimeraze care aveau o fenilalanină acolo pentru a accepta mai mult dideoxisul și, prin urmare, mai bine la utilizarea bolii în chimia secvenționării ADN-ului. Și asta a fost pur și simplu prin inginerie -- introducerea acelui oxigen acolo, prin schimbarea fenilalaninei într- o tirozină, acum a făcut o potrivire mai bună între -- vă puteți gândi la asta ca -- puteți avea fie oxigen și prin eliminarea acestui oxigen. , îl înlocuiești cu un oxigen pe partea proteică. Încerc să subliniez, prin câteva exemple aici, ideea de suprafețe complementare și modul în care le puteți proiecta. Acesta este un caz frumos. Acum, vorbim mai degrabă de un singur atom decât de suprafețele complementare ale acizilor nucleici despre care vorbeam înainte. Acest lucru are un efect de 8.000 de ori asupra specificității acestei polimeraze și un impact mare asupra Proiectului Genom. Acum, așa programăm un anumit atom pentru a atinge un obiectiv important. Și, desigur, virusul are propriile mecanisme de programare în mod tipic, prin mutageneză și selecție aleatorie, așa cum am vorbit în genetica populației. Dar modul în care programăm proteinele în general este fie transgenice, în care s- ar putea să supraproducăm proteina, fie recombinarea omoloagă, care este cea mai finală unde mergem și dacă proteina este deja -- dacă gena care codifică proteina este deja prezentă, poate schimba acea anumită nucleotidă in situ în locul corect, astfel încât să fie reglată corespunzător și totul. Este o modalitate grozavă de a face asta. Mutanții punctiali nu sunt singura modalitate de a genera mutanți condiționali. Mulți dintre ei au fost din punct de vedere istoric. Dar există modalități prin care puteți programa și condiționat, adică puteți regla în ce condiții proteina este exprimată sau nu sau activă sau nu cu un întreg domeniu, sau cu polimorfisme de un singur nucleotide. Acum, deci aceasta este o singură cale. Aceasta este calea acidului nucleic. O altă modalitate este prin modularea activității proteinelor din exterior cu medicamente sau molecule asemănătoare medicamentelor și cinetică chimică. Și sub subtitlurile pentru asta, le puteți face prin sinteză combinatorie - și vom arăta un exemplu în acest sens. Dar sinteza combinatorie se poate baza pe principii de proiectare, nu doar complet aleatorie. De obicei sunt. Principiile de proiectare pot lua în considerare ceea ce știți despre natura interacțiunii proteinelor similare. Și puteți extrage orice date biochimice pe care le puteți colecta pentru așa-numitele relații de activitate a structurii cantitative . Aceasta este o disciplină puțin diferită de studiile cristalografice și cantitative detaliate despre care am vorbit până acum. Aici, în principiu, încercați să extrageți prin structurile ligandului însuși părțile ligandului care ar putea fi responsabile pentru activitatea, activitatea de legare sau activitatea biologică completă pe care o vedeți. Deci, să ne uităm la câteva exemple de polimorfisme cu o singură nucleotidă despre care am vorbit înainte în-- de fapt, aceasta este o clasă despre care nu am discutat înainte. Dar la clasele anterioare. Dar este legat de ceea ce am tot vorbit. În cazul degetului de zinc am făcut o specificitate alterată. Am făcut noi degete de zinc cu legare la trinucleotide complet noi . Cu ADN-polimeraza, prin schimbarea unui aminoacid, am putea face ca acum să accepte aproape patru loguri mai bine, un inhibitor este foarte util. Și aici, multe diferite - multe dintre acestea sunt enzime, în care nu puteți pur și simplu elimina enzima, ci o puteți face să recunoască un nou substrat sau să schimbați radical constanta de legare și rata catalitică pentru noi substraturi. Și am acest diapozitiv lung, cu litere fine, doar pentru a vă impresiona -- acesta este de fapt mai puțin de jumătate din listă -- câte exemple. Acestea nu sunt atât de neobișnuite. Și acestea pot fi proiectate sau apar în mod natural. Acum, vom lua structura tridimensională a proteinelor și o vom conecta cu discuția noastră despre haplotipuri și polimorfisme cu o singură nucleotidă . Și vă puteți aminti că, cu... unul dintre polimorfismele obișnuite cu o singură nucleotidă este alela ApoE4. Este prezent la 20% din populația umană. Chiar dacă are consecințe nefericite, credem că, în principal pentru boala Alzheimer -- crește riscul de apariție a bolii Alzheimer și, probabil, crește capacitatea cardiovasculară prin ApoE se referă la implicarea sa în metabolismul și transportul colesterolului. Alela ApoE3 este prezentă în aproximativ 80% și este mult mai frecventă la populațiile umane, dar ambele ar fi considerate alele foarte comune. Și am menționat, de asemenea, că forma ancestrală a acesteia, de exemplu, găsită la cimpanzei la aproape 100%, este această arginină 112, în loc de ceea ce este acum obișnuit la populațiile umane a fost cisteina 112. Și asta a fost... o explicație pentru asta ar putea fi că a fost fiziologic... standardele noastre nutriționale s- au schimbat. Acum mâncăm mult mai multe lucruri grase. Trăim suficient de mult pentru a face Alzheimer. Și poate că acesta a fost ceva care a fost... această alelă proastă, E4, a fost bună la cimpanzeii care au diete sau durate de viață diferite. Dar cealaltă posibilitate - și nu pot face distincția între acestea chiar acum - ci o altă posibilitate de luat în considerare în mod serios, nu doar în acest caz, ci în cazuri în general, este că nu te mai gândești doar la nucleotide individuale. Te gândești la haplotipuri. Totul insistă asupra faptului că catena de ADN are șanse de a afecta fie nivelul de expresie al proteinei, fie insistă, asupra catenei proteice, să se retragă și să interacționeze. Și puteți vedea că unul dintre cei mai apropiați aminoacizi de această arginină 112, care este principala diferență dintre ApoE4 și ApoE3. Arginina 61 este aceeași pe cele două alele. Dar te gândești la acesta ca la un haplotip, iar la cimpanzei haplotipul este acum treonină 61. Și poți crede că un [? 3R ?] la cimpanzei, sau ancestral, nu este prea diferit de [? Rcys. ?] Deci, ordinea diferită. Deci este ca această mutație compensatoare, complementară, așa cum am avut-o în oxigenul din polimerază acum câteva diapozitive. Și vă puteți gândi la mutațiile compensatoare... am avut teoria informației reciproce pentru a face structura teoriei. Gândiți-vă la suprafețe complementare. Când vă gândiți la nucleotide individuale, nu vă gândiți la ele ca haplotip și eventual constelații complementare. Mai ales, acum, acest lucru ne aduce la posibilul impact al structurii tridimensionale asupra predicției alelelor umane dăunătoare. Dacă am avut dintr-o dată secvența tuturor din această cameră și am fi vrut ca programul nostru de calculator să prioritizeze, cărora ar trebui să le acord atenția? La ce abateri de la cea mai comună alela ar trebui să mă uit mai întâi? Ei bine, s-ar putea să vă gândiți la aceste lucruri în termeni de proteine. Am ajuns acum la punctul în care vorbim despre proteine. Trebuie să vă gândiți la structura tridimensională. Cine este lângă cine în structură? Vă puteți gândi la site-uri de legare. Acestea ar putea fi indicate de... dacă cunoașteți structura tridimensională sau cunoașteți modelul de conservare în această familie de proteine. Puteți întreba lucruri despre taxare. În ultimul diapozitiv, am avut sarcina argininelor aproape de o sarcină negativă parțială compatibilă asupra cisteinelor sau treoninelor. Poți avea... o disulfură este un lucru foarte important de pierdut. Ele tind să fie foarte conservate. Dacă introduceți o prolină în ceea ce ar fi în mod normal un helix alfa, acesta este ceva în care cunoașterea structurii tridimensionale ar spune, o, acea prolină, aceasta a priori, fără nicio cunoștință de conservare, ar putea fi o schimbare uriașă în structura tridimensională. Și apoi aceste profile multi-secvențe sunt o modalitate bună de a privi conservarea. Acesta este o modalitate de a prioritiza polimorfismele cu o singură nucleotidă care ar putea avea impact asupra farmacogenomică sau asupra bolii în general. Acum, pe măsură ce integrăm asta cu diversitatea chimică pe care o putem crea, acesta va fi subiectul pentru următoarele câteva diapozitive, cum creăm diversitatea chimică? Și voi prezenta aceasta, ideea diversității chimice, într-un fel, sper că se conectează frumos la locul în care am fost cu matricele ARN. Matricele ARN și matricea ARN dublu catenară pe care am folosit-o mai devreme în clasă de astăzi pot fi generate într- un sens comentativ. Puteți face un set exhaustiv. Acum, de obicei, acelea erau făcute acolo unde, spațial, erau izolate. Fiecare acid nucleic diferit , oligonucleotidă, este prezent într-un loc diferit, identificabil de computer prin coordonatele sale pe o matrice. Dar le puteți, de asemenea, să le faceți într-un amestec mare și să le folosiți ca amestec și să faceți o selecție pe ele, așa cum am făcut cu afișajul phage. Sau le puteți face ca un amestec de particule de fază solidă și apoi separați particulele de fază [INAUDIBILE] într-un fel. Faza solidă apare din nou și din nou în matrice. Este foarte evident de ce ai o fază solidă. Doriți să îl puteți adresa prin pozițiile sale în x și y pe matrice. Dar celălalt motiv -- motivele tehnice sunt că este o modalitate fantastică de a obține purificarea produselor prin simpla spălare, mai degrabă decât prin proceduri complicate de purificare. Și vă permite să, în cazul margelelor, acolo acum - vă puteți gândi la ea ca la o matrice finală și flexibilă . Puteți muta margelele și le puteți pune în matrice noi și le puteți identifica mai târziu. Oricum, așa că vom introduce modul general de a produce fie -- substanțe chimice complexe, fie că sunt polimeri liniari, cum ar fi proteinele sau acizii nucleici, sau molecule mult mai strânse și mai mici. Dar au concepte similare de care aveți nevoie. Există faza solidă despre care am vorbit deja. Există ideea grupurilor de protecție, iar grupurile de protecție protejează împotriva unei grupări reactive. Deci, grupul foarte reactiv de aici este fosforamidit, care este această legătură de azot fosfat. Acesta este capabil să reacționeze cu aproape orice azot sau oxigen, cum ar fi acesta -- în cele din urmă, odată ce protejați acest oxigen în poziția primă 5, acești doi oxigeni sunt 5 și 3, la fel ca cei despre care am vorbit. tot acest timp. Aceasta este versiunea de sinteză chimică a polimerazei despre care am tot vorbit. Deci aveți aceste grupuri reactive și grupurile protectoare. Și acestea sunt conceptele majore. Acum, să trecem. Acesta este... subiectul aici este proteinele. Și vom vorbi mai multe despre sinteza proteinelor ca parte a cuantificarii data viitoare și ca parte a rețelelor în ultimele trei prelegeri. Dar iată o modalitate complet sintetică de a obține peptide scurte, fie prin sintetizarea directă a peptidelor, fie prin sintetizarea acidului nucleic care codifică acea peptidă sau interferează cu producerea acelei peptide. Și vă puteți gândi la acestea ca la molecule asemănătoare medicamentelor. Acestea sunt înrudite în mod natural - pot fi analogi ai acizilor nucleici și proteinelor, nu doar cele directe. Și vom vorbi despre oportunitățile de a face acești analogi. Și astfel, făcând analogi ai proteinelor sau acizilor nucleici cunoscuți, aveți o legătură mai imediată între lucrul pe care computerul dvs. a instruit sintetizatorul să îl facă și țintele dvs. Ei bine, dacă faci o substanță chimică aleatorie, nu știi neapărat care este ținta ta. Dar vom vorbi despre modalități de a face substanțe chimice puțin mai puțin aleatorii. Dar aceasta este o modalitate de a face o legătură directă. Și procesul este ciclic în sensul că la fiecare ciclu, te întorci, iar polimerul devine puțin mai lung. Începeți cu un monomer pe o fază solidă, arătate de aceste mici hexagoane din partea dreaptă a diapozitivei. Și adăugați... îndepărtați grupul de protecție de pe polimerul imobilizat, un grup de protecție. Și apoi aduci acest grup reactiv, altfel protejat. Și există într-adevăr un produs major la care vă așteptați. Spălați tot excesul. Acum ai unul mai mult. Tu deprotejezi. Acest grup DMT este eliminat. Și te întorci și faci din nou bicicletă. Pot exista pași suplimentari, cum ar fi oxidarea, care vor stabiliza noua legătură pe care ați făcut-o. Sau puteți avea un pas de plafonare care poate absorbi orice exces care a rămas. Dar, în general, după ce ați terminat cu toate aceste cicluri, atunci va exista un pas în care eliminați grupările de protecție cu totul și eliminați polimerul din faza solidă, dacă doriți. Sau o lași acolo, dacă ai o matrice. Acestea sunt alte exemple de grupuri protectoare. Acestea sunt acum pe baze. Unele baze nu au nevoie de protecție, cum ar fi tiaminele. Dacă aveți o amină exociclică, atunci aveți nevoie de obicei de o grupare benzii sau izobutiril în albastru, aici sunt grupările protectoare. Am spus că există o oportunitate aici de a modifica nucleotidele sau oligopeptidele sau alte substanțe chimice pentru a le face astfel încât să fie legate de, dar să nu fie identice în fiecare proprietate, cu constituenții normali ai corpului tău sau ai unei celule bacteriene către care vizați. . Și de ce ai vrea să faci derivate? De ce să nu faci exact lucrul? Și motivul pentru care doriți să faceți derivate ar fi, de exemplu, să le creșteți stabilitatea, sau să le micșorați stabilitatea, sau să le faceți să se lege mai rapid sau mai ireversibil. Și exemple sunt, în slide-ul anterior, puteți face baze modificate. Și în diapozitivul 29 aici puteți schimba coloana vertebrală în sine. Puteți schimba ribozomii astfel încât să aibă grupuri voluminoase care împiedică nucleazele să intre, sau pot schimba oxigenul cu sulf sau hidrogeni pentru a face coloana vertebrală fosfodiesterică în sine, care este locul în care este scindat nucleul, o formă mai puțin atractivă, mai puțin energetic. substrat favorabil. Deci, acum, acestea sunt procese chimice care, într-un anumit sens, imită polimerazele și ribozomii normali din celulă. Și există procese analoge pentru a genera diversitate chimică pe molecule mai mici. Și apoi există, în mod analog cu asta, mecanisme biologice prin care puteți face diversitate de molecule mici, care sunt mai puțin ciclice decât procesele despre care tocmai am vorbit. Acestea sunt mai degrabă un set de reacții ordonate care au o repetare conceptuală, dar într-un anumit sens, te poți gândi la el ca la un program liniar pe care îl mergi de la început până la sfârșit. Și asta pentru a face aceste polichetide, care sunt afișate în partea dreaptă a diapozitivului. O clasă mare de produse farmaceutice, inclusiv majoritatea antibioticelor, sunt produse de un set destul de mic de organisme, cum ar fi streptomicele din anumite plante. Și acest proces prin care este realizat, care va fi ilustrat mai detaliat în următorul diapozitiv, este foarte asemănător cu sinteza acizilor grași. Acizii grași sunt lanțuri lungi de hidrocarburi, la care vă puteți gândi, adăugarea fiecărui atomi de carbon pe acel acid gras este un proces asemănător cu cel de fabricare a acestor molecule asemănătoare medicamentelor policetidice. O altă modalitate biologică de a face o structură foarte compactă, care folosește de fapt ribozomi, dar îi folosește pentru a face peptide scurte foarte strânse și un precursor care apoi se pliază cu multe disulfuri pentru a face acest lucru mic și foarte reticulat. Acum, faptul că acești melci conici au dispărut și-au dat problemele de a produce sute de aceste peptide diferite, foarte mici, care au aceste proprietăți, vă spune ceva despre ceea ce doriți - că moleculele asemănătoare medicamentelor au în comun. Și adică sunt mici, așa că difuzează rapid și ajung pe site-ul lor. Și astfel puteți avea cantități mari din ele într-un spațiu mic. Deci, puteți produce o mulțime de ele. Și apoi trebuie să fie foarte reticulate pentru a menține rigiditatea. Deoarece sunt mici, au o suprafață mai mică pentru a se lega de buzunarul de legare. Deci, pentru a compensa asta, trebuie să aibă multă rigiditate. Și lucrul pe care îl blocați rigid trebuie să fie structura corectă. Nu- ți folosește de nimic să ai o structură rigidă care nu este chiar perfect complementară cu acea suprafață. Și a treia sursă de diversitate biologică este una cu care probabil ești mai familiarizat, și anume receptorii imuni, receptorii celulelor B și T , anticorpii și imunitatea mediată de celule. Și acestea folosesc mașini de recombinare pentru a programa diferite combinații de motive de acid nucleic care codifică motive proteice. Și pe măsură ce fac acea recombinare, au o diversificare suplimentară care are loc datorită unei polimeraze independente de șablon , [? termotransferaza, ?] care va extinde câteva nucleotide de secvență de acid nucleic complet aleatorie care practic accelerează incredibil rata de mutageneză, generând practic secvența de novo. Acesta este unul dintre exemplele din biologie în care generați secvența de novo. Și cred că asta este foarte potrivit pentru acest subiect combinatoriu. Acum, acesta este un exemplu frumos din diapozitivul anterior. Polichetidele acelea din extrema dreapta acum sunt vedeta acestui diapozitiv. Și aici, într-un anumit sens, natura a -- și acum oamenii de știință au -- a conceput module de proteine pentru a face această secvență liniară de evenimente. Vă puteți gândi la, aici, că utilizați un set liniar de domenii proteice pentru a programa serii foarte complicate de reacții chimice, în același mod în care secvența liniară a ARN-ului mesager îi spune ribozomului să facă o serie de adăugiri în proteină. Ciclul catalitic al ribozomilor este un ciclu, în timp ce acesta este mai mult o bandă liniară, o serie liniară de evenimente. Proteinele în sine, aceste lucruri mici în formă de săgeată, cu cutii în ele în partea de sus, etichetate Modulul 1 până la 6, acele proteine ​​sunt, desigur, fabricate pe ribozomi. Dar apoi acționează cam ca sinteza în fază solidă, în care proteina purtătoare acil , ACP din cutie, se leagă de primul monomer și începe să- l transfere de la proteină la proteină de-a lungul acestei proteine ​​uriașe cu mai multe domenii. Și sunt de fapt trei proteine ​​la rând aici. Și fiecare dintre pași sunt parcurși în ordine de-a lungul proteinei și implică lucruri precum o etapă de sintetază, în care aduci un alt monomer, sau o etapă de ceto reductază, KR, în care vei aduce -- unde vei reduce una dintre legăturile duble sau o etapă de aciltransferază, AT. Dar puteți vedea că fiecare dintre acestea are o specificitate de substrat. Și schimbând ordinea specificităților substratului, puteți construi o colecție combinatorie uriașă aici în comunitățile microbiene și, de asemenea, în laborator. Acum, interacțiunea proteinelor. Tocmai începem să vorbim serios despre testele de interacțiune cu proteine. Cred că mulți dintre voi sunteți sau veți fi din ce în ce mai familiarizați cu testele de interacțiune cu proteine. În clasa următoare, vom vorbi despre modalități de obținere a informațiilor directe despre proteine prin reticulare și spectrometrie de masă. O altă modalitate este crearea indirectă a acestor teste reporter, în care profitați de proprietățile de legare ale proteinelor cunoscute pentru a analiza două proteine ​​necunoscute. Și astfel o proteină cunoscută ar putea fi, [INAUDIBLE], care se leagă de ADN și B42, care activează transcripția a ceva pentru care aveți un test vizual bun, cum ar fi [? URO3, ?] viaţă şi moarte. Și luând aceste două cunoscute, să spunem, în B42, care au proprietăți cunoscute, dar își exercită proprietățile numai atunci când sunt reunite și sunt reunite numai dacă proteinele necunoscute sau proteinele parțial cunoscute la care le sunt obligați să interacționeze unul cu celălalt. Și deci acesta este un așa-numit test cu doi hibridi și variații ale acestuia. Și cred că am menționat unul în care puteți caracteriza interacțiunile acid nucleic-proteină cu un singur test hibrid. Și aici, puteți inhiba această interacțiune dintre cele două cunoscute-- scuze, necunoscute sau molecule parțial cunoscute în albastru aici. Iată un TGF beta, un factor de creștere și o proteină de legare. Puteți inhiba acest lucru cu o anumită moleculă mică sau cu o colecție de molecule mici, care pot fi introduse dintr-una dintre aceste sinteze combinatorii într-o serie de aceste teste celulare. Și obțineți aceste informații despre... puteți fie colecta un set de date mari de proteine ​​care interacționează dintr-un experiment la scară proteomică , fie din molecule care inhibă una sau mai multe dintre aceste interacțiuni. Aceasta este o sursă de informații, care este intrinsec computațională în sensul... ei bine, în sensul că există o cantitate mare de ea. Puteți modela structura tridimensională a acestei interacțiuni dacă aveți suficiente date pentru a face asta. Și puteți modela impactul moleculelor mici într-o activitate de structură [? de cand. ?] Acum, dacă te uiți la partea din dreapta sus a diapozitivului 34 aici, poți vedea această diversitate uriașă a tuturor acestor forme colorate diferite. Și dacă doriți să le utilizați într-un test combinatoriu, le- ați conecta în fiecare combinație de perechi și le-ați încerca împotriva țintei dvs. printr-un test biologic. Cu toate acestea, dacă acea bibliotecă este prea mare fie pentru a fi creată, fie pentru a verifica -- de obicei, pentru a verifica -- atunci ceea ce puteți face este să puteți studia o parte a moleculei și să vedeți -- și apoi să luați subsetul diversității care se poate lega și apoi să ia acel subset, să- l caracterizeze și acum să facă doar combinațiile în perechi ale celor două semimolecule. Și, în general, dacă geometria este destul de rigidă, atunci constanta de legare va deveni - va fi aproximativ produsul dintre cele două constante de legare. Deci, dacă fiecare are o constantă de legare foarte scăzută, atunci va fi aproximativ pătratul acesteia. Și obțineți un punct de rentabilitate descrescătoare, în cele din urmă. Deci acesta este un exemplu de strategie în care folosiți puține cunoștințe anterioare, care pot fi empirice sau pot fi pur computaționale, despre cum să vă limitați biblioteca și să faceți combinații interesante. Acum, am vorbit în principal despre tipul de diversitate chimică pe care o putem obține, care vizează liganzii care se combină pentru a ținti proteinele. Dar acum, vrem să vorbim despre sursa de informații despre acele proteine ​​țintă în sine, care este un alt proiect genomic, genomica structurală. Și, de obicei, dorim să selectăm ținte pentru legarea medicamentelor sau să selectăm ținte pentru rezolvarea structurilor proteinelor pentru a analiza liganzii lor mai detaliat. Și cum putem face asta? Cum putem decide ce ținte se află în fruntea listei noastre pe care să le alegem în continuare? Avem sute de proteine ​​pentru care avem structuri tridimensionale, iar din unele dintre ele, avem informații despre ce liganzi se leagă. Dar acestea sunt alte criterii care sunt uneori folosite în domeniu pentru selecția țintei. Dacă sunt omoloage țintelor interesante anterioare, atunci asta le pune în fruntea listei scurte. Dacă sunt conservate - și am vorbit despre cât de importantă este conservarea din când în când - atunci aceasta ar putea fi o abordare. Dacă sunt conservate și le elimini, atunci te-ai putea aștepta să fie letal. Și asta ar putea să-l facă o țintă bună pentru un antibacterian. Dacă doriți să limitați acțiunea terapiei dumneavoastră la suprafață pentru, de exemplu, a reduce reacția încrucișată cu moleculele interne, uneori vă puteți limita la proteinele acceptabile la suprafață. Și, de fapt, o clasă foarte mare de medicamente vizează proteinele membranare accesibile la suprafață. Și astfel, de foarte multe ori, aceștia au prioritate ridicată. Există, de asemenea, proteinele acceptabile la suprafață sunt importante dacă vorbiți despre vaccinuri, ceea ce este din ce în ce mai important, sau diagnostice care nu sunt invazive sau cel puțin nu merg în interiorul celulei. Și există modalități, să zicem, cu microarrays, prin care puteți întreba ce gene sunt exprimate diferențial în starea bolii. Și asta provoacă prioritizare ridicată. Acum, odată ce ai acea prioritizare, care vine de la, să zicem, secvențierea genomului și unele dintre acele alte fapte, atunci ne-am dori să... ai ținta ta. Ai secvența ta genomului... secvența genei pentru acea țintă. Cum, atunci, obțineți structura tridimensională care vă ajută să proiectați medicamente sau să îmbunătățiți medicamentele pe care le aveți? Ei bine, o abordare foarte atractivă, având în vedere o secvență de proteine ​​care ar putea proveni din potopul lor de secvențe de genom, abordarea practică ar putea fi să începem cu această secvență a genomului - această secvență de genă care este 99,99% precisă și să încercăm să preziceți cele tridimensionale. structura proteinei și specificitatea ligandului acesteia. Și dacă treci prin acestea, acestea sunt un fel de estimări, unele dintre ele mai bune decât altele. Pentru a trece de la secvență la exoni -- am vorbit despre asta înainte -- ar putea fi 80%. Amintiți-vă, aceste numere chiar ar trebui să fie false pozitive, false negative, așa mai departe. Dar acest joc, 80%, ajunge la exoni, exoni la gene. Dacă nu aveți privilegiul suficient pentru a avea ADNc, atunci acesta este un proces predispus la erori, cu o rată de succes de 30%. Odată ce genele știe că este reglarea, indiferent dacă este activată sau dezactivată în anumite tipuri de celule de care ești interesat, este foarte dificil acum. Cunoașterea motivelor este abia un început pentru a obține regulamentul complet. Deci as spune 10% sau mai putin. Odată ce aveți o genă reglată, obținerea secvenței proteinelor este ușor. Acesta este codul genetic. Trecerea de la secvență la structura secundară este ușoară în contextul unora dintre aceste alte lucruri, dar totuși, precizia este de numai aproximativ 77%. Am lângă aceasta referința este [? cast,?] care este o competiție pentru evaluarea computațională a predicției structurii tridimensionale pentru proteine, care se desfășoară din, cred, din '94, iar următoarea va apărea în câteva luni. Și aceasta este un fel de mare cursă sau coacere între diferitele metode. Foarte palpitant. Dar, din păcate, de-a lungul deceniilor, este încă în jurul valorii de 77% pentru structura secundară și aproximativ 25% pentru structura tridimensională ab initio. Apoi, chiar dacă aveți structura tridimensională la o precizie adecvată, obținerea specificității ligandului este problematică și depinde de ligand. Dacă este ADN, este un caz bun. Dacă este o moleculă mică, poate fi de până la 10% sau mai rău. Acum, deoarece fiecare dintre acestea este destul de independentă de estimări, puteți obține o acuratețe generală aproximativă care este un produs al tuturor acestora, care este îngrozitor de mică la 0,0005. Așa că se cuvine să folosim cât mai multe date extra-experimentale sau să îmbunătățim algoritmii care sunt cei mai slabi în această călătorie de la secvența genomului la specificitatea ligandului. Vom ridica acest fir imediat după o pauză și vom continua cu modul în care obținem structura tridimensională, fie că este predictivă sau experimentală, și sarcinile de calcul de acolo. Mulțumesc. Ia o pauză.