Următorul conținut este furnizat de MIT OpenCourseWare sub o licență Creative Commons. Informații suplimentare despre licența noastră și despre MIT OpenCourseWare în general, sunt disponibile la MIT.edu. PROFESORUL: OK. Bine ați revenit în a doua jumătate. Vom prelua această notă oarecum pesimistă despre cum se trece de la o secvență foarte precisă la o ligă și specificitate speculativă probabil mai puțin precisă , până la cum obținem de fapt o ligă de structură 3D și o specificitate și unele dintre metodele puternice. care sunt împărtășite de instrumentele de calcul. Unul dintre lucrurile pe care vrem să le facem este să găsim, dacă este posibil, un omolog. Poate fi un omolog îndepărtat sau unul foarte apropiat. Dacă este foarte aproape, așa cum am văzut din acel diapozitiv anterior, despre cea mai mare precizie provenind de la omologi care sunt de 80% sau 90%. Pe măsură ce ne depărtăm din ce în ce mai mult , amintiți-vă că a trebuit să... mai întâi, puteți folosi potriviri exacte. Și apoi a trebuit să folosești programarea dinamică și apoi modelele Markov ascunse. Și, în cele din urmă, în partea de jos a acestui Slide 37, mergem la - recurgem la threading, în care una dintre structuri este căutată printr-o bază de date de structuri tridimensionale cu secvența ta preferată. Și nu numai că căutați prin baza de date a structurilor, ci și prin fiecare structură, vă gândiți la toate modurile în care vă puteți conecta secvența în acea structură 3D complicată. Și unele dintre pozițiile de filetare cu inserții, ștergeri și decalaje vor fi mai bune decât altele. Se vor potrivi acelei structuri tridimensionale. Unele vor provoca ciocniri, în care structura tridimensională prin care căutați și poziția particulară a firului pe care o aveți face ca două grupuri voluminoase să se așeze unul peste altul în spațiu într-un mod care este greu de eliberat de stres. Și, așadar, acest threading este probabil cel mai bun în obținerea de relații foarte îndepărtate. Este limitat de faptul că într-adevăr funcționează doar dacă una dintre cele două proteine are o structură tridimensională. Dar puteți căuta în baza de date de secvențe în baza unei baze de date de structuri 3D. Antidotul la limitarea de a nu avea suficiente structuri tridimensionale este lansarea unui proiect, cum ar fi Proiectul Genome, pentru a obține toate structurile tridimensionale. Acum, e finit? Ei bine, cu siguranță pentru un anumit genom, acel număr este mai mic sau egal cu numărul de proteine din acel proteom pentru acel anumit organism. Dar dacă ne uităm la organisme în ansamblu, unde nici măcar nu știm cu adevărat câte organisme există pe Pământ, atunci acest număr poate fi mai mare. Dar unii oameni estimează că este mai puțin de 10.000. Pliuri de bază, unde un pliu este schela -- care, odată ce ai acel pliu, fie că este vorba de un anumit număr de elice alfa, beta și viraje într- o anumită ordine, într-o anumită geometrie. Odată ce ai asta și ai orice secvențe de aminoacizi într-o identitate de aminoacizi de 35% - și vei vedea, pe măsură ce această ultimă secțiune a acestei prelegeri , de ce este în jur de 35%. Scopul este de a obține, satura spațiul structurii tridimensionale , astfel încât fiecare trei-- fiecare secvență să fie în cel puțin 35% din una dintre acele structuri. Acest lucru este oarecum conjectural, spre deosebire de Proiectul Genomului Uman, unde știam că avem 3 miliarde de baze de secvențial. Aici, sperăm că avem 10.000 de pliuri de bază. Și sperăm că identitatea secvenței de aminoacizi de 35% va fi suficientă pentru a face modelarea omologiei. BINE? Nu este. Nu este momentan. Și criteriile pentru aceasta trebuie să fie prioritizate într-un fel. Și amintiți-vă, am avut prioritizarea țintelor de droguri în diapozitivul anterior. Și aici, prioritizarea pentru genomica structurală este similară. Dar, în plus, vrei să ai... vrei să reprezinte cea mai mare familie pe care o poți obține, dar să nu fie rezolvată anterior. Și dintr-un anumit motiv, exclud non-- sau exclud proteinele transmembranare. Acum, aceasta este o clasă foarte importantă, așa cum vom vedea în următorul diapozitiv. Deoarece scopul enunțat în partea de sus a acestui articol, Slide 38, de a atribui funcții și de a interpreta polimorfismele legate de boli și țintele medicamentoase și așa mai departe se aplică cu siguranță și proteinelor membranare. Și există motive la care am făcut deja aluzie pentru a căuta specifice pentru programarea celulelor prin intermediul proteinelor membranare. Aici apar interacțiunile celulă-celulă . Aici are loc recunoașterea imună a motilității de aderență. Toate acestea apar fără a intra în interiorul celulei. Aceasta este o clasă majoră de ținte de droguri. Și, în plus, nu este o clasă de proteine ​​imposibil de rezolvat. De fapt, bazele de date structurale tridimensionale -- mai multe despre asta într-un moment -- sunt pline cu aceste lucruri. Ei sunt cu siguranță... sunt clasa cea mai subreprezentată, dar există o mulțime de exemple. Și există două clase majore. Unul dintre ele este fragmentele solubile de proteine ​​fibroase sau membranare. Unele dintre proteinele fibroase sunt, de asemenea, excluse. Aici vei folosi o protează pentru a desprinde, eventual, o bucată minusculă care o face insolubilă, poate o mică ancoră în membrană. Și tot restul se comportă acum ca o proteină solubilă. Și știm cum să rezolvăm proteinele solubile. Alteori, cealaltă clasă este proteinele membranare integrale, unde merg ca aceasta bacterie în partea dreaptă a imaginii, puteți vedea elicele alfa roșii mergând înainte și înapoi de-a lungul membranei unde lipidele gri. Și aceasta este... nu ai cum să tai o mică parte din asta și să ai o parte importantă din ea de rezolvat. Dar asta s-a rezolvat în membrană. Și puteți vedea micile molecule de apă albastră trecând prin acel canal în asta. Acest canal este responsabil pentru pomparea de protoni, care poate face parte din procesul de producție a ATP. Dar există multe alte clase - proteine ​​redox, toxine, canale ionice, fotosinteză și fototransducție și așa mai departe. Clasa de receptori cuplati proteinei G este o țintă deosebit de importantă a medicamentului. Au fost de asemenea rezolvate proteinele ABC și transportatorii. Deci, având în vedere că aceasta este o clasă subreprezentată și având în vedere că proiectul de genomică structurală nu le va viza neapărat într-o manieră rapidă, care este situația actuală pentru predicția computațională a regiunilor transmembranare ale proteinelor? Și de fapt, aș spune că perspectivele de aici sunt destul de favorabile în comparație cu unele dintre cele mai puțin favorabile din acel diapozitiv, acel diapozitiv foarte pesimist de câteva în urmă. Aici, puteți obține, așa cum este indicat în această lucrare JMP, elice transmembranare identificate - și pot exista și beta transmembranare, de asemenea, dar elicele se identifică cu o acuratețe mai mare de 99%. Și amintiți-vă, asta înseamnă, practic, să spuneți că le-ați identificat corect. Și atunci ai și predicții false. Vor exista o serie de regiuni peptidice ale proteinelor cunoscute, despre care se prevede incorect a fi în transmembrană. Și aceasta este o rată tolerabilă de predicție falsă de 17% până la 43%, având în vedere un set de proteine ​​solubile ca un set de învățare negativ. Acum, asta-- doar să știi că un anumit segment de proteină este transmembranar este un pas mare în ceea ce privește identificarea funcției sale. Dar pentru a obține o caracterizare funcțională ulterioară, avem nevoie de lucruri precum legarea ligandului, pe care le-am abordat deja. Și dacă vă uitați la unele dintre aceste citate, puteți vedea că o mare parte din accent este pe afișare și catalogare și o așteptare plină de speranță că vom putea trece de la structuri tridimensionale brute la specificitatea legată de liganzi. Dar de unde provin structurile tridimensionale pe care le avem, credem, care ne spun despre geometria exactă a legării ligandului? De unde vin ei? Și cum le calculăm? Cum le citim? Cum le citesc programele noastre de calculator? Ei bine, acesta este un fișier tipic al unei structuri tridimensionale. Aceasta se întâmplă să fie una pe care o vom arăta la... structura tridimensională chiar la sfârșitul acestei discuții. Este receptorul uman de estrogen. Și puteți vedea, prima linie este că este un complex între o proteină și o moleculă de ADN. Și moleculele, receptorul de estrogen. A treia linie de jos este rezoluția. Aceasta este o descriere tehnică a modelului de difracție de raze X. Vă oferă o limită superioară a cât de precisă este. Va fi mai precis decât 2,4 angstromi, în funcție de cât de multă supraeșantionare statistică aveți și de cât de bine aplica programul dvs. de calculator constrângerile chimice. O precizie tipică pentru o structură a proteinei de 2,4 angstrom ar putea fi de ordinul a 0,3 angstrom, poate de opt ori mai bună decât rezoluția nominală. Dar acesta este un număr important, determinat fără ambiguitate în procesul de colectare. Deci, când te uiți la literatură, uită-te la acest număr. Și uită-te la următorul număr în jos, care este valoarea R, care nu este o măsură a rezoluției, ci o măsură a bunei potriviri între model. Modelul este coordonatele X, Y, Z ale atomilor tăi. Este bunătatea potrivirii dintre model și date. Și vom avea în curând un diapozitiv despre cum este calculată această valoare R. BINE. Următoarea linie în jos începe secvența. Și dacă aveți o secvență cu mai multe lanțuri , aici am tăiat-- am tăiat câteva linii pentru-- există multe linii de secvență pentru proteina din acest cod de trei litere și linii principale de secvență pentru nucleul acid în acest cod format dintr-o literă. Și apoi, părți chimice suplimentare ale structurii. Amintiți-vă, structura este complicată. Nu este vorba doar de proteine. Aici are acid nucleic, are zinc. Are molecule de apă, uneori diverse alte lucruri. Fiecare dintre aceste molecule, dacă o puteți găsi în structură, veți determina coordonatele X, Y și Z. Deci următorul vă spune structura secundară. Amintiți-vă că există trei tipuri de bază: elice alfa, foi beta și bobine. Și acestea sunt descrise - și din nou, vă arăt doar un exemplu de rând din fiecare. Există o listă lungă pentru fiecare dintre acestea, unde au fost identificate fie manual, fie printr-o automatizare computațională din structură. Și acestea pot fi utile ca un rezumat al structurii. Și apoi, iată adevărata carne a structurii. Liniile care încep cu cuvântul atom, aceasta este o poziție a atomului de azot numărul unu în metionină, care este aminoacidul numărul unu din lanțul A. Deci l-a întâlnit pe A. Lanțul A se întâmplă să fie lanțul proteic. Și apoi, după aceea este reziduul numărul unu. Și apoi, coordonatele XYZ, aproximativ 50, 24, 79. Apoi un factor de scară unu, care este aproape întotdeauna unul. Și apoi un factor B, 60, care este reprezentativ pentru cât de departe de acea valoare XYZ se poate abate? Acesta este un termen de abatere pătrată. Și absoarbe mișcarea termică a atomului respectiv și diverse defecte structurale. Deci vă oferă o idee despre dezordinea acelui atom. Și apoi aveți ultimele două înregistrări pe care trebuie să le faceți, ce atom este conectat la ce atom din structură? Într-un anumit sens, acestea pot fi adesea deduse doar prin distanța dintre atomi din structură. Acum, în partea dreaptă, este doar numărul de înregistrare și prescurtarea pentru structură, care este 1/8 CQ. 1/8 CQ se referă la receptorul uman de pui. Deci este un lucru foarte uscat - așa apare când îl descărcați din baza de date PDB sau RCSV. Apoi, când îl afișați, în timp ce îl rezolvați, dacă sunteți RMN sau cristalograf cu raze X sau, eventual, îl afișați din bazele de date, iar cele două culturi diferite din [INAUDIBLE] din stânga tind să-și descrie structurile ca fiind multiple. trase în lanț pentru că doresc fie să-și exprime incertitudinea cu privire la structură, fie doresc să se laude cu modul în care știu ceva despre dinamică. Oricum, aveți mai multe lanțuri care se suprapun aici în culori diferite, indicând o parte din incertitudinea sau dinamica diferită a fiecărui atom major. Uneori, veți afișa toți atomii ca unul în dreapta, sau veți arăta doar atomii majori, cum ar fi carbonul alfa, care este centrul fiecărui aminoacid pe măsură ce mergeți în stânga. În dreapta este modul în care cristalograful cu raze X ar putea arăta potrivirea datelor. Deci modelul este o figură care conectează atomii ca cercuri. Și apoi munca de plasă este densitatea electronică, pe care o puteți observa odată ce aveți toate datele cu raze X și modelul, sau o puteți calcula odată ce aveți modelul. Modelul plus fizica cunoscută a împrăștierii fiecăruia dintre... fizica cunoscută a densității electronice a fiecăruia dintre atomi, puteți calcula densitatea electronică. Acum puteți compara densitatea de electroni calculată cu cea observată. Sau puteți compara împrăștierea calculată cu cea observată. De obicei, se face în împrăștiere, care este transformarea 4E a densității electronilor. Și asta este tot. Densitatea electronilor este indicată de RHO aici, la mijlocul acestei formule. Și transformarea 4E este doar această integrală a RHO peste informațiile de fazare, fazarea undelor luminoase. Aceste valuri, la fel ca un val pe un ocean, au o fază. Fie că este în sus sau în jos în jgheab, cât. Și astfel produsul densității de electroni RHO, care este o funcție a lui X, Y și Z, toate cele trei coordonate, este însumat prin aceste integrale-- Este o funcție continuă-- de la 0 la 1. 0 la 1 și X, Y și Z. Acesta este Y01, deoarece aceasta este o structură care se repetă. Are un mic cub dreptunghiular de spațiu în jurul său, care se repetă. Și tot ce trebuie să faceți pentru a calcula întreaga densitate de electroni este să vă gândiți la acest mic cub, care merge de la 0 la 1 în acele unități arbitrare. Dar acum așa poți ajunge dintr-un spațiu în altul. De la densitatea de electroni până la împrăștierea pe care o observați de fapt atunci când străluciți cu raze X o structură cristalină care se repetă. Dar acum doriți să ajustați modelul. Reglați acești atomi din slide-ul anterior, astfel încât să puteți maximiza potrivirea. Adică, minimizați diferența dintre împrăștierea observată F0 și împrăștierea calculată, FC. Pentru că știți împrăștierea fiecărui atom și știți că încercați să determinați poziția fiecărui atom. Poziția atomului ar putea fi un parametru, P, pe care îl ajustați puțin la un moment dat. Și asta și acea schimbare pot fi aproximate prin ceea ce se numește o extindere a seriei Paler. Aici, luăm doar primul termen, care implică primele derivate, toți termenii subsecvenței implică derivate a doua și mai mari. Și acestea sunt suficient de aproape de 0 pentru această muncă încât să le renunți. Și, practic, spune că, dacă vom ajusta acest parametru, ne putem da o impresie cât de repede îl ajustam, care se bazează pe sensibilitatea împrăștierii, F. Derivata lui F calculată în raport cu fiecare parametru . Parametrii ar fi coordonatele X, Y și Z sau ar putea fi un fel de parametri de rotație. Deci, acesta este pentru a vă oferi o aromă a modului în care se face de fapt. Acesta este modul în care obții de fapt din împrăștierea unui cristal. Cristalul are avantajul. În principiu, puteți face un experiment de împrăștiere din molecule individuale. Dar moleculele individuale, semnalul este prea slab. Și este acoperit de zgomotul altor evenimente fotonice aleatorii . Deci, având un număr mare de ele într-o matrice ordonată, toate sunt coerente și, practic, vă fac statisticile pentru dvs. Se integrează și obțineți valoarea statisticilor de miliarde de molecule fără a fi nevoie să observați fiecare dintre miliardele de molecule și apoi să faceți calculul în prezența unui zgomot imens. Deci despre asta este vorba despre cristal. RMN necesită, de asemenea, miliarde de molecule. Și astfel ambii au marea cerere de a necesita cantități mari de molecule pure. Și acesta este unul dintre motivele pentru care proteinele membranare au fost mai greu de obținut. Este mai greu să obții cantități mari de bucăți de membrană pură. Acum, aceste două metode RMN, pe care nu le voi descrie, și cristalografia suplimentară pe care abia am descris-o, împărtășesc cu metodele abinitio de predicție a structurii proteinelor anumite componente computaționale cheie . Și acestea sunt încorporate într- un sistem combinat, care face cristalografie, RMN și unele dintre aceste mecanici moleculare care păstrează structura. Vă puteți imagina că, dacă structura a început să explodeze, atomii mergând în direcții ciudate, ar putea totuși să minimizeze funcția dacă aveți un minim local. Dar dacă mențineți chimia intactă și satisfaceți ceea ce știți despre mecanica moleculă a substanțelor chimice, atunci de fapt puteți potrivi o structură de mai departe. Acum iată factorul ARC la care am spus că vom reveni. Pe măsură ce faceți această rafinare, pe măsură ce ajustați pozițiile fiecăruia dintre atomi, pe măsură ce computerul ajustează poziția fiecăruia dintre acești atomi, comparați împrăștierea F0 observată cu FC. Acestea sunt în valori absolute deoarece, de fapt, împrăștierea are ca rezultat pierderea informațiilor de fază. Deci lucrurile reale pe care le măsurați sunt valori absolute. Și apoi luați valoarea absolută a diferenței pentru a vă asigura că însumați un număr pozitiv. Și apoi normalizi acest lucru, așa cum am făcut-o înainte, pentru a-l pune pe o scară standard recunoscută unde 0,4 înseamnă că ai o structură foarte brută - dacă vezi asta în literatură, nu crezi . Dacă este mai mică de 0,25, ceea ce a fost ultima structură, atunci crezi că este destul de aproape de gata. Acesta este foarte analog cu coeficientul de corelație. Amintiți-vă, am avut un coeficient de corelație liniară între două funcții, aici ar fi observat și calculat. Dacă se corelează bine, atunci ești aproape de terminat. Corelarea bine este mai bună decât 0,7, în acest caz. Și o modalitate de a raporta asemănările dintre două structuri, aceasta nu este o bună potrivire între model și date, aceasta este o bunătate de potrivire între două modele. Atom cu atom treci și măsori distanța dintre ele. Și acea rădăcină a deviației pătrate medii, a tuturor distanțelor de pe toți atomii, sau a tuturor atomilor cheie, atomi de miez , alfa de carbon -- sau poate chiar un nucleu mai mic decât atât -- vă permite să citați o abatere medie pătrată, care are o anumită semnificație independentă de câți atomi ai și de ce proteine ​​te uiți. Fiecare dintre acestea încearcă să pună acest lucru la o scară comună, astfel încât să puteți compara de la structură la structură. Acum, dacă vom face mecanică moleculară, care este comună metodelor empirice computaționale și metodelor bazate pe secvențe computaționale, trebuie să vorbim despre lanțurile laterale ale proteinelor. Am vorbit în principal despre coloana vertebrală. Și doar o reîmprospătare, aceasta este din codul geniculat. Din nou, albastrul sau încărcarea pozitivă și încărcarea negativă și așa mai departe. Au o chiralitate. Contează dacă vorbești despre L-aminoacizi sau D-aminoacizi. Felul în care îți amintești-- acesta este doar un mnemonic pentru a-l aminti-- este că atunci când hidrogenii îndreaptă spre tine, mergând în sensul acelor de ceasornic, merge C0 carbonil R, acesta este un lanț lateral în porumb. Și unii dintre cei 19 dintre acești aminoacizi au o chiralitate acolo. Glicina nu are pentru că are doi hidrogeni în loc de R, ea are un hidrogen. Și doi dintre aminoacizi au de fapt doi centre de asimetrie chirală. Treonina, care are acest lanț lateral, și izoleucina. Au carbonul alfa și carbonul beta sunt ambele asimetrice. Și unul dintre cele mai vechi exerciții a fost făcut atunci când au fost analizate primele modele de proteine , mici peptide. Poate face acest lucru manual, cu niște modele brute foarte simple. Și poți trece prin sistematic, există trei legături de-a lungul unei peptide, peptidă lungă. Și acestea sunt legătura peptidică în sine, care conectează un aminoacid la următorul. Și asta tinde să fie destul de rigid. Are o legătură parțială dublu catenară și tinde să fie o configurație trans, 180 de grade. Aceasta este rotația în jurul legăturilor, nu unghiul de legătură, ci rotația în jurul legăturilor. Și există alte două legături care nu sunt atât de rigide. Deci acestea sunt gratuite, dar sunt constrânse de ciocnirile care apar, astfel încât, atunci când vă rotiți în jurul legăturii, lanțurile laterale se vor ciocni cu alte părți ale proteinei. Și așa Ramachandran și colegii au trecut sistematic prin toate unghiurile Phi și PSI posibile, acestea sunt aceste două legături libere. Și acest lucru este afișat aici variind pe întreaga gamă de Phi și PSI pe axa verticală orizontală. Și obțineți aceste mici regiuni portocalii în care chiar și cu grupuri de lanț foarte voluminoase, ceea ce ar avea loc, obțineți aceste regiuni permise. Și aceste două regiuni permise s-au întâmplat să coincidă cu două dintre cele mai populare motive pe care le găsiți în proteine, care sunt foaia beta și helixul alfa. Există și alte lucruri, cum ar fi helixul 310 și diverse alte structuri care apar. Dar acestea sunt de departe cele două cele mai comune. Și galbenul arată cum se extind atunci când aveți lanțuri laterale mai mici care permit mai multor părți ale spațiilor de conformare, așa cum se numește, să fie inspectate. Acum, acesta este un lucru foarte grosolan pe care îl puteți face cu figuri simple. Dar, pe măsură ce ajungeți la o analiză mai detaliată, aplicația finală a tot ceea ce știm despre fizică, dacă le-am putea calcula, ar fi electrodinamica cuantică. Aceasta este cu mult în afara intervalului pentru orice moleculă de dimensiunea care ne interesează. Și apoi, pe măsură ce cobori în această listă, obții programe din ce în ce mai precise până când ajungi la ceva care abia este fezabil din punct de vedere computațional pentru lucruri de dimensiunea a proteinelor. Și o mare aproximare a tuturor aproximărilor cuantice de deasupra ei. Fiecare dintre acestea este o aproximare, dar fiecare pe măsură ce cobori, devine din ce în ce mai aproximativă. Și principalul lucru care lipsește din mecanica moleculară care este prezentă în următorul pas este polarizarea electronilor. Cu alte cuvinte, în micromecanică, presupuneți că norii de electroni sunt practic sferici. Și aceasta este o pierdere uriașă, dar încă este foarte solicitantă din punct de vedere informatic. Deci nu obțineți polarizarea asimetrică pe care o obțineți în legăturile de hidrogen și în mulți alți dipoli. Deci asta este într-adevăr... aceasta este fizica de bază. Puteți vedea prima linie, forțată e egală cu masa înmulțită cu accelerația. Legea fundamentală a lui Newton. Și Newton ne-a introdus și calculul. Deci ar fi foarte confortabil cu următoarea linie, care este că forța poate fi redefinită ca prima derivată a energiei în raport cu poziție sau rază. Și apoi masa este doar masă. Și introducem indicele I, pentru atomic. Pentru că fiecare atom are propria sa lege a lui Newton. Și atunci accelerația este doar o derivată a doua a poziției în raport cu timpul. Acum despre ce fel de constante de timp vorbim aici? Acesta este intervalul femtosecunde pentru mișcarea atomică până la minus 15 secunde. Și pe măsură ce parcurgeți, actualizați această procedură cinetică, o puteți face în intervale de jumătate de timp, actualizând viteza și poziția la fiecare femtosecundă sau jumătate de femtosecundă. Deci acum care este acest termen de energie? La asta am făcut aluzie în diapozitivul anterior ca fiind foarte aproximativă. Și semi-empiric, se bazează pe experimente nu în totalitate din primele principii sau nici măcar din aproximările cuantice. Aveți, să zicem, analize spectroscopice care vor arăta că mișcarea arcului pe care o pot avea doi atomi atunci când sunt legați printr-o legătură are un fel de mișcare a arcului conform legii lui Hooke. Și aceasta este energia lungimii legăturii, EB în această sumă a tuturor E, diapozitivul 52. Și E theta este unghiul pe care îl aveți când se îndoaie unghiul de legătură. Și aceasta este forța ca un arc. Și apoi omega este acest tip de unghi de torsiune despre care am tot vorbit în diagrama phi PSI, diagrama Ramachandran chiar înainte. Van der Waals este contactul nelegat, care poate fi fie pozitiv, fie negativ. De fapt, în partea de jos a slide-ului ar trebui să se arate că există o forță de respingere, care este legată de R la a 12-a putere. Și o forță atractivă, care este R la a șasea putere. Deci, pe măsură ce vă apropiați, începe să fie atras până când obțineți această repulsie a sferei dure pe măsură ce vă apropiați puțin. Interacțiunile electrostatice sunt cele mai lungi efecte. Toate aceste legături covalente, B și theta și omega, sunt pe distanță scurtă. Van der Waals sunt pe distanță scurtă. Electrostatic este un interval puțin mai lung, deoarece este un 1 peste R sau R este distanța dintre cei doi atomi. Și aceștia sunt termenii principali care intră în toată mecanica moleculară, indiferent dacă sunt folosiți în cristalografie sau dacă sunt folosiți în abinitio. Acum, acesta este stadiul tehnicii pentru abinitio. Doar cea mai recentă competiție CAS a dus la un câștigător foarte clar după anumite criterii, cel puțin. Laboratorul Baker de aici, URL-ul este aici jos, este numărul de abateri standard la distanță pentru medie în ceea ce privește scorul pentru numărul de predicții corecte, aici în jur de 30, unde media este aproape de zero. Și chiar și cu acest avans uriaș pentru domeniul predicției, aceasta este totuși o abatere standard RMS tipică între structura reală, care a fost ținută ascunsă de toți acești concurenți - până când a fost cunoscută, dar nu și pentru concurenți - și apoi dezvăluit. Și abaterea RMS a fost 6, sau 4, sau 5 în acel interval, în funcție de structură și dacă includeți toți atomii sau doar pe cei de bază. Și acest lucru nu este adecvat, așa cum am văzut în acel diapozitiv de fapt din același grup mai devreme. Un alt mod de a privi acest lucru este acum -- acelea erau structuri predictive -- acestea sunt acum structuri observate. Purpuriu compară două structuri, ambele fiind realizate prin cristalografie cu raze X. Și de-a lungul axei roșii, aici este identitatea secvenței, variind de la 0 la aproape 100%, să spunem 96 plus la sută. Și axa verde este medierea pătratică medie RMS între structura unu și structura doi. Și puteți vedea că... gândiți-vă la această curbă violetă ca începând din dreapta jos , unde aveți o identitate de secvență foarte mare și mai puțin de 1 angstrom scris în abatere. Asta înseamnă că atunci când rezolvi două proteine ​​care sunt foarte asemănătoare în secvență, vei obține structuri foarte asemănătoare. Asta e bine. Acest lucru este de bun augur pentru modelarea structurală, deși nu este o modelare structurală, adică nu o modelare de omologie. Apoi, pe măsură ce coborâți în identitatea secvenței, curba violet începe să se încline în sus și în sus până când începe să se curbeze spre 2,74 și mai departe. devine din ce în ce mai greu să faci aceste aliniamente structurale. Deci, 4 angstromi este genul pe care l-ați obține de la modelarea omologiei la mai puțin de 20% sau 30% identitate de secvență. Și asta este ceea ce am spus mai devreme, de ce încercăm să populăm suficiente proteine. Acestea sunt toate proteinele cunoscute aici fiind comparate, atunci când le populează suficient. Deci nu trebuie să coborâți sub 35% în această zonă Twilight, unde chiar nu puteți face bine - nu găsiți abateri RMS bune între două structuri cristaline cunoscute. Acum, pe măsură ce facem dinamica proteinelor folosind aproximarea mecanicii moleculare despre care am vorbit, acestea pot fi aplicate nu numai pentru a prezice o structură statică sau o serie de pași într-un proces proteic, ci și dinamica plierii dintr- o proteină complet desfășurată, așa cum ar putea fi. care se desprinde de ribozom. Și acesta este ceva pentru care există relativ puține metode experimentale. Și deci aceasta este în mod clar o contribuție valoroasă, dar există o problemă cu efectuarea unui calcul teoretic care este greu de verificat empiric. Dar, în orice caz, pentru a face una dintre sarcinile mai mari și IBM și alții scufundă resurse și infrastructură semnificative din acest lucru. Dar făcându-ți scala de timp femtosecundă pe o simulare de o microsecundă, poți face cu ușurință calculul, adică 10 la minus 6, împărțit la 10 la -15 este aproximativ 10 până la al nouălea astfel de pași, fiecare dintre acestea implicând acest calcul mare care tocmai am trecut prin toate jurnalul de termeni energetici. Dar asta s-a făcut pentru asta. Și puteți vedea albastrul și roșul reprezintă structura calculată și observată la un moment dat în simularea dinamică. Când aveți o structură tridimensională a proteinelor, puteți încerca să o andocați cu molecule mici. Acest lucru ar putea fi mai ușor, în principiu, deoarece puteți menține atât molecula mică, cât și proteina relativ rigide pe măsură ce le andocați. Trebuie să existe o oarecare flexibilitate, de unde și numele, flex, pentru unul dintre aceste programe. Și în general, rezultatele sunt suficient de interesante încât s-ar putea să doriți să o utilizați ca alternativă în puținele cazuri în care aveți structura tridimensională a unei proteine, dar din anumite motive nu puteți rezolva structura tridimensională a complexului. Dar trebuie să vă amintiți că, de fapt, deși am menționat că rezolvarea structurii proteinelor ar putea fi de 100.000 USD, rezolvarea unui complex odată ce aveți structura proteinei este de fapt considerabil mai mică decât atât. Dar, în orice caz, acest lucru este încurajator atunci când aveți de ordinul 0,25 până la 1,84 ca deviație pătrată medie între modurile de legare prezise și experimentale ale moleculei mici. Vă puteți imagina că, pentru a fi oprit cu 1,8 angstroms, trebuie să fie andocat în buzunarul potrivit, dar poate într-un unghi greșit sau da, poate ușor deplasat. Deci ultimul subiect este problema discuțiilor încrucișate. Pe măsură ce vorbim despre structuri tridimensionale ale proteinelor, încercăm să găsim omologi. Și adesea găsim omologi într-un organism, jurnalele de perechi. Și aceste perechi de busteni și forme alternative de îmbinare ale unei proteine ​​sunt potențiale reacții secundare toxice ale unui anumit medicament. Și puteți vedea că multe dintre aceste medicamente sunt destinate membrilor familiei. De exemplu, primele două fac parte din familia de legare a steroizilor , pe care am introdus-o deja o dată și va fi într- un diapozitiv viitor. Și când considerați că aceste proteine, acea clasă specială de proteine ​​interacționează atât cu o moleculă mică, care este fie un steroid natural, fie artificial, fie tiroida, care este un compus asemănător steroizilor, și se leagă de un acid nucleic țintă. Și atât acidul nucleic, cât și molecula mică au potențial de diafonie. Și aici este partea de acid nucleic a poveștii. Și în următorul diapozitiv va arăta partea mică a moleculei din poveste. Dar partea de acid nucleic, aveți două domenii proteice similare unul cu celălalt. Acesta este un alt exemplu de simetrie cu care am început această discuție și am încheiat ultima discuție. Simetria aici este că aveți aceste două care pot fi repetări directe sau inversate, separate prin distanțiere mici aici. Deci, ADN-ul este în galben, iar distanțierele mici sunt în culorile gri și CPK. Și domeniile proteice sunt în verde și alb, unde verde și alb sunt structural similare unul cu celălalt. Îți este greu să-i apreciezi cum merg așa. Acest lucru este pentru a sublinia faptul că aici se repetă direct sau invers. Acum asta e interacțiunea ADN-ului. Și aceasta este legarea ligandului. Puteți vedea că estradiolul este ligandul mic, galben. Și tamoxifenul, care este ligand mai mare. Acesta este ceva important în tratarea cancerului de sân care ar putea răspunde la medicamentele care leagă estrogenii. Deci aceasta este partea proteinei care are două sau trei părți aici. Acesta este domeniul obligatoriu. Micul lucru roșu este o peptidă activatoare și apoi este componenta de legare a ADN-ului. Acum care sunt diafoniile pe care le avem aici? Puteți vedea că această mare varietate de diferite domenii de legare a proteinelor asemănătoare steroizilor leagă o vitamina D3, acizii retinoici, cum ar fi cei care apar în procesele de dezvoltare și în viziune. Tiroida, care ne reglează metabolismul. Și estrogen, testosteron și așa mai departe. Toate aceste lucruri au locuri de legare a moleculelor mici destul de asemănătoare . Și secvențele de ADN pe care le leagă sunt aceste jumătăți de situsuri, care sunt foarte strâns conservate în toți membrii acestei mari familii. Și una dintre principalele diferențe este distanța dintre acestea poate varia. Iar distanța aici este indicată în partea stângă jos, aici. dR3, înseamnă repetare directă cu trei nucleotide între acele două jumătăți de laturi. IR0 înseamnă o repetare inversată cu 0 nucleotide între jumătate de situsuri. R15 se repetă direct cu 15 nucleotide și așa mai departe. Și vezi că fiecare membru al familiei are un ligand și un acid nucleic distinct. Deși, există multă asemănare a liganzilor, multă asemănare a acizilor nucleici. Cum -- ultima linie a acestui slide 61 -- vizam un membru al acestei familii de proteine ​​sau alte familii de proteine? În unele cazuri, veți avea control artistic complet, nu numai asupra moleculei mici, ci și asupra proteinei în sine. Dacă aveți o moleculă mică care arată ca ATP, puteți inhiba tot felul de proteine ​​care leagă ATP. Dacă aveți noroc, puteți inhiba o anumită clasă de proteine ​​de legare a ATP . Dar eliminarea unui anumit membru al unei clase este dificilă. Și puteți vedea aici, în partea dreaptă, aceste trei structuri chimice. Partea adenină sunt aceste inele topite cu cinci și șase membri. Și atașate de ele sunt lanțurile laterale. Primul, cu structură complet neagră, este un inhibitor cunoscut al protein kinazelor în general. Iar adaosurile roșii sunt modul de a face acest lucru puțin mai voluminos, astfel încât să nu se mai lege de protein kinaze în general. Acum de ce ai vrea să faci ca acest inhibitor să nu se lege de protein kinaze? Ei bine, acum, dacă nu leagă prea bine nicio protein kinază pentru că este prea voluminoasă, nu se mai potrivește, atunci poți să scoți un aminoacid dintr-una dintre proteine ​​kinaze făcând recombinare omoloagă sau mutant transgenic în special... - acidul nucleic care codifică acea genă. Și veți avea această capacitate de a manipula atât ținta chimică, cât și ținta proteică în cazurile în care -- așa cum vom ajunge la ultimele trei prelegeri -- în care analizăm sisteme rețele de biologie, doriți să puteți viza un o anumită proteină la un moment dat, având o interacțiune cunoscută cu proteine ​​​​ligand în care minimizați diagrama încrucișată prin proiectarea interacțiunii specifice. Începi cu o interacțiune specifică pentru clasă și apoi o proiectezi astfel încât să lovească unul dintre ei. Astfel, puteți face un curs de timp, să zicem, doar eliminând acea anumită proteină rapid sau lăsând-o să revină. Și asta arată rezultatele în partea de jos aici. Începi cu aceste două kinaze diferite. CDK2, implicat în ciclul celular. Și kinaza chimică. Doi, ambele s-ar lega de inhibitorul negru original. Și, prin urmare, ar exista o diafonie semnificativă. Și aici, dozele de interferență în micromolari sunt afișate în cele trei coloane de aici pentru cei trei compuși diferiți, rulați sub fiecare dintre ei. Și puteți vedea că cu cât numărul este mai mic, cu atât se leagă mai bine. Deci, când iei astea-- dacă iei aceste buzunare de legare și le tăiați, asta este ceea ce a tăiat pană pentru cele două cele mai mici, CDK2, derivatul AS1 și chem kinaza 2, derivatul AS1. Acum că puteți vedea, au o constantă de legare mult îmbunătățită chiar și pentru cele mai voluminoase derivate. Și aceasta este mediată de o treonină sau fenilalanină la poziția 38 este schimbată într-o glicină. Glicina este în mod evident mai mică decât o treonină sau fenilalanina în acea poziție și face loc pentru medicament exact în același mod în care schimbarea tirozinei într-o fenilalanină a făcut loc pentru terminatorul dideoxi în exemplul anterior. Deci, în rezumat, am vorbit despre structura tridimensională a proteinelor și despre cum putem programa proteinele, practic. Cum putem folosi fragmente de proteine ​​pe care s-ar putea să nu le putem prezice, a priori-- de la zero-- cum ajungem de la o secvență la un ligand. Dar putem lua părți pe care le cunoaștem și le putem rearanja în combinații interesante. Putem construi baze de date de constante de legare la combinații de biblioteci combinatorii de acizi nucleici, de peptide, de molecule mici. Și le putem pune împreună în combinații noi care ne permit să facem analize de rețea și să întrebăm ce proteină face ce eveniment. Deci mulțumesc. Pana data viitoare.