PROFESORUL: OK. Deci, data trecută, am petrecut o oră și jumătate vorbind despre metodele de clasificare și utilizarea lor a tehnologiilor genomice în direct și aproape de direct, pe care le-am numit indirect, aplicații ale medicinei clinice. Și am vorbit din nou despre trei tipuri diferite de metode de clasă, explorarea clasei, predicția clasei și descoperirea clasei. Și cred că am terminat cu o discuție despre predicția de clasă, care este o abordare de bază care este obișnuită... care începe cu date microarray de la un anumit număr de pacienți, construiește un anumit model și apoi încearcă să prezică ceva. Toți cei care au fost aici își cam amintesc asta, cel puțin vag? Iar pașii de bază ai predicției de clasă au fost, în primul rând, să alegeți un set de gene, așa că alegeți un număr de gene care este reprezentativ pentru date și care împarte datele în clase pentru care țintiți predicțiile pentru a construi o funcție, o predicție. funcția, aceasta va fi o funcție matematică pe care o veți lua o nouă mostră cu datele sale de expresie și veți conecta la funcție și veți obține un răspuns, apoi determinați o regulă de încercat și apoi utilizați regula pentru a clasifica într-un fel sau celălalt și apoi, în sfârșit, validarea. Așa că m-am gândit că ceea ce vom face astăzi este să trecem printr-un exemplu. Așa că am trecut prin toate astea. Deci nu sunt sigur că mai avem nevoie de asta. M-am gândit că ceea ce vom face astăzi este să trecem printr-un exemplu. Iar exemplul este legat de cancerul de sân și de lucrarea din Nature 2002 despre care am vorbit. Deci, numărul New England Journal of Medicine care a fost publicat astăzi a avut o serie de articole legate de utilizarea acestor metode de clasificare în AML, în leucemia mielogenă acută. PUBLIC: [INAUDIBIL] PROFESOR: Ei bine, sunt două lucrări diferite. Există un editorial și există o perspectivă scrisă. Poate ne vom uita la perspectivă pentru o secundă. Și perspectiva se numește „Microarrays în investigațiile clinice”. Și astfel perspectiva este destul de îndrăzneață în opiniile sale aici. Și, în esență, ultimul paragraf, mesajul de a lua acasă, deci mesajul de a lua acasă este că gândirea noastră obișnuită despre descoperirea biomarkerilor în studiile clinice este pe cale să se schimbe dramatic. În viitor, investigațiile clinice vor consta în studii mici, cu o densitate mare de date, stratificare precisă a pacientului în funcție de profilul de expresie și analiză foarte adaptată a datelor microarray. Deci se uită la articolele din acest număr despre expresia genelor și AML. Și se concentrează pe identificarea celor relevante -- deci analizând 7.000 de gene sau cred că un studiu a folosit 133 de matrice cu 13.000, altul cu 25.000 -- analizând un număr mare de gene și expresia lor la pacienți și identificând un număr mai mic care sunt foarte relevante pentru boala. Și asta este ceea ce se înțelege prin termenul biomarkeri aici. Și fac o predicție că acest lucru va schimba în mod dramatic modul în care se desfășoară studiile clinice . Mi se pare foarte puțin probabil ca acest lucru să... PUBLIC: Eram foarte curios pentru că atunci când citești articolele, cel puțin cu privirea, par foarte bune , doar o clasificare și o anumită predicție. Și eram doar curios cum [INAUDIBIL] New England Journal of Medicine este foarte reticent să ia ceva cu [INAUDIBIL].. Și așa ceva m- a frapat cu adevărat. PROFESOR: Ei bine, este un proces de învățare pentru toată lumea. Sunt lucruri de învățat din munca depusă împotriva cancerului de sân. Și vom trece peste lucrarea Nature. Și asta a fost publicată și în New England Journal of Medicine. Lasă-mă să-ți dau... hai să vedem. Am avut asta pentru tine. Și acesta este important pentru că atunci când aveți [INAUDIBLE]. Așa că haideți... Nu am avut timp să analizez chestiile AML care însoțesc editorialele și perspectiva în numărul de astăzi. Cred că ar fi bine să trec prin asta și să ne uităm la datele direct în loc de afirmațiile din editorial. Dar să facem asta pentru munca de cancer de sân care a fost făcută. Deci aceasta este hârtia. S- ar putea să vrei să-l ai doar ca să-l ai aici, pentru că vom... M-am gândit, decât să vorbim în abstract, așa cum am făcut data trecută, să trecem cu adevărat prin utilizarea metodei de predicție aici, care este folosit destul de similar într-una dintre aceste lucrări de aici. Deci, să trecem prin această lucrare Nature despre profilarea expresiei genelor care prezice rezultatul clinic al cancerului de sân. Deci, în această lucrare, în esență, ceea ce au făcut acești autori în rezumat, puteți vedea că au folosit analiza microarray pe tumorile mamare primare a 117 de pacienți tineri și au aplicat clasificarea supravegheată pentru a identifica o semnătură a expresiei genei puternic predictivă a unui interval scurt până la metastazele la distanță. Așa că, din nou, acesta este... din nou, de multe ori mă împiedic de vizualizarea lucrurilor în ceea ce privește instrumentul specific care a fost folosit. Și într-adevăr ceea ce fac ei este să facă predicții aici. Unele dintre casele noastre diferite în care încerc să pun lucruri, clasă, explorare, predicție și descoperire. Aceasta este o predicție. Clasificarea supravegheată este un aspect al acesteia. Dar există și alte părți ale acestui lucru pentru a face predicții. Dar ceea ce i-a interesat, în esență, este să ia pacienți și să facă predicții bune sau proaste privind prognosticul rezultatului pe baza expresiei lor genice. Deci au făcut o varietate de lucruri. Dar cea mai mare parte a acestei lucrări este concentrată - ne uităm, de exemplu, la al doilea paragraf de pe prima pagină după rezumat. Un algoritm de grupare ierarhică nesupravegheată ne-a permis să grupăm cele 98 de tumori -- acum am scăzut la 98 de la 117, voi reveni la asta -- pe baza asemănărilor lor măsurate pe aproximativ 5.000 de gene semnificative. Și aceasta este figura 1A. Deci aici au lucrurile pe partea laterală. Ei au specimenele ca rânduri și genele ca coloane din diagrama de sus. Și deci aceasta este o grupare ierarhică a acestui set de date care constă dintr-un tabel mare. Iar tabelul are din nou 98 de mostre de pacienți și 5.000 de gene și niveluri de expresie care... S- ar putea să fiu scurt la hârtie. De ce nu vă uitați la asta deocamdată, da. Da, această lucrare este pe site. OK, deci acesta este setul de date pe care l-au construit. PUBLIC: Am doar o întrebare despre figura 1A în special. Care este utilitatea unui astfel de lucru în ziar? Vreau să spun că, evident, nu se uită la asta-- ca și cum ar fi eu să-- când își primesc datele și văd așa ceva, ei alimentează un computer care face toate aceste analize. Deci, care este scopul de a ne arăta acest lucru, mai degrabă decât de a trece la urmărirea rezultatelor lor reale. Acest lucru ar trebui să fie standard pentru atunci când faceți aceste tipuri de studii sau orice altceva? PROFESOR: Cred că sunt diagrame destul de valoroase pentru că vă permit -- acesta este alb-negru, deci există versiunea color -- vă permit să vedeți că există modele diferite de expresii ale genelor și diferite subgrupuri. PUBLIC: Vreau să spun, cred că poate aceste inferioare sunt aruncate în aer, așa că acolo unde [INAUDIBIL] poate deveni mai evident. Dar mă gândesc doar dacă am văzut un gel SDS-PAGE în hârtie, este exact ca, chiar acolo poți vedea rezultatele. Dacă mă uit la ceva de genul acesta, arată doar ca o grămadă de pixeli [INAUDIBILI].. Cred că. PROFESORUL: Deci întrebi despre motivație? PUBLIC: Ei bine, da, vreau să spun așa-- [VOCI INTERPUSE] PUBLIC: Da, așa că cifrele secundare pot fi utile. Bănuiesc și poate văd cum ați spune, OK, acesta este motivul pentru care ne-am extins. PROFESORUL: Dar chiar și în cifrele mari, puteți vedea adesea și poate am o poză cu asta pe culoare pe care o pot pune, nu sunt sigur dacă o fac. Dar ar trebui. Dar puteți vedea că există diferite grupuri, chiar și în interiorul culorii. [BIIP] Îmi pare rău, am câțiva pacienți. PUBLIC: Bănuiesc că oarecum ca un începător aici, uitându-mă la [INAUDIBILUL] în mod tradițional, vezi așa ceva... când văd așa ceva, mă duc, ei bine, la naiba, asta arată frumos. Și habar n-am ce înseamnă sau orice altceva. Și cred că ar fi un fel de intimidant pentru oamenii să vrea să ia o astfel de hârtie. Și nu prea înțeleg rostul să vadă așa ceva. - Ei bine, sunt două probleme. Este o problemă independentă. Cred că există o problemă pe care o consider că vorbind despre aceste lucruri este, același lucru cu privire la o diagramă de dispersie, de ce ar trebui să implicați o -- uitați-vă la o diagramă de dispersie, mai degrabă decât doar coeficientul de corelație descris aici. Aruncă-mi o privire pe calea corectă pentru a vedea, pentru a vedea de fapt , prin inspecție vizuală, că se pare că această clasă este acolo. Și atunci când mă uit la chestia asta, chiar mă pot convinge, dar sunt multe prostii. Dar există și câteva bucăți mari de roșu. PUBLIC: Deci cu siguranță imaginea color ajută foarte mult. PROFESOR: Cealaltă parte a acestor imagini, care este utilă, sunt dendrogramele. OK, așa că din nou am vorbit despre utilizarea clusteringului ierarhic ca metodă de clasificare și că nu produce cu adevărat clase. OK, din nou, totul este legat de orice altceva. Nu ai clase disjunse. Doar că gradul de relație este reprezentat de distanță, literalmente lungimea acestei linii, chiar aici în diagramă, reprezintă relația dintre acești doi de aici și spuneți acestea două de aici. Și așa, din nou, totul este împărțit. Acesta este binar. Deci totul este împărțit în două. Și astfel adiacența este de fapt o altă problemă, despre acestea, este că puteți roti oricare dintre aceste clustere la orice nod fără a schimba organizația aici. Așa că, uneori, veți vedea diagrame - de ce nu vă arăt una, deoarece ajungem la niște chestiuni aici. PUBLIC: Când ai o hârtie și vezi acea cifră, doar în afară de ceea ce este evident, cum ar fi aici o pată roșie foarte mare , [INAUDIBIL] asta e... și tu, dacă cineva este familiarizat cu asta, ești și tu culegând alte informații. Dacă nu aveți date în mână, puteți vedea, puteți să vă uitați la acea cifră și să spuneți, ah, model, dar iată o altă parte a figurii care mi-a oferit și mai multe informații. Și eu, ca începător, pur și simplu nu o văd pentru că nu sunt la fel de familiarizat cu asta. PROFESORUL: Și nu am o parolă aici. Nu pot face asta. PUBLIC: Este aceasta o evaluare corectă? PROFESORUL: E o evaluare corectă, bine. Ceea ce aveam să vă arăt este că, în zona mea, a existat săptămâna trecută o publicație -- este a doua pe care a făcut-o acest grup -- în care au pus una dintre aceste diagrame aici. Și arată că trei pacienți cu o afecțiune, toți se grupează și se despart de alți șapte. Dar ei nu pun dendrograma pe asta. Tot ceea ce arată este adiacența rândurilor. Și nu arată exact cum sunt organizați sau conectați. Deci vedeți trei care sunt aici și apoi alte șapte care sunt aici. Dar este posibil ca acesta de aici să fie de fapt parte dintr-un grup de patru de aici. Și, deci, aceasta este o altă valoare pentru aceste diagrame, este atunci când oamenii pretind că clasele trebuie să privească și să vadă. Când te uiți la acesta, nu este copleșitor, de fapt. Și aici au tras linie. Și au luat asta ca o singură clasă. Dar aceasta este într-adevăr... Adică fiecare dintre acestea este doar subdivizată aici, în loc de o clasă destul de mare. Deci, există informații utile pentru a vedea acele diagrame. AUDIENTA: Deci cea mai din stanga sunt cele doua clase din [INAUDIBLE] 117-- PROFESORUL: Este corect. Au spus că sunt două clase. Deci aceasta este o ramură aici. Și aceasta este cealaltă ramură de aici. BINE. Bine, da, ei bine, hai să intrăm în chestiune, cel puțin așa că avem un exemplu că am înțeles destul de bine ce se întâmplă. OK, deci acesta este un exemplu. Deci aceasta este doar o grupare ierarhică. Cum ai numi asta dacă te-aș pune să-l încadrezi în explorarea clasei, predicția clasei sau descoperirea clasei? Acestea sunt 98 de paciente cu cancer de sân. Acestea sunt atât ganglioni limfatici pozitivi, cât și ganglioni limfatici negativi. Sunt aproape toate mostrele lor, cu excepția unui grup pe care l-au lăsat pentru alte scopuri. Acesta ar fi un exemplu de explorare a clasei. Așa că încep prin a se uita la datele lor. Și doar spun, ei bine, se pare că profilurile de expresie diferă între pacienți și ne permit să găsim diferite subgrupuri, profiluri diferite? Și am vorbit despre un pas care era important de făcut înainte de asta. Și asta era chestia cu semnăturile și reproductibilitatea și distincția lor. Ei nu oferă aici date în acest sens. Ei spun că au făcut fiecare probă de tumoră de două ori, că au făcut două profile de matrice independente pe fiecare. Dar ei nu spun nimic despre ce au făcut cu acele date. Ei nu oferă coeficienți de corelație, de exemplu, pentru a spune că atunci când faci același experiment de două ori pe un țesut dat, obții același model de gene. Dar acceptând asta, acest prim pas este explorarea. Și aici există o încercare de a corela aceste grupuri cu diferite caracteristici clinice. Deci, mai întâi, ei fac gruparea ierarhică a întregului set de date. Și ei arată și văd modele largi. Poate că există un grup aici care este mai roșu pentru aceste gene și verde pentru acestea. Și deci poate că există o structură aici. Așa că următorul pas pe care îl fac este ca, pentru fiecare dintre acești pacienți, să se uite la rezultatele binare și să spună dacă acest pacient de aici a avut o mutație în gena BRCA1, o vor colora în negru. Și acest pacient de aici nu a avut o mutație. Deci, pentru fiecare dintre acești 98 de pacienți, acum se uită la unul, doi, trei, patru, cinci, șase markeri fenotipici diferiți și îi colorează în acest fel, astfel încât apoi să putem privi și să spunem dacă există vreo relație între aceștia. variabilele fenotipice și aceste două clase care au fost definite de dendrogramă? Din nou, pentru a o încadra într- una din cele trei metode de clasă, ce fac ei aici? Ce-i asta? Explorarea clasei, descoperirea clasei... ei fac descoperiri în clasă aici. Așa că s-au uitat la datele lor. L-au explorat. S-au întrebat că ar putea exista cursuri. Și acum se întreabă dacă există ceva semnificativ din punct de vedere fenotipic, ceva semnificativ din punct de vedere clinic, care se referă la aceste două clase? Sau este doar un artefact de a face clustering, care va reduce întotdeauna lucrurile în clase? În funcție de locul în care tăiați acest copac, puteți avea două clase aici, sau aceasta aici, care arată ca și cum ar fi o clasă mare, care merge de aici în jos până aici. Puteți crea clase la orice nivel diferit aici, pentru că, în principiu, nu există clase cu dendrogramă. Dar acum spun, ei bine, ce variabile fenotipice s-ar putea corela cu această divizare chiar aici? Aceasta este încă o descoperire. Da, aș numi această descoperire de clasă, că au găsit două clase. Și acum că pentru a le stabili ca clase cu adevărat care au o anumită semnificație, o anumită semnificație clinică, ei vor să spună la ce variabile clinice s-ar putea referi acest lucru aici? Și, uitându-mă la lucrurile de aici, sunt puține lucruri care sunt destul de izbitoare, cred. Prezența receptorilor de estrogen pe celulele tumorale aici este destul de bună. Majoritatea acestor pacienți sunt ER pozitivi. Majoritatea acestor pacienți de aici sunt... de fapt, nu-mi amintesc care este negru și care este alb, care este pozitiv și care este negativ pentru cursurile lor de aici. Metastaze-- deci prezența-- și cred că acestea sunt metastaze la distanță la cinci ani-- nu prea multă diferență. Poate cred că albul este prezent. Deci poate mai multe dintre acestea. Ce-i asta? Albul este pozitiv. Deci, s-ar putea să existe mai constant, cu siguranță un procent mai mare din acest grup, a avut metastaze la distanță la cinci ani. Așa că, odată ce fac asta și cred că au cursuri aici, trec la pasul următor și spun că vom construi un model predictiv. Și pe asta se concentrează, dacă există metastaze sau nu. Deci, ei spun că în aceste date, se pare că există o modalitate de a clasifica datele care are unele distincții în ceea ce privește prezicerea rezultatului. Și vom face un pas mai departe aici și vom trece de fapt prin necazul de a construi un model care să prezică acest lucru. PUBLIC: Așa că vor să folosească metastazele ca predictor principal pentru sau [INAUDIBIL].. De ce, poate aceasta este doar o altă întrebare ignorantă. PROFESORUL: Nu, aici nu sunt întrebări ignorante. PUBLIC: De ce au ales asta ca receptorul de estrogen? PROFESOR: Ei bine, da, pentru că oamenii știu deja despre receptorul de estrogen și mutațiile BRCA1. BINE. Așadar, și metastaza este... este în mod fundamental lucrul important. Este obiectivul clinic important. Dacă putem face predicții mai bune pe baza profilurilor de expresie genetică a tumorii atunci când facem o biopsie inițială a cancerului de sân, putem folosi asta pentru a decide apoi cum să tratăm oamenii? Oamenii cu un prognostic bun nu au nevoie de același tratament ca și cei cu un prognostic prost, poate. De fapt, nu-- nu există nicio intervenție de tratament-- nu un studiu de tratament aici. Nu înseamnă că putem interveni și modifica prognosticul prin tratament. Este strict predictiv al prognosticului în acest moment. BINE? Bine, deci să revenim la hârtie. Și deci următorul lucru pe care îl fac după această explorare de clasă, acest fel de descoperire parțială a clasei, vreau să spun că nu îl duc mai departe și spun că noi chiar am descoperit o nouă clasă aici, pentru că ei chiar nu au făcut-o. Vreau să spun cu ceea ce se corelează cu adevărat prognoza este starea receptorului de estrogen aici, care este un fapt binecunoscut. Deci, pacienții cu receptori de estrogeni pozitivi au un rezultat mai bun, cred, în cancerul de sân. Deci nu sunt sigur că negrul este pozitiv sau negativ. Negrul este negativ, OK. Da, asa este. Deci, pacienții cu receptori de estrogeni pozitivi au un rezultat mai bun. Pacienții cu receptori estrogeni negativi, în general, au un rezultat prost. Deci, de fapt, nu este nimic nou. Nu există nicio descoperire importantă de clasă care a avut loc în această lucrare. Deci, ceea ce fac în continuare este să schimbe setul de date. Să oprim asta. Nu este închis. Deci, următorul pas pe care îl fac în această lucrare, și acesta este pe această pagină 532. Partea de jos a primei pagini, scuze, partea de jos a paginii 530-- este că ei se concentrează acum pe un subgrup din aceste mostre pe cei 78 de pacienți cu ganglioni limfatici sporadici. boală negativă. Deci, aceștia sunt toți pacienți care, la momentul diagnosticării cancerului de sân, au avut biopsii de ganglioni limfatici care au fost negative și nu au prezentat nicio răspândire la ganglionii limfatici. Și așa s-au concentrat apoi restul lucrării pe acest grup select de pacienți, ganglioni limfatici negativi și, de asemenea, sporadici, ceea ce înseamnă că niciunul dintre aceștia nu a avut mutații, BRCA1 sau chiar BRCA2. Nu erau cancere de sân genetice, pacienți care sunt genetici. Și astfel, în acel grup de 78, 44 de pacienți au fost liberi de boală după cinci ani, iar 34 de pacienți au dezvoltat metastaze. Deci am ajuns la 78 de pacienți. Și 44 au avut un prognostic bun sau s-au dovedit a avea un rezultat bun. Și 34 au avut rezultate slabe. Deci, ceea ce spun ei pe pagina următoare, 532, este să identificăm în mod fiabil tumorile cu prognostic bun și prost , am folosit o metodă puternică de clasificare supravegheată în trei etape, similară cu cele utilizate anterior. Pe scurt, aproximativ 5.000 de gene au fost selectate din cele 25.000 de gene de pe microarray. OK, deci haideți să vedem cum construiesc modelul aici. Deci vor folosi aceste date. Deci vor folosi 78 în loc de 98. Și au 5.000 de gene. Deci, microarray-ul a măsurat de fapt 25.000 de gene. Deci au avut acest set de date pentru a începe. Și primul lucru pe care l-au făcut a fost să folosească proceduri de bază, dar totuși destul de ad-hoc, pentru a scăpa de gene care aveau foarte puțină semnificație, deci gene care pur și simplu nu au variat, o genă care avea un nivel scăzut de expresie pentru fiecare dintre ele. aceste. Și au eliminat astfel de gene și au ajuns cu 5.000 după acel moment. PUBLIC: Deci au fost 5.000 predeterminați, sau asta era... PROFESORUL: Ei... hai să vedem cum au ajuns cu cinci. Ei au spus că sunt reglementate în mod semnificativ și mai mult de trei tumori din 78. Deci, aceasta este o zonă care rămâne complet ad-hoc și diferită în aproape fiecare lucrare. O numim filtrarea inițială a genelor fără sens. Și au decis că... cred că au făcut teste T pentru semnificație și au cerut să existe o anumită semnificație în cel puțin trei din 78 la un anumit nivel semnificativ și au ajuns să aibă 5.000 de gene. Există multe moduri în care oamenii fac asta. Unii oameni vor spune că mă voi uita la deviația standard a acestor vectori genetici. Și dacă abaterea standard este mai mică decât o limită, voi presupune că acele gene nu variază suficient în acest set de date și voi scăpa de acestea. Așa că acum vor să-și construiască predictorul. Și așa am vorbit despre cei trei pași. Iar primul pas este alegerea unui set de gene discriminative. Așa că vor reduce cele 5.000 de gene în număr mic, pe care le vor pune în cutia lor neagră pentru a-și face modelul. Și fac acest lucru prin corelare cu rezultatul ideal. Cred că am mai vorbit despre această metodă. Așa că mai întâi vor aranja setul de date astfel încât toate prognozele bune să fie aici. OK, și apoi T+ 45 până la 78 sunt prognosticul prost. Și apoi vor alcătui un vector ideal, i, și vor pune să spunem 1 aici și apoi 0 aici. Și apoi pentru fiecare dintre aceste 5.000 de gene, vor calcula un coeficient de corelație cu acest vector ideal. Deci r pentru gena unu corelat cu vectorul ideal i a fost un număr, 0,6. Și r pentru gena doi corelat cu vectorul i este un alt număr, negativ 0,45, să spunem. Și fă asta pentru cele 5.000 de gene. Toata lumea urmareste? Așa că primul lucru pe care îl fac este să reducă acest lucru la 231 de gene utilizând o limită de 0,3 negativă sau pozitivă. Deci, orice a fost între un r între 0,3 și negativ 0,3 este scăpat de aici. Așa că ei scapă de acesta aici. Asta ar fi păstrat. Pe acesta l-ar păstra și așa mai departe. Și asta le-a lăsat cu 231 de gene, pe care le vom renumerota și le vom numi acum. Da-- PUBLIC: Întrebare legată de coeficientul pentru [INAUDIBIL] normalizarea variabilelor lor în expresia genei [INAUDIBIL], astfel încât să fie în aceeași ordine a variabilelor de rezultat, probabil binare. Ce fel de transformare are loc? PROFESORUL: Ei bine, sunt două probleme aici. Una este normalizarea setului de date. Deci au folosit matrice cADN. Așa că normalizarea lor a fost încorporată pentru că au folosit o referință. Deci, o matrice cADN este un experiment în care aveți două mostre aplicate de fiecare dată. Și referința lor a constat dintr-un pic de ARN din fiecare dintre, cred, setul mai mare. Nu știu dacă este vorba de mostrele 78 sau 98 sau 117. Deci asta a fost normalizarea. Pentru a face acest lucru, ei doar o organizează în acest fel. Doar mutați-le aici sus și mutați-le aici jos. PUBLIC: Bănuiesc că întrebarea mea a fost, încerc doar să-mi dau seama de [INAUDIBIL] pentru care cuantificați de fapt... în coeficientul de corelație, vă uitați la direcție. Dar contează cantitatea de expresie sau diferența de expresie dintre partea pozitivă și cea negativă în ceea ce privește corelația dvs.? PROFESORUL: Nu, asta nu va conta. Din nou, ați putea... din nou, coeficienții de corelație Pearson , cel puțin, sunt invarianți la transformările liniare. Deci, puteți lua fiecare piesă de aici și puteți înmulți cu 15 și adăugați 7 și nu-și va schimba coeficientul de corelație. OK, așa că acum au rămas cu 231 de gene. Și toate aceste gene au un prag de corelație ridicată, fie pozitivă, fie negativă, cu acest rezultat ideal aici. Deci gena unu a avut un anumit set de valori de expresie în acest grup. Și a fost diferit față de acest grup, deoarece se corelează, are un coeficient de corelație ridicat cu acel factor. Toata lumea urmareste? BINE. Bine, deci acum fac... unii oameni s-ar opri aici și ar spune că acesta este setul meu de gene discriminatorii. Și următorul lucru pe care îl voi face este să-mi construiesc funcția de predicție. Și apoi îmi voi face regula. Și apoi o să validez. Dar ei decid să optimizeze în continuare acest set de gene discriminatorii. Deci, acesta este puțin complex. Dar ce fac ei... nu atât de complex. Așa că iau cele 231 de gene pe care le au aici. Și ei le ordonează după mărimea cea mai mare a coeficienților lor de corelație . Deci gena 16 a avut un coeficient de corelație de 0,9. Și G 12 a avut un coeficient de corelație negativ de 0,85. Și ei le clasifică până la G 231, care tocmai a ajuns cu un coeficient de corelație de 0,31, în acest grup. Așa că acum se uită chiar mai profund în această structură de date. Și caută cele mai bune gene care se corelează cu acest rezultat. Un exemplu de astfel de genă ar putea fi gena 16, care a avut niveluri de expresie care au fost 1.000 pentru aceste probe și a fost 5 pentru toate aceste probe. Era un clasificator perfect, acea genă. Așa că acum vor construi cu adevărat un set de gene discriminative prin următoarea procedură. Ei vor lua primele cinci din această listă și vor numi că setul nostru de gene discriminatorii este format din doar cinci gene. OK, atunci ei vor trece prin asta, vor construi o funcție de predicție, vor face o regulă și vor valida folosind validarea încrucișată exclusă aici. Apoi vor adăuga încă cinci gene la acest set de gene discriminatorii. Deci, ei vor mai scădea cinci în acest grup și acum au un set de gene discriminative de 10 gene. Ei vor lua asta, vor construi o funcție de predicție, vor face o regulă și vor valida din nou. Acum că au făcut o a doua validare, au un al doilea număr de precizie de văzut. Și vor spune că precizia mea s-a îmbunătățit sau nu? Așa că prima dată când au făcut asta cu primele cinci gene, au găsit o acuratețe în ceea ce privește predicția, nu știu ce a fost. Dar vom alcătui un număr. Să presupunem că 60% predicții au fost corecte după ce și-au construit modelul. Așa că apoi au făcut asta cu un alt set de gene mai mare, inclusiv următoarele cinci cele mai bune gene. Și au descoperit că aveau o funcție de predicție de 70, ceea ce le-a adus până la 70%. Și au continuat să meargă până când acuratețea lor a fost cea mai bună posibilă și nu s-a îmbunătățit cu adăugarea a mai multor gene din partea de jos a acestei liste. Acolo s-au oprit la 70 de gene. Așa că și-au construit setul lor de gene discriminative chiar aici ca un set de 70 de gene pe baza acestei optimizări de a încerca mai întâi primele cinci, de a construi modelul, de a testa modelul și de a analiza acuratețea acestuia și de a îmbunătăți acuratețea până când a fost cât mai bine. ar putea fi. Da-- PUBLIC: De ce cinci și nu unul? PROFESORUL: Le-ar fi luat de cinci ori mai mult să ajungă acolo. PUBLIC: Este adevărat, dar [INAUDIBIL] unul este mai relevant. PROFESORUL: Ei bine, acesta este de fapt punctul pe care oamenii încearcă să-l facă în acest domeniu. Acesta nu este relevant, deoarece biomarkerii pe care îi căutăm acum sunt grupuri de gene. PUBLIC: Adică în sensul implementării, nu vreau să spun... PROFESOR: Acest lucru poate fi implementat clinic. Odată ce v-ați configurat pentru a realiza o matrice sintetizată cu jet de cerneală sau chiar detectată robot, o puteți face pentru câțiva dolari. Puteți observa matrice pentru câțiva dolari, practic. Acest lucru nu este de fapt scump. PUBLIC: Deci, practic, ei vor găsi cantitatea minimă de aceste gene și le oferim valoarea maximă de valoare predictivă [INAUDIBILĂ]. PROFESOR: Corect, o acuratețe predictivă în ceea ce privește această predicție a rezultatului bun versus rău. PUBLIC: Există vreo valoare, așa că la fiecare pas înainte de a ajunge la revizuirea suplimentară pe care ați menționat-o, [INAUDIBLE] aproape de locul unde s-ar opri majoritatea oamenilor. Există vreo valoare în afara celor 231, înapoi în cei 5.000? Și doar la întâmplare... PROFESORUL: Nu știu cât de departe au mers. Nu știu dacă au trecut de 231. Mă îndoiesc că apoi s-au uitat înapoi la alte gene. PUBLIC: [INAUDIBIL] și niciodată [INAUDIBIL] la 231 de gene, apoi au spus OK, ei bine, de acolo avem anumiți candidați, ceea ce cred că este destul de corect. Odată ce au ajuns la 70, mai are vreo valoare să revenim la datele mai mari și să vedem dacă mai putem numi câteva lucruri care poate... PROFESORUL: Poate, dar principalul punct critic al acestei abordări este că acesta este supraadaptare, aceasta este o supraadaptare foarte, foarte gravă a datelor. Nu cred că asta vrei să faci. Dar oamenii încă o fac. Și vreau să spun, este destul de rezonabil să stabilim această genă aici și să ne oprim acolo. Dar pentru a face o procedură pe care apoi să optimizați acest set, vă opriți cu 231. Pentru a lua apoi asta și pentru a face o validare încrucișată repetitivă chiar pe datele pe care le utilizați pentru a construi modelul și pentru a face acest lucru pentru a selecta genele. , chiar și în acest fel, este o supraadaptare foarte gravă a unui set de date. Și am pus ieri acel grafic fictiv despre puncte și l-am supraadaptat cu cea mai bună curbă posibilă. Dar s-ar putea să nu fie cel potrivit să faci o predicție a unui nou punct aici, din cauza cât de exagerat este. Deci funcționează perfect pentru setul de date. Și cred că am adus în discuție unele dintre capcanele în ceea ce privește validarea care a fost făcută cu datele microarray. Cred că am distribuit în mare parte o copie a acelei lucrări. PUBLIC: Nu poate fi depășit prin tăierea setului de date la jumătate și făcând exact ceea ce tocmai ai descris, metoda pe care tocmai ai descris-o, și apoi luând asta-- [INAUDIBIL] și apoi luând acea jumătate [INAUDIBIL] pentru că tu a descris-- PROFESORUL: Poți construi-- corect, acesta este modul corect de a face asta. Deci acesta este setul de antrenament și apoi setul de validare. Vreau să spun că chiar și modalitatea corectă de a face acest lucru este să inventezi orice model dorești și apoi să-l testezi prospectiv pe următorii 100 de pacienți. PUBLIC: [INAUDIBIL] este că, de obicei, performanța reală este în special în 2004, ai atât de puțini pacienți încât detesti să scapi de mulți dintre setul tău de testare, pentru că s-ar putea să nu ai suficient semnal în setul de antrenament pentru a putea [ INAUDIBIL] pentru oameni. În caz contrar, [INAUDIBIL]. De aceea este atât de uimitor că [INAUDIBLE] poate [? scrie?] o lucrare în afară de o treime dintre pacienți [INAUDIBIL]. PROFESORUL: Da, când aceste jetoane au apărut prima dată, erau 2.000 de dolari bucata. Da, sunt foarte-- sunt chiar mai mult decât atât, dar-- PUBLIC: Chiar mai [INAUDIBIL] PROFESOR: Deci acestea erau experimente foarte costisitoare de făcut atunci. Deci acesta este setul lor de gene discriminatorii. OK, acum trebuie să aleagă o funcție predictivă. Deci, funcția predictivă, din nou, este, dacă ar fi să-i oferim acestui model un nou specimen clinic, cum facem apoi o predicție asupra noului specimen clinic? Și astfel au folosit o funcție predictivă destul de simplă aici, care este coeficientul de corelație cu acest rezultat ideal. Deci, dacă ți-aș da o probă de țesut pacient. Și ai făcut unul dintre aceste experimente cu microarray și ai măsurat 25.000 de gene diferite pe el, apoi ai folosi asta în acest model, scotând numerele din cele 70 de gene care erau relevante - care făceau parte din setul de gene discriminative . Și apoi luând acel număr de 70 de gene și... să vedem, scuze, mă prost aici. Deci... îmbunătățit... Clasificatorul a prezis corect rezultatul. Îmi pare rău, am crezut că le-am înțeles funcția predictivă în această lucrare. Să aruncăm o privire la el. Funcția predictivă este o regulă de prag. Și asta este evident ca în figura 2. Cred că au luat un număr mediu. Deci au luat media. Profil atât de prost... au luat aceste profiluri aici și sunt doar medii. Deci sunt 34 în acest grup prost, grup cu prognostic prost. Și au luat cele 34 de numere de aici și le-au făcut o medie împreună pentru a obține un număr aici. Și apoi au făcut asta pentru celelalte gene ale lor. Deci am ajuns la 70 de gene chiar acum. Și așa au acest profil prost ideal. Și apoi destul de sigur că asta au făcut. Și au făcut același lucru pentru binele aici. Și au profilul lor bun, care este doar o medie aritmetică a nivelurilor de expresie. Și acum, când modelul este prezentat cu un nou vector rând de date de expresie pentru 70 de gene pentru pacienți și vom numi acel nou pacient pacient n, atunci ei vor calcula coeficientul de corelație al pacientului n la, poate, doar vectorul bun. Bănuiesc că nu o poți face. Ei bine, așa că îmi pare rău că am uitat puțin detaliile de aici . Și am probleme în a le găsi chiar aici. Dar sunt destul de sigur că asta au făcut. Dar atunci cu care l-au corelat? Cel bun? Uh-huh. OK, da, ceea ce aduce în discuție un alt punct, de ce să nu o faci la profilul prost și să corelezi cu asta ca mijloc al algoritmului tău? Asta s-ar putea să-ți ofere un răspuns foarte diferit. Nu sunt chiar sigur. Dar, în orice caz, deci, OK, se pare că există această alegere aici, că ei se uită la coeficientul său de corelare cu profilul mediu bun și au primit un număr. Deci asta vă va da r, vă vom da un număr, 0,4. Și aceasta este funcția lor de predicție. Și apoi ultimul pas în construirea acestui model este să alcătuiești o regulă și să spui dacă există... și au folosit o regulă de prag și un clasificator non-ambigu. Deci, dacă este peste prag, este într-un singur grup. Dacă este sub prag, este în alt grup. Și au explorat de fapt câteva posibilități diferite pentru prag. Și am vorbit despre acea marți că această regulă și modificarea pragului este clasicul compromis dintre sensibilitate și specificitate aici al unui test. Și ei vorbesc despre asta în această lucrare și arată... deci pe această diagramă aici, deci cum să împărțiți negrii și albii în mod optim este întrebarea aici, prognosticul bun versus pronosticul rău. Și îl tăiem aici și obținem toți albii cu doar câteva negre sau tăiem puțin mai mult și obținem mai mulți albi? Dar facem schimb de sensibilitate și specificitate aici. Și asta este și aceasta este regula pe care o folosesc. Deci acesta este modelul pe care îl folosesc. Și apoi, de fapt, fac câteva -- în această lucrare, fac câteva lucruri pentru validarea acesteia, pentru acest pas chiar aici. Și au ales un nou test, un nou set de validare de 19 mostre pe care nu l-au folosit pentru a construi modelul aici. Și este mic. Ei nu spun exact cum au construit acel grup de 19. Dar folosesc un grup separat de 19 pentru a testa apoi acest lucru. Și când au făcut asta, cred că e pagina 534, al treilea paragraf, pentru a valida clasificatorul de prognostic și un set suplimentar independent de tumori primare de la 19 pacienți tineri negativi ai ganglionilor limfatici . Au fost șapte pacienți care au avut un rezultat bun, 12 care au avut un rezultat rău. Și a rezultat în două din 19 clasificări incorecte. Cred că ambele-- așa că au obținut un număr de precizie din asta, doi din 19 ca precizie. Una dintre problemele importante în care intri atunci când faci așa ceva este că acuratețea poate să nu fie aceeași pentru pacienții buni față de cei răi. Deci, s-ar putea să aveți un clasificator care prezice toate rezultatele bune în mod corect, dar este groaznic în a prezice cele rele. Jumătate din cele rele sunt rezultate bune. Și asta nu-ți este de mare ajutor. Și cred că datele sunt aici. Și cred că este menționat în articolul capcană pe care l-am înmânat. Asta dezvăluie un pic mai mult despre importanța de a spune dacă predictorul funcționează la fel de bine asupra cazurilor bune și rele care îi sunt prezentate. Deci, cred că aceasta este în esență această lucrare. A existat o continuare pentru aceasta, care a fost în New England Journal. Este pe site-ul web, care este și mai axat pe predicție ca supraviețuire, semnătura expresiei genelor ca predictor al supraviețuirii în cancerul de sân. Au folosit un set de date mai mare aici. Dar folosesc același model aici. Au făcut validarea setului de date. Dar nu au făcut întreaga procedură de validare. Așa că am vorbit despre asta, cât de multă validare se face prin lăsarea uneia afară. Deci, lăsați o probă afară, construiți modelul și apoi testați acea probă. Și apoi fă-o pentru fiecare dintre probe de 78 de ori sau de 200 de ori, indiferent. Și vezi cât de precise sunt predicțiile tale de fiecare dată. Dar, atunci când faci asta, este important să te întorci și să reconstruiești alegerea setului de gene discriminatorii de fiecare dată. Și asta este de fapt în New England Journal of Medicine. De fapt, le raportează pe amândouă. Ei sunt conștienți de necesitatea de a face asta. Și cifrele cred că au fost 24% față de 41% sau ceva de genul ăsta, 27%. Deci, când fac eroarea, când fac validarea bazată pe faptul că nu au făcut acest pas, aici alegem setul de gene, a existat o rată de eroare de 27%. Dar când au făcut-o repetând acest pas al genei, a existat o rată de eroare de 41%, care se apropie de întâmplare, aruncând o monedă. Dar, în orice caz, pe baza acestui fapt, Institutul de Cancer din Țările de Jos care a făcut acest lucru a spus că vor începe să folosească acest set de 70 de gene pentru a lua decizii clinice. Vor lua noi pacienți cu cancer de sân. Faceți un experiment cu microarray. Măsurați cele 70 de gene. Utilizați acest model și faceți o predicție despre rezultatul bun sau rău și adaptați tratamentul în funcție de acesta. Da-- PUBLIC: De fapt, am avut o întrebare legată de asta și mai mult [INAUDIBIL]. Deci, laboratorul realizează un studiu ca acesta, spune că aici sunt 70 de gene despre care credem că sunt un indicator bun al [INAUDIBILE] [? După logică,?] Vreau să validez aceste rezultate, nu? Acum, în adunarea și colectarea acestor date, precum acest studiu ridicol, se uită la pacienți de peste cinci ani. Faceți o analiză cu microarray pe un pacient și apar pozitiv sau orice altceva pentru acest indicator, acum aveți oameni care iau decizii clinice în acest sens. Și se pare că metoda de validare este o dată [INAUDIBILĂ] ascunsă. Ei trebuie să aibă un prognostic prost sau un rezultat prost pentru a spune că acești candidați -- pentru pacient -- dacă aceste 70 de gene au într-adevăr un efect negativ sau indică [INAUDIBIL] că efectul trebuie să existe. Deci, cum face un clinician sau un cercetător clinic, care vede pacienții și face asta, cum echilibrează asta? Adică care ar fi sugestia sau sfatul tău? Are ceva sens? PROFESORUL: Ei bine, vorbești despre cum faci cercetări asupra pacienților din acest domeniu? [VOCI INTERPUSE] PUBLIC: [INAUDIBIL] cum sunteți [INAUDIBIL] pacienții din punct de vedere clinic? PUBLIC: Ei bine, [INAUDIBIL], așa că avem acest rezultat, oamenii trebuie să-l valideze. În procesul de validare, vor găsi oameni care au acest tipar special, nu? Și trebuie să-i urmeze pe acești oameni pe o anumită perioadă de timp . Și pentru a-și valida propriul [INAUDIBIL], în esență, dacă niciunul dintre oamenii care au aceste 70 de gene, sau profiluri de expresie sau orice altceva nu dezvoltă cancer de sân, atunci modelul este un fel de [INAUDIBIL] înapoi la planșa de desen. Deci, în esență, și urăsc să spun așa... PROFESORUL: Nu, spune ce gândești. PUBLIC: Au nevoie de acești oameni, pentru a valida modelul, au nevoie de ei să progreseze până la starea de boală. Și totuși, în același timp, ei sunt, ca clinicieni, așa că lăsând deoparte partea de cercetător, ca clinicieni, trebuie să trateze acești pacienți. Și dacă există un indiciu puternic din studiile anterioare că sunt șanse să faceți cancer de sân și să metastazeze. Și o să devină foarte rău pentru tine. Ei nu pot pur și simplu să nu trateze acești oameni în mod agresiv. Sau acel tratament va afecta rezultatul. PROFESOR: Ei bine, oameni... da, da, deci nu cred că cineva face... PUBLIC: Vă gândiți la experimentele de tip Tuskegee. PROFESORUL: Da, deci nimeni nu neagă tratamentul sau refuză pacienților cele mai cunoscute tratamente. PUBLIC: Deci, cum calculezi asta în validarea modelului? Asta dacă ajungi... nu poți... pentru că nu poți spune, ei bine, ei nu au avut metastaze din cauza tratamentului meu. PROFESORUL: Sunt câteva probleme. Și tu de fapt... așa că în această lucrare New England Journal of Medicine... aici, nu l-am lăsat pe el . Este pe site. Ceea ce au făcut a fost că au folosit acest model într-un grup mai mare de pacienți și apoi au comparat predicțiile acestui model cu cei mai buni predictori clinici. Deci, de exemplu, există și alte scale predictive. Și au folosit una numită scara St. Gallen, care prezice rezultatul cancerului de sân. Și au spus cum se compară modelul nostru cu scara St. Gallen . Dacă luăm toți acești pacienți și vedem care a fost numărul lor de St. Gallen și cum au procedat. Și luăm predicțiile noastre și cum au făcut, care este mai bine? Și au ajuns la concluzia că metoda lor era mai bună decât metoda St. Gallen de a face predicții. Și asta a fost într-adevăr una dintre principalele-- principala justificare pentru a spune că avem o metodă mai bună de a face predicții despre cum se vor descurca pacienții. Și vom începe să folosim acest lucru în Țările de Jos la Institutul de Cancer pentru a lua decizii, mai degrabă decât în ​​St. Gallen. Și ceea ce subliniați este de fapt un mare defect în cercetarea care face acest lucru, deoarece pacienților li s-a determinat scala St. Gallen când au fost diagnosticați. Și în funcție de ceea ce au crezut clinicienii lor, i-au tratat în consecință, pentru a obține cel mai bun rezultat. Deci, dacă au fost într- un grup cu rezultate slabe pentru început, pe baza criteriilor St. Gallen, au fost tratați mai agresiv pentru a încerca să-și îmbunătățească rezultatul. Deci, de fapt, scopul clinicianului este ca scala St. Gallen să nu fie potrivită pentru acest grup de pacienți. Intervențiile care au avut loc asupra acestor pacienți, deoarece nu a fost un studiu controlat în perspectivă , intervențiile care au avut loc au fost concepute special pentru a atenua prognosticul prost pe care criteriile St. Gallen l- au indicat acestor pacienți. Și, așadar, poate să nu fie o surpriză că predictorul St. Gallen nu a fost chiar atât de precis mai târziu, deoarece oamenii au intervenit activ cu rezultatele acelui predictor pentru a schimba rezultatul. Și asta nu se întâmpla cu profilurile de expresie genetică. Nimeni nu s-a uitat la profilul de expresie genetică a acestor pacienți acum 10 ani și apoi a decis cum îi vor trata în următorii cinci ani pentru a le îmbunătăți boala. PUBLIC: Așadar, pentru că, în acest moment, trecerea în revistă a analizei profilurilor de expresie genetică este suficient de lungă încât abordarea St. Gallen a tratamentului agresiv sau orice altceva, această schimbare este suficient de lungă încât să aveți răspunsul dvs. și dvs. validarea înainte ca decizia clinică să înceapă să fie luată, se fac experimente repetate pentru validarea încrucișată... PROFESORUL: Nu vor fi niciodată un... Vreau să spun că pentru a obține un medicament nou aprobat în această țară pentru etichetare necesită să luați un grup de pacienți cu un boală, iar pe unii dintre ei îi tratezi cu medicamentul și pe alții cu un placebo și vezi care funcționează. Pentru a ști cu adevărat dacă modelele de predicție vor funcționa cu acuratețe, trebuie să faceți același lucru, să luați pacienții prospectiv pentru a le aplica modele de predicție din timp și să vedeți ce se întâmplă cu ei, fără o intervenție care se bazează pe rezultate ale predicției. De aceea, o lucrare ca această perspectivă mi se pare cam înfricoșătoare. Micromatricele din investigațiile clinice din revista de astăzi, în care autorii preconizează că, în viitor, investigațiile clinice vor consta în studii mici cu o densitate mare de date, stratificare precisă a pacientului în funcție de profilul de expresie și analiză foarte adaptată a datelor microarray, altfel cunoscute ca supraadaptarea masivă a tonelor de date de expresie la un număr mic de pacienți de aici. Și asta nu vă va spune niciodată dacă predicțiile dvs. sunt corecte. Și dacă veți lua decizii cu privire la tratament sau predicții pe baza acestuia, nu veți fi exact. Nu cred că va exista suficientă precizie de la mic. Nu cred că încercările trebuie să fie mai mici. Și testele pot fi reduse pentru că acum avem date microarray. De fapt, încercările trebuie să fie probabil mai mari, deoarece aveți un set de date mult mai nedeterminat. PUBLIC: Dacă ești [INAUDIBIL] reproductibilitatea [INAUDIBIL] PROFESOR: Ei bine, deci Institutul Olandez de Cancer, și-a patentat setul de gene ca un predictor al cancerului de sân. Deci, sperând... corect, ei bine, sperând că vor avea brevetul. Și dacă arată că lucrurile lor funcționează, atunci oamenii vor veni la ei și vor începe să vândă cu ridicata tipul lor de matrice și abordarea lor. Știi că... N-am văzut nimic, Zack. Vreau să spun că a existat un articol că urmau să înceapă să facă asta în vara lui 2003. Și era în Nature. Vom începe să facem asta. Și liniște. Au venit în fire? PUBLIC: Asta cred că trebuie să se fi întâmplat. Cred că, probabil, cineva care știa de fapt acest lucru [INAUDIBIL] spune, vrei să-i dai peste pacienții noștri făcând asta? Nu știu asta cu adevărat. PROFESORUL: Corect. PUBLIC: Da, ce este un articol [INAUDIBIL] PUBLIC: Oh, da. PUBLIC: Nu-mi amintesc câte de marketing [INAUDIBILE] [VOCI INTERPUSE] PUBLIC: Sunt două probleme aici. Una este dacă FDA aprobă aceste cipuri genetice în general. Vom reveni la asta într-o secundă. În rest, dacă utilizați o formulă [INAUDIBILĂ] pentru a prescrie acest tip de [INAUDIBILĂ] pe orice platformă. Și cred că, în calitate de clinician responsabil, cei mai mulți dintre noi nu ne-am stratifica neapărat pacienții în acest moment doar pe baza prognosticului. Sunteți de acord cu asta? PROFESORUL: Da. PUBLIC: S-a făcut cam pentru cancer. Și niște teste oncologice, mi-e cam înfricoșător, care au fost făcute. [INAUDIBIL] a fost efectuat. Modul în care se desfășoară cancerul în această țară este în centrele de impact și grupurile cooperative de oncologie unde un număr mare de indivizi sunt tratați în protocoale. Și acestea sunt acum stratificate de [INAUDIBLE] pentru unele studii. Nu pot spune că sunt pe deplin de acord cu asta. [INAUDIBIL] folosind efectiv măsurarea [? tehnologie. ?] Roche Diagnostics a făcut titluri în urmă cu aproximativ două luni, când au încercat să obțină un cip, nu pentru expresie, ci pentru genotiparea mutațiilor în P450 a proteinelor care clarifică ideea despre substanțele chimice toxice din corpul nostru în ficat. Au încercat [INAUDIBLE], este foarte important pentru [? promo ?] genomica pentru că vă va spune cât de rapidă a apărut creșterea. Roche a încercat să o obțină pur și simplu printr-o derogare care spunea în esență că aceasta este doar o metodă de măsurare. Nu trebuie să obținem cu adevărat aprobarea FDA. FDA a spus nu, nu, nu, stai. Să trecem prin procesul formal de aprobare. Deci despre ce vorbește Cecily este că a anunțat că un alt [INAUDIBLE] va vedea dacă o poate repeta în același mod. Și acesta este... Este de fapt un act de vitejie. Deoarece unii dintre voi sunt implicați [? în HSP?] ar trebui să știe că HSP este de fapt foarte implicat în a ajuta FDA să-și dea seama exact cum să privească acest lucru, deoarece [INAUDIBIL] FDA a dezvoltat abia acum standardele minime de transmitere a datelor de la companiile farmaceutice cu privire la datele microarray. . Ei nu au niciun fel de ghiduri cu privire la pacienții de identificare standard. Așa că cred că vor exista mai multe sărituri, sărituri și sărituri pentru a obține astfel de măsurători traduse din descrierile cercetării în măsuri clinice. Încă va fi folosit, apropo, pentru a vă oferi o... încă poate fi folosit într-un centru medical fără aprobarea FDA atâta timp cât nu sunt vânduți. Deci, de exemplu, [INAUDIBIL], genetica și genomica au contractat cu Affymetrics un cip de secvențiere pentru genele implicate în pierderea auzului și cardiomiopatie. Dar [INAUDIBLE] nu vinde acest lucru pentru uz general. A fost folosit intern de clinicienii săi. Deci, este un proces foarte complicat că acolo a fost locul în care reglementarea -- de fapt, genomica [INAUDIBLE] va ține o prelegere despre asta [? mai târziu. ?] PROFESORUL: Margulies ține acea prelegere? PUBLIC: Da. PROFESORUL: Bine, asta e tot pentru azi.