2012 tájékán egy ex-számítástechnikai szakemberből lett biofizikus, Alex Zhavoronkov észrevette, hogy a mesterséges intelligencia egyre pontosabban felismeri a képeket, hangokat és szövegeket. Zhavoronkov úgy látta, hogy eme három terület közös tulajdonsága az, hogy mindegyikben hatalmas adatkészletek álltak rendelkezésre, ami megkönnyítette az MI 'kiképzését'. Mivel a gyógyszertanban ugyancsak jelentős mennyiségű adatkészlet található, Zhavoronkov körülbelül 2014-től kezdve azon gondolkodott, hogyan tudná felhasználni a mesterséges intelligenciát a gyógyszeriparban, és segítségével felgyorsítani a felfedezési folyamatokat. A biofizikus akkoriban hallott a GAN (generative adversial networks) technológiáról, melynek lényege az algoritmusok egymással versengése, miközben megpróbálnak az emberi agyhoz hasonlóan kreatív tartalmakat létrehozni.
A fejlesztők többek között ezáltal kreálnak videókat, zenei anyagokat, vagy éppen hamis emberi arcokat. Zhavoronkov viszont a gyógyszerészetben akarta hasznosítani. Idővel rájött, hogy a GAN lehetővé teszi a kutatók számára a gyógyszerek tulajdonságainak verbális módon történő leírását, valahogy így: "A vegyületnek gátolnia kell az X fehérjét az Y koncentrációban, minimális mellékhatásokat okozva az emberekben", majd az MI ezek alapján felépítheti a molekulát. Hogy ötletét megvalósítsa, Zhavoronkov megalapította az Insilico Medicine Inétzetet a Johns Hopkins Egyetem kampuszán, Baltimore-ban (Maryland), és nekilátott a projektnek. Az Insilico találmánya egyszerre több millió adatminta szűrésére képes, miközben leírja az egyes betegségek biológiai tulajdonságait. Ezután meghatározza a legígéretesebb kezelési célokat, és a GAN-ok felhasználásával létrehozza a hozzájuk leginkább passzoló első gyógyszermintákat. Zhavoronkov szerint mindez sokkal hatékonyabbá teheti a tesztelést, illetve nagyobb eséllyel fejleszthetnek már rögtön az első alkalomkora az adott betegség legyőzésére irányuló készítményt.
"Az MI lehetővé teszi számunkra, hogy ötven emberrel megcsináljuk, amit egy tipikus gyógyszergyártó cég tesz öt ezerrel. ” - mondja a biofizikus.
2018-ban például az Insilico kevesebb mint negyvenhat nap alatt generált új molekulát, ez idő alatt ráadásul nemcsak a kezdeti felfedezésen jutottak túl, hanem a gyógyszer szintézisén és annak kísérleti validálásán is számítógépes szimulációk során. Jelenleg a rendszert új gyógyszerek felfedezésére használják többek között rák, öregedés, fibrózis, Parkinson és Alzheimer-kór, ALS, cukorbetegség és még sok más betegség ellen. Az első, egy hajhullás kezelésére szánt gyógyszer első fázisú tesztjei pedig előreláthatólag az év végére megkezdődnek. Sőt mi több, a mesterséges intelligenciát már arra is használják, hogy megjósolja a klinikai tesztek eredményét még a vizsgálatok befejezése előtt. Vagyis a technológia lehetővé teszi a kutatóknak, hogy egy csomó időt és pénzt megspóroljanak a hagyományos tesztelési eljáráshoz képest. (Az alábbi videóban megnézhetjük Elizabeth Krutoholow, a Bloomber szakértőjének előadását arról, hogy vajon tényleg forradalmasítja az MI a gyógyszeripart.)
A fehérjék az élethez szükséges kulcsfontosságú molekulák, melyek egyrészt kémiai reakciókat katalizálnak, másrészt biztosítják az örökítő anyagban tárolt genetikai információ kifejeződését és másolását, illetve szállító, strukturális, jelátviteli, mozgató és egyéb funkciókat is ellátnak. Az aminosavak, azaz a fehérjék építőelemei egy genetikai kód által meghatározott sorrendű láncban alkotják a fehérjéket. A legtöbb fehérje a genetikai kód által meghatározott húsz aminosavból áll, amelyek kovalens típusú peptidkötéssel kapcsolódnak egymáshoz, és egy polipeptid láncnak nevezett egyenes struktúrát képeznek. Ebből keletkezik egy háromdimenziós szerkezet a fehérje feltekeredésnek nevezett folyamat során. A fehérjék felépítéséhez szükséges információt a DNS tárolja. Az információ innen előbb a transzkripció folyamatában mRNS-é módosul, majd az mRNS a transzláció folyamán, a riboszóma segítségével lefordítódik aminosavsorrendé, ezáltal létrejön a polipeptid lánc. Ezzel még további poszttranszlációs módosulások történhetnek, ugyanakkor végső, biológiai funkcióját csak a fehérje-feltekeredési folyamat után nyeri el, ami általában már a transzlációval egy időben kezdetét veszi. Bár a fehérjék a genetikai információ által meghatározott alakú, háromdimenziós struktúrának köszönhetik funkciójukat, a biokémia talán egyik legnagyobb megoldatlan problémáját jelenti ennek előrejelzése az aminosavsorrendjéből.
A fehérjék térszerkezetének előrejelzése forradalmasíthatja több, valószínűleg fehérjék hibás feltekeredése által okozott neurodegeneratív betegség kezelését és a biotechnológiai iparágat is.
Szerkezetük pontos meghatározása jelenleg bonyolult, időigényes és költséges módszereket, mint például röntgen-krisztallográfiát igényel. Ezen azonban hamarosan változtathat a londoni székhelyű, jelenleg a Google anyacége, az amerikai Alphabet tulajdonában álló vállalat, a DeepMind AlphaFold szoftvere más, szintén gépi tanulási és mélytanulási módszereket felhasználó megoldások.
2018. decemberben rendezték meg a tizenharmadik CASP fehérjeszerkezet-predikciós versenyt, melynek nyertese a DeepMind AlphaFold (A7D) programja lett az új fehérjefeltekeredéseket előrejelző kategóriában.( A DeepMind fő profilja a mesterségesintelligencia-programok fejlesztése.) Legnagyobb fejlesztése eddig az AlphaGo, egy gépi tanuláson alapuló szoftver, amely 2016-ban öt alkalomból négyszer legyőzte legnagyobb vetélytársát, a dél-koreai Lee Sedolt. A területtel foglalkozó szakemberek szerint ez egyértelmű mérföldkő volt a mesterségesintelligencia-kutatásban, néhányan pedig az általános mesterséges intelligencia felé tett lépésnek tekintik az AlphaGót. A DeepMind 2016-ban kezdett foglalkozni a fehérjefeltekeredés problémájával.
Ebből lett az AlphaFold szoftver, ami két különböző fehérjetulajdonságot állapít meg azok genetikai kódjából, mély neurális hálózatokon alapuló technológiával.
Az első ezek közül az aminosavpárok közötti távolságok, a második pedig az ezeket az aminosavakat összekapcsoló kémiai kötések közötti szögek meghatározása. A sikerek ellenére természetesen hosszú még az út a célig, hiszen ahogy azt a szakemberek is kifejtették, az AlphaFold nagyon jól teljesít a nagyvonalú szerkezet meghatározásában, a praktikus alkalmazásokhoz szükséges nagyobb felbontású előrejelzései alig negyven százalék körüli pontosságúak. További kérdés, hogy alapvetően akadémiai vagy mérnöki-számítástechnikai terület lesz-e a fehérjestruktúra-előrejelzés a jövőben, illetve az is, hogy miként alkalmazkodnak majd a DeepMind sikeréhez az akadémiai kutatók. Az mindenesetre vitathatatlan, hogy a fehérjefeltekeredés problémájának megoldásához a mesterséges intelligencia és a nagy mennyiségben rendelkezésre álló biológiai adat kombinálásán keresztül vezet az út.
(Fotó: Getty Images Hungary)