Právě na tom na Přírodovědecké fakultě MU pracuje Stanislav Mazurenko. Využívá při tom metody strojového učení, díky nimž se mu už podařilo zkrátit dobu analýzy dat z týdnů na minuty.
Enzymy využívá celá řada odvětví od potravinářství přes farmacii až po odpadové hospodářství. Tyto přírodní katalyzátory ovlivňují průběh chemických reakcí, ale často je třeba jejich přirozenou aktivitu vylepšit, což se dělá změnou struktury těchto molekul. Odborníci tak mohou upravit jejich rozpustnost, stabilitu v závislosti na teplotě či rozpouštědle a řadu dalších vlastností.
Využívají k tomu postupy zahrnující počítačové modelování možných úprav nebo takzvanou řízenou evoluci, při níž vyrobí v laboratoři statisíce náhodných variant daného enzymu s drobnými rozdíly ve struktuře a studují jejich vlastnosti. Stále víc se ale využívá i strojové učení, tedy oblast umělé inteligence, která pomáhá odhalovat vztahy mezi strukturou a funkcí těchto bílkovin a také efektivněji předpovídat jejich možné úpravy.
Protože vývoj této oblasti je v posledních letech velmi rychlý, zpracoval Stanislav Mazurenko z Loschmidtových laboratoří práci o možnostech současných metod strojového učení a databází bílkovinných struktur, s nimiž tyto metody pracují. „Šlo o kritické zhodnocení nejnovějších metod využívaných v enzymovém inženýrství a především posouzení možného budoucího vývoje tohoto oboru. Zaměřili jsme se na metody strojového učení a nové technologie sběru dat,“ přiblížil Mazurenko obsah publikace, kterou zpracoval pro časopis Americké chemické asociace ACS Catalysis. Podle Altmetric score se článek dostal mezi pět procent nejčtenějších publikací na světě.
Popisoval v ní metody sběru dat a především přínos takzvaných high-throughput přístupů, jako je mikrofluidika, při níž se na zařízení tvořícím mikrokapénky provádějí tisíce experimentů za sekundu, nebo například sekvenování nové generace pro zjišťování složení bílkovin. Tyto metody produkují obrovské množství surových dat, která je třeba zpracovat.
Jedním z doporučení, které Mazurenko v publikaci dává, je vyšší míra využívání právě takových vstupních dat, která výzkumníci získají v rámci svého vlastního týmu. Rozvoj zmíněných high-troughput technologií umožňuje získat potřebné množství vstupních dat pro strojové učení v krátké době.
„Vytváření vlastních databází má tu výhodu, že přesně víte, jakým způsobem data měříte a jak jsou kvalitní. Můžete si také zajistit jejich kompatibilitu v čase,“ podotkl mladý výzkumník. U metod strojového učení je pak zase potřeba sledovat jejich úspěšnost – tedy jaká je pravděpodobnost, že navrhnou strukturu enzymu s požadovanými vlastnostmi.
Právě využití umělé inteligence má Mazurenko v týmu Loschmidtových laboratoří na starosti. Vystudoval matematiku a aplikovanou informatiku na Lomonosovově univerzitě v Moskvě, kde se dostal i k jejímu využití v biologii. Do laboratoře na přírodovědecké fakultě, kde se propojování informatiky a biologie dlouhodobě věnují, pak přišel už v roce 2014 jako postdoc. Po následujícím dvouletém působení na Liverpoolské univerzitě v Anglii se před nedávnem vrátil na přírodovědeckou fakultu díky grantu Marie-Sklodowska Curie Action.