Před čtyřmi lety vznikla Evropská digitální matematická knihovna, která slučuje dědictví tohoto oboru v podobě knih a článků na jednom místě. Její uživatelé v ní mohou vyhledávat informace i pomocí speciálního systému, za jehož vývoj a vyhodnocení získal třetí místo v soutěži ACM SPY Martin Líška z fakulty informatiky.
Nynější doktorand začal systém pro vyhledávání matematických výrazů v dokumentech vyvíjet už při sepisování bakalářské práce. „Využijí ho především matematici, fyzici, informatici a ti, kteří potřebují hledat v odborných textech, v nichž tvoří velký objem dat matematika,“ přibližuje systém Líška. Zájemci v něm vyhledávají pomocí vzorců a výrazů a získají přehled dokumentů, v nichž se daný nebo do jisté míry podobný vzorec vyskytuje.
Ve světě se podle Líšky vyvíjí zhruba pět až deset podobných vyhledávačů, vyhodnocováním jejich efektivity se zabývají vědci na konferencích. Líška se však ve své diplomové práci pokusil ohodnotit vlastní systém pomocí testovací kolekce. „Podle jejích výsledků funguje docela dobře,“ říká s úsměvem informatik.
Pro navrhování vyhledávače Líška údajně velkou znalost matematiky nepotřeboval, při jeho dalším rozvoji a především jeho evaluaci už jsou ale matematici nezbytní. „Při textovém vyhledávání můžete poměrně jednoduše posoudit, jestli výsledek odpovídá tomu, co potřebujete. Když ale zadáte vzorec například o deseti proměnných, tak vyhodnotit, zda v desetistránkovém dokumentu skutečně hledaná věc je a zda má výsledek nějaký informační přínos, je výrazně složitější,“ podotýká Líška.
Od běžných vyhledávačů se liší hlavně tím, že nevyužívá lineární způsob vyhledávání, při němž se porovnává shoda textových řetězců, ale pracuje se s matematickou informací, která je strukturovaná. „Hledání shody je tedy mnohem složitější,“ dodává Líška.
Jak jeho vyhledávač hodnotí uživatelé, ještě neví. Vzhledem k jinému způsobu zadávání dotazů podle něj zřejmě chvíli potrvá, než s ním začnou pracovat.
>> vyzkoušejte na eudml.org/search