ZHAW stellt intuitive Suchmaschine für wissenschaftliche Datensätze vor
Die ZHAW School of Engineering hat im Rahmen eines EU-Projekts eine intuitive Suchfunktion entwickelt. So können Informationen, beispielsweise zur Krebsforschung oder Astrophysik, in riesigen Datenbanken gefunden und ausgewertet werden. Das Projekt INODE wird über das EU-Forschungsprogramm Horizon 2020 finanziert.
ZHAW-Forscher Kurt Stockinger vom Institut für angewandte Informationstechnologie beschäftigt sich als Data Scientist schwerpunktmässig mit der Frage, wie Daten strukturiert und effizient innert kürzester Zeit durchsucht werden können. Immer lauter wird die Forderung nach einer Demokratisierung und allgemeiner Zugänglichkeit von Forschungsresultaten, die häufig mittels öffentlicher Gelder zu Stande gekommen sind. Doch gerade im Umfeld wissenschaftlicher Datenbanken ist die Suche nach Informationen schwierig.
Für das Projekt INODE haben Stockinger und sein Team eine intuitive Suchfunktion entwickelt, bei der die Eingabe in natürlicher Sprache erfolgt. Das heisst, das gewünschte Suchresultat erzielen die User ganz ohne Informatikkenntnisse. «Das Ziel liegt darin, der Suchmaschine in natürlicher Sprache Fragen zu stellen, also ähnlich wie wir mit anderen Menschen sprechen,» erklärt Stockinger. Dabei werden menschliche und künstliche Intelligenz miteinander kombiniert.
Verschiedene User aus der wissenschaftlichen Community als auch die Öffentlichkeit können auf die Daten zugreifen und Anfragen an die Suchmaschine stellen. So könnten beispielsweise Ärzte in der Krebsforschung bestimmte Bioinformatikdaten finden, die Einfluss auf den Erfolg von Therapien haben. Oder Astrophysiker könnten bestimmte Positionsverschiebungen von Sternen ausfindig machen. Weder die Ärzte noch die Astrophysiker müssten dazu eine Datenbanksprache anwenden.
Unterstützung aus der internationalen Forschung
Ein wichtiger Meilenstein im Projekt wurde kürzlich erreicht, als das Team das Projekt im internationalen INODE EOSC Workshop vorgestellt hat. Das Ziel von EOSC (European Open Science Cloud) ist es, wissenschaftliche Daten und Resultate aus europäischer Forschung der Allgemeinheit zur Verfügung zu stellen. Unter den Teilnehmenden waren Projektpartner und Forschende, die ihre Fallbeispiele im Workshop präsentierten. Video-Aufzeichnungen der Präsentationen und Demos finden sich auf der INODE-Website. Zu den Höhepunkten gehörten diese Vorträge:
- Maximilian Fabricius (Max-Planck-Institut für extraterrestrische Physik) spricht über weitentfernte Galaxien und was wir mithilfe von INODE über sie erfahren können. Mit der Auswertung von riesigen Mengen an komplexen Daten und Teleskopaufnahmen können also nicht nur einzelne Galaxien betrachtet, sondern ganze Systeme analysiert werden.
- Frederic Bastian und Tarcisio Mendes de Farias (SIB Schweizer Institut für Bioinformatik) beschäftigen sich mit sogenannten Biomarkern in der Krebsforschung. Biomarker sind biologische Merkmale, die auf bestimmte Krankheiten hinweisen können. INODE ermöglicht ein intuitiveres Verständnis von komplexen Daten, um diese Biomarker zu identifizieren.
Datenbankforschung ist hoch im Kurs
Das Projekt INODE will die Forschung an der Schnittstelle zwischen künstlicher Intelligenz und Datenbanken vorantreiben. Mit der Zeit soll das System ganz auf dem Machine Learning basieren. Bis zum Projektabschluss Ende 2022 wollen Stockinger und sein Team die Suchmaschine weiterentwickeln. «Dabei geht es unter anderem darum, wie menschliche und künstliche Intelligenz noch besser zusammenarbeiten können, um neue wissenschaftliche Erkenntnisse zu gewinnen. Also zum Beispiel auch darum, wie wir unser System für andere Forscherinnen und Forscher einfach zugänglich machen können, sodass sie damit ihre eigenen Daten besser analysieren und verstehen können», sagt Stockinger.
Das Projekt «INODE – Intelligent Open Data Exploration» ist 2019 gestartet und wird vom EU-Forschungsprogramm Horizon 2020 mit knapp 6 Millionen Euro gefördert. Unter Leitung der ZHAW School of Engineering entwickeln insgesamt neun Partnerinstitutionen aus verschiedenen europäischen Ländern gemeinsam eine für unterschiedliche Anwendungen einsetzbare Suchmaschine.