Eingabe löschen

Kopfbereich

Hauptnavigation

School of Engineering

Intelligente Datenbanken: Übersetzung von natürlicher Sprache in eine Datenbanksprache mit neuronalen Netzwerken

Um eine Datenbank effektiv abfragen zu können, muss man eine spezielle Datenbanksprache namens SQL beherrschen. Diese Computersprache kann beispielsweise mit Esperanto verglichen verwenden – einer Sprache, die nur einige Spezialisten beherrschen, jedoch nicht die Allgemeinheit. Wenn jemand in dieser speziellen Computersprache SQL jedoch nicht sattelfest ist, ist es fast unmöglich, die verborgenen Informationen von Datenbanken zu durchforsten.

Klassischer Ansatz

Bereits seit den 70er Jahren beschäftigt sich die Informatikforschung mit der Entwicklung von natürlichsprachlichen Schnittstellen zu Datenbanken, um die Interaktion zwischen Mensch und Maschine zu erleichtern. Frühe Systeme benutzten meist regel- oder musterbasierte Ansätze, um das Problem zu lösen. In der Praxis haben sich diese Systeme jedoch aufgrund der geringen Genauigkeit nicht durchgesetzt. Aufgrund der Fortschritte im Bereich Big Data, Machine Learning und der rasanten Entwicklung von Prozessortechnologien, konnten in letzter Zeit vielsprechende Lösungen entwickelt werden, etwa die Sprachassisten von Amazon, Apple oder Google.

Ansatz mit Deep Learning: ValueNet

Ursin Brunner hat in seiner Masterarbeit unter der Leitung von Prof. Dr. Kurt Stockinger ein System namens ValueNet entwickelt, das natürliche Sprache in die Datenbanksprache SQL mit Hilfe von neuralen Netzwerken übersetzt. Im Speziellen hat Ursin Brunner sogenannte «Transformer» verwendet – eine Art von neuralen Netzwerken, die sich besonders gut für Problemstellungen im Bereich von «Natural Language Processing» eignet, wie etwa die maschinelle Übersetzung von Deutsch auf Englisch oder die automatische Erstellung von Texten.

Dabei wird ein neuronales Sprachmodell verwendet, das auf grossen Mengen von Texten vortrainiert und dann für eine spezielle Datenbank feinjustiert wird. Das von Ursin Brunner entwickelte System ValueNet erreicht eine Übersetzungsgenauigkeit von Englisch nach SQL von knapp 65% auf einem international verwendeten Benchmarkdatensatz. Die Übersetzungsergebnisse sind derart gut, dass seine Arbeit als Publikation in der international sehr renommierten Konferenz «International Conference on Data Engineering» angenommen worden ist. Somit zeigt sich, dass sich Schweizer Präzessionsarbeit auch in der vor allem von US-amerikanischen Firmen dominierten Computerwissenschaft behaupten kann.

Referenz

Brunner, Ursin; Stockinger, Kurt, 2021. ValueNet: A Natural Language-to-SQL System that Learns from Database Information. In: Proceedings of the 37th ICDE. International Conference on Data Engineering (ICDE), Chania, Greece, 19-22 April 2021. IEEE. Verfügbar unter: https://doi.org/10.21256/zhaw-22000