End-to-End Low-Resource Speech Translation for Swiss German Dialects

Auf einen Blick

Projektleiter/in : Prof. Dr. Mark Cieliebak
Co-Projektleiter/in : Prof. Dr. Manfred Vogel
Stellv. Projektleiter/in : Dr. Jan Milan Deriu
Projektteam : Michel Plüss, Dr. Tanja Samardzic
Projektvolumen : CHF 322'260
Projektstatus : abgeschlossen
Drittmittelgeber : SNF (SNF-Projektförderung / Projekt Nr. 200729)
Projektpartner : Fachhochschule Nordwestschweiz FHNW, Universität Zürich
Kontaktperson : Mark Cieliebak

Beschreibung

Dieses Projekt untersucht die Anwendung der neuesten Erkenntnisse in der Sprachübersetzung auf Schweizerdeutsch. Sprachübersetzung (ST) ist die Aufgabe, gesprochene Äusserungen in einer Sprache in einen schriftlichen Text in einer anderen Sprache zu übersetzen. Sie dient als wesentliches Instrument, Sprachbarrieren in verschiedenen Kommunikationsumgebungen zu überwinden und ein vielversprechendes Mittel zur Erhaltung bedrohter Sprachen.

Wir werden untersuchen, wie ST auf schweizerdeutsche Dialekte angewandt werden kann, d.h. zur Übersetzung von Sprache in Schweizerdeutsch in Text in Standarddeutsch zu übersetzen. Dies hat zahlreiche wichtige Anwendungen in der Praxis, z.B. Sprachroboter wie Siri oder Alexa, Transkription von Interviews, Erstellung von Besprechungsprotokollen, Auswertung von Call-Center-Dialogen, etc. Die Grundidee für die Transkription ins Standarddeutsche ist, dass dadurch eine einheitliche Schriftform geschaffen wird und dies uns ermöglicht, von der Fülle an NLP-Methoden zu profitieren, die es für Standarddeutsch als einer gut untersuchten Sprache mit vielen Ressourcen gibt (z. B. Part-of-Speech-Tagging, Named Entity Recognition, Sentimentanalyse, Zusammenfassung usw.).

ST ist ein attraktiver Ansatz für Schweizerdeutsch, da er nicht auf eine textuelle Zwischenrepräsentation in der Ausgangssprache angewiesen ist (es gibt keine einheitliche Schriftform für Schweizerdeutsch). Allerdings erfordert er normalerweise eine große Menge an annotierte Trainingsdaten, die für die zahlreichen schweizerdeutschen Dialekte nicht verfügbar sind. Aus diesem Grund werden wir untersuchen, wie ST-Systeme für schweizerdeutsche Dialekte aufgebaut werden können, ohne dass für jeden Dialekt annotierte Daten erzeugt werden müssen. Genauer gesagt, werden wir:

ein umfangreiches paralleles Korpus von 450 Stunden Audio in 7 wichtigen Schweizer Dialekten erstellen und den entsprechenden Übersetzungen in Standarddeutschem Text. Dieses Korpus wird in einer kontrollierten Umgebung erstellt, so dass er für wissenschaftlich fundierte Experimente zu schweizerdeutschen Dialekten genutzt werden kann.
3 ST-Systeme implementieren und Experimente zum optimalen Training eines ST-Systems für verschiedene Dialekte durchführen.
untersuchen, wie man Trainingsdaten zwischen verschiedenen Dialekten des Schweizerdeutschen übertragen kann, z.B. mit Hilfe von Speech-to-Speech-Übersetzung, Vokabelerweiterung oder Stimmanpassung, um den Mangel an Trainingsdaten für die meisten schweizerdeutschen Dialekte zu mildern.
Eine Sammlung von Empfehlungen und Best Practices für die Entwicklung von allgemeinen ST-Systemen für schweizerdeutsche Dialekte.

Die Ergebnisse dieses Projekts werden den Weg für die Entwicklung praktischer ST-Lösungen für Schweizerdeutsch auf breiter Ebene unterstützen und zur Verbreitung des Schweizerdeutschen als Teil des kulturellen Erbes der Schweiz im digitalen Zeitalter beitragen.

Publikationen

Paonessa, Claudio; Schraner, Yanick; Deriu, Jan Milan; Hürlimann, Manuela; Vogel, Manfred; Cieliebak, Mark,

2023.

Dialect transfer for Swiss German speech translation.

arXiv.

Verfügbar unter: https://doi.org/10.48550/arXiv.2310.09088
Bollinger, Tobias; Deriu, Jan Milan; Vogel, Manfred,

2023.

Text-to-speech pipeline for Swiss German : a comparison [Paper].

In:

8th Swiss Text Analytics Conference – SwissText 2023, Neuchâtel, Switzerland, 12-14 June 2023.

arXiv.

Verfügbar unter: https://doi.org/10.48550/arXiv.2305.19750
Plüss, Michel; Deriu, Jan Milan; Schraner, Yanick; Paonessa, Claudio; Hartmann, Julia; Schmidt, Larissa; Scheller, Christian; Hürlimann, Manuela; Samardžic, Tanja; Vogel, Manfred; Cieliebak, Mark,

2023.

STT4SG-350 : a speech corpus for all Swiss German dialect regions [Paper].

In:

Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers).

61st Annual Meeting of the Association for Computational Linguistics, Toronto, Canada, 9-14 July 2023.

Association for Computational Linguistics.

S. 1763-1772.

Verfügbar unter: https://doi.org/10.18653/v1/2023.acl-short.150
Plüss, Michel; Hürlimann, Manuela; Cuny, Marc; Stöckli, Alla; Kapotis, Nikolaos; Hartmann, Julia; Ulasik, Malgorzata Anna; Scheller, Christian; Schraner, Yanick; Jain, Amit; Deriu, Jan Milan; Cieliebak, Mark; Vogel, Manfred,

2022.

SDS-200 : a Swiss German speech to Standard German text corpus [Paper].

In:

Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022).

13th Language Resources and Evaluation Conference (LREC), Marseille, France, 20-25 June 2022.

European Language Resources Association.

S. 3250-3256.

Verfügbar unter: https://doi.org/10.21256/zhaw-26131

Zurück