Natural Language Processing Group

«Wir verbinden Grundlagenforschung mit industriellen Anwendungen, um neue und innovative Produkte und Dienstleistungen hervorzubringen, während wir gleichzeitig die ethischen und gesellschaftlichen Dimensionen erforschen.»
Expertise

- Textanalytik
- Dialogsysteme
- Sprachverarbeitung
Das NLP-Forschungsteam entwickelt Technologien zur Analyse, zum Verständnis und zur Generierung von Sprache und Texten. Wir verbinden Methoden aus der Linguistik, dem Natural Language Processing (NLP) und der künstlichen Intelligenz, um eine natürlichsprachliche Kommunikation zwischen Mensch und Maschine zu ermöglichen. In unserer Forschung arbeiten wir an Themen wie der Textklassifikation (z. B. Sentiment-Analyse), Chatbots und Dialogsystemen, Textzusammenfassung, Speech-to-Text, Sprecherunterscheidung sowie der Generierung von natürlicher Sprache (Natural Language Generation). Die schweizerdeutsche Sprach- und Textverarbeitung bildet einen besonderen Schwerpunkt der Gruppe.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
Plattform “Sinn-im-Beruf”
Wir entwickeln eine digitale Plattform namens “Sinn-im-Beruf”, die Erwerbstätige dabei unterstützt, ihre Arbeit und berufliche Laufbahn sinnstiftend zu gestalten.
laufend, 03/2025 - 02/2028
-
NLP Community Building (ComBi)
SwissNLP möchte in einer konzertierten Aktion die Schweizer Akteure aus Industrie, Wissenschaft und Administration im Bereich Natural Language Processing (NLP) besser vernetzen. Dazu sollen bis Ende 2025 verschiedene Aktivitäten durchgeführt werden, um dieses Ziel zu erreichen (z.B. Expert Group…
laufend, 12/2023 - 01/2026
-
AI für sich selbst-organisierende Content Plattform (AI4CP)
In dieser Vorstudie soll ein Prototyp entwickelt werden, der aus dem Text einer Website oder eines Blog-Posts einen Vorschlag für einen Content-Post für die Conteo-Plattform erstellt. Dieser Prototyp soll vollautomatisch arbeiten, einen Text in vorgegebener Länge und Struktur erzeugen und den Post…
abgeschlossen, 05/2023 - 11/2023
-
Towards a Voice-Based Chatbot for Language Learners (ChaLL) (ChaLL)
Wir entwickeln ChaLL, den Prototypen eines sprachbasierten Chatbots. ChaLL bietet Sprachlerner:innen die Möglichkeit, das Sprechen in verschiedene aufgabenbasierten Konversationen zu üben und Feedback zu erhalten, frei von den zeitlichen Beschränkungen und dem Stress des klassischen Umfeldes im…
abgeschlossen, 02/2023 - 07/2024
-
PRISM: Predicting Radicalization Events in Social Media User Timelines
Das PRISM-Projekt konzentriert sich auf die Erkennung von Radikalisierungsereignissen in Social-Media-Netzwerken. Insgesamt sind wir daran interessiert, die Mechanismen aufzudecken, die dazu führen, dass extremistische Ideologie übertragen und in die Weltanschauung eines Social-Media-Nutzers oder…
abgeschlossen, 04/2022 - 02/2023
-
Evaluation automatische Spracherkennung (Schweizerdeutsch) für Menschen mit Schwerhörigkeit
Schriftdolmetschen ist eine Dienstleistung der Pro Audito für Schwerhörige/Hörbehinderte in verschiedensten Alltagssituationen. Ca. 100 Einsätze monatlich werden den Mitgliedern vermittelt, das Interesse ist aber viel grösser. Deshalb möchten wir evaluieren, inwieweit automatische Spracherkennung…
abgeschlossen, 09/2021 - 06/2022
-
DOSSMA – Erkennung von verdächtigem Verhalten in Social Media
Das Projekt DOSSMA wird verdächtiges und bösartiges Verhalten auf Social-Media-Plattformen untersuchen. In einer ersten Phase werden wir einen umfangreichen Übersichtsbericht über die Bereiche erstellen, die derzeit erforscht werden, einschließlich des jeweiligen Stands der Technik, bestehender…
abgeschlossen, 05/2021 - 12/2021
-
Speech-to-Text für Schweizerdeutsch
Im gemeinsamen. Forschungsprojekt «Speech-to-Text for Swiss German (STT4SG)» verfolgen die teilnehmenden Institutionen das Ziel, eine geeignete Datenbasis aufzubauen und damit eine Speech-to-Text Software-Lösung. zu entwickeln. Diese Lösung soll schweizerdeutsch (Dialekte) gesprochene Audios in…
abgeschlossen, 02/2021 - 02/2022
-
Crowdsourcing für Schweizerdeutsches Speech-to-Text
Die Verschriftlichung von gesprochenem Schweizerdeutsch (Speech-to-Text, STT) ist ein wichtiges Problem, das viele Firmen bei uns nachfragen. Anwendungen sind z.B. automatischer Kundensupport, Voice Assistants wie Siri, TV-Untertitelung, etc. Bisher existiert keine praxistaugliche Lösung, was vor…
abgeschlossen, 01/2021 - 06/2021
-
Swiss Text Analytics Conference 2021 (SwissText)
Die Swiss Text Analytics Conference (SwissText) findet seit 2016 jährlich statt und bringt Expertinnen und Experten der Textanalyse aus Industrie und Forschung zusammen. Das Programm besteht aus Keynote-Referaten von international bekannten Repräsentanten aus Forschung und Industrie,…
abgeschlossen, 12/2020 - 09/2021
-
Virtual Kids - Virtuelle Charaktere zur Verbesserung der Qualität von Kindesbefragungen
Werden Kinder in Ermittlungsverfahren zu eigenen, strafrechtlich relevanten Erlebnissen oder Beobachtungen befragt, hängt es entscheidend von der Qualität der Befragung ab, ob deren Aussagen im Strafverfahren verwertbar sind bzw. ob auf dieser Grundlage Entscheidungen getroffen werden und…
abgeschlossen, 04/2020 - 04/2024
-
AuSuM – Automatic Supply Chain Monitoring
The project implements an online service for companies to monitor suppliers for violations ofenvironmental, social, or governance norms. To do so, a vast variety of sources, such as news outlets, is monitored using machine learning and natural language processing with near human-level accuracy.
abgeschlossen, 12/2018 - 05/2021
-
Pre-Study on Generation of Hockey News
Tamedia möchte ein Softwaresystem entwickeln, das aus Hockeyspiel-Daten automatisch News-Artikel generiert.Die ZHAW wird die verschiedenen State-of-the-Art-Technologien untersuchen um die Machbarkeit der Entwicklung eines natürlichen Sprachsystems zu bewerten, das einen umfassenden kontextuellen…
abgeschlossen, 10/2018 - 12/2019
-
Digitale Kommunikationsstrategien für den Kultursektor in der Bodenseeregion
In Kooperation mit der FH Vorarlberg und dem ZHAW Institut für Angewandte Informationstechnologie untersucht das Zentrum für Kulturmanagement, wie eine Kommunikationsstrategie zur Vermarktung und Vermittlung der vielfältigen Kulturaktivitäten und -orte im Bodenseeraum zu gestalten wäre.Das Projekt…
abgeschlossen, 07/2018 - 06/2020
-
Call-E – Virtual Call Agent
The industrial project partner offers online brokering of loans, mortgages and insurances. The brokering process involves several phone calls of a call agent with a potential client. This is time-consuming and highly repetitive. For this reason, we want to develop a dialogue system which can take…
abgeschlossen, 06/2018 - 05/2020
-
NLP4TC: Natural Language Processing for Tumor Classification
Eingangs-, Entladungs-, Radiologie- und Pathologieberichte und andere klinische Dokumente sind wertvolle Ressourcen, die für Erfolge in der Präzisionsmedizin vewendet werden können. Sie werden aber typischerweise in einem Freitextformat gespeichert, es wird nur wenig Struktur vorgegeben und die…
abgeschlossen, 05/2018 - 12/2019
-
SCAI – Smart Contract Analytics using Artificial Intelligence
Im SCAI-Projekt untersuchen die ZHAW und die Firma legartis, wie Inhalte von Verträgen automatisch juristisch ausgewertet und bewertet werden können. Dabei kommen Verfahren aus den Bereichen Natural Language Processing und Deep Learning zum Einsatz.
abgeschlossen, 05/2018 - 05/2020
-
LIHLITH – Learning to Interact with Humans by Lifelong Interaction with Humans
The LIHLITH project is a fundamental pilot research project which introduces a new lifelong learning framework for the interaction of humans and machines on specific domains. A Lifelong Learning system learns different tasks sequentially, over time, getting better at solving future related tasks…
abgeschlossen, 10/2017 - 12/2020
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4…
abgeschlossen, 09/2016 - 05/2019
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit…
abgeschlossen, 09/2016 - 02/2018
Publikationen
-
Aghaebrahimian, Ahmad; Cieliebak, Mark,
2019.
Towards integration of statistical hypothesis tests into deep neural networks [Paper].
In:
Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics.
57th Annual Meeting of the Association for Computational Linguistics, Florence, Italy, 28 July - 2 August 2019.
Association for Computational Linguistics.
S. 5551-5557.
Verfügbar unter: https://doi.org/10.18653/v1/P19-1557
-
Cieliebak, Mark; Galibert, Olivier; Deriu, Jan Milan,
2019.
Towards understanding lifelong learning for dialogue systems [Paper].
In:
IWSDS 2019 Proceedings.
IWSDS 2019 : International Workshop on Spoken Dialogue Systems Technology, Siracusa, Italy, Apr 24, 2019 - Apr 26, 2019.
IWSDS.
-
Elezi, Ismail; Tuggener, Lukas; Pelillo, Marcello; Stadelmann, Thilo,
2018.
DeepScores and Deep Watershed Detection : current state and open issues [Paper].
In:
Proceedings of the 1st International Workshop on Reading Music Systems.
1st International Workshop on Reading Music Systems at ISMIR 2018, Paris, France, 20 September 2018.
Paris:
Society for Music Information Retrieval.
S. 13-14.
Verfügbar unter: https://doi.org/10.21256/zhaw-4777
-
Siddiqui, Nadina; Metzler, Linus; Tuggener, Don; Cieliebak, Mark,
2018.
A framework for text analytics with visual exploration and machine learning [Poster].
In:
Fachkonferenz Technik, Architektur und Life Sciences (FTAL), Lugano, 18.-19. Oktober 2018.
-
von Grünigen, Dirk; Benites de Azevedo e Souza, Fernando; Pradarelli, Beatrice; Magid, Amani; Cieliebak, Mark,
2018.
Best practices in e-assessments with a special focus on cheating prevention [Paper].
In:
Proceedings of 2018 IEEE Global Engineering Education Conference (EDUCON).
2018 IEEE Global Engineering Education Conference (EDUCON18), Tenerife, 17-20 April 2018.
IEEE.
S. 893-899.
Verfügbar unter: https://doi.org/10.1109/EDUCON.2018.8363325