Swiss-AL: Eine Plattform für Sprachdaten in den Angewandten Wissenschaften
Als mehrsprachige Textsammlung der Schweizer öffentlichen Kommunikation ermöglicht Swiss-AL die datenbasierte Analyse und Simulation gesellschaftlicher Diskurse. Es steht für Forschende und die Öffentlichkeit als Open-Research-Data-Ressource zur Verfügung.
Swiss-AL besteht als Sprachdatenressource aus (1) einer Familie von mehrsprachigen Korpora der Schweizer öffentlichen Kommunikation, (2) einer korpus- und computerlinguistischen Pipeline zur Erstellung und Verarbeitung dieser Korpora und (3) einer browserbasierten Workbench zur Analyse dieser Korpora. Swiss-AL ermöglicht datengestützte und datengetriebene Forschung zu gesellschaftlichen Diskursen in der Schweiz. Es enthält Schweizer journalistische Medien sowie Medienmitteilungen, Newsmeldungen und Blogbeiträge von Akteuren aus Politik & Verwaltung, Wirtschaft, Wissenschaft und Zivilgesellschaft. Eine flexible Verarbeitungspipeline ermöglicht es, massgeschneiderte Teilkorpora für die Untersuchung von Diskursen zu modellieren.
Anwendungsgebiete
Swiss-AL wird vom ZHAW Digital Discourse Lab in angewandten Forschungsprojekten zur Analyse und Simulation öffentlicher Diskurse in der Schweiz eingesetzt. Dazu gehören unter anderem die folgenden Projekte:
- COVIDisc – A Focus on vector populations
- Feldstudie: Digitale Diskursanalysen in der Schweiz
- Energiediskurse in der Schweiz
Die in Swiss-AL enthaltenen Mediendaten bilden ausserdem die Grundlage für das Wort des Jahres Schweiz in den Sprachen Deutsch, Französisch, Italienisch und Rumantsch.
Das Korpus wird ausserdem in allen Studiengängen des Departements für die forschungsbasierte Lehre genutzt, beispielsweise bei der Erstellung von Abschlussarbeiten auf Bachelor- und Masterniveau oder im studiengangübergreifenden Kernstudium.
Swiss-AL und Open Research Data
Swiss-AL steht als offene Forschungsressource zur Verfügung. Seit Januar 2023 wird Swiss-AL von der ZHAW und swissuniversities im Rahmen der Swiss Open Research Data Grants gefördert, um Praktiken im Umgang mit sprachbasierten Forschungsdaten weiterzuentwickeln und in konkrete Nutzungsformen zu überführen. Im Zentrum stehen Praktiken, die Forschende aus anwendungsorientieren, nicht-linguistischen Disziplinen ausüben, um Sprachdaten zu analysieren.
Zugang
Swiss-AL kann mit Hilfe der am Departement Angewandte Linguistik entwickelten Swiss-AL Workbench genutzt werden.
- Zugang für die Öffentlichkeit: https://swiss-al.linguistik.zhaw.ch
- Zugang für ZHAW-Angehörige mit SwitchEDU-ID: http://tools.linguistik.zhaw.ch
Zusammensetzung
Die Korpusfamilie Swiss-AL setzt sich aus drei Komponenten zusammen:
- Swiss-AL Base: eine Auswahl zentraler Akteure der Schweizer öffentlichen Kommunikation aus Journalismus, Politik & Verwaltung, Wissenschaft, Wirtschaft und Zivilgesellschaft zur Exploration von Diskursen.
- Swiss-AL Media: breite Zusammenstellung journalistischer Medien (Tages- und Wochenzeitungen, lokal/regional/überregional).
- Swiss-AL Projects: Korpora aus inter- und transdisziplinären Forschungsprojekten zu spezifischen Diskursen; methodische Innovationen in diesen Projekten fliessen in die Zusammenstellung und Erstellung von Swiss-AL Media und Base ein.
Die Korpora werden über eine an der ZHAW entwickelte korpus- und computerlinguistische Pipeline erstellt. Die Textdaten werden regelmässig und automatisiert aus dem Web heruntergeladen (Webcrawling) sowie – im Falle journalistischer Medien – über die Schweizer Mediendatenbank bezogen (Swissdox@LiRi).
Publikationen
-
Krasselt, J., Dreesen, P., Fluor, M., Mahlow, C., Rothenhäusler, K., & Runte, M. (2020). Swiss-AL: A Multilingual Swiss Web Corpus for Applied Linguistics. Proceedings of the 12th Language Resources and Evaluation Conference, 4138--4144. https://aclanthology.org/2020.lrec-1.510/
-
Krasselt, J., Dreesen, P., Fluor, M., Mahlow, C., Rothenhäusler, K., & Runte, M. (2020). Swiss-AL: A Multilingual Swiss Web Corpus for Applied Linguistics. Proceedings of the 12th Language Resources and Evaluation Conference, 4138--4144. https://aclanthology.org/2020.lrec-1.510/
-
Krasselt, J., Dreesen, Ph., Fluor, M., & Rothenhäusler, K. (im Druck). Swiss-AL. Korpus und Workbench für mehrsprachige digitale Diskurse. In Korpuslinguistik und Interdisziplinäre Perspektiven auf Sprache (CLIP). Narr.