CAI erfolgreicher Mitorganisator der SwissText Konferenz 2022 in Lugano
Die 7. Swiss Text Analytics Conference (SwissText) fand vom 8. bis 10. Juni statt. Mehr als hundert Teilnehmer aus Industrie und Wissenschaft tauschten sich über neue und spannende Entwicklungen in der Verarbeitung Natürlicher Sprache (Natural Language Processing, NLP) aus.
Die SwissText 2022 wurde gemeinsam von der SUPSI, SwissNLP und dem Zentrum für Künstliche Intelligenz (CAI) der ZHAW organisiert. Die jährlich stattfindende Konferenz ist ein Forum wo sich Forschende und Praktiker im Bereich NLP treffen um sich auszutauschen und zu diskutieren. Nach zwei Online-Ausgaben fand sie nun endlich wieder als physische Konferenz auf dem SUPSI Ost-Campus in Lugano statt.
Am Vorkonferenztag standen interaktive Workshops auf dem Programm: Extraktion von Schlüsselwörtern aus wissenschaftlichen Dokumenten, Schweizerdeutsch (Speech-to-Text und lexikalische Normalisierung) und NLP für den Versicherungsbereich, sowie eine affiliierte Veranstaltung über ein Projekt zur Weiterbildung von Linguisten für technische Berufe.
An den beiden Hauptkonferenztagen gab es insgesamt 18 Präsentationen, die in thematischen Tracks wie "Speech-to-Text and Swiss German", "Legal Applications", "Generation and Parsing" und "Business Applications " organisiert waren. Der neu geschaffene Junior Track, der jungen Forschenden eine Plattform bieten soll, beinhaltete sechs interessante Präsentationen.
Zwei interaktive Veranstaltungen sorgten dafür, dass die Teilnehmer ihre Arbeit weiter präsentieren konnten, und boten wertvolle Gelegenheiten zur Vernetzung:
Erstens bot die Ausstellung am Donnerstagnachmittag 21 Forschungsposter, 4 Systemdemonstrationen sowie 11 Stände der Konferenzsponsoren und angeschlossenen akademischen Einrichtungen.
Zweitens diskutierten die Teilnehmer beim "Battle of NLP Ideas" am Freitag in kleinen Gruppen, um Ideen für neue NLP-Projekte zu entwickeln. In den folgenden Runden wurden die Gruppen pyramidenförmig zusammengeführt und die vielversprechendsten Vorschläge ausgewählt, bevor sie in im Plenum präsentiert wurden, in der das Publikum seine Stimme abgeben konnte. Die drei siegreichen Ideen betrafen die Generierung synthetischer Daten, die Identifizierung von Bot-generierten Inhalten und die Anonymisierung von Daten für NLP. Alle Teilnehmer konnten sich dann für jene Ideen eintragen, bei denen sie an einem Folgetreffen teilnehmen möchten.
Das reichhaltige und abwechslungsreiche Programm wurde durch drei Keynotes von renommierten Experten ergänzt:
Raul Rodriguez-Esteban, Senior Principal Scientist bei Roche, sprach über Quantitative Social Media Listening, einen relativ neuen Trend im Gesundheitswesen, bei dem soziale Medien genutzt werden, um noch nicht dokumentierte Krankheitssymptome oder Bevölkerungsgruppen mit ungedecktem medizinischem Bedarf zu identifizieren oder den besten Standort für eine klinische Studie zu finden.
Enrique Alfonseca von Google stellte die laufenden Arbeiten zur Integration von strukturiertem Wissen in grosse Sprachmodelle vor. Dies ist wichtig, um die Argumentationsfähigkeit dieser Modelle zu verbessern und sachlich korrektere Antworten zu geben.
Marco Passarotti, Professor an der Katholischen Universität Mailand, sprach über die Vorteile der Interoperabilität von Linked Data bei der Erstellung von Sprachressourcen, die er anhand seines laufenden ERC-Projekts "LiLa: Linking Latin" illustrierte.
Insgesamt war es eine sehr erfolgreiche Konferenz und das schöne Tessiner Wetter war ein grosser Bonus! Die Folien und Videos der Vorträge werden in den nächsten Wochen auf der Konferenz-Website zur Verfügung gestellt. SwissText 2023 wird die Reise durch die Sprachregionen der Schweiz fortsetzen: Sie wird in der Haute École Arc Ingénierie (HE-ARC) in Neuenburg stattfinden.