Erstes BRIDGE-Discovery-Projekt an der School of Engineering: PDF-Dokumente sollen einfacher barrierefrei werden
PDF-Dateien für Sehbehinderte zugänglich zu machen, ist heute noch mit zu viel manuellem Aufwand verbunden. ZHAW-Forschende entwickeln dafür ein halbautomatisches System. Gefördert wird das Projekt vom Sonderprogramm BRIDGE des Bundes.
Obwohl es eines der beliebtesten Dokumentformate ist, sind PDF-Dateien vielfach nicht oder nur teilweise für Sehbehinderte zugänglich. Dies, weil sie nicht vollständig mit Vorleseprogrammen kompatibel sind. Dafür müssen Autorinnen und Autoren verschiedenen Strukturelementen beim Erstellen des PDFs manuell spezielle «Tags» hinzufügen. Dies ist jedoch sehr zeitaufwändig, insbesondere bei wissenschaftlichen Dokumenten. Bisher gibt es noch keine zuverlässige automatisierte Methode, um die Seitenstruktur und somit die Lesereihenfolge zu erkennen sowie Tabellen, Formeln und Grafiken korrekt zu interpretieren. Für jeden dieser Aspekte hat die Forschung bereits unterschiedliche Ansätze untersucht, deren Ergebnisse jedoch nicht ausreichen, um eine vollständige Automatisierung der jeweiligen Verarbeitungsschritte zu ermöglichen. «Angesichts der vielen offenen Forschungsfragen ist es nicht unser Projektziel, den Bereitstellungsprozess von PDF-Dateien vollständig zu automatisieren», sagt ZHAW-Forscher Alireza Darvishy. «Aber mit der Automatisierung möglichst vieler Prozessschritte wollen wir den Aufwand für die Autoren auf ein Minimum reduzieren.»
Von der richtigen Segmentierung bis ins Detail
Dazu untersuchen die ZHAW-Forschenden in einer ersten Phase die Möglichkeiten der automatischen Erkennung von Struktur und Lesereihenfolge einer PDF-Seite. Dabei bauen sie auf Deep-Learning-Ansätzen auf, die am ZHAW-Institut für angewandte Informationstechnologie für die Segmentierung von Zeitungsartikeln entwickelt wurden. «Eine genaue Segmentierung der Inhaltselemente ist entscheidend für den Erfolg der nachfolgenden Verarbeitungsschritte», erklärt Darvishy. «In der zweiten Phase konzentrieren wir uns darauf, wie Formeln zugänglich gemacht werden können, da sie einen wesentlichen Teil von PDFs in den MINT-Bereichen ausmachen.» Das Ergebnis wird ein halbautomatisches System sein, das die effiziente Konvertierung von herkömmlichen PDFs in für alle zugängliche PDFs ermöglicht, indem die verschiedenen Inhaltselemente eines Dokuments so identifiziert und konvertiert werden, dass ein Vorleseprogramm diese Informationen korrekt wiedergeben kann.
Erstmals Fördermittel durch BRIDGE
Für vier Jahre erhält das Projekt als erstes überhaupt an der ZHAW School of Engineering Unterstützung vom Sonderprogramm BRIDGE des Bundes. BRIDGE ist ein gemeinsames Programm des Schweizerischen Nationalfonds (SNF) und der Innosuisse. Es schafft ein neues Förderungsangebot an der Schnittstelle von Grundlagenforschung und wissenschaftsbasierter Innovation und ergänzt damit die Förderungstätigkeit der beiden Trägerorganisationen. «Das Verfahren ist sehr kompetitiv. Nur rund zehn Prozent der eingereichten Projekte werden unterstützt», sagt Darvishy. «Für uns ist das ein grossartiger Erfolg.»