Eingabe löschen

Kopfbereich

Hauptnavigation

School of Management and Law

CAS Data Engineering

Das Phänomen der stetig zunehmenden Menge und Verbreitung von Daten begleitet uns seit Jahrzehnten. Zu Beginn dieser Entwicklung entstanden Daten in Systemen, bei denen die gewünschte Funktionalität die Form und Verarbeitung der Daten vorgab. Heutzutage verbreiten sich aber auch Systeme, in denen ein Nutzen dank dem Einbezug vorhandener Daten gestiftet wird.

Anmelden

Favoriten vergleichen

Auf einen Blick

Abschluss:

Certificate of Advanced Studies ZHAW in Data Engineering (12 ECTS)

Start:

22.08.2025

Dauer:

Kosten:

CHF 8'340.00

Bemerkung zu den Kosten: 

  • MAS-Teilnehmende erhalten einen Rabatt von CHF 1‘000.00
  • die vollständigen Studiengebühren sind vor Studienbeginn zu begleichen
  • in den Studiengebühren sind die Einschreibe- und Prüfungsgebühren sowie sämtliche kursrelevanten Unterlagen enthalten

Durchführungsort: 

  • ZHAW School of Management and Law / Campus St.-Georgen-Platz, 8401 Winterthur
  • Online
  • An Freitagen am Campus ZHAW School of Management and Law, Winterthur; Samstage finden i.d.R. online statt; ausgenommen von Tagen mit Workshops und Leistungsnachweisen

Unterrichtssprache:

  • Deutsch
  • Das Unterrichtsmaterial ist teilweise in englischer Sprache.

Weiterführende Informationen: 

Es besteht eine Präsenzpflicht von 80%.
Der CAS kann einzeln oder als Teil des MAS Business Engineering absolviert werden.

Ziele und Inhalt

Zielpublikum

Der CAS richtet sich an Fach- und Führungskräfte aus allen Branchen, welche ein Grundlagenverständnis für das Datenmanagement mitbringen, bereits Erfahrungen im generellen Umgang mit Daten gesammelt haben (bspw. durch den Besuch des CAS Data Competence for Business) und sich im Bereich der Sammlung, Aufbereitung, Validierung und Distribution von Daten vertiefen wollen. Idealerweise haben Sie bereits erste Erfahrungen mit 1 – 2 Abfrage-, Programmier- oder Skriptsprachen gesammelt. Der CAS bereitet Sie darauf vor, Aufgaben im Bereich des Data Engineering selbst durchzuführen sowie auf einem fachlichen Niveau zu überwachen.

Ziele

Sie können im Anschluss an diesen CAS:

  • Fragestellungen identifizieren, denen mit dem Einbezug von Daten und unterschiedlichen Aufbereitungs- und Analysemethoden begegnet werden kann
  • für den Erkenntnisgewinn erforderliche Daten identifizieren und spezifizieren
  • Speicherlösungen konzeptionieren und Datenmodelle skizzieren
  • Daten mittels unterschiedlicher Vorgehensweisen beschaffen und in geeignete Speicherlösungen überführen
  • für die Datenpipeline geeignete Transformationsmethoden kennen und anwenden, um die Datenkompatibilität herzustellen
  • für die Datenpipeline geeignete Bereinigungsmethoden kennen und anwenden, um eine akzeptable Datenqualität herzustellen
  • Grundsätzliche Überlegungen und Wege zur Bereitstellung von Daten für die Anwendungsfälle Analytik und Machine Learning kennen
  • die wichtigsten Überlegungen im Bereich der Informationssicherheit kennen
  • Überlappungen des Data Engineering – Lebensyzklus mit Datenmanagement, Orchestrierung, Software Engineeering und DevOps/DataOps/MLOps kennen
  • Statistische Methoden und Modelle des maschinellen Lernens für die Analyse und Validation der Daten innerhalb des Data Enginee-ring - Lebenszyklus kennen und anwenden
  • Statistische Methoden und Modelle des maschinellen Lernens für die Identifikation von Anomalien in Daten kennen und anwenden
  • Werkzeuge und Methoden für den Umgang mit natürlicher Sprache kennen und anwenden
  • Werkzeuge und Methoden für den Umgang mit Bilddaten kennen und anwenden
  • Werkzeuge und Methoden für den Umgang mit räumlichen Daten kennen und anwenden
  • Daten über ausgewählte Deployment-Lösungen bereitstellen und Datenübergänge automatisieren

Inhalt

Data Engineering wird je nach Definition als Teilbereich oder als Vorstufe des Data Science verstanden und befasst sich hauptsächlich mit den praktischen Aspekten der Datenbeschaffung und Zusammenführung, über den gesamten Datenaufbereitungskreislauf bis zur Analyse mit dem Ziel, eine qualitativ und quantitativ akzeptable Datengrundlage für die anschliessende Modellierung zu bieten.

Mit dem Wachstum der Datenmenge haben wir immer mehr Möglichkeiten, nützliche Produkte, Dienstleistungen und effektive Betriebe zu gestalten. Menschen in diversen Positionen, Funktionen und Rollen verfolgen ein breites Spektrum an Aufgaben, in denen Fragestellungen mit der Erfassung, Aufbereitung und Verarbeitung von Daten effektiver und effizienter beantwortet werden können. Im CAS Data Engineering vermitteln wir ein ebenso breites Spektrum an Werkzeugen und Methoden, welche Teilnehmende dazu befähigt, in ihrem beruflichen Alltag Daten mittels systematischer Techniken bereitzustellen, damit aus diesen ein konkreter Nutzen gewonnen werden kann.

Jeder Themenblock wird begleitet durch eine theoretische Einführung in die Thematik, die prozessorientierte Perspektive sowie praktische Übungen. Die Übungen finden mit öffentlich zugänglichen Daten aus den Bereichen Pharma & Gesundheit, Energie & Umwelt, Automobilindustrie, Versicherungen, Finanzen und Agrarwirtschaft statt. Es besteht ebenfalls die Möglichkeit, mit eigenen Daten zu arbeiten.

Modul 1: Werkzeuge und Methoden

Das erste Modul widmet sich den Werkzeugen und Methoden der folgenden Phasen des Data Engineering Lifecycle (Reis & Housley, 2022).

1. Einführung

  • Definition von Data Engineering, Abgrenzung zu verwandten Themenbereichen
  • Motivation, Organisation, Anforderungen, Organisatorisches
  • Tools und Equipment (Programmier-, Abfrage- und Skriptsprachen, Umgebungen)

2. Architekturen

  • Datenarchitekturen und ihrer Grundsätze
  • Architekturkonzepte

3. Ingestion

  • Formate und Datentypen
  • Datenquellen und -identifikation
  • API’s
  • Webscraping
  • Streaming

4. Storage

  • Verteilte Systeme
  • Datenbankeigenschaften
  • Raw ingredients
  • Data Storage Systems

5. Transformation

  • ROI der Transformation
  • Zeitfenster
  • Kombination von Streams mit anderen Daten
  • Kompatibilitäten
  • Integration
  • Datenqualität

6. Serving

  • Überlegungen zur Bereitstellung von Daten
  • Wege zur Bereitstellung von Daten
  • Anwendungsfälle Analytik und Machine Learning
  • Reverse ETL

7. Unterströmungen

  • Datenmanagement
  • Orchestrierung
  • Software Engineering
  • DevOps und DataOps
  • Informationssicherheit

Modul 2: Domänen und Daten

Im 2. Modul stehen Anwendungsfälle in den folgenden Themenblöcken im Fokus.

1. Daten, Datenmodelle und Datenbanken – eine Einführung

2. Graphen und Graphendatenbanken

3. Service Public

4. Plattformen

5. Soziale Medien

6. Natural Language Processing

7. Räumliche Daten

8. Bilddaten

Wir arbeiten mit den folgenden Sprachen und Umgebungen.

Programmier-, Abfrage- und Skriptsprachen:

  • Python (Pandas, NumPy, Matplotlib, Seaborn, Scikit Learn)
  • SQL
  • Cypher
  • R (optional)
  • Visual Basic (optional)

Entwicklungsumgebungen:

  • OpenRefine
  • Anaconda (Jupyter Notebook / Lab, Spyder, PyCharm)
  • Google Colab
  • MS Visual Studio
  • MS Excel
  • MS Access (optional)

Datenbanken:

  • MySQL, MariaDB
  • MongoDB
  • Neo4J
  • MS Azure SQL Server (optional)
  • MS Azure Cosmos DB (optional)

Weitere:

  • Google Cloud Platform
  • Git
  • MS Shell / Terminal
  • Docker
  • Flask
  • Dash
  • Social Network Visualizer
  • QT Designer (optional)
  • Django (optional)

Methodik

Der CAS zeichnet sich durch methodische Vielfalt aus. Neben Lehrgesprächen, Referaten, (Gruppen-)Übungen, Fallstudien oder Arbeit an Fallbeispielen aus der Praxis wird grosser Wert auf den Erfahrungsaustausch zwischen den Teilnehmenden gelegt.

Leistungsnachweis

Der Leistungsnachweis besteht aus einer Projektarbeit, die den gesamten CAS begleitet und in Gruppen erarbeitet wird. Die Projektarbeit wird pro Modul im Rahmen eines Kolloquiums durch die Gruppen präsentiert und im Plenum diskutiert.

Mehr Details zur Durchführung

Die Vorlesungen finden jeweils am Freitag und Samstag statt. Änderungen sind möglich.
Der CAS kann einzeln oder als Teil des MAS Business Engineering bzw. des MAS IT-Leadership und TechManagement absolviert werden.

Beratung und Kontakt

Veranstalter

Dozierende

Prof. Dr. Alexandre de Spindler, Anwendungsfälle für Daten, Datenmodelle und Datenbanken, Graphen und Graphendatenbanken, Natural Language Processing

Dr. Mario Gellrich, Ingestion und Anwendungsfälle für räumliche Daten

Jasmin Heierli, Workshop, Leistungsnachweis

Dr. Peter Heinrich, Informationssicherheit

Dr. Christian Hitz, Einführung

Benjamin Kühnis, Anwendungsfälle für Bilddaten

Václav Pechtor, Übungen mit Google Cloud Plattform (GCP)

Maria Pelli, Einführung, Architekturen, Storage, Transformation, Serving, Unterströmungen, Use Cases mit kombinierten Fragestellungen, Workshop, Leistungsnachweis

Dr. Anna Wiedemann, DevOps

Kooperationspartner

Gastvortrag
Kirsten Scherer
Use Cases und Best Practices im Umgang mit unstrukturierten Daten im Service Public
(Kantonspolizei ZH, SRG SSR)

Der Vortrag widmet sich den Aufgaben, die sich in der Praxis im Umgang mit unstrukturierten Daten ergeben können. Dazu werden drei Beispiele aus dem Umfeld des Service Public, deren spezifische Problemfelder und die gewählten Lösungsansätze vorgestellt. Anschliessend erfolgt einerseits ein Spotlight auf die allgemeinen Fähigkeiten, die zur Identifizierung von Daten und Verfahren für bestimmte Problemstellungen erforderlich sind und andererseits auf die besonderen Anforderungen, die die Nutzung unstrukturierter Daten im Unternehmen mit sich bringen kann.

Gastvortrag
Frederic Auberson
SRE for Data Engineers
(Google)

Site Reliability Engineering is Google's way of running services at scale. Because up to 90% of the cost of software is incurred after a service is launched, SREs make data-driven decisions in order to optimize the efficiency of systems operations. In this talk, we'll look at what an SRE does, where we get our data from, and how we leverage it in our day-to-day work.

  • Kirsten Scherer

  • Frederic Auberson

Anmeldung

Zulassungskriterien

Der Zertifikatslehrgang richtet sich an Absolventinnen und Absolventen von Hochschulen (FH/Universität) mit mind. 3 Jahren Berufserfahrung sowie an Berufsleute ohne Hochschulabschluss mit mind. 5 Jahren Berufserfahrung und entsprechenden Weiterbildungsausweisen (höhere Fachschule oder höhere Fachprüfung mit eidg. Fachausweis/Diplom).

Englischkenntnisse werden vorausgesetzt, weil im Studiengang mit englischer Literatur gearbeitet wird.

Über die definitive Zulassung entscheidet die Studienleitung.

Anmeldeinformationen

Anmeldungen werden in der Reihenfolge des Eingangs berücksichtigt.

Startdaten und Anmeldung

Start Anmeldeschluss Anmeldelink
22.08.2025 20.07.2025 Anmeldung

Downloads und Broschüre

Downloads