Weiterbildung: KI-Infrastruktur & MLOps

KHMI · Weiterbildungen · Modul · T2

Modul T2 · Technische Fachrichtung

KI-Infrastruktur & MLOps

Skalierbare ML-Pipelines, Cloud-Deployment und Continuous Delivery für Modelle: Der Weg vom Notebook zum produktionsreifen, beobachtbaren KI-System.

⏰ Zeitraum: wird noch bekannt gegeben
📅 Dauer: 44 Tage Vollzeit | 2 Monate
🕐 Umfang: 396 Unterrichtseinheiten
🎓 Abschluss: AZAV-Zertifikat
💶 Förderbar: Bildungsgutschein möglich

Über dieses Modul der Weiterbildung

ML-Modelle in Produktion bringen – und dort halten.

Dieses Modul fokussiert sich auf die Infrastruktur und operative Aspekte von KI‑Systemen. Teilnehmende lernen, skalierbare ML-Pipelines aufzubauen, Modelle automatisiert zu deployen und ML-Workflows in der Cloud zu betreiben – mit den Werkzeugen, die heute in der Industrie Standard sind.

Voraussetzungen: Erfahrung in DevOps oder Cloud Engineering, Kenntnisse in Docker und Kubernetes, Programmierkenntnisse in Python/Bash. ML-Grundverständnis empfohlen.

Lernziele der Weiterbildung

Nach dem Modul können Sie:

ML-Pipelines mit MLflow und Kubeflow aufbauen, versionieren und reproduzierbar machen
CI/CD für ML-Modelle implementieren: automatisiertes Training, Evaluation und Deployment
Modelle in Cloud-Umgebungen deployen und betreiben: AWS SageMaker, Azure ML, Google Vertex AI
Monitoring und Observability für ML-Systeme einrichten: Metriken, Alerting, Data Drift Detection
Daten und Modelle versionieren und in einer Registry verwalten
GPU-Cluster für Training konfigurieren und skalierbar verwalten

Curriculum der Weiterbildung

Von MLflow bis Kubernetes – der vollständige MLOps-Stack.

Woche 1–2	MLOps Grundlagen und Tool-Ökosystem MLOps-Prinzipien: Warum Notebooks nicht reichen · Experiment-Tracking mit MLflow: Metriken, Parameter, Artefakte · Modellversionierung und Modell-Registry · Data Versioning mit DVC: Datenpipelines nachvollziehbar machen
Woche 3–4	ML-Pipelines und Orchestrierung Kubeflow für ML-Workflows: Pipelines definieren und ausführen · Apache Airflow für Datenpipelines und Scheduling · Feature Stores mit Feast: konsistente Features für Training und Serving · Pipeline-Automatisierung und Trigger-Konzepte
Woche 5–6	Cloud Deployment und Skalierung AWS SageMaker, Azure Machine Learning, Google Vertex AI im Vergleich · Kubernetes für ML-Workloads: Deployments, Jobs, Custom Resources · Serving-Strategien: Batch Inference vs. Realtime Inference · Auto-Scaling, Load Balancing und Cost Optimization
Woche 7–9	Monitoring, Security und Compliance Model Performance Monitoring: Metriken, Dashboards, Alerting · Data Drift und Concept Drift Detection: Erkennen und Reagieren · Security Best Practices für ML-Systeme in der Produktion · Compliance, Audit-Trails und Regulatorik für produktive KI-Systeme

Praxisprojekt in der Weiterbildung

Eine produktionsreife MLOps-Pipeline von Anfang bis Ende.

Aufbau einer vollständigen MLOps-Pipeline – von der automatisierten Datenaufbereitung über Training und Deployment bis zum Monitoring, inklusive CI/CD-Integration und Cloud-Deployment auf einer der großen Plattformen.

MLOps-Pipeline Implementierung 65 %

Infrastruktur-Dokumentation 20 %

System-Demo und Q&A 15 %

Zielgruppe der Weiterbildung

Für wen ist dieses Modul gemacht?

👨‍💻 AI Infrastructure Engineer
🪟 MLOps Engineer | ML Platform Engineer
📱 Cloud Engineer | DevOps Engineer
🧊 Kubernetes Platform Engineer
💡 Data Platform Engineer
🎯 Quereinsteiger | technische Berufsbilder
☁️ Cloud Solution Architect

Das Modul T2 „KI-Infrastruktur & MLOps“ eignet sich besonders für technische Berufsbilder mit Erfahrung in DevOps, Cloud Engineering, Docker, Kubernetes, Python/Bash und idealerweise einem Grundverständnis für Machine Learning. Das Modul fokussiert darauf, ML-Modelle aus dem Notebook in produktive, skalierbare und überwachte Systeme zu bringen – inklusive CI/CD, Cloud-Deployment, Monitoring, Model Registry und MLOps-Pipelines.

Dieses Modul richtet sich an technische Fachkräfte, die KI- und Machine-Learning-Systeme zuverlässig in Produktion bringen und dort professionell betreiben möchten. Im Mittelpunkt stehen skalierbare ML-Pipelines, automatisiertes Training und Deployment, Cloud-Plattformen wie AWS SageMaker, Azure ML und Google Vertex AI sowie Tools wie MLflow, Kubeflow, DVC, Kubernetes und CI/CD. Teilnehmende lernen, Modelle zu versionieren, Deployments zu automatisieren, Monitoring und Data-Drift-Erkennung einzurichten und produktive KI-Systeme sicher, beobachtbar und skalierbar zu betreiben. Als Abschluss entsteht eine vollständige MLOps-Pipeline – von der Datenaufbereitung über Training und Cloud-Deployment hin zu Monitoring, Dokumentation und System-Demo.