Zum Inhalt springen
Start » Weiterbildung: KI-Infrastruktur & MLOps

Weiterbildung: KI-Infrastruktur & MLOps

KHMI · Weiterbildungen · Modul · T2

Modul T2 · Technische Fachrichtung

KI-Infrastruktur & MLOps

Skalierbare ML-Pipelines, Cloud-Deployment und Continuous Delivery für Modelle: Der Weg vom Notebook zum produktionsreifen, beobachtbaren KI-System.

  • ⏰ Zeitraum: wird noch bekannt gegeben
  • 📅 Dauer: 44 Tage Vollzeit | 2 Monate
  • 🕐 Umfang: 396 Unterrichtseinheiten
  • 🎓 Abschluss: AZAV-Zertifikat
  • 💶 Förderbar: Bildungsgutschein möglich

Über dieses Modul der Weiterbildung

ML-Modelle in Produktion bringen – und dort halten.

Dieses Modul fokussiert sich auf die Infrastruktur und operative Aspekte von KI‑Systemen. Teilnehmende lernen, skalierbare ML-Pipelines aufzubauen, Modelle automatisiert zu deployen und ML-Workflows in der Cloud zu betreiben – mit den Werkzeugen, die heute in der Industrie Standard sind.

Voraussetzungen: Erfahrung in DevOps oder Cloud Engineering, Kenntnisse in Docker und Kubernetes, Programmierkenntnisse in Python/Bash. ML-Grundverständnis empfohlen.

Lernziele der Weiterbildung

Nach dem Modul können Sie:

  • ML-Pipelines mit MLflow und Kubeflow aufbauen, versionieren und reproduzierbar machen
  • CI/CD für ML-Modelle implementieren: automatisiertes Training, Evaluation und Deployment
  • Modelle in Cloud-Umgebungen deployen und betreiben: AWS SageMaker, Azure ML, Google Vertex AI
  • Monitoring und Observability für ML-Systeme einrichten: Metriken, Alerting, Data Drift Detection
  • Daten und Modelle versionieren und in einer Registry verwalten
  • GPU-Cluster für Training konfigurieren und skalierbar verwalten

Curriculum der Weiterbildung

Von MLflow bis Kubernetes – der vollständige MLOps-Stack.

Woche 1–2MLOps Grundlagen und Tool-Ökosystem
MLOps-Prinzipien: Warum Notebooks nicht reichen · Experiment-Tracking mit MLflow: Metriken, Parameter, Artefakte · Modellversionierung und Modell-Registry · Data Versioning mit DVC: Datenpipelines nachvollziehbar machen
Woche 3–4ML-Pipelines und Orchestrierung
Kubeflow für ML-Workflows: Pipelines definieren und ausführen · Apache Airflow für Datenpipelines und Scheduling · Feature Stores mit Feast: konsistente Features für Training und Serving · Pipeline-Automatisierung und Trigger-Konzepte
Woche 5–6Cloud Deployment und Skalierung
AWS SageMaker, Azure Machine Learning, Google Vertex AI im Vergleich · Kubernetes für ML-Workloads: Deployments, Jobs, Custom Resources · Serving-Strategien: Batch Inference vs. Realtime Inference · Auto-Scaling, Load Balancing und Cost Optimization
Woche 7–9Monitoring, Security und Compliance
Model Performance Monitoring: Metriken, Dashboards, Alerting · Data Drift und Concept Drift Detection: Erkennen und Reagieren · Security Best Practices für ML-Systeme in der Produktion · Compliance, Audit-Trails und Regulatorik für produktive KI-Systeme

Praxisprojekt in der Weiterbildung

Eine produktionsreife MLOps-Pipeline von Anfang bis Ende.

Aufbau einer vollständigen MLOps-Pipeline – von der automatisierten Datenaufbereitung über Training und Deployment bis zum Monitoring, inklusive CI/CD-Integration und Cloud-Deployment auf einer der großen Plattformen.

MLOps-Pipeline Implementierung 65 %
Infrastruktur-Dokumentation 20 %
System-Demo und Q&A 15 %

Zielgruppe der Weiterbildung

Für wen ist dieses Modul gemacht?

  • 👨‍💻 AI Infrastructure Engineer
  • 🪟 MLOps Engineer | ML Platform Engineer
  • 📱 Cloud Engineer | DevOps Engineer
  • 🧊 Kubernetes Platform Engineer
  • 💡 Data Platform Engineer
  • 🎯 Quereinsteiger | technische Berufsbilder
  • ☁️ Cloud Solution Architect

Das Modul T2 „KI-Infrastruktur & MLOps“ eignet sich besonders für technische Berufsbilder mit Erfahrung in DevOps, Cloud Engineering, Docker, Kubernetes, Python/Bash und idealerweise einem Grundverständnis für Machine Learning. Das Modul fokussiert darauf, ML-Modelle aus dem Notebook in produktive, skalierbare und überwachte Systeme zu bringen – inklusive CI/CD, Cloud-Deployment, Monitoring, Model Registry und MLOps-Pipelines.

Dieses Modul richtet sich an technische Fachkräfte, die KI- und Machine-Learning-Systeme zuverlässig in Produktion bringen und dort professionell betreiben möchten. Im Mittelpunkt stehen skalierbare ML-Pipelines, automatisiertes Training und Deployment, Cloud-Plattformen wie AWS SageMaker, Azure ML und Google Vertex AI sowie Tools wie MLflow, Kubeflow, DVC, Kubernetes und CI/CD. Teilnehmende lernen, Modelle zu versionieren, Deployments zu automatisieren, Monitoring und Data-Drift-Erkennung einzurichten und produktive KI-Systeme sicher, beobachtbar und skalierbar zu betreiben. Als Abschluss entsteht eine vollständige MLOps-Pipeline – von der Datenaufbereitung über Training und Cloud-Deployment hin zu Monitoring, Dokumentation und System-Demo.