DevOps Engineer (A)
Für ein anspruchsvolles Beratungs- und Entwicklungsprojekt im Bereich GenAI-Plattform suchen wir einen erfahrenen DevOps Engineer (Senior) mit fundierter Expertise in Cloud-Infrastruktur, CI/CD und MLOps.
WORKLOAD
100%
WORKPLACE
Zürich / Remote (nur aus der Schweiz)
START DATE
01.10.2025
END DATE
31.03.2027
REFERENCE
3500
TYPE
Contracting
Aufgaben
- Entwicklung und Pflege von CI/CD-Pipelines für Code, Daten und Modellbereitstellungen
- Automatisierung von Build-, Test- und Release-Prozessen für GenAI-Anwendungen in Entwicklungs-, Test- und Produktionsumgebungen
- Bereitstellung und Verwaltung von Cloud-Ressourcen (Recheninstanzen, Container, Datenbanken, Netzwerke) mittels Infrastructure-as-Code (z. B. Terraform, CloudFormation)
- Sicherstellung einer konsistenten, skalierbaren und compliance-konformen Infrastruktur gemäss ZKB-Richtlinien
- Optimierung der Infrastruktur für KI-Workloads (hohe Verfügbarkeit, elastische Skalierung)
- Überwachung der Systemleistung, Betriebszeit und Protokolle zur frühzeitigen Fehlererkennung
- Implementierung von Monitoring- und Alarmierungsmechanismen (z. B. Prometheus, Grafana)
- Implementierung von Qualitätssicherungsmechanismen (automatisierte Tests, Validierung von Modellen/Daten)
- Konfiguration von Netzwerken, Firewalls und Zugriffskontrollen
- Zusammenarbeit mit Data Scientists, Entwicklern und Solution Architects
- Durchführung von Schulungen und Workshops zu Cloud-Infrastruktur, CI/CD und MLOps
- Mehrjährige Erfahrung (5–8 Jahre) als DevOps Engineer, idealerweise im KI-/GenAI-Umfeld
- Fundierte Kenntnisse in DevOps-Toolchains (Git, Docker, Terraform)
- Erfahrung mit MLOps-Techniken (Continuous Model Integration & Deployment)
- Erfahrung in der Implementierung automatisierter Tests und Validierungen für Datenpipelines, Modelle und Anwendungen
- Tiefgehendes Wissen über Azure Cloud-Dienste (VMs, Container, Serverless, Speicher, Netzwerke)
- Sehr gute Kenntnisse in Infrastructure as Code (Terraform, ARM, o. ä.)
- Erfahrung mit Monitoring-Tools (Prometheus, Grafana, Azure Monitor), Logging und Alarmierung
- Erfahrung in Performance Tuning und Kapazitätsplanung
- Verständnis für generative KI-Lösungen (z. B. GPT, DALL-E) und deren Infrastruktur-Anforderungen
- Fähigkeit zur interdisziplinären Zusammenarbeit
- Bereitschaft, Wissen zu teilen und Teams zu schulen
Soft Skills
- Analytisches und lösungsorientiertes Denken
- Teamfähigkeit und Kommunikationsstärke
- Eigeninitiative und Verantwortungsbewusstsein
Your contact
Praveen Rajkumar
