DevOps/Platform Expert (AI & Agentic Systems)

Cloudiax AG

Apply Now
Gudow
Salary not disclosed
full-time
Posted March 4, 2026
via arbeitnow

About This Role

Cloudiax ist ein f hrender Anbieter von Cloud-Technologien mit mehr als 280 internationalen Partnern und ber 1100 SAP-Kunden in 90 L ndern. Wir erm glichen kleinen und mittelst ndischen Unternehmen weltweit die Nutzung von Anwendungen wie SAP Business One und KI-L sungen in unserer Cloud. Als globaler Marktf hrer bieten wir eine sichere, schnelle und zuverl ssige Cloud-Plattform - Made in Germany. Mit Rechenzentren in Deutschland, Kanada und Singapur stellen wir rund um die Uhr h chste Servicequalit t sicher. Zur Verst rkung unseres Teams suchen wir dich - engagiert, technisch stark und bereit, Verantwortung zu bernehmen. Ab sofort und Remote. Aufgaben Cloud-Native & Infrastruktur • Kubernetes: Tiefe Erfahrung in Cluster-Orchestrierung, GPU-Scheduling, Device-Plugins und Mandanten-Isolierung in Rechenzentren. • Hardware-Abstraktion: Praktische Erfahrung mit Multi-Instance GPU (MIG) zur effizienten, sicheren Aufteilung physischer GPUs auf unterschiedliche Kunden-Workloads. • Managed Backends: Sicherer Betrieb von Managed Postgres und Skalierung von Vektor-Datenbanken f r performante Retrieval-Architekturen. • Schnittstellen & Security: Kenntnisse in Keycloak, Kong API Gateway oder vergleichbaren Tools f r sicheren Zugriff und exakte Abrechnung. • DevOps & CI/CD: Erfahrung mit Git, CI/CD-Pipelines und Infrastructure-as-Code f r schnelle, zuverl ssige und dokumentierte Deployments. KI-Expertise & Inferenz-Logik • Inferenz-Optimierung: Erfahrung mit KV-Caching, Batching, Quantisierung und Serving-Frameworks wie vLLM oder NVIDIA Triton. • Modell-Kombination & Kostenmanagement: Wissen, wie kleine spezialisierte und gro e Generalisten-Modelle kombiniert werden, um Kosten und Latenz zu optimieren - Open und Closed Models. • Qualit tssicherung: Techniken zur Reduzierung von Halluzinationen, z. B. Retrieval-Augmented Generation (RAG) und Bereitstellung valider Datenkontexte auf Infrastruktur-Ebene. • Agenten & Frameworks: Operationalisierung von LangChain, LangGraph oder AutoGen sowie Management komplexer Deep Agents, die autonom mehrere Schritte ausf hren. Monitoring & Skalierung (AI-Native) • Observability: Tracing f r Agenten-Entscheidungen (z. B. OpenTelemetry, LangSmith), um Abl ufe im Rechenzentrum nachvollziehbar zu machen. • KI-spezifisches Auto-Scaling: Skalierung basierend auf Token-Durchsatz oder Modell-Kontext-Auslastung, nicht nur CPU-Metriken. Qualifikation Du musst kein Prompt-Engineer sein, aber du verstehst, wie KI "arbeitet . Wichtig ist, dass du neue Ans tze (z. B. Inferenzmethoden oder Agenten-Strukturen) schnell erfassen und in stabile, mandantenf hige Rechenzentrums-Infrastrukturen integrieren kannst. • Experimentierfreude: Freude an Systemen, die nicht immer deterministisch reagieren. • Security & Safety: Bewusstsein f r AI-Security (Sandboxing, Schutz vor Prompt-Injections) bei jedem System. Benefits 100% Remote-Arbeitsplatz mit gro er zeitlicher Flexibilit t • attraktives Jahresgehalt, sowie automatische KPI-basierte Gehaltserh hungen und attraktive Jahresboni. • 30+ Tage Erholungsurlaub. • Voll ausgestatteter Premium-Homeoffice-Arbeitsplatz. • Firmen-(e)Bike, betriebliche Kranken-Zusatzversicherung und weitere Corporate Benefits. • Arbeiten in einem internationalen Umfeld bei einem der weltweit f hrenden Cloud-Provider im SAP-Umfeld. Haben wir dein Interesse geweckt? Dann lade hier gerne deine vollst ndigen Bewerbungsunterlagen hoch (Lebenslauf, Zeugnisse, Gehaltsvorstellung, fr hestm glicher Eintrittstermin). Find Jobs in Germany on Arbeitnow

Ready to Apply?

Click the button below to visit the company's application page.

Apply for this Position