Site Reliability Engineer (all genders)
envelio
About This Role
ber das arbeiten bei envelio
Zu einfach ist langweilig! Gemeinsam haben wir die Mission, die Energiewende voranzutreiben. Wir lieben, was wir tun und dabei ist uns kein Thema zu gro . Wir bernehmen Verantwortung f r unsere Arbeit und wachsen an jeder neuen Aufgabe. Kurz gesagt: Own it, love it, grow with it. Wir sind ein bodenst ndiges Team aus Kaffee- und Mate-Liebhaber:innen. Unser Geek-Humor resultiert in einer rituellen Nutzung von Emojis und der enzyklop dischen Herausarbeitung von unn tzem Wissen. Mehr als 150 envelianer:innen mit ber 20 verschiedenen Nationalit ten sind bereits an Bord. Komm dazu und wachse mit uns!
deine rolle
Als Site Reliability Engineer (all genders) wirst du Teil eines hochspezialisierten Squads von ca. 6 Engineers, das f r den zuverl ssigen Betrieb und die Infrastruktur der Intelligent Grid Platform (IGP) verantwortlich ist. Die Plattform l uft auf ber 100 Kundeninstanzen auf Kubernetes, verteilt ber Azure, Open Telekom Cloud und On-Premise-Umgebungen.
Du entwirfst, baust und pflegst die Plattform-Grundlage: Cluster-Provisionierung, Deployment-Pipelines, Observability, Secrets-Management und Infrastructure-as-Code. Du arbeitest eng mit dem neuen Operations-Team zusammen, das den t glichen IGP-Betrieb f r Kunden bernehmen wird, und stellst Tooling, Monitoring und Automatisierung bereit, die sie daf r brauchen.
Du arbeitest in einem Squad zusammen mit anderen SRElern und berichtest an den Engineering Manager.
wie du etwas bewirkst
• Du betreibst und verbesserst Kubernetes-Cluster ber mehrere Clouds und On-Premise-Umgebungen hinweg und stellst sicher, dass sie zuverl ssig, sicher und kosteneffizient sind
• Du entwickelst und pflegst Infrastructure-as-Code (Terraform, SaltStack) zur Verwaltung von ber 100 Kundeninstanzen mit geschichteter Konfiguration
• Du entwirfst und pflegst Observability (Monitoring, Alerting, SLOs), damit Produktionsprobleme fr hzeitig erkannt und schnell behoben werden
• Du verantwortest und entwickelst Secrets-Management, Zertifikatsautomatisierung und Security-Tooling ber die gesamte Plattform
• Du reduzierst operativen Aufwand durch Automatisierung, besseres Tooling und solide Runbooks
• Du beteiligst dich an Incident Response, Root-Cause-Analyse und treibst Follow-ups voran, damit sich dieselben Probleme nicht wiederholen
• Du arbeitest mit Entwicklungs-Squads und dem Operations-Team zusammen, um die Gesamtzuverl ssigkeit der IGP zu verbessern
dein profil
Perfektion ist ein Mythos! Uns interessiert der Mensch hinter dem Bildschirm - betrachte diese Kriterien als hilfreiche Orientierung. Wir freuen uns zu sehen, wie deine individuellen St rken zu uns passen.
• Du hast nachweisliche Erfahrung im Betrieb von Produktions-Workloads auf Kubernetes in einer Cloud- oder Hybrid-Umgebung
• Du bist vertraut mit LinuxAdministration, Netzwerken und verteilten Systemen
• Du hast praktische Erfahrung mit Infrastructure-as-CodeTools wie Terraform oder CloudFormation
• Du hast mit Configuration-ManagementTools wie SaltStack, Ansible oder Chef gearbeitet
• Du hast Erfahrung mit Container- und Orchestrierungs-Technologie (Docker, Kubernetes, Helm) im produktiven Einsatz
• Du verstehst Monitoring und Observability und hast mit Tools wie Datadog, Prometheus oder Grafana gearbeitet
• Du kommunizierst effektiv in asynchronen, Remote-first-Umgebungen
• Du bist neugierig, lernst gerne und bist offen f r den Einsatz von KI-Tools in deiner t glichen Arbeit
• Du verf gst ber verhandlungssichere Englischkenntnisse (Niveau C1)
• Nice to have: Erfahrung mit einer Programmiersprache wie Python oder Go
• Nice to have: Deutschkenntnisse
wie wir software entwickeln
• Agile Arbeitsweise mit Kanban in cross-funktionalen Squads
• Continuous Integration / Continuous Delivery
• Arbeiten in kleinen Batches mit schnellen Reviews
• Knowledge-Sharing-Sessions zwischen Entwickler:innen
• "You Code it - You Own it" - Squad-Verantwortung f r definierte Funktionsbereiche des Produkts
• Blameless Post-Mortems und Kultur der kontinuierlichen Verbesserung
unser tech stack
• Multi-Cloud, hybrides On-Prem-Setup mit Kubernetes und Helm als gemeinsamer Nenner
• Applikation prim r geschrieben in Python und TypeScript
• Standard-Backing-Services wie PostgreSQL, RabbitMQ, Redis
• Gitlab & Gitlab CI f r das Management des Software Delivery Lifecycle
• Terraform f r Infrastructure as Code
deine benefits
• Passe den Arbeitsmodus an deinen Lifestyle an - fully remote oder hybrid mit Office-Option in K ln
• Option zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von berall in der EU oder den USA)
• State of the Art Technologie und moderner Tech Stack
• Sehr gute Hardware-Ausstattung (16 Zoll MacBooks, 2 Bildschirme an deinem Arbeitsplatz)
• 30 Urlaubstage + 3 Corporate Holidays
• Unterst tzung deiner Gesundheit mit der Urban Sports Club Kooperation
• Professionelle Unterst tzung rund um mentales Wohlbefinden f r dich und deine Familie durch unseren Part...
Ready to Apply?
Click the button below to visit the company's application page.
Apply for this Position