SRE (Site reliability engineer)
O pozici
Hledáme Site Reliability Engineera (SRE), který se postará o stabilitu, dostupnost a výkon našich produkčních systémů.
Poslat CV
Víš, co děláš, když aplikace běží. Ale taky víš, co dělat, když neběží. Chceme k sobě parťáka, který se nezalekne alertu (i když ho radši předem ošetří), rozumí cloudu, automatizaci a ví, že dobrý monitoring je víc než hezký dashboard. Budeš se podílet na rozvoji našich SRE procesů, včetně automatizace a optimalizace pracovních postupů. Ve spolupráci s vývojovými týmy se také aktivně zapojíš do vývoje a testování aplikací.
Co tě čeká?
Tvoje hlavní mise:
udržet naše systémy v chodu, funkční a rychlé
monitorovat výkonnost a zdraví aplikací (Dynatrace, Grafana, vlastní kouzla)
vést incident management - rychle, klidně, konstruktivně
automatizovat, co se dá, a zbytek optimalizovat
spolupracovat s vývojáři a DevOps týmem na rozvoji infrastrukturu
Co oceníme:
zkušenost s cloudem - ideálně GCP nebo AWS (certifikace vítaná)
znalost REST API a základního síťového/systémového inženýrství
přehled v CI/CD nástrojích, verzovacích systémech, logování
zkušenost s monitoringem (Grafana, Dynatrace) a automatizací
znalost skriptování (Bash, Python, nebo co ti sedí)
znalost Javy je bonus - alespoň na úrovni „vím, co je stack trace“
Na dálku
Ihned
DevOps and Observability
Staráme se o deployment, udržování a hladký chod aplikací. Spravujeme cloudovou infrastrukturu na AWS a GCP. Díky zkušenostem a odborným znalostem jsme spolehlivým partnerem vývojových týmů, kterým poskytujeme konzultace a technickou podporu v oblasti IaaC, CI/CD a Application Performance Monitoring. Kvalita našeho týmu spočívá v expertní znalosti používaných technologií, precizním zpracování úkolů a silné orientaci na výsledek.
Více o týmu
Staň se součástí týmu Assist