Machine Learning Engineer
O pozici
Budete převádět modely LLM (Large Language Model), TTS (Text to Speech) a ASR (Automatic Speech Recognition) z výzkumu do produkce, tak aby splňovaly požadavky na škálovatelnost, nízké latence a dostupnost. Pokud vás baví Python, Linux, Kubernetes a práce s LLM, TTS a ASR technologiemi, připojte se k nám a využijte stovky GPU karet pro inovativní projekty!
Co od vás očekáváme:
• Zkušenosti s vývojem v Pythonu nejlépe 2 až 3 roky a alespoň základní zkušenosti s Linuxovým prostředím.
• Znalost Kubernetes, Dockeru a cloudových technologií (SCIF).
• Zkušenosti s optimalizací inference serverů a monitoringem nasazených modelů.
• Znalost technologií jako KServe, S3, MLflow, FastAPI a dalších.
• Zájem o LLM, TTS a ASR technologie a ochota se v nich dále vzdělávat.
• Schopnost automatizovat a optimalizovat procesy, budovat spolehlivou infrastrukturu.
Co můžete očekávat vy:
• Možnost pracovat s unikátními daty a stovkami GPU karet (H100 a L4) pro inovativní projekty.
• Samoorganizovaný tým s přátelskou atmosférou a týmovým duchem.
• Prostor pro seberealizaci a profesní růst, včetně sdílení nápadů a inspirace mezi kolegy.
• Práci s moderními technologiemi jako vLLM a Triton (TensorRT-LLM, ONNX).
• Spolupráci s výzkumníky na implementaci nových LLM, TTS a ASR funkcionalit.
Jak probíhá výběrko:
Po zaslání životopisu se vám ozveme do 3 pracovních dní. Následně vás čeká praktický úkol – řešení problému, který jsme museli implementovat do naší service (časová náročnost 2–8 hodin). Poté se setkáte s hiring managerem Markem Šimůnkem na osobním setkání. Pokud vše ladí, následuje nabídka a vítejte na palubě!