Výzkumník strojového učení pro zpracování řeči

Jméno/Firma
Seznam.cz, a.s.
Pracoviště
Praha
Úvazek
Plný
Požadované vzdělání
Vysokoškolské
Požadované jazyky
Angličtina, Čeština
Profese
Informatika a IT služby
Vytvořeno
9. 7. 2025

O pozici

Pracovní nabídka

Jsme tým zaměřený na vývoj a zdokonalování technologií pro syntézu a automatické rozpoznávání řeči, s důrazem na nejnovější přístupy a modely. V současnosti se soustředíme především na češtinu, ale naše ambice jsou širší.

Naše práce pokrývá celý vývojový cyklus – od přípravy a validace dat, přes průzkum a trénování modelů na vlastním výkonném GPU clusteru, až po jejich ladění, evaluaci a nasazení.

Klademe důraz na odborný růst: pravidelně pořádáme reading groups, sdílíme znalosti v týmu a účastníme se konferencí.

Základní předpoklady

  • Praxe v oblasti zpracování řeči.
  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy.
  • Orientujete se v problematice strojového učení a dokážete porozumět a reprodukovat postupy z vědeckých článků.
  • Ovládáte základy Linuxu.

Součástí práce výzkumníka je

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému
  • Příprava a analýza dat – Python, pandas, librosa, torchaudio, HuggingFace 
  • Učení ML modelů – hlavním cílem je mít co nejlepší modely pro automatické rozpoznání řeči a její syntézu, což mj. zahrnuje i spoustu dalších menších modelů. Pracujeme s knihovnami PyTorch (Lightning), HuggingFaceNVIDIA Nemo.
  • Aplikace state-of-the-art metod pro zpracování řeči
  • Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků
  • Předávání modelů a kódu do produkce např. pomocí Docker containerů

Co nabízíme

  • Zajímavou a rozmanitou práci, řešení netriviálních problémů
  • Velká data, možnost anotací
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
  • Vlastní výkonné servery, dedikovaná výpočetní kapacita
  • Sdílení znalostí a zkušeností napříč Seznamem
  • Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
  • Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
  • Malý tým – zodpovědnost za větší kousky práce
  • Možnost psát vědecké články
  • Flexibilní pracovní doba s možností HO

Kdo bude váš nadřízený

Jakub Náplava - Vedoucí týmu výzkumu:

"V Seznamu vedu jeden z fulltextových výzkumných týmů. Mám za sebou doktorát z ÚFALu a pětiletou zkušenost s machine learningovými modely z IBM. V Seznamu nejvíc oceňuju, že se tu můžu věnovat širokému spektru zajímavých úloh, na které dostaneme dostatek času k jejich důkladnému prozkoumání. Líbí se mi, že můžeme přicházet s vlastními výzkumnými otázkami a že výsledky naší práce se rychle nasadí do ostrého provozu. Máme k dispozici vlastní GPU cluster a in-house anotátoři nám rychle připraví potřebná data. A v neposlední řadě tu mám skvělé kolegy, se kterými si rádi zahrajeme stolní fotbálek nebo deskovky."