Výzkumník strojového učení pro zpracování řeči

Nabízím práci
Jméno/Firma
Seznam.cz, a.s.
Pracoviště
Plzeň
Úvazek
Plný
Požadované vzdělání
Vysokoškolské
Požadované jazyky
Angličtina, Čeština
Profese
Informatika a IT služby
Nabízím práci/ Hledám práci
Nabízím práci
Vytvořeno
Dnes

O pozici

Pracovní nabídka

Jsme tým zaměřený na vývoj a zdokonalování technologií pro syntézu a automatické rozpoznávání řeči, s důrazem na nejnovější přístupy a modely. V současnosti se soustředíme především na češtinu, ale naše ambice jsou širší.
Naše práce pokrývá celý vývojový cyklus – od přípravy a validace dat, přes průzkum a trénování modelů na vlastním výkonném GPU clusteru, až po jejich ladění, evaluaci a nasazení.
Klademe důraz na odborný růst: pravidelně pořádáme reading groups, sdílíme znalosti v týmu a účastníme se konferencí.

Základní předpoklady

  • Praxe v oblasti zpracování řeči.
  • Umíte programovat v jazyce Python a navrhovat efektivní algoritmy.
  • Orientujete se v problematice strojového učení a dokážete porozumět a reprodukovat postupy z vědeckých článků.
  • Ovládáte základy Linuxu.

Součástí práce výzkumníka je

  • Podílení se na formování zadání výzkumné úlohy a analýzy problému
  • Příprava a analýza dat – Python, pandas, librosa, torchaudio, HuggingFace
  • Učení ML modelů – hlavním cílem je mít co nejlepší modely pro automatické rozpoznání řeči a její syntézu, což mj. zahrnuje i spoustu dalších menších modelů. Pracujeme s knihovnami PyTorch (Lightning), HuggingFaceNVIDIA Nemo.
  • Aplikace state-of-the-art metod pro zpracování řeči
  • Týmová spolupráce při řešení problému a tvorbě kódu – Git, code review
  • Vyhodnocení navržených řešení, interpretace a prezentace výsledků
  • Předávání modelů a kódu do produkce např. pomocí Docker containerů

Co nabízíme

  • Zajímavou a rozmanitou práci, řešení netriviálních problémů
  • Velká data, možnost anotací
  • Dostáváme věci do produkce, přímý dopad na miliony uživatelů,
  • Vlastní výkonné servery, dedikovaná výpočetní kapacita
  • Sdílení znalostí a zkušeností napříč Seznamem
  • Osobní rozvoj – vzdělávání, reading groups a konference (v případě zájmu i veřejné přednášky na univerzitách a akcích)
  • Super kolektiv a neformální a přátelské prostředí – všichni si tady tykáme a nemáme předepsaný dress code
  • Malý tým – zodpovědnost za větší kousky práce
  • Možnost psát vědecké články
  • Flexibilní pracovní doba s možností HO

Jak probíhá výběrové řízení

  • Zašlete nám svůj životopis nebo odkaz na profesní profil, který si pečlivě prostudujeme.
  • Pokud uvidíme shodu, do tří dnů se vám telefonicky ozveme, sladíme vzájemná očekávání a domluvíme další postup.
  • Dalším krokem je online test na platformě Codility a zadání, které odráží práci našeho výzkumného týmu. Tyto části slouží jako první technická zkouška na cestě k získání pozice.
  • Po úspěšném absolvování následuje osobní pohovor s vedoucím týmu. Detailněji vám představíme pozici a fungování týmu. Zároveň se budeme ptát na vaše předchozí zkušenosti a společně projdeme váš postup při řešení zadání. Osobní setkání obvykle trvá přibližně 1,5–2 hodiny.

Kdo bude váš nadřízený

Jakub Náplava - Vedoucí týmu výzkumu:

"V Seznamu vedu jeden z fulltextových výzkumných týmů. Mám za sebou doktorát z ÚFALu a pětiletou zkušenost s machine learningovými modely z IBM. V Seznamu nejvíc oceňuju, že se tu můžu věnovat širokému spektru zajímavých úloh, na které dostaneme dostatek času k jejich důkladnému prozkoumání. Líbí se mi, že můžeme přicházet s vlastními výzkumnými otázkami a že výsledky naší práce se rychle nasadí do ostrého provozu. Máme k dispozici vlastní GPU cluster a in-house anotátoři nám rychle připraví potřebná data. A v neposlední řadě tu mám skvělé kolegy, se kterými si rádi zahrajeme stolní fotbálek nebo deskovky."