O ofercie
Dołącz do zespołu, który wyznacza nową erę chmury obliczeniowej dla globalnej gospodarki AI. Tworzymy narzędzia i infrastrukturę, które umożliwiają naszym klientom wdrażanie zaawansowanych rozwiązań AI na dużą skalę—bez ogromnych kosztów infrastruktury ani konieczności budowy dużych wewnętrznych zespołów. Będziesz pracować na styku AI i technologii chmurowej, razem z doświadczonymi i innowacyjnymi inżynierami, kształtując przyszłość multimodalnej sztucznej inteligencji.
Gdzie pracujemy
Firma z siedzibą główną w Amsterdamie, notowana na Nasdaq, działa globalnie, posiadając centra R&D w Europie, Ameryce Północnej i Izraelu. Zespół liczy ponad 800 osób, w tym ponad 400 wysoko wykwalifikowanych inżynierów. Nasze zespoły AI budują jedną z największych chmur GPU na świecie, obsługującą dziesiątki tysięcy procesorów graficznych.
Zespół AI Studio rozwija platformę inferencyjną, która umożliwia szybkie, niezawodne i łatwe wdrażanie modeli bazowych—tekstowych, wizualnych, audio i powstających architektur multimodalnych—w skali masowej. W związku z dynamicznym rozwojem szukamy inżynierów gotowych przesuwać granice wydajności, routingu i przepustowości w systemach AI.
Zakres obowiązków
Projektowanie i implementacja usług obsługujących obciążenia inferencyjne dla klientów wewnętrznych i zewnętrznych.
Integracja i skalowanie back-endów modeli oraz tworzenie zaawansowanej logiki routingu żądań dla obciążeń o wysokiej przepustowości i niskich opóźnieniach.
Wzmacnianie pipeline’ów obserwowalności, aby platforma pozostała stabilna w trakcie rozwoju.
Rozwiązywanie zróżnicowanych wyzwań inżynierskich—od strojenia wydajności i zarządzania pamięcią po harmonogramowanie wielu najemców.
Optymalizacja na poziomie kernela (CUDA, Triton i inne narzędzia), gdy wymaga tego sprzęt.
Wymagania
Bardzo dobra znajomość Python, Go lub Rust.
Doświadczenie w programowaniu asynchronicznym i architekturach rozproszonych.
Umiejętności w zakresie projektowania API, balansowania obciążenia, cache’owania i kolejkowania.
Znajomość frameworków inferencyjnych i back-endów (np. vLLM, sglang, ComfyUI).
Wiedza o technologiach orkiestracji, takich jak Kubernetes, Ray lub FastAPI.
Dbałość o czysty, testowalny kod i nowoczesne procesy CI/CD.
Umiejętność pracy zespołowej i gotowość do mentoringu.
Oferujemy
Konkurencyjne wynagrodzenie i pełen pakiet benefitów.
Możliwości rozwoju zawodowego w szybko rozwijającej się organizacji.
Hybrydowy model pracy.
Dynamiczne, zespołowe środowisko pracy ceniące inicjatywę i innowacyjność.
Dołącz do społeczności Znoydzem.
Podobne CV