Привіт! Ми, talanovyti (ex-Netpeak Talent) — рекрутингова агенція від FRACTAL. Допомагаємо нашому партнеру знайти ML/AI Engineer-a у продуктову R&D-команду, яка будує ML-інфраструктуру для роботи з документами, сканами та зображеннями в miltech-домені.
Про компанію Наш партнер — українська продуктова miltech-компанія, створена після початку повномасштабної війни як технологічна відповідь на нові безпекові виклики.
Ти приєднаєшся до невеликої продуктової команди з високим темпом розробки.Склад: CTO, CEO, ML Engineers, ~5 Data Engineers, Backend і Frontend розробники.
У ML-напрямі працюють двоє інженерів — ти будеш третім.
Комунікація пряма і супер швидка.
Що ми шукаємо в тобі: * Комерційний досвід у ML/AI від 2 років. * Досвід роботи з OCR-системами: Tesseract, PaddleOCR, EasyOCR або подібними. * Практичний досвід роботи з Vision-Language моделями: навчання, fine-tuning, оптимізація якості розпізнавання. * Досвід роботи з інструментами document parsing: Docling, PyMuPDF, Apache Tika, markitdown. * Практичний досвід розробки на Python: архітектурні патерни, багатопоточність, асинхронність. * Досвід роботи з різними типами баз даних: документоорієнтованими, реляційними, векторними. * Самоменеджмент, ініціативність і здатність працювати в умовах швидкої розробки.
Буде плюсом: * Досвід роботи зі Speech-to-text або Video-to-text пайплайнами. * Досвід аналізу контенту: класифікація, NER, сумаризація. * Розуміння data engineering процесів: ETL / ELT, оркестратори (Airflow, Prefect, Temporal). * Досвід роботи з RAG-системами або LLM-рішеннями у продакшені. * Досвід роботи з self-hosted моделями або GPU-інференсом — буде перевагою.
Твої майбутні задачі: * Розробка та розвиток ML-пайплайнів для обробки неструктурованих даних (документів, сканів, зображень). * Робота з OCR- і Vision-Language-моделями: інтеграція, навчання, fine-tuning, оптимізація якості розпізнавання. * Побудова та оптимізація процесів document parsing: обробка складних PDF, таблиць, багатошарових документів. * Розробка end-to-end рішень: від ingestion даних до інференсу та інтеграції в продукт. * Робота з self-hosted моделями: розгортання, оптимізація inference, робота з GPU. * Інтеграція ML-рішень у продуктову інфраструктуру та пошукові системи. * Оптимізація якості даних: preprocessing, фільтрація, покращення зображень перед розпізнаванням. * Співпраця з Data Engineers, Backend-розробниками та ML-командою над розвитком продукту.
Що ми пропонуємо: * Можливість бронювання від мобілізації відповідно до законодавства України. * Наразі закладена вилка до 6000$, але якщо твої очікування вищі, відкриті до обговорення. * Робота над власним продуктом у miltech-домені з реальним застосуванням у задачах державного рівня. * Вплив на розвиток ML-пайплайнів і технічних підходів продукту. * Повністю віддалений формат роботи — можливість працювати з будь-якої локації. * Гнучкий графік без фіксованих годин: орієнтація на результат. * Оплачувана відпустка: 24 календарні дні + оплачувані лікарняні. * Компанія надає всю необхідну техніку для роботи. * Мінімум бюрократії та швидке прийняття рішень.
Якщо тобі близькі production ML, складні multimodal-задачі та реальний вплив продукту, будемо раді знайомству!