1001 Remote Jobs
Свежие вакансии удаленной работы
Сегодня: 14-May-2026 02:53 GMT
Просмотр вакансии
Подробный просмотр вакансии (вы будете перенаправлены на сторонний веб-сайт)
Название вакансии: C++ Engineer — AI Runtime
Кто разместил: Внешняя вакансия с jobs.dou.ua
Опубликована: 30-Sep-2025 16:40 GMT
Компания: Optime
Описание: C++ Engineer — AI Runtime (Stealth Startup)About Us
We are a stealth-mode startup building next-generation infrastructure for the AI industry. Our team has decades of experience in software, systems, and deep tech. We are working on a new kind of AI runtime that pushes the boundaries of performance and flexibility — making advanced models portable, efficient, and customizable for real-world deployment.

If you want to be part of a small, fast-moving team shaping the future of applied AI systems, this is your opportunity.
Role
We are looking for a C++ Engineer with strong systems and GPU programming background to help extend and optimize an open-source AI inference runtime. You will work on low-level internals of large language model serving, focusing on:
* Dynamic adapter integration (e.g., LoRA/QLoRA)
* Incremental model update mechanisms
* Multi-session inference caching and scheduling
* GPU performance improvements (Tensor Cores, CUDA/ROCm)

This is a hands-on role: you will be designing, coding, profiling, and iterating on high-performance inference code that runs directly on CPUs and GPUs.
Responsibilities
* Implement support for runtime adapter loading (LoRA), enabling models to be customized on the fly without retraining or model merges.
* Design and implement mechanisms for incremental model deltas, allowing models to be extended and updated efficiently.
* Extend runtime to handle multi-session execution, with isolation and caching strategies for concurrent users.
* Optimize core math kernels and memory layouts to improve inference performance on CPU and GPU backends.
* Collaborate with backend and infrastructure engineers to integrate your work into APIs and orchestration layers.
* Write benchmarks, unit tests, and profiling tools to ensure correctness and measure performance gains.
* Contribute to system architecture discussions and help define the roadmap for future runtime features.

Requirements
* Strong proficiency in modern C++ (C++14/17/20) and systems programming.
* Solid understanding of low-level performance optimization: memory management, multithreading, SIMD, cache efficiency.
* Experience with CUDA and/or ROCm/HIP GPU programming.
* Familiarity with linear algebra kernels (matrix multiply, attention) and how they map to hardware acceleration (Tensor Cores, BLAS libraries, etc.).
* Exposure to machine learning inference frameworks (e.g., llama.cpp, TensorRT, ONNX Runtime, TVM, PyTorch internals) is a plus.
* Comfortable working in a Unix/Linux environment; experience with build systems (CMake, Bazel) and CI pipelines.
* Strong problem-solving and debugging skills; ability to dive deep into both code and performance traces.
* Self-motivated and able to thrive in a fast-moving startup environment.

Nice to Have
* Experience implementing LoRA or adapter-based fine-tuning in inference runtimes.
* Knowledge of quantization methods and deploying quantized models efficiently.
* Background in distributed systems or multi-GPU orchestration.
* Contributions to open-source ML/AI systems.

Why Join
* Build core IP at the intersection of AI and systems engineering.
* Work with a highly technical founding team on problems that are both intellectually challenging and commercially impactful.
* Opportunity to shape the direction of a new AI platform from the ground up.
* Competitive compensation (contract or full-time), equity potential, and flexible remote work.

Відгукнутись на вакансію
Job ID: 144142
Требуемые навыки: Backend, Cpp, Linux
Зарплата:
Регион: віддалено
Подробный просмотр вакансии (вы будете перенаправлены на сторонний веб-сайт)
Новые вакансии / Все вакансии
Вакансия Компания Открыта
Видеомонтажёр (Short-form видео / Reels / Shorts)
Регион: Алматы
United Plumbing 13-May-2026
20:24 GMT
Менеджер по работе с клиентами
Регион: Семей
Mango Development 13-May-2026
20:19 GMT
Backend Engineer (Ruby) в Учи.ру
Навыки: Backend, Ruby
Регион: Москва
VK, Учи.ру 13-May-2026
20:14 GMT
Senior DevOps Engineer with Development Background (Go/Python, AWS)
Навыки: Cloud, Devops, Java, Javascript, Python
Регион: віддалено
A-listware 13-May-2026
20:06 GMT
Визовый менеджер
Зарплата: от 100 000 руб.
Регион: Москва
Ви Эф Эс Трэвел 13-May-2026
20:04 GMT
Руководитель удаленного отдела продаж
Зарплата: от 350 000 руб.
Регион: Москва
ESTADEL 13-May-2026
20:03 GMT
Антикредитный брокер
Зарплата: от 50 000 руб.
Регион: Москва
Чипликов Артём Игоревич 13-May-2026
20:03 GMT
Senior SRE (AWS & Kubernetes & Development Experience)
Навыки: Backend, Cloud, Devops, Fullstack, Linux
Регион: віддалено
A-listware 13-May-2026
20:03 GMT
Главный эксперт
Зарплата: до 125 000 руб.
Регион: Нижний Новгород
Т Плюс 13-May-2026
20:02 GMT
Senior DevOps Engineer with Software Development Experience (AWS)
Навыки: Backend, Cloud, Devops, Fullstack, Linux
Регион: віддалено
A-listware 13-May-2026
20:01 GMT
Главный бухгалтер
Регион: Москва
Компания Сд 13-May-2026
20:00 GMT
Middle DevOps (GCP & AWS )
Навыки: Cloud, Devops, Python
Регион: віддалено
A-listware 13-May-2026
19:57 GMT
Антикредитный брокер
Зарплата: от 100 000 до 140 000 руб.
Регион: Ростов-на-Дону
Чипликов Артём Игоревич 13-May-2026
19:56 GMT
Python developer (Django Admin)
Навыки: Python
Регион: Москва
BMGM 13-May-2026
19:54 GMT
Руководитель отдела продаж в диагностиках в pro.finansy kids
Регион: Москва
Академия Создания Капитала 13-May-2026
19:50 GMT
Все вакансии
Удаленные вакансии по навыкам ...
Удаленные вакансии 'android'
Удаленные вакансии 'angular'
Удаленные вакансии 'ajax'
Удаленные вакансии 'aspnet'
Удаленные вакансии 'backend'
Удаленные вакансии 'bigdata'
Удаленные вакансии 'cloud'
Удаленные вакансии 'cms'
Удаленные вакансии 'cpp'
Удаленные вакансии 'csharp'
Удаленные вакансии 'css'
Удаленные вакансии 'devops'
Удаленные вакансии 'drupal'
Удаленные вакансии 'excel'
Удаленные вакансии 'frontend'
Удаленные вакансии 'fullstack'
Удаленные вакансии 'html'
Удаленные вакансии 'java'
Удаленные вакансии 'javascript'
Удаленные вакансии 'joomla'
Удаленные вакансии 'iphone'
Удаленные вакансии 'linux'
Удаленные вакансии 'mysql'
Удаленные вакансии 'php'
Удаленные вакансии 'python'
Удаленные вакансии 'qa'
Удаленные вакансии 'ruby'
Удаленные вакансии 'seo'
Удаленные вакансии 'sql'
Удаленные вакансии 'sysadm'
Удаленные вакансии 'vbnet'
Удаленные вакансии 'xml'
Удаленные вакансии 'wordpress'
Читать RSS-ленты ... Новое!
Лента вакансий для 'android'
Лента вакансий для 'angular'
Лента вакансий для 'ajax'
Лента вакансий для 'aspnet'
Лента вакансий для 'backend'
Лента вакансий для 'bigdata'
Лента вакансий для 'cloud'
Лента вакансий для 'cms'
Лента вакансий для 'cpp'
Лента вакансий для 'csharp'
Лента вакансий для 'css'
Лента вакансий для 'devops'
Лента вакансий для 'drupal'
Лента вакансий для 'excel'
Лента вакансий для 'frontend'
Лента вакансий для 'fullstack'
Лента вакансий для 'html'
Лента вакансий для 'java'
Лента вакансий для 'javascript'
Лента вакансий для 'joomla'
Лента вакансий для 'iphone'
Лента вакансий для 'linux'
Лента вакансий для 'mysql'
Лента вакансий для 'php'
Лента вакансий для 'python'
Лента вакансий для 'qa'
Лента вакансий для 'ruby'
Лента вакансий для 'seo'
Лента вакансий для 'sql'
Лента вакансий для 'sysadm'
Лента вакансий для 'vbnet'
Лента вакансий для 'xml'
Лента вакансий для 'wordpress'
Новое!
Jobs in English
Длинный URL:
www.1001remotejobs.ru
Мобильная версия:
m.1001rejo.ru
Copyright © 2020-2022 1001 Remote Jobs