ОПИС ВАКАНСІЇ
Опис компанії:
Ми — технологічна компанія, що надає AML-рішення для корпоративних клієнтів у фінансовому секторі. Серед наших основних напрямків — аналіз транзакцій, виявлення підозрілої активності, супровід кейсів та створення інструментів на базі штучного інтелекту. До холдингу входять кілька компаній зі суміжними продуктами.
Основні обов’язки:
- Розробка та підтримка сервісів, що використовують великі мовні моделі (LLM)
- Побудова пайплайнів із використанням retrieval-augmented generation (RAG)
- Інтеграція моделей через API або локальний inference
- Оптимізація продуктивності моделей (quantization, pruning, streaming)
- Робота з Hugging Face Transformers (токенізація, завантаження моделей, конфігурація)
- Розгортання рішень за допомогою FastAPI, Docker, TorchServe або vLLM
- Проєктування промптів і застосування технік на кшталт chain-of-thought
Вимоги:
- Досвід роботи з Python від 2 років
- Досвід роботи з LLM (GPT, Claude, LLaMA, Mistral та ін.)
- Глибоке розуміння архітектури Transformer, механізмів attention, fine-tuning, LoRA
- Досвід інтеграції LLM у продукти (через API або локально)
- Досвід розробки з використанням RAG
Буде перевагою:
- Знання LangChain, LlamaIndex або Haystack
- Досвід роботи з векторними базами даних (FAISS, Qdrant, Weaviate)
- Розуміння практик ML Ops та інструментів (MLflow, Weights & Biases)
- Участь у проєктах із чат-ботами, AI-асистентами або текстогенерацією
- Знання проблем LLM (GPT, Claude, LLaMA, Mistral та ін.)
Контактна інформація →