Kami membangun AI Chatbot Platform berbasis multi-SME, multi-topic, human-in-the-loop, dan knowledge upgrade.
Kami mencari AI Engineer yang mampu membangun dan mengelola LLM + RAG system hingga production, bukan hanya eksperimen model.
● Membangun dan mengoptimasi sistem RAG (Retrieval-Augmented Generation)
● Mengelola Vector DB (Qdrant) dan embedding pipeline
● Mengimplementasikan multi-SME / multi-topic routing (LangChain / LangGraph)
● Deploy dan optimasi LLM lokal (Ollama, quantized models, GPU tuning)
● Mengembangkan backend API (FastAPI)
● Setup Docker-based deployment
● Monitoring & troubleshooting performa AI system
● Mengelola ingestion pipeline (upload → parse → chunk → embed → index)
● LLM Runtime: Ollama
● Model: Qwen / LLaMA / Mistral (quantized)
● Vector DB: Qdrant atau lainnya sesuai kebutuhan
● Embedding: ModernBERT atau lainnya sesuai kebutuhan
● Framework: LangChain, LangGraph, LlamaIndex
● Backend: FastAPI
● Infra: Docker, K3s
● Monitoring: Prometheus, Grafana
● Strong Python skill
● Pengalaman membangun RAG system
● Pengalaman Vector DB (Qdrant / Milvus / Weaviate)
● Pengalaman LangChain atau LlamaIndex
● Pengalaman deploy LLM lokal/On premise (Ollama / open-source LLM)
● Familiar dengan Docker & Linux server
● Memahami dasar GPU resource management
● Pengalaman multi-agent orchestration
● Pengalaman human-in-the-loop workflow
● Pengalaman Whisper / TTS pipeline
● Familiar dengan Kubernetes
● Familiar dengan IndoBERT / NLP Bahasa Indonesia
Kami tidak mencari :
● Research-only AI engineer
● Hanya fine-tuning model
● Hanya cloud-based AI builder
Kami mencari engineer yang mampu membangun AI system production-grade end-to-end.