Wir suchen eine:n erfahrene:n KI-Ingenieur:in mit fundierter Expertise in Agentic AI, dem Einsatz großer Sprachmodelle (LLMs) und Workflows im Bereich Computer Vision. In dieser Rolle entwickeln Sie intelligente Multi-Agenten-Systeme und implementieren skalierbare KI-Lösungen für Video- und Bildverarbeitung auf cloud-nativen Plattformen. Zu den Hauptaufgaben gehören die Orchestrierung von Agentensystemen, das Deployment von KI-Modellen sowie der Aufbau umfassender Video-Intelligence-Pipelines für unser AI Video Tool.
Aufgaben
– Entwurf und Deployment von LLM- und Computer-Vision-Modellen unter Verwendung von AWS-Diensten wie Batch, Fargate, Lambda, SageMaker und Bedrock zur Ermöglichung skalierbarer, latenzarmer Inferenz.
– Implementierung von verteiltem Training über mehrere GPUs sowie Aufbau serverloser KI-Inferenzsysteme.
– Koordination von Multi-Agenten-Workflows mit Tools wie LangChain, LangGraph, AutoGen, CrewAI, OpenAI Agents SDK und Agent OS.
– Entwicklung anspruchsvoller Video- und Bildverarbeitungspipelines, einschließlich Erkennung, Tracking und generativer KI-Techniken.
– Erstellung intelligenter Kommunikationsprotokolle für KI-Agenten zur Automatisierung verteilter Aufgaben.
– Einhaltung von Best Practices im Bereich MLOps und LLMOps zur Sicherstellung produktionsreifer KI-Pipelines.
Qualifikationen
– Über 5 Jahre Erfahrung in der KI/ML-Entwicklung mit fundierten Python-Kenntnissen.
– Nachgewiesener Erfolg beim Deployment von KI-Lösungen auf cloud-nativen Plattformen wie AWS Batch, Fargate und Lambda.
– Tiefgehende Kenntnisse in der Orchestrierung von Agenten mit Tools wie LangGraph, AutoGen, CrewAI und dem OpenAI Agents SDK.
– Starker Hintergrund in Computer Vision und generativer KI unter Verwendung von Frameworks wie PyTorch, TensorFlow und CUDA.
– Erfahrung mit Vektordatenbanken (z. B. FAISS, Milvus, Weaviate), fortgeschrittener Retrieval-Augmented Generation (RAG/GraphRAG) und Wissensgraphen.
– Versiert im Aufbau automatisierter Workflows, verteilter Inferenzsysteme und skalierbarer KI-Architekturen.
Bevorzugte Qualifikationen
– Vertrautheit mit mehreren Cloud-Plattformen, einschließlich GCP Vertex AI und Azure AI.
– Hintergrund in Reinforcement Learning, Context Engineering und fortgeschrittenem Prompt Engineering.
– Branchenerfahrung in Bereichen wie Fintech, Gesundheitswesen, Luftfahrt oder Energie.
To apply for this job, please visit airtable.com
