Estamos em busca de um Engenheiro de IA experiente, com sólida expertise em IA Agente (Agentic AI), implantação de modelos de linguagem de grande porte (LLM) e fluxos de trabalho de visão computacional. Nesta função, você desenvolverá sistemas inteligentes com múltiplos agentes e implementará soluções de IA escaláveis para processamento de vídeo e imagem em plataformas nativas da nuvem. As principais responsabilidades incluem a orquestração de sistemas de agentes, implantação de modelos de IA e construção de pipelines abrangentes de inteligência de vídeo para nossa Ferramenta de Vídeo com IA.
Responsabilidades
– Projetar e implantar modelos de LLM e visão computacional utilizando serviços da AWS como Batch, Fargate, Lambda, SageMaker e Bedrock, visando inferência escalável e de baixa latência.
– Implementar treinamento distribuído em múltiplas GPUs e construir sistemas de inferência de IA serverless.
– Coordenar fluxos de trabalho com múltiplos agentes utilizando ferramentas como LangChain, LangGraph, AutoGen, CrewAI, OpenAI Agents SDK e Agent OS.
– Desenvolver pipelines sofisticados de processamento de vídeo e imagem, incluindo técnicas de detecção, rastreamento e IA generativa.
– Criar protocolos inteligentes de comunicação entre agentes de IA para automatizar tarefas distribuídas.
– Seguir as melhores práticas de MLOps e LLMOps para garantir pipelines de IA em nível de produção.
Qualificações
– Mais de 5 anos de experiência em engenharia de IA/ML com forte domínio de Python.
– Sucesso comprovado na implantação de soluções de IA em plataformas nativas da nuvem como AWS Batch, Fargate e Lambda.
– Conhecimento profundo em ferramentas de orquestração de agentes como LangGraph, AutoGen, CrewAI e OpenAI Agents SDK.
– Sólida formação em visão computacional e IA generativa utilizando frameworks como PyTorch, TensorFlow e CUDA.
– Experiência com bancos de dados vetoriais (por exemplo, FAISS, Milvus, Weaviate), geração aumentada por recuperação avançada (RAG/GraphRAG) e grafos de conhecimento.
– Proficiência na construção de fluxos de trabalho automatizados, sistemas de inferência distribuída e arquiteturas de IA escaláveis.
Qualificações Desejáveis
– Familiaridade com múltiplas plataformas em nuvem, incluindo GCP Vertex AI e Azure AI.
– Conhecimento em aprendizado por reforço, engenharia de contexto e engenharia avançada de prompts.
– Experiência na indústria em setores como fintech, saúde, aviação ou energia.
To apply for this job, please visit airtable.com
