AI Engineer
LATAM l Remote
Sobre nosotros
Hay empresas que están cambiando el mundo, y detrás de ellas, hay equipos que necesitan ir más lejos, pensar distinto, moverse más rápido.
Ahí entramos nosotros.
En Acid Labs nos sumamos a los equipos tech de las empresas que están liderando el futuro digital en las industrias más desafiantes en Latinoamérica, con talento especializado que entiende la complejidad, respira colaboración y encuentra claridad donde otros ven ruido.
Y lo hacemos #RadicalmenteMejor
No trabajamos para nuestros clientes.
- Trabajamos con ellos.
- Desde adentro.
- Como parte de su ritmo.
- Como una extensión natural de su capacidad tecnológica.
¡Estamos en búsqueda de Senior AI Engineers!
Descripción del Rol
Buscamos un Tech Lead de IA con profundo dominio en el diseño, implementación y operación de sistemas agénticos escalables en producción. Es el referente técnico que formula y defiende propuestas de arquitectura con criterio sólido, evalúa frameworks y servicios de IA con visión de costos, latencia y mantenibilidad, y asegura que los sistemas agénticos del equipo sean robustos, trazables y listos para escalar.
Su flujo de trabajo es claro: investiga → evalúa → propone con criterio → defiende la propuesta ante arquitectura y seguridad → implementa lo aprobado. Buscamos a alguien proactivo que identifique oportunidades de mejora antes de que sean solicitadas, las investigue en profundidad y las presente con argumentación técnica fundamentada.
Responsabilidades Principales
Arquitectura y Diseño de Sistemas Agénticos:
Proponer y fundamentar arquitecturas agénticas complejas: single-agent, multi-agent (orquestador/trabajadores, peer-to-peer, jerárquico), pipelines híbridos y flujos con herramientas externas.
Evaluar frameworks de agentes (LangGraph, CrewAI, AutoGen, Agno, Smolagents, OpenAI Agents SDK, etc.) y presentar recomendaciones argumentadas según el caso de uso, complejidad del grafo, observabilidad nativa y ecosistema de integración.
Proponer patrones de diseño reutilizables para el equipo: gestión de estado, manejo de memoria (short-term, long-term, episodic), routing de agentes, error recovery y human-in-the-loop.
Proponer contratos de integración entre agentes usando A2A Protocol y MCP, definiendo schemas, autenticación y flujos de comunicación.
Selección y Optimización de Infraestructura IA:
Evaluar servicios cloud optimizados para workloads de IA y presentar recomendaciones fundamentadas en benchmarks propios: Runtime de agentes (AWS Bedrock AgentCore, Vertex AI Agent Builder, Azure AI Foundry), Memory stores, Knowledge bases y AI Gateways.
Proponer selección de modelo (Claude, GPT-4o, Gemini, Llama, modelos de embeddings) con benchmark propio documentado: calidad, latencia P50/P95, costo por token y límites de rate.
Proponer estrategias de escalabilidad: manejo de concurrencia, colas de tareas, fan-out de agentes, patrones async y gestión de timeouts en flujos largos.
Identificar y proponer oportunidades de optimización de costos de inferencia: caching semántico, prompt compression, selección de modelo por complejidad de tarea, batching estratégico.
Implementación y Desarrollo:
Implementar end-to-end los sistemas agénticos aprobados: desde el diseño del grafo de estado hasta el despliegue en producción con IaC.
Construir pipelines RAG optimizados: estrategias de chunking (fixed, semantic, recursive, agentic), modelos de embedding, vector stores (Pinecone, pgvector, OpenSearch, S3 Vectors), reranking y retrieval híbrido.
Aplicar prompt engineering avanzado: chain-of-thought, few-shot estructurado, system prompts defensivos, structured outputs y técnicas de grounding.
Desarrollar APIs y microservicios en Python (FastAPI) y Node.js (NestJS) con diseño orientado a integración con plataformas ecommerce de alto tráfico.
Provisionar infraestructura con Terraform y mantener pipelines CI/CD (GitLab CI / GitHub Actions / CodeBuild).
Testing, Trazabilidad y Observabilidad:
Proponer y ejecutar estrategias de evaluación de sistemas agénticos: evals automatizadas (LLM-as-a-judge, unit evals, regression evals), datasets de golden answers y métricas de calidad end-to-end.
Implementar trazabilidad distribuida completa con OTEL + Langfuse / LangSmith: trazas por agente, spans por tool call, costos por trace y dashboards de latencia.
Diseñar estrategias de testing para agentes: mocks de LLMs, simulación de herramientas, pruebas de flujos de error y chaos testing de dependencias externas.
Monitorizar sistemas en producción: alertas sobre degradación de calidad, drift de respuestas, anomalías de latencia y costos fuera de SLA.
Proponer SLOs para sistemas de IA: latencia aceptable, tasa de éxito de tareas, fallback behavior y circuit breakers.
Seguridad y Gobierno:
Aplicar OWASP Top 10 para LLMs: prompt injection, data leakage, insecure tool use, excessive agency.
Implementar guardrails a nivel de input/output, manejo seguro de secrets (KMS, Secrets Manager) y autenticación de servicios agénticos (IAM SigV4, OAuth 2.0, JWT).
Asegurar compliance en el manejo de datos sensibles dentro de pipelines de IA.
Liderazgo Técnico:
Documentar propuestas técnicas de arquitectura con contexto, opciones evaluadas, justificación y trade-offs, para revisión y aprobación del TL, arquitectura y seguridad.
Construir base de conocimiento del área: runbooks, guías de patrones agénticos, frameworks de evaluación y propuestas técnicas documentadas.
Mantenerse actualizado con el ecosistema de IA y traer al equipo referencias concretas y accionables.
Requisitos Excluyentes
Titulado en Ingeniería Informática, Computación, Sistemas o carrera afín.
5+ años en desarrollo de software, con al menos 3 años implementando sistemas agénticos en producción.
Experiencia demostrable con al menos dos frameworks de orquestación de agentes y capacidad de argumentar sus trade-offs.
Manejo sólido de AWS como plataforma principal: Bedrock, Lambda, API Gateway, ECS/ECR, S3, IAM, Secrets Manager.
Experiencia real con testing y evaluación de sistemas LLM: evals automatizadas, métricas de calidad, regresiones.
Dominio de Python avanzado para sistemas de IA y APIs de producción.
Requisitos Deseables
Experiencia multicloud: Google Cloud (Vertex AI / Agent Builder) y Azure (AI Foundry / OpenAI Service).
Conocimiento de servicios AWS Bedrock AgentCore: Runtime, Memory, Gateway, Identity, Observability.
Experiencia con Langfuse o LangSmith en entornos de producción.
Haber propuesto o implementado integraciones con A2A Protocol y servidores MCP propios.
Conocimiento de técnicas de optimización de costos en inferencia a escala.
¡Los beneficios empresariales dependerán del lugar de LATAM donde te encuentres!
Con presencia en más de 10 países y un equipo multicultural, trabajamos con organizaciones que están cambiando la forma en que Latinoamérica opera, se conecta y se digitaliza.
Lo hacemos desde una cultura que pone a las personas en el centro y lleva la excelencia y la innovación como hábito, no como excepción.
Nuestros valores
- Agilidad: evolucionamos rápido porque el mundo no espera.
- Colaboración: el talento se multiplica cuando construimos juntos.
- Innovación: pensamos diferente para desbloquear lo que viene.
- Distinción: buscamos elevar el estándar en cada detalle.
Creamos impacto real porque creemos en las personas reales que lo construyen.
Esa es nuestra cultura. Ese es nuestro motor.