Científico de Datos (Red Teaming y Evaluación)
Empresa
Luxen
Estado
Ciudad de México
Ciudad
Ciudad de Mexico
Tipo de Contrato
Tiempo Completo
Descripción
Científico de Datos (Red Teaming y Evaluación)
Título: Senior Data Scientist / AI Safety Researcher. Dominio: RAG, Embeddings, Evaluación de Modelos
Experiencia: +3 años en validación estadística y seguridad de modelos. Experiencia en "Red Teaming" (ataques simulados a IA para forzar alucinaciones).
Tareas Principales:
Diseñar y mantener la estrategia de indexación vectorial en Qdrant para la Base de Conocimiento Fundacional (BCF) y para "The Vault".
Implementar los pipelines de generación de embeddings para documentos legales, propuestas, RFPs y datos del Santuario Corporativo.
Evaluar continuamente la precisión del RAG: medir métricas de recall y precisión para garantizar que los Expertos Digitales no alucinen.
Construir los datasets de evaluación para medir el desempeño de los Expertos Digitales y las predicciones de la Matriz de Cumplimiento.
Calcular el PWin Score (Probabilidad de Ganar) usando regresión histórica y análisis bayesiano.
Tareas Clave:
Diseñar las pruebas de estrés para el Nodo B (intentar engañar al "Profesor").
Calibrar el Global Trust Score (GTS) y las métricas de precisión.
Entregables Clave:
Índices Qdrant optimizados para BCF y The Vault.
Benchmarks de precisión de RAG por Experto Digital.
Remuneración pretendida.
Posibilidad de trasladarse para trabajar en República Dominicana.
Postulate para mas informacion
Título: Senior Data Scientist / AI Safety Researcher. Dominio: RAG, Embeddings, Evaluación de Modelos
Experiencia: +3 años en validación estadística y seguridad de modelos. Experiencia en "Red Teaming" (ataques simulados a IA para forzar alucinaciones).
Tareas Principales:
Diseñar y mantener la estrategia de indexación vectorial en Qdrant para la Base de Conocimiento Fundacional (BCF) y para "The Vault".
Implementar los pipelines de generación de embeddings para documentos legales, propuestas, RFPs y datos del Santuario Corporativo.
Evaluar continuamente la precisión del RAG: medir métricas de recall y precisión para garantizar que los Expertos Digitales no alucinen.
Construir los datasets de evaluación para medir el desempeño de los Expertos Digitales y las predicciones de la Matriz de Cumplimiento.
Calcular el PWin Score (Probabilidad de Ganar) usando regresión histórica y análisis bayesiano.
Tareas Clave:
Diseñar las pruebas de estrés para el Nodo B (intentar engañar al "Profesor").
Calibrar el Global Trust Score (GTS) y las métricas de precisión.
Entregables Clave:
Índices Qdrant optimizados para BCF y The Vault.
Benchmarks de precisión de RAG por Experto Digital.
Remuneración pretendida.
Posibilidad de trasladarse para trabajar en República Dominicana.
Postulate para mas informacion