Proyecto de Evaluación de Respuestas de IA Multilingüe

last updated September 16, 2025 12:26 UTC

CrowdGen

HQ: On-site

  • OFF: Any
  • Full-Time
  • All Other Remote

Únete al Proyecto Spearmint, una iniciativa de evaluación de inteligencia artificial multilingüe centrada en revisar las respuestas generadas por modelos de lenguaje grande (LLM) en varios idiomas, con énfasis en el tono o la fluidez. Para participar, debes tener un dominio nativo del idioma objetivo y una sólida comprensión del inglés.

Como evaluador, analizarás conjuntos de datos breves y predivididos, y evaluarás las respuestas generadas por IA según criterios de calidad definidos. Tus comentarios apoyarán la validación de los métodos de evaluación y ayudarán a establecer estándares básicos de calidad para futuras mejoras del modelo.

Responsabilidades clave:

– Evaluar respuestas de IA en tu idioma nativo, enfocándote en el tono o la fluidez.
– Juzgar la calidad general, precisión y naturalidad de las respuestas.
– Leer una solicitud del usuario y dos respuestas generadas por modelos, luego calificar cada una en una escala de cinco puntos.
– Proporcionar breves explicaciones para cualquier calificación extrema.

Detalles del proyecto:

Lote 1 – Tono: Evaluar si las respuestas son útiles, atractivas, justas y perspicaces. Identificar problemas como formalidad inapropiada, condescendencia, sesgo u otras preocupaciones relacionadas con el tono.

Lote 2 – Fluidez: Revisar las respuestas en cuanto a gramática, claridad, coherencia y fluidez natural.

Este es un trabajo por proyecto con CrowdGen, donde participarás como contratista independiente. Si eres seleccionado, recibirás un correo electrónico de CrowdGen para crear una cuenta utilizando el correo electrónico de tu solicitud. Deberás iniciar sesión, restablecer tu contraseña, completar los pasos de configuración y continuar con tu aplicación.

Ayuda a dar forma al futuro de la IA: postúlate ahora y contribuye desde casa.

Pago: $2 – $20.22 por hora.

Apply info ->

To apply for this job, please visit jobs.lever.co