Caso de estudio · 2021

NLP · Flujo editorial

Resumen de textos con transformers

Asistente de resumen para redacciones en español largo con revisión humana en bucle.

P95 de latencia −62% frente a la referencia monolítica · aprobación 4,3/5

Rol
Líder técnico
Stack
PyTorch · HuggingFace · FastAPI · tokenización bilingüe

Contexto

La redacción necesitaba resúmenes fieles sin citas inventadas. APIs caja negra no cumplían auditoría y el CMS cortaba peticiones en horas pico.

Enfoque

Transformer afinado con decodificación acotada, semillas deterministas y pre-filtro extractivo. Servicio FastAPI con streaming de parciales para revisión progresiva + captura de retroalimentación humana ligera para recalibrar umbrales.

Resultados

  • P95 −62% frente al servicio monolítico previo mediante batching y ventanas eficientes.
  • 4,3 / 5 percepción cualitativa con tres redes nacionales.
  • Incidentes por alucinación ↓ mediante bloqueo de citas en entidades nombradas.

Enlaces