Caso de estudio · 2021
NLP · Flujo editorial
Resumen de textos con transformers
Asistente de resumen para redacciones en español largo con revisión humana en bucle.
P95 de latencia −62% frente a la referencia monolítica · aprobación 4,3/5
- Rol
- Líder técnico
- Stack
- PyTorch · HuggingFace · FastAPI · tokenización bilingüe
Contexto
La redacción necesitaba resúmenes fieles sin citas inventadas. APIs caja negra no cumplían auditoría y el CMS cortaba peticiones en horas pico.
Enfoque
Transformer afinado con decodificación acotada, semillas deterministas y pre-filtro extractivo. Servicio FastAPI con streaming de parciales para revisión progresiva + captura de retroalimentación humana ligera para recalibrar umbrales.
Resultados
- P95 −62% frente al servicio monolítico previo mediante batching y ventanas eficientes.
- 4,3 / 5 percepción cualitativa con tres redes nacionales.
- Incidentes por alucinación ↓ mediante bloqueo de citas en entidades nombradas.
Enlaces
- Resúmenes
- Transformers