Resumen de textos con transformers

Asistente de resumen para redacciones en español largo con revisión humana en bucle.

P95 de latencia −62% frente a la referencia monolítica · aprobación 4,3/5

Rol: Líder técnico
Stack: PyTorch · HuggingFace · FastAPI · tokenización bilingüe

Contexto

La redacción necesitaba resúmenes fieles sin citas inventadas. APIs caja negra no cumplían auditoría y el CMS cortaba peticiones en horas pico.

Enfoque

Transformer afinado con decodificación acotada, semillas deterministas y pre-filtro extractivo. Servicio FastAPI con streaming de parciales para revisión progresiva + captura de retroalimentación humana ligera para recalibrar umbrales.

Resultados

P95 −62% frente al servicio monolítico previo mediante batching y ventanas eficientes.
4,3 / 5 percepción cualitativa con tres redes nacionales.
Incidentes por alucinación ↓ mediante bloqueo de citas en entidades nombradas.

Enlaces

GitHub

Resúmenes
Transformers