El archivo de texto plano (.txt) que genera directamente el motor Whisper. Sin intervención humana ni procesamiento por IA posterior.
Texto corrido en un solo bloque, en el orden cronológico del audio. Puede incluir errores de transcripción, repeticiones, fragmentos en otros idiomas, muletillas y ruido textual.
Identificación de hablantes. Separación en párrafos lógicos. Corrección de errores. Eliminación de ruido. Marcado de tramos inaudibles. Ningún tipo de formato ni estructura.
Clientes que quieren el texto bruto para procesarlo ellos mismos con sus propias herramientas. Investigadores, periodistas, profesionales que solo necesitan buscar en el texto.
Archivo .txt plano, codificación UTF-8.
Una versión limpia y legible de la transcripción. El texto mantiene el orden cronológico exacto de la grabación. No se reestructura, no se reorganiza, no se sintetiza. Se limpia.
Se eliminan: repeticiones involuntarias generadas por Whisper (ej: "Gracias" repetido 50 veces), fragmentos en idiomas incorrectos (Whisper a veces cambia de idioma), caracteres corruptos o ininteligibles, bucles de transcripción.
Se corrigen: errores de transcripción claramente identificables (ej: "texto respondido" → "texto refundido" cuando se refiere a legislación), números y fechas cuando el error es obvio por contexto. NO se corrigen contenidos ambiguos — se dejan tal cual.
Se etiquetan los hablantes con identificadores genéricos: [PRESIDENCIA], [CONCEJAL-1], [CONCEJAL-2], [SECRETARIO], [HABLANTE NO IDENTIFICADO]. La atribución se infiere del contexto (quién preside, quién responde a quién, nombres mencionados). Se marca explícitamente como TENTATIVA en el documento.
Los tramos donde la transcripción genera texto ininteligible se marcan como [INAUDIBLE — descripción]. Se incluye orientación sobre qué falta para facilitar la verificación con el audio original.
El texto se divide en párrafos coherentes por intervención de cada hablante. Cada cambio de interlocutor genera un párrafo nuevo.
Reorganización del contenido (el orden es estrictamente cronológico). Extracción de votaciones o acuerdos. Síntesis o resumen de intervenciones. Notas editoriales. Estructura por puntos del orden del día. Formato de acta ni ningún formato específico.
Cualquier cliente que necesite un texto legible como base de trabajo. Secretarios que van a redactar el acta ellos mismos. Profesionales que necesitan revisar qué se dijo en una reunión.
Documento .docx con encabezado de metadatos, leyenda de hablantes, disclaimer sobre la identificación tentativa, y transcripción cronológica.
Una versión organizada y procesada de la transcripción. El contenido se reestructura por secciones temáticas (puntos del orden del día en un pleno, temas en una reunión). Incluye extracción de datos clave y atribución de intervenciones.
El contenido se organiza bajo epígrafes que reflejan los puntos tratados. En un pleno municipal: puntos del orden del día. En una reunión: temas abordados. El texto deja de ser cronológico puro para ser temático.
Se extraen y formatean las votaciones con resultado: votos a favor, en contra, abstenciones. Los acuerdos adoptados se señalan.
Los hablantes se identifican por nombre cuando es posible (no solo por etiqueta genérica). La atribución sigue siendo inferida y puede requerir verificación, pero es más precisa que en el Nivel 1 porque el contexto de la reestructuración ayuda a identificar quién habla.
Los intercambios caóticos con múltiples personas hablando a la vez se sintetizan en un resumen de lo tratado, con nota indicando que el tramo original era confuso.
Se añaden notas breves cuando el contexto lo requiere: referencias legales corregidas, aclaraciones sobre terminología, indicaciones de que falta información por verificar.
Formato de acta oficial. Adaptación al estilo o plantilla del cliente. Redacción formal administrativa. Validación jurídica del contenido. Estos elementos formarían parte de un posible Nivel 3 (Premium) que se definiría junto al cliente.
Ayuntamientos que necesitan el contenido organizado para redactar el acta. Empresas que quieren un resumen estructurado de sus reuniones. Cualquier organismo que necesite consultar rápidamente qué se trató y qué se decidió.
Documento .docx con encabezado de metadatos, tabla de asistentes identificados, índice de puntos tratados, contenido organizado por secciones, votaciones formateadas y notas técnicas sobre incidencias de la transcripción.