Transcriptor y subtitulado

El software de transcripción de Natural Speech convierte de forma automática, precisa y ágil todos tus audios en documentos escritos.

Empezar a usar

Natural Transcriptor es un software capaz de realizar transcripciones automáticas de gran calidad. Convierte los audios en texto con elevados niveles de precisión, textos que pueden ser gestionados en formato de salida para subtitulación o como texto editable para la formalización de actas o similar.

Natural Speech Transcriptor

Natural Transcriptor también puede funcionar como sistema de subtitulado automático, en batch o en streaming. Incluye los siguientes módulos tecnológicos:

ASR Engine

Realiza la transcripción voz a texto. Consta de dos componentes: modelo de lenguaje y modelo acústico, ambos adaptables al dominio. Basado en tecnología DeepLearning.

Modelo de puntuación y capitalización

Tomando como entrada la transcripción, la categorización de las distintas palabras que componen la transcripción e información temporal asociada (silencios), añade capitalización y signos de puntuación a los subtítulos. Basado en tecnología DeepLearning.

Módulo de normalización

Realiza normalización de texto, por ejemplo, el paso de números en letra a dígitos en aquellos casos en los que sea necesario, uso de abreviaturas permitidas, símbolos ampliamente conocidos.

Generación de subtítulos

Un factor muy importante en el subtitulado en vivo es el compromiso entre retardo, precisión de la transcripción y disposición del subtítulo (número de líneas, número de caracteres por línea). Es necesario llegar a una composición que permita una buena legibilidad y comodidad en la lectura, cumpliendo la norma de subtitulado

Es Independiente de locutor y está adaptado a diferentes dominios, tanto telefónico como media, y puede mejorar sustancialmente sus resultados si se va alimentando con material específico.

Es un sistema en castellano capaz de identificar automáticamente otros idiomas, así como la diarización para marcar el cambio de locutor; puede incorporar, además, marcas temporales para facilitar la localización de un punto determinado de la conversación, así como la capitalización y puntuación del texto.

La utilidad es capaz de transcribir diferentes formatos de audio (mp3, WAV, ogg…), y guardar la transcripción en texto plano TXT, formato RTF, formato XML o SRT. Es importante señalar que es necesario que las grabaciones tengan una calidad de grabación adecuada y los hablantes estén diferenciados por canal de grabación para obtener los porcentajes de error más bajos y una tasa de acierto superior.