
La transcripción y los subtítulos estuvieron presentes regularmente en nuestro trabajo, aunque siempre con una frecuencia media o baja. En los últimos tiempos, sin embargo, las cosas han cambiado: con la despoblación de las plataformas de streaming y la enorme difusión de vídeos en la red -y especialmente en las redes sociales-, la demanda de servicios de transcripción y subtitulación ha ocupado una parte cada vez mayor de nuestro tiempo.
Así que hoy en día, se han convertido en actividades con las que lidiamos a diario, y esto nos ha llevado a sondear el mercado en busca de una solución ágil y eficaz que satisfaga nuestras necesidades. De hecho, utilizamos o probamos varias alternativas para encontrar un software basado en web que ofreciera las funciones que más necesitábamos, es decir, transcripción automática, subtitulación según las reglas preestablecidas y la posibilidad de traducirlas. Además, la herramienta debía permitir agilizar la gestión de carpetas y la asignación de empleados.
En este artículo, compararemos algunas de las principales plataformas de subtitulación y transcripción que hemos evaluado para nuestro trabajo diario.
1. Amberscript
Iniciamos nuestra lista con uno de los paquetes de software más conocidos del sector, Amberscript, entre cuyos socios se encuentran Netflix, Disney + y Warner Bros. y ofrece transcripción y subtitulación de vídeos, tanto manual como automática.
De todos las aplicaciones de subtitulación de vídeo, es probablemente el más ágil, sencillo e intuitivo de navegar. Al elegir la transcripción o el subtitulado automático, se tiene acceso a un editor (directamente desde el navegador) para editar y revisar la transcripción y los subtítulos. No faltan las funciones típicas, como la posibilidad de resaltar frases y la función de buscar y reemplazar.
También cuenta con una aplicación móvil, que a pesar de no ofrecer la función de edición de texto, le da un punto a favor a Amberscript: permite grabar audio directamente en ella y, gracias a la sincronización con la versión de escritorio, todo lo que se grabe o cargue desde la aplicación también estará disponible en el ordenador. Una función que no hay que subestimar para ahorrar tiempo al mover archivos entre plataformas. Se adhiere a las normas GDPR y a las certificaciones ISO27001 e ISO9001.
Características
Precisión: 85%
Idiomas: 39+
Tiempo de entrega del archivo menos de 10 minutos para la transcripción, aproximadamente una hora para los subtítulos
Reconocimiento de voces: manual (se reconocen varias voces, pero los nombres no se asocian automáticamente)
Incrustado nativo: no
Personalización de subtítulos: no
Prueba gratuita: sí
Pro
- Editor claro, muy fácil de usar.
- La transcripción utiliza inteligencia artificial, por lo que «aprende» las palabras utilizadas en el audio para reducir los errores.
Contras
- No siempre es preciso, siempre requiere algún ajuste por parte del usuario.
- No se pueden subir vídeos desde la nube.
- Varios usuarios tuvieron problemas para transcribir un audio grabado con acentos marcados y utilizando palabras técnicas.
Costes
Paga sobre la marcha: 10 euros por hora
Suscripción: 40€ euros al mes (con un límite de 5 horas de audio/vídeo disponibles para subir)
2. Happy Scribe
Nos suscribimos a Happy Scribe a través de la oferta de Appsumo en 2020 y es la herramienta que llevamos utilizando más tiempo, con una frecuencia de un par de veces al mes. En cuanto a la transcripción automática, se ajustaba bien a nuestros propósitos, aunque en idiomas distintos al inglés los resultados eran manifiestamente mejorables. El editor es bastante sencillo y cumple su función.
Los problemas, sin embargo, empezaron cuando necesitamos más funcionalidades y nos encontramos con el silencio y la lentitud del servicio de atención al cliente, en dos ocasiones. La primera, cuando pedimos pasar a la versión Business, que acababa de lanzarse y tenía muchas funciones interesantes para nosotros, pero las respuestas fueron siempre lentas e imprecisas: nunca nos dijeron el precio de la actualización y sin explicarnos por qué, se limitaron a decirnos que con nuestra suscripción la actualización era imposible. Tampoco nos dieron ninguna otra solución, salvo activar una versión reducida de los espacios de trabajo, que en cualquier caso era insuficiente para nuestras necesidades y causaba más problemas de los que resolvía.
La segunda vez fue aún peor, porque en medio de un proyecto tuvimos un problema con una transcripción que teníamos que entregar urgentemente y corríamos el riesgo de quedarnos atascados porque el servicio de atención al cliente respondió dos días más tarde. Mientras tanto, ya había vuelto a subir el vídeo y rehecho la transcripción automática (gastando dos veces los créditos correspondientes), y luego tuve que copiar y pegar la transcripción ya corregida. Llegados a este punto, decidimos no perder más tiempo y cambiamos a otra herramienta.
Características
Precisión: hasta el 85%
Idiomas: 62
Turnaround: la mitad de la duración del audio
Reconocimiento de voces: manual
Incrustado nativo: no
Personalización de subtítulos: sí
Prueba gratuita: sí
Pro
- No hay límites en cuanto a la cantidad y el tamaño de los archivos cargados
- Ofrece la traducción de los subtítulos
- Ofrece herramientas gratuitas de transcripción manual y subtitulación.
Contras
- Los usuarios consideran que la interfaz puede ser más intuitiva.
- El servicio de atención al cliente es lento y poco resolutivo.
Costes
0.20€ por minuto para transcripción y subtitulación automática
3. Sonix
Sonix es la herramienta que utilizamos actualmente para la mayoría de nuestras necesidades. Es un sistema bastante sólido y completo y la oferta que nos hicieron para la versión empresarial era rentable. La transcripción automática es bastante precisa y requiere relativamente poca intervención. Además de transcripción y subtitulación automáticas, pronto ofrecerá servicios de transcripción en tiempo real.
A través de su editor, es posible hacer el clásico resaltado, buscar-sustituir, y también permite tachar texto para excluirlo de los subtítulos que aparecen en pantalla, pero sin eliminarlo por completo del editor. Una función de Sonix que nos fue útil en varias ocasiones es que ofrece la posibilidad de crear breves clips de vídeo para compartir, muy útil para que otra persona escuche y opine sobre una escena concreta de un vídeo.
Aunque lo utilizamos principalmente para crear subtítulos en el mismo idioma (closed captions), en algunas ocasiones utilizamos la traducción automática y la calidad es razonablemente buena. Según nuestra experiencia, los resultados son mejores si traduces la transcripción del vídeo (después de corregirla, si es necesario) en lugar de los subtítulos, porque así el motor de traducción puede seguir mejor el hilo del discurso. De lo contrario, tiende a considerar cada subtítulo como una frase independiente y no interpreta correctamente el contexto.
En términos más generales, lo elegimos porque permite gestionar a un equipo de colaboradores y asignar (aunque de forma algo rudimentaria) el subtitulado de un determinado vídeo a una determinada persona. El servicio de atención al cliente respondió rápidamente (teniendo en cuenta la diferencia horaria de California) e incluso arreglaron un pequeño error del programa cuando se lo comunicamos.
Características
Precisión: 95-97%
Idiomas: 35+
Turnaround: depende de la calidad y duración del archivo
Reconocimiento de voces: tanto manuales como automáticas
Incrustado nativo: función premium
Personalización de subtítulos: función premium
Prueba gratuita: 30 minutos
Pro
- Permite introducir notas y comentarios directamente en la transcripción.
- Se pueden añadir varios diccionarios personalizados, en función de los clientes y el contenido (requiere suscripción premium).
- Permite combinar varias pistas (requiere suscripción premium).
- Permite subir archivos desde la nube.
- Ofrece traducción de subtítulos (requiere suscripción premium).
- API disponibles
Contras
- No funciona del todo bien con una mala calidad de audio o cuando se habla en diferentes idiomas.
- La línea de tiempo se desplaza de forma irregular durante la reproducción de algunos vídeos.
Costes
Paga sobre la marcha: 10$ por hora.
Premium: 22$ al mes. Esta suscripción no incluye las horas, pero sólo reduce el coste por hora a 5$. Por lo tanto, habrá que pagar por cada hora subida de todas formas.
4. Amara
Probamos Amara cuando buscábamos una alternativa a Happy Scribe. A diferencia de otros programas, no ofrece un servicio de transcripción y subtitulación automática, sino sólo un editor para subtitulación manual y traducción de subtítulos.
Tiene algunas funciones un poco limitadas en comparación con otras opciones en el mercado, sin embargo, es gratuito y es la solución ideal para proyectos benéficos. En su versión gratuita, todos los vídeos subidos serán de dominio público, y cualquiera con acceso al vídeo podrá editar los subtítulos. Las suscripciones de pago, por su parte, incluyen subtitulado de audio, solo para el idioma inglés, y permiten también subir archivos manteniéndolos en el dominio privado.
Pro
- El editor es gratuito.
- No hay límite en la duración de los archivos cargados.
Contras
- El editor no está muy desarrollado.
- En la versión gratuita, no puedes mantener los vídeos en privado.
Costes
Amara public: gratuito.
Amara plus: 24$ al mes
5. Rev
Rev es la solución adecuada para quienes buscan un servicio de transcripción de audio que no tenga problemas con los términos técnicos. El editor permite resaltar, subrayar y tachar texto, así como añadir comentarios y notas. También ofrece captioning automático para Zoom, que al final de la llamada también permite descargar la transcripción de la reunión.
De todas las soluciones propuestas, es probablemente la menos conocida, y muchos usuarios señalan la escasa inversión de la empresa en marketing. A pesar de ello, la calidad del servicio es excelente y las críticas son numerosas y muy positivas.
Características
Precisión: depende de la calidad del audio, pero afirman que supera el 90%
Idiomas: no especificado
Turnaround: 5 minutos
Reconocimiento de voces: sí
Incrustado nativo: sí
Personalización de subtítulos: sí
Prueba gratuita: 45 minutos
Pro
- Permite añadir diccionarios personalizados.
- Es muy rápido.
Contras
- Puede presentar problemas con diferentes acentos.
Costes
Para la transcripción automática: 0.25$ por minuto.
Para el pie de foto Zoom: 20$ por anfitrión.
6. Ooona
Si prefieres trabajar «a la antigua», Ooona es la herramienta web más completa del mercado para crear subtítulos y transcripciones manualmente. En términos más generales, es una solución completa para quienes trabajan en el campo de la localización y en [traducción audiovisual](/traduccion/traduccion audiovisual).
Como se trabaja solo en modo manual, Ooona está equipada con controles muy precisos para el movimiento de la línea de tiempo, el posicionamiento en pantalla de los subtítulos y otras funciones avanzadas como la detección de cambios de escena, el burn-in y la codificación. La interfaz también permite la traducción de subtítulos (solo manualmente) a partir de la plantilla original.
A diferencia de otras herramientas similares, Ooona no es una solución «todo en uno», sino que es modular, ya que consta de varias herramientas independientes, de modo que puede adaptarse con flexibilidad a las necesidades de cada empresa. En mi opinión, sin embargo, es una elección bastante confusa, lo que también se refleja en la estructura de precios.
De hecho, existen hasta siete herramientas diferentes, cada una con su propio precio. Para algunas de las herramientas existe una versión estándar más barata, que incluye las funciones básicas, y una versión pro más cara, que en cambio da acceso a funciones más avanzadas, como el reconocimiento de cambios de escena. Lo mismo ocurre con los paquetes, que agrupan varias herramientas a un precio reducido. Para complicar aún más las cosas, algunas herramientas también se ofrecen con suscripción semanal, mientras que otras sólo tienen periodicidad mensual, semestral o anual.
Pro
- Potente
- Flexible
- Personalizable
- Fácil de usar
Contras
- La estructura modular puede resultar confusa y cada herramienta requiere una suscripción independiente.
- Es más caro que la competencia.
Costes
Paquete estándar: 84$ al mes, incluye: Create, Translate, Standard Subtitle Converter, Compare.
Paquete Pro: 248$ al mes, incluye: Create Pro, Translate Pro, Standard Subtitle Converter, Compare, Transcribe, Burn & Encode.
7. Subtitle Next
Subtitle Next es una plataforma profesional para crear subtítulos, doblajes y subtitulados, tanto offline como online. Tiene funciones muy avanzadas y es totalmente personalizable.
Ofrece la posibilidad de crear subtítulos en tiempo real, también para Zoom, y desde la versión 5.11 se pueden generar automáticamente subtítulos ya traducidos a partir del audio, tanto para eventos en directo (como para Twitch en directo) como para contenidos offline. Al ser un software tan complejo, se recomienda solo para expertos en la materia. En cuanto a los precios, tiene varios tipos de suscripciones mensuales y paquetes de pago únicos.
Pro
- Puedes subir vídeos desde cualquier enlace, incluso directamente desde las redes sociales, sin tener que descargarlos.
- Compatible con todos los idiomas.
- Actualmente es uno de los pocos paquetes de software que ofrece subtítulos ya traducidos a partir del audio sin pasos adicionales.
Contras
- No es adecuado para principiantes o estudiantes, la interfaz gráfica de usuario es demasiado compleja.
- Muy caro.
Costes
Suscripciones mensuales:
SubtitleNEXT Explorer: 70€ al mes, es el paquete básico para crear subtítulos y traducciones.
Live Subtitles Bundle: 140€ al mes, incluye: SubtitleNEXT Explorer, SubtitleNEXT Live Option (para subtítulos en tiempo real) y SubtitleNEXT Spark (para mostrar subtítulos generados en tiempo real en dispositivos externos).
SubtitleNEXT Vlogger: 180€ al mes, incluye creación, edición y formateo de subtítulos, visualización de subtítulos en vídeos o streams, subtitulación en tiempo real de streams en directo en YouTube u otras plataformas, y transcripción automática a un idioma.
Licencias una tantum:
Novice: 350€, para principiantes y autónomos, incluye todas las funciones esenciales para completar un proyecto.
Explorer: 900, un paquete completo para trabajar con textos que requieren sincronización.
Expert: 2950€, para profesionales y organizaciones, incluye toda la suite de productos.
8. Konch
Konch es un programa de transcripción automática muy sencillo, adecuado para instituciones y centros de enseñanza.
Dispone de un editor para modificar transcripciones y añadir notas, comentarios y resaltados, y está diseñado para que equipos de varias personas puedan colaborar en la misma transcripción sin problemas. El texto resultante puede traducirse automáticamente. Cumple con la normativa GDPR. Ofrece una prueba gratuita de 15 minutos.
Características
Precisión: muy alto
Idiomas: 30+
Turnaround: pocos minutos
Reconocimiento de voces: manual
Incrustado nativo: no
Personalización de subtítulos: no
Prueba gratuita: 15 minutos
Pro
- Interfaz sencilla.
- Traducción automática.
- Económico.
- Cumple con la normativa GDPR.
Contras
- Sin funciones avanzadas.
Costes
Paga sobre la marcha: 8$ por hora de audio.
Suscripción: 32 $ al mes (5 horas incluidas, luego 8 $ por hora).
9. Media.io
Media.io es un programa muy completo para editar, convertir y comprimir audio y vídeo, por lo que es especialmente adecuado para creadores de contenidos de todo tipo. Sus servicios también incluyen la generación automática (y traducción) de subtítulos y la transcripción automática de audio o vídeo. Funciona a través del navegador, por lo que puede utilizarse en cualquier plataforma (ordenador de sobremesa y smartphone) y sistema operativo.
Características
Precisión: más del 90%
Idiomas: 11 para la transcripción, 90 para los subtítulos
Turnaround: pocos minutos
Reconocimiento de voces: no especificado
Incrustado nativo: sí
Personalización de subtítulos: sí
Prueba gratuita: 10 minutos
Pro
- No aplica marcas de agua.
- Permite un alto nivel de personalización.
- Extremadamente barato.
- Traducción automática de subtítulos.
Contras
- No es adecuado para grandes cantidades de contenido.
- Herramienta genérica de edición de vídeo, no específica para subtítulos.
Costes
3.95$ al mes: 2 horas de subtitulado y transcripción, hasta 100.000 caracteres de transcripción.
6.66$ al mes: 6 horas de subtitulado y transcripción, hasta 200.000 caracteres de transcripción.
10. Subly
Subly es otro programa especialmente recomendado para creadores. Ofrece las funciones de transcripción automática y subtitulación automática (y traducción), así como la posibilidad de redimensionar los vídeos según los formatos más utilizados en las redes sociales y una herramienta para crear posts utilizando las frases de la transcripción.
Características
Precisión: hasta el 98
Idiomas: 67+
Turnaround: pocos minutos
Reconocimiento de voces: función premium
Incrustado nativo: sí
Personalización de subtítulos: sí
Prueba gratuita: 7 días, 240 minutos.
Pro
- Funciones adicionales, como redimensionamiento de vídeo.
- Creator friendly.
- Prueba gratuita muy generosa.
- Económico.
Contras
- No siempre es preciso, los usuarios señalan errores como la ausencia de signos de puntuación y de mayúsculas.
- No apto para contenidos muy largos.
Costes
Paga sobre la marcha: 0.60$ por minuto.
Suscripción Pro: 17$ al mes. Incluye 100 minutos al mes, con 10 GB de almacenamiento y un tamaño máximo de carga de 1 GB por archivo.
Suscripción Premium: 39$ al mes. Incluye 240 minutos al mes, 50 GB de almacenamiento y un tamaño máximo de subida de 2 GB por archivo, subtitulación y permite subir archivos a través de URL o de Google Drive.
Suscripción empresarial: 218 $ al mes, incluye más de 1000 minutos, 200 GB de almacenamiento y un tamaño máximo de carga de 5 GB por archivo.
Una opción futurista
Está claro que, con tantas opciones disponibles en el mercado, la tecnología necesaria para la conversión de texto a voz ya está bien establecida. Pero como nos ha demostrado DALL-E, la inteligencia artificial capaz de generar imágenes basadas en una descripción inicial, realmente no existe un límite a lo que las IA pueden lograr. De hecho, la propia OpenAI, madre de DALL-E, también está trabajando en un sistema que promete dejar obsoleto todo el software de esta lista: Whisper.
Se trata de una red neuronal capaz de alcanzar una capacidad de reconocimiento del habla (en inglés) igual a la humana. Pero el verdadero avance de esta tecnología es que será capaz de entender la voz independientemente de la calidad del audio, que es actualmente el mayor obstáculo de la conversión de texto a voz. Esto significa que quienes quieran confiar en la transcripción automática de audio ya no tendrán que preocuparse por la presencia de ruido de fondo, música y otros sonidos, lo que hace que la tecnología de texto a voz no sólo sea más precisa, sino también más accesible.
Whisper es actualmente de código abierto y, por tanto, cualquiera puede descargarlo, siempre que disponga de un ordenador capaz de soportar el rendimiento que exige el programa. Whisper también promete trabajar sin problemas con lenguajes técnicos y transcribir en idiomas multilingües.
Pero como Whisper aún no es una realidad, o al menos, no para todo el mundo, la única forma de optimizar al máximo la transcripción automática es tomar precauciones al grabar audio. Si, por el contrario, lo que busca es una transcripción 100% precisa, capaz de informar fielmente de cada palabra independientemente de solapamientos, acentos y términos técnicos, nadie puede superar la experiencia de profesionales experimentados, tanto para transcripciones como para subtítulos.
Ponte en contacto con nosotros sin compromiso si necesitas ayuda para subtitular o transcribir tus vídeos