10 (+1) applicazioni di trascrizione e sottotitolaggio a confronto

Subs apps

La trascrizione e i sottotitoli sono stati regolarmente presenti nel nostro lavoro, anche se sempre con una frequenza medio-bassa. Negli ultimi tempi però le cose sono cambiate: con lo spopolare delle piattaforme streaming e l’enorme diffusione dei video sul web – e in particolare sui social - le richieste di servizi di trascrizione e sottotitolazione hanno occupato una fetta sempre più rilevante del nostro tempo.

Perciò oggi sono diventate attività con cui abbiamo a che fare quotidianamente e questo ci ha portato a sondare il mercato alla ricerca di una soluzione snella ed efficiente, in grado di soddisfare le nostre esigenze. Abbiamo infatti usato o testato varie alternative per trovare un software web-based che offrisse le funzionalità di cui abbiamo maggiormente bisogno, vale a dire la trascrizione automatica, la suddivisione in sottotitoli secondo regole prestabilite e la possibilità di tradurli. Inoltre lo strumento doveva permettere una gestione snella delle cartelle e l’assegnazione dei collaboratori.

In questo articolo metteremo a confronto alcune delle principali piattaforme di sottotitolaggio e trascrizione che abbiamo valutato per il nostro lavoro quotidiano.

1. Amberscript

Apriamo la nostra carrellata con uno dei software più conosciuti del settore, Amberscript, che vanta tra i suoi partner Netflix, Disney + e Warner Bros. e offre la trascrizione e il sottotitolaggio di video, sia manuali che automatici.

Tra tutti i siti di applicazioni per sottotitolare video, probabilmente è quello più snello, semplice e intuitivo da navigare. Scegliendo la trascrizione o la sottotitolazione automatica, si ha accesso a un editor (direttamente dal browser) per la modifica e revisione della trascrizione e dei sottotitoli. Non mancano le funzionalità tipiche come la possibilità di evidenziare frasi e la funzione cerca-sostituisci.

È anche dotata un’app mobile, che nonostante non offra la funzione di editing del testo, dà comunque un punto a favore ad Amberscript: permette infatti di registrare audio direttamente al suo interno, e grazie alla sincronizzazione con la versione desktop, tutto quello che viene registrato o caricato dall’app è disponibile anche sul computer. Una funzionalità da non sottovalutare per risparmiare tempo nello spostamento dei file tra le varie piattaforme. Aderisce alle norme del GDPR e alle certificazioni ISO27001 e ISO9001.

Caratteristiche

Accuratezza: 85%
Lingue: 39+
Tempo di consegna file: meno di 10 minuti per la trascrizione, circa un’ora per i sottotitoli
Multi speaker: manuale (vengono riconosciute diverse voci, ma non vengono associati automaticamente i nomi)
Burn in nativo: no
Personalizzazione sottotitoli: no
Prova gratuita: sì

Pro

  • Editor chiaro, molto user friendly.
  • La trascrizione sfrutta l’intelligenza artificiale, quindi “impara” le parole utilizzate nell’audio per ridurre gli errori.

Contro

  • Non sempre accurato, richiede sempre un po’ di lavoro di perfezionamento da parte dell’utente.
  • Non si possono caricare video da cloud.
  • Diversi utenti hanno riscontrato difficoltà nella trascrizione di audio registrati con accenti marcati e che utilizzano parole tecniche.

Costi

Pay as you go: 10€ per ora
Abbonamento: 40€ al mese (con un limite di 5 ore di audio/video caricabili)

2. Happy Scribe

Happy Scribe

Ci siamo abbonati a Happy Scribe tramite l’offerta di Appsumo nel 2020 ed è lo strumento che abbiamo usato per più tempo, con una frequenza di un paio di volte al mese. Per quanto riguarda la trascrizione automatica, andava bene per i nostri scopi, nonostante nelle lingue diverse dall’inglese i risultati fossero decisamente migliorabili. L’editor è abbastanza semplice e fa il suo dovere.

I problemi però sono iniziati quando abbiamo avuto bisogno di più funzionalità e ci siamo scontrati con il silenzio e la lentezza del servizio clienti, in ben due occasioni. La prima, quando abbiamo chiesto di fare l’upgrade alla versione Business, che era appena stata lanciata e aveva molte funzioni interessanti per il nostro caso, ma le risposte sono sempre state lente e vaghe: non ci hanno mai detto il prezzo dell’upgrade e senza spiegarci perché, ci hanno solo detto che con il nostro abbonamento l’upgrade era impossibile. Non ci hanno neanche dato un’altra soluzione, tranne quella di attivare una versione ridotta dei Workspaces, che comunque era insufficiente per le nostre necessità e causava più problemi di quelli che risolveva.

La seconda volta invece è stata ancora più grave, perché nel bel mezzo di un progetto abbiamo avuto un problema con una trascrizione che dovevamo consegnare urgentemente e rischiavamo di restare bloccati perché il servizio al cliente ha risposto due giorni dopo. Nel frattempo avevo già ricaricato il video e rifatto la trascrizione automatica (spendendo i relativi crediti due volte), dovendo poi copiare e incollare la trascrizione già corretta. A questo punto abbiamo deciso di non perdere più tempo e siamo passati a un altro strumento.

Caratteristiche

Accuratezza: fino all’85%
Lingue: 62
Turnaround: metà della lunghezza dell’audio
Multi speaker: manuale
Burn in nativo: no
Personalizzazione sottotitoli: sì
Prova gratuita: sì

Pro

  • Non ci sono limiti alla quantità e alla dimensione dei file di upload
  • Offre la traduzione dei sottotitoli
  • Offre strumenti di trascrizione e sottotitolazione manuale gratuiti.

Contro

  • Gli utenti trovano che l’interfaccia possa essere più intuitiva.
  • Il servizio al cliente è lento e poco risolutivo.

Costi

0.20€ al minuto per la trascrizione e la sottotitolazione automatica

3. Sonix

Sonix

Sonix è lo strumento che usiamo al momento per la maggior parte delle nostre esigenze. È un sistema abbastanza solido e completo e l’offerta che ci hanno fatto per la versione business era economicamente vantaggiosa. La trascrizione automatica è abbastanza precisa e richiede relativamente pochi interventi. Oltre alla trascrizione e sottotitolazione automatica, a breve offrirà anche servizi di real time transcription.

Tramite il suo editor è possibile fare le classiche operazioni di evidenziazione, cerca-sostituisci, e permette anche di barrare del testo per escluderlo dai sottotitoli mostrati a video, ma senza eliminarlo del tutto dall’editor. Una funzione di Sonix che ci è servita in più occasioni è la possibilità di creare clip video brevi da condividere, utile per far ascoltare a qualcun altro e avere il suo parere su una scena specifica di un video.

Anche se lo usiamo principalmente per creare sottotitoli nella stessa lingua (closed captions), ci è capitato in qualche occasione di usare la traduzione automatica e la qualità è mediamente buona. Nella nostra esperienza i risultati sono migliori se si traduce la trascrizione del video (dopo averla corretta, se necessario) invece dei sottotitoli, perché in questo modo il motore di traduzione riesce a seguire meglio il filo del discorso. Altrimenti tende a considerare ogni sottotitolo come frase a sé stante e non interpreta il contesto correttamente.

Più in generale l’abbiamo scelto perché consente di gestire una squadra di collaboratori e di assegnare (seppure in maniera un po’ rudimentale) il sottotitolaggio di un certo video a una certa persona. Il servizio al cliente risponde tempestivamente (se si considera il fuso orario della California) e hanno anche risolto un piccolo bug del programma quando glielo abbiamo segnalato.

Caratteristiche

Accuratezza: 95-97%
Lingue: 35+
Turnaround: dipende da qualità e durata file
Multi speaker: sia manuale che automatico
Burn in nativo: funzione premium
Personalizzazione sottotitoli: funzione premium
Prova gratuita: 30 minuti

Pro

  • Permette di inserire note e commenti direttamente nella trascrizione.
  • Si possono aggiungere più dizionari personalizzati, in base ai clienti e ai contenuti (richiede l’abbonamento premium).
  • Permette la combinazione di diverse tracce (richiede l’abbonamento premium).
  • Consente l’upload da cloud.
  • Offre la traduzione dei sottotitoli (richiede premium).
  • API disponibili

Contro

  • Non se la cava bene con l’audio di scarsa qualità o quando si parlano lingue diverse.
  • La timeline scorre a scatti durante la riproduzione di alcuni video.

Costi

Pay as you go: 10$ per ora.
Premium: 22$ al mese. Questo abbonamento non include delle ore ma abbassa solamente il costo per ora, che scende a 5$. Quindi bisognerà comunque pagare per ogni ora caricata.

4. Amara

Amara

Abbiamo provato Amara quando cercavamo un’alternativa a Happy Scribe. Al contrario degli altri software, non fornisce un servizio di trascrizione e sottotitolazione automatica ma solo un editor per la sottotitolazione manuale e la traduzione dei sottotitoli.

Ha delle funzionalità un po’ limitate rispetto alle altre opzioni sul mercato, tuttavia è gratuito ed è la soluzione ideale per progetti di beneficenza. Nella sua versione gratuita infatti tutti i video caricati saranno di dominio pubblico, e chiunque abbia accesso al video può modificarne i sottotitoli. Negli abbonamenti a pagamento è incluso invece il servizio di audio captioning, disponibile però solo per la lingua inglese, ed è possibile caricare i file mantenendoli di dominio privato.

Pro

  • L’editor è gratuito.
  • Nessun limite alla durata dei file caricati.

Contro

  • L’editor non è molto sviluppato.
  • Nella versione gratuita non si possono mantenere i video privati.

Costi

Amara public: gratuito.
Amara plus: 24$ al mese

5. Rev

Rev è la soluzione adatta per chi cerca un servizio di audio trascrizione che non faccia fatica con i termini tecnici. Tramite l’editor si può evidenziare, sottolineare, barrare il testo e si possono anche aggiungere commenti e note. Offre anche il servizio di captioning automatico per Zoom, che a fine chiamata permette anche di scaricare la trascrizione della riunione.

Tra tutte le soluzioni proposte probabilmente è quella meno conosciuta, infatti molti utenti fanno notare lo scarso investimento dell’azienda in marketing. Nonostante ciò la qualità del servizio è ottima e le recensioni sono numerose e molto positive.

Caratteristiche

Accuratezza: dipende dalla qualità audio, ma affermano 90%+
Lingue: non specificate
Turnaround: 5 minuti
Multi speaker: sì
Burn in nativo: sì
Personalizzazione sottotitoli: sì
Prova gratuita: 45 minuti

Pro

  • Permette di aggiungere dizionari personalizzati.
  • È molto veloce.

Contro

  • Può presentare problemi con accenti diversi.

Costi

Per la trascrizione automatica: 0.25$ al minuto.
Per le caption Zoom: 20$ per host.

6. Ooona

Se preferite lavorare alla “vecchia maniera”, Ooona è lo strumento web-based più completo sul mercato per la creazione manuale di sottotitoli e trascrizioni. Più in generale, è una soluzione a 360° per chi lavora nel campo della localizzazione e nella traduzione audiovisiva.

Dato che si lavora completamente in modalità manuale, Ooona è dotato di controlli molto precisi per il movimento della timeline, il posizionamento sullo schermo dei sottotitoli e altre funzioni avanzate come il riconoscimento del cambio della scena, il burn-in e la codifica. L’interfaccia permette anche la traduzione dei sottotitoli (sempre manuale) partendo dal template originale.

In controtendenza rispetto agli altri strumenti simili, Ooona non è una soluzione “tutto in uno” ma è modulare, perché si compone di vari tool separati, in modo da adattarsi in modo flessibile alle necessità di ogni azienda. Secondo me però è una scelta piuttosto disorientante, che si riflette anche sulla struttura dei prezzi.

Ooona Tools

Infatti sono disponibili ben sette tool diversi, ognuno con il suo prezzo. Per alcuni dei tool è presente una versione standard più economica, che include le funzioni di base, e una versione pro più cara, che invece dà accesso alle funzioni più avanzate, come per esempio il riconoscimento del cambio di scena. Lo stesso vale per i pacchetti, che raggruppano vari tool a prezzo scontato. Per complicare ulteriormente le tariffe, alcuni tool sono offerti anche in abbonamento settimanale, mentre altri hanno ricorrenza solo mensile, semestrale o annuale.

Pro

  • Potente
  • Flessibile
  • Personalizzabile
  • Facile da usare

Contro

  • La struttura modulare può generare confusione e ciascun tool richiede un abbonamento a parte.
  • È più costoso rispetto alla concorrenza.

Costi

Pacchetto Standard: 84$ al mese, include: Create, Translate, Standard Subtitle Converter, Compare.
Pacchetto Pro: 248$ al mese, include: Create Pro, Translate Pro, Standard Subtitle Converter, Compare, Transcribe, Burn & Encode.

7. Subtitle Next

Subtitle Next è una piattaforma professionale per la creazione di sottotitoli, doppiaggio e captioning, sia offline che online. Dispone di funzionalità molto avanzate ed è completamente personalizzabile.

Offre la possibilità di creare sottotitoli in tempo reale, anche per Zoom, e dalla versione 5.11 si possono generare automaticamente sottotitoli già tradotti dall’audio, sia per eventi live (come per esempio per live Twitch) che per contenuti offline. Trattandosi di un software così complesso, è consigliato per esperti del campo. Per quanto riguarda il pricing, dispone di diversi tipi di abbonamenti mensili e di bundle una tantum.

Pro

  • Si possono caricare video da qualsiasi link, anche direttamente dai social, senza doverli scaricare.
  • Compatibile con tutte le lingue.
  • Attualmente uno dei pochi software che offre sottotitoli già tradotti dall’audio senza nessun passaggio aggiuntivo.

Contro

  • Non adatto a chi ha iniziato da poco o per studenti, l’interfaccia grafica è troppo complessa.
  • Molto costoso.

Costi

Abbonamenti mensili:
SubtitleNEXT Explorer: 70€ al mese, è il pacchetto base per creare sottotitoli e traduzioni.
Live Subtitles Bundle: 140€ al mese, include: SubtitleNEXT Explorer, SubtitleNEXT Live Option (per la realizzazione di sottotitoli in tempo reale) e SubtitleNEXT Spark (per mostrare i sottotitoli generati in tempo reale su dispositivi esterni).
SubtitleNEXT Vlogger: 180€ al mese, include la creazione, modifica e formattazione dei sottotitoli, la visualizzazione dei sottotitoli su video o stream, sottotitoli in tempo reale di stream live su YouTube o altre piattaforme e la trascrizione automatica in una sola lingua.
Licenze una tantum:
Novice: 350€, per principianti e freelance, include tutte funzioni essenziali per completare un progetto.
Explorer: 900€, un pacchetto completo per lavorare con testi che richiedono sincronizzazione.
Expert: 2950€, per professionisti e organizzazioni, comprende l’intera suite di prodotti.

8. Konch

Konch

Konch è un software di trascrizione automatica molto semplice, indicato per le istituzioni e per l’ambito dell’educazione.

Dispone di un editor per modificare le trascrizioni e per aggiungere note, commenti ed evidenziazioni, ed è costruito per permettere a team di più persone di collaborare alla stessa trascrizione senza intoppi. Il testo risultante può essere tradotto automaticamente. Rispetta le norme del GDPR. Offre 15 minuti di prova gratuiti.

Caratteristiche

Accuratezza: molto alta
Lingue: 30+
Turnaround: pochi minuti
Multi speaker: manuale
Burn in nativo: no
Personalizzazione sottotitoli: no
Prova gratuita: 15 minuti

Pro

  • Interfaccia senza fronzoli.
  • Traduzione automatica.
  • Economico.
  • Rispetta le norme del GDPR.

Contro

  • Nessuna funzione avanzata.

Costi

Pay as you go: 8$ per ora di audio.
Abbonamento: 32$ al mese (5 ore incluse, poi 8$ per ora).

9. Media.io

Media.io è un software molto completo per la modifica, la conversione e la compressione di audio e video, per questo è particolarmente adatto per content creator di qualsiasi genere. Tra i suoi servizi ci sono anche la generazione (e traduzione) automatica dei sottotitoli e la trascrizione automatica di audio o video. Funziona via browser, quindi si può utilizzare su qualsiasi piattaforma (desktop e smartphone) e sistema operativo.

Caratteristiche

Accuratezza: più del 90%
Lingue: 11 per la trascrizione, 90 per i sottotitoli
Turnaround: pochi minuti
Multi speaker: non specificato
Burn in nativo: sì
Personalizzazione sottotitoli: sì
Prova gratuita: 10 minuti

Pro

  • Non applica watermark.
  • Permette un livello elevato di personalizzazione.
  • Estremamente economico.
  • Traduzione automatica dei sottotitoli.

Contro

  • Non adatto per grandi quantità di contenuti.
  • Strumento di montaggio video generico, non specifico per sottotitoli.

Costi

3.95$ al mese: 2 ore di sottotitoli e trascrizione, fino a 100.000 caratteri di trascrizione.
6.66$ al mese: 6 ore di sottotitoli e trascrizione, fino a 200.000 caratteri di trascrizione.

10. Subly

Subly Subly è un altro software particolarmente consigliato per i creator. Offre le funzioni di trascrizione automatica e sottotitolazione (e traduzione) automatica, oltre alla possibilità di ridimensionare i video in base ai formati più utilizzati sui social e un tool per la creazione di post utilizzando le frasi della trascrizione.

Caratteristiche

Accuratezza: fino al 98%
Lingue: 67+
Turnaround: pochi minuti
Multi speaker: funzione premium
Burn in nativo: sì
Personalizzazione sottotitoli: sì
Prova gratuita: 7 giorni, 240 minuti.

Pro

  • Feature aggiuntive come il ridimensionamento dei video.
  • Creator friendly.
  • Prova gratuita molto generosa.
  • Economico.

Contro

  • Non sempre molto preciso, gli utenti riportano errori come assenza della punteggiatura e delle maiuscole.
  • Non adatto a contenuti molto lunghi.

Costi

Pay as you go: 0.60$ per minuto.
Abbonamento Pro: 17$ al mese. Include 100 minuti al mese, con 10 GB di storage e dimensione massima di upload 1 GB per file.
Abbonamento Premium: 39$ al mese. Include 240 minuti al mese, 50 GB storage e dimensione massima di upload 2 GB per file, sottotitolazione, e permette l’upload dei file sia via URL che tramite Google Drive.
Abbonamento Business: 218$ al mese, include 1000+ minuti, 200 GB di storage e dimensione massima di upload 5 GB per file.

Un’opzione futuristica

È chiaro che con così tante opzioni disponibili sul mercato, la tecnologia necessaria per il text-to-speech sia ormai ampiamente affermata. Ma come ci ha dimostrato DALL-E, l’intelligenza artificiale in grado di generare immagini in base a una didascalia di partenza, non esiste davvero un limite a quello che le IA possono raggiungere. Infatti la stessa OpenAI, madre di DALL-E, sta lavorando anche a un sistema che promette di rendere obsoleti tutti i software di questo elenco: Whisper.

Si tratta di una rete neurale in grado di raggiungere una capacità di riconoscere il parlato (in lingua inglese) uguale a quella umana. Ma la vera svolta di questa tecnologia è che sarà in grado di comprendere la voce a prescindere dalla qualità dell’audio, che attualmente è il più grande ostacolo del text-to-speech. Questo vuol dire che chi vorrà affidarsi alla trascrizione automatica di audio non dovrà preoccuparsi più della presenza di rumori di fondo, musica e altri tipi di suoni, rendendo la tecnologia text-to-speech non solo più precisa ma anche più accessibile.

Whisper attualmente è open-source e quindi scaricabile da chiunque, a patto che abbia un computer in grado di sopportare le prestazioni richieste dal programma. Whisper promette anche di lavorare senza problemi con linguaggi tecnici e di effettuare trascrizioni in multilingua.

Ma dato che Whisper non è ancora realtà ー o almeno, non per tutti ー l’unico modo di ottimizzare al massimo la trascrizione automatica è prendere delle precauzioni quando si registra l’audio. Se invece cerchi una trascrizione accurata al 100%, in grado di riportare fedelmente ogni parola a prescindere da accavallamenti, accenti e termini tecnici, nessuno può battere la competenza di professionisti esperti, sia per le trascrizioni che per i sottotitoli.

Contattaci senza impegno se ti serve una mano per sottotitolare o trascrivere i tuoi video!

Copywriter, content writer e social media manager. Laureata in Mediazione Linguistica presso l’Università Roma TRE, Master in Traduzione Audiovisiva presso ISTRAD e Digital Marketing e Communication Specialist presso ITS Academy Machina Lonati
Traduttore tecnico, project manager, mentore e ammiratore dell’ingegno. Socio fondatore di Qabiria.

Leggi anche:

Parla con uno di noi

Spiegaci cosa ti serve con una mail a hola@qabiria.com o attraverso il modulo di contatto. Risposta garantita entro 24 ore, ma di solito molto prima.

Contattaci