18.000 film tradotti in mezz'ora

(2 voti)
18.000 film tradotti in mezz'ora

Uno dei nostri clienti abituali è specializzato nella redazione e traduzione di domande a quiz, di quelle che si trovano comunemente nei programmi televisivi come Chi vuol esser milionario, nei giochi in scatola o anche in quei giochi elettronici da bar ultimamente molto di moda (soprattutto all'estero). Sta di fatto che da qualche anno alterniamo ai consueti manuali tecnici e siti web questi divertenti progetti.

Abbiamo tradotto (e in varie occasioni anche creato ex novo) diverse migliaia di domande, sia di cultura generale, che di sport, cinema, videogiochi, ecc. Ricordo con particolare piacere un progetto interamente dedicato a Star Trek, che mi ha convertito in un trekkie incallito, o un altro dedicato alla storia del calcio italiano, nel quale mi sono avvalso della collaborazione di un paio di amici tifosi sfegatati.

L'ultimo lavoro a cui abbiamo partecipato riguardava domande sulla fantascienza nelle sue varie manifestazioni: cinema, letteratura, fumetti e TV. In moltissime domande si citavano titoli di film, per cui (e arriviamo al nocciolo di questo articolo) mi sono trovato subito con un problema da risolvere: come velocizzare il reperimento degli equivalenti italiani dei titoli citati in inglese.

Normalmente ricorro a un dizionario del cinema in CD-ROM oppure al sito IMDB.com (per i film più recenti che non compaiono nel dizionario), ma i tempi di consulta sono comunque eccessivi, anche automatizzando la ricerca con strumenti quali IntelliWebSearch o simili. Allora ho pensato di ricorrere a uno stratagemma: recuperare un indice di titoli originali con il loro corrispettivo italiano. Si dà il caso che il Dizionario dei film di Paolo Mereghetti abbia proprio un indice dei titoli originali. Mi sarebbe bastato digitalizzare le pagine dell'indice, convertirle a testo con un programma di OCR e quindi formattare il risultato come file di glossario.

Purtroppo però l'indice è composto da oltre 100 pagine e sarebbe stato necessario un lavoro di varie ore, senza garanzie sul risultato finale, per un motivo molto concreto: il volume del Mereghetti è rilegato in modo tale che risulta difficile appiattirlo per metterlo su uno scanner. Il testo più vicino alla rilegatura sarebbe stato quasi sicuramente distorto, inficiando i risultati del riconoscimento dei caratteri con l'OCR.

Poi ho avuto un'illuminazione: i dati dell'IMDB sono disponibili anche offline, suddivisi in vari file. Il loro utilizzo è soggetto a una licenza abbastanza restrittiva: “The data can only be used for personal and non-commercial use and must not be altered/republished/resold/repurposed to create any kind of online/offline database of movie information (except for individual personal use)”. Tuttavia, dato che la rielaborazione che avevo in mente non presupponeva uno scopo di lucro, ho deciso che potevo accettare questi termini e sono così entrato nel sito FTP su cui sono ospitati i file.

Qui ho avuto una piacevole sorpresa: sul sito è presente un file chiamato italian-aka-titles.list.gz che contiene esattamente quello che stavo cercando, ovvero i titoli italiani dei film il cui titolo italiano è diverso da quello originale (cioè mancano tutti quelli che hanno lo stesso titolo). Ho subito scaricato il file, notando tuttavia che contiene i film solo fino all'anno 2001. Un piccolo problema, dato che molti quiz si riferiscono a film recenti, ma - come si dice - I can live with that. Se avessi voluto, è presente anche un file, aggiornato di continuo, chiamato aka-titles.list.gz che contiene le traduzioni dei titoli originali per TUTTI i paesi, ma implicava un lavoro di conversione maggiore rispetto a quello che contiene solo i titoli italiani.

Difatti, da un punto di vista tecnico ero solo a metà dell'opera. Mi rimaneva ancora da modificare il formato del file in modo che fosse automaticamente riconoscibile da OmegaT, il software che usiamo per la traduzione. Il file di testo scaricato da IMDB, pur non essendo strutturato, segue una formattazione costante:

Hell Bent for Leather (1960)
(aka Duello tra le rocce (1960)) (Italy)

Hell Boats (1970)
(aka Diavoli del mare, I (1970)) (Italy)

Mediante alcune semplici espressioni regolari, in pochi minuti ho convertito il file in un formato a 3 colonne, in cui la prima contiene il titolo originale, la seconda quello italiano e la terza l'anno di uscita (in Italia). Successivamente, con un'altra espressione regolare ho riordinato gli articoli, ovvero il passaggio è stato:

  
Tortoise and the Hare, The (1935)
(aka Lepre e la tartaruga, La (1935)) (Italy)

Tortoise and the Hare, The ->Lepre e la tartaruga, La -> (1935)

The Tortoise and the Hare -> La Lepre e la tartaruga -> (1935)

Al termine del lavoro (durato complessivamente meno di mezz'ora) mi sono ritrovato un semplice glossario con oltre 18.000 titoli di film, che si sta rivelando essenziale per tradurre il più velocemente possibile questi riferimenti. Con un po' di pazienza e qualche espressione regolare si possono davvero fare miracoli.

Qabiria white logo

Crediamo nell’aumento della produttività attraverso l’uso creativo della tecnologia.

il traduttore insostituibile

Ultime notizie

Contatti

Qabiria Studio SLNE
Carrer Lleida, 3 1-2
08912 Badalona
(Barcelona)
SPAGNA

+34 675 800 826

qabiria

Inviaci un messaggio

Ricevi la newsletter

Vuoi leggere gli articoli e le novità di Qabiria direttamente nella posta?