Tagging linguistico per NLP
In varie occasioni abbiamo collaborato con un’azienda leader nell’elaborazione del linguaggio naturale (NLP) che aveva bisogno di etichettare un enorme corpus di testi in italiano e in inglese.

L’approccio di Qabiria nel comprendere le nostre esigenze ha garantito un’esperienza impeccabile dall’inizio alla fine. Con Qabiria non si tratta solo di ottenere i risultati sperati, ma di superare le aspettative. Consigliamo vivamente i loro servizi a chiunque cerchi una professionalità senza compromessi e soluzioni orientate ai risultati.

500
mila parole
8
linguisti coinvolti
3
settimane di tempo
Informazioni su Leader nell’elaborazione del linguaggio naturale
Fornitore di strumenti e servizi per l’annotazione di corpora e dataset, sia a livello di parole che di frasi.
Il case study in sintesi
Settore | IT e software |
---|---|
Servizi | Consulenza |
Lingue | Italiano, Inglese |
La sfida
I servizi linguistici attuali vanno al di là della semplice traduzione. In Qabiria siamo abituati ad affrontare progetti a cavallo di diverse discipline.
Nel 2020 siamo stati contattati da un’azienda leader nell’elaborazione del linguaggio naturale (NLP) che aveva bisogno di etichettare un corpus di testi, tratti dalle conversazioni di un social network, che presentavano varie lingue mescolate fra loro. L’etichettatura, o tagging, comportava identificare le lingue, le parti del discorso e le funzioni svolte da ciascun elemento.
Il progetto era particolarmente complesso per vari motivi: innanzitutto, le tempistiche molto strette del cliente. Sottoposto alla pressione del committente finale, un grosso gruppo internazionale, il progetto di circa 500.000 parole andava completato in sole 3 settimane.
In secondo luogo era richiesto l’uso di brat rapid annotation tool, uno strumento specifico di annotazione strutturata, che fino a quel momento non avevamo mai utilizzato. In questo caso era sufficiente collegarsi tramite un browser all’istanza di brat presente sui server del cliente per accedere alle attività assegnate e svolgerle in modalità collaborativa.
Infine, la presenza di altre lingue, oltre all’italiano, comportava un’ulteriore complicazione, in quanto bisognava distinguere l’uso di semplici anglicismi, molto frequenti in italiano, dalle parti propriamente in altre lingue.
La soluzione
Per far fronte all’urgenza del cliente abbiamo approntato in pochi giorni una squadra di 8 linguisti che hanno lavorato in modo coordinato. Dopo averli formati sull’attività da svolgere e sul sistema da usare, abbiamo assegnato a ciascuno la sua parte e abbiamo allestito un sistema per tenere traccia delle ore spese.
Qabiria ha inoltre assegnato un project manager dedicato a questo incarico. Questa persona manteneva i contatti con il cliente, controllava il rispetto delle tempistiche, rispondeva ai dubbi dei linguisti e si occupava della supervisione di tutto il progetto.
Il risultato
Dopo aver portato a termine una prima parte del progetto nei tempi e nei modi richiesti, il cliente ha manifestato la sua piena soddisfazione e ha inviato altri lavori di tagging simili nei mesi successivi.
Per affrontare questi nuovi lavori abbiamo ottimizzato ulteriormente i procedimenti e ridotto sensibilmente i tempi di consegna, mantenendo comunque lo stesso livello di qualità.
Leggi anche:
Servizi offerti ad Leader nell’elaborazione del linguaggio naturale
Traduzioni in inglese
Abbiamo tradotto i testi di marketing di Leader nell’elaborazione del linguaggio naturale in inglese.
Scopri i servizi di traduzione in ingleseTraduzioni in spagnolo
Abbiamo tradotto i testi di marketing di Leader nell’elaborazione del linguaggio naturale in spagnolo.
Scopri i servizi di traduzione in spagnoloLocalizzazione web
Abbiamo aiutato Leader nell’elaborazione del linguaggio naturale a internazionalizzare il suo e-commerce.
Scopri il servizio di localizzazione webOttieni gli stessi risultati di Leader nell’elaborazione del linguaggio naturale!
Spiegaci cosa ti serve con una mail a hola@qabiria.com o attraverso il modulo di contatto. Risposta garantita entro 24 ore, ma di solito molto prima.
Contattaci