Dubber: superare i pregiudizi nel NLP e nel riconoscimento vocale

  • Redazione
  • 04/04/2022
  • Tempo di lettura: 3 minuti

L’elaborazione del linguaggio naturale (NLP) è un tipo specifico di tecnologia AI che permette ai computer di comprendere il testo e il discorso, in modo simile a come farebbe un umano.

Le implicazioni pratiche e i benefici di questa tecnologia sono significativi per il successo aziendale. Ora, i computer sono in grado di elaborare, analizzare e comprendere una grande quantità di informazioni, non solo da fonti di testo scritto come le biblioteche o Internet, ma anche da conversazioni parlate come le riunioni di lavoro. Con questo, per esempio, le organizzazioni possono far trascrivere automaticamente le riunioni, risparmiando un’enorme quantità di tempo e denaro.

Alcuni esempi di come l’applicazione della PNL - in particolare in - può aiutare un business ad avere successo sono attraverso:

Guardando specificamente al speech-to-text e all’analisi, c’è una serie di applicazioni in cui questo tipo di tecnologia può sostenere le aziende.

NLP può analizzare il sentiment nelle conversazioni con i clienti in tempo reale, avvisando i manager di potenziali conflitti che richiedono assistenza, o suggerendo all’operatore un diverso script da seguire. Può anche raccogliere gli argomenti e i temi più importanti o d’impatto sollevati in una riunione e trasformarli in verbali di riunione, compresi gli elementi di azione.

Con la capacità di misurare l’impegno dei dipendenti in particolari progetti, la tecnologia può sostenere il personale che è meno impegnato o offrire abilitazione a quelli più impegnati.

Infine, determinando i livelli di interesse dei clienti in diversi marchi, prodotti o servizi durante le conversazioni, le aziende possono ottenere informazioni di mercato attraverso l’analisi del discorso.

Nonostante questi vantaggi significativi, un problema chiave con questa tecnologia è la distorsione. Per saperne di più, abbiamo parlato con Iain McCowan, direttore di AI a Dubber che ha condiviso la sua visione

Perché ci sono problemi di bias nella PNL e nel riconoscimento vocale? Come si verificano?

I moderni modelli NLP sono addestrati su grandi insiemi di dati, quindi in definitiva la maggior parte delle distorsioni deriva da qualsiasi distorsione insita nell’insieme di dati. Poiché gli Stati Uniti sono l’economia più significativa e il luogo in cui sono nate molte tecnologie NLP recenti, storicamente ci sono state molte più risorse linguistiche per l’inglese americano che per qualsiasi altra lingua o dialetto. Questo ha fatto sì che la maggior parte delle tecnologie vocali e linguistiche, ancora oggi, forniscano la migliore accuratezza e le caratteristiche più ricche per gli utenti dell’inglese americano. Un altro fattore di distorsione che può essere presente nei dati è la distorsione storica, in cui i vecchi set di dati di formazione possono riflettere stereotipi o pregiudizi della società obsoleti.

Negli ultimi anni, il bias dei dati di formazione è stato affrontato attraverso due approcci principali:

Raccogliere e migliorare la disponibilità di serie di dati linguistici più varie e aggiornate. Un esempio di questo è il progetto Common Voice di Mozilla. Concentrare la ricerca su metodi che migliorano le prestazioni per le lingue con poche risorse, come il cosiddetto apprendimento auto-supervisionato per pre-addestrare modelli NLP che possono essere utilizzati per una serie di compiti finali senza bisogno di grandi set di dati annotati. Questo rende più facile l’apprendimento di modelli per le lingue meno comuni dove non ci sono molti set di dati annotati di grandi dimensioni disponibili. Un esempio è XLM-R .

Questi approcci possono essere utilizzati non solo per affrontare la diversità linguistica, ma anche per ridurre i pregiudizi contro qualsiasi popolazione sottorappresentata.

Ciao, sono Michele!

Sono molto felice di saperti qui.
Ogni giorno ti raccontiamo qualcosa di nuovo sull'AI e sulle nuove tecnologie. Seguici sui social o iscriviti alla newsletter!

Iscriviti alla newsletter!

Iscrivendoti accetti la nostra Privacy Policy

Ti va di rimanere aggiornatə?

Niente spam, niente pubblicità. Ogni tanto una mail. Tutto qui.
(Ah, ovviamente i tuoi dati non verranno mai ceduti)

Iscrivendoti accetti la nostra Privacy Policy