AI

Implementare l'analisi del testo e l'elaborazione del linguaggio naturale per un vantaggio strategico

  • Redazione
  • 04/03/2022
  • Tempo di lettura: 4 minuti

Implementare l’analisi del testo e l’elaborazione del linguaggio naturale per un vantaggio strategico

Quasi tutto quello che si sa sull’analisi del testo, o che si pensava di sapere, sta cambiando. Infatti, l’analisi del testo sta cambiando in meglio per diventare più facile, più veloce e più applicabile ai casi d’uso aziendali di quanto non sia mai stato prima, in gran parte grazie ai progressi nell’elaborazione del linguaggio naturale (NLP).

Di conseguenza, questa forma di analisi è alla base di tutto, dalla tradizionale sentiment analysis alla ricerca in linguaggio naturale e al riconoscimento vocale. Non è più solo un mezzo per applicare la gestione della conoscenza, ma anche un modo di creare azioni per ottenere un vantaggio strategico in qualsiasi numero di domini.

Le modifiche specifiche di come l’analitica del testo è usata in tutta l’impresa includono quanto segue:

♦ Struttura dei dati: Il testo non è più solo relegato nelle torbide incertezze dei dati non strutturati o semi-strutturati, ma può essere regolarmente convertito in dati strutturati e facilmente calcolabili.

♦ Apprendimento automatico avanzato: Diversi approcci di apprendimento automatico relativi a embeddings di parole e ciò che Slater Victoroff, CTO di Indico Data, ha definito “tecniche moderne di IA come l’apprendimento di rappresentazione e la disposizione di manifold” riducono il numero di esempi che i modelli devono imparare, espandendo anche la loro utilità aziendale per l’NLP.

Tassonomie: Come uno dei pilastri del ragionamento simbolico, le tassonomie che contengono conoscenze aziendali sono sempre più accoppiate con processi di apprendimento automatico in una confluenza calcolata di approcci NLP tradizionali e moderni per un’analisi del testo più accessibile.

♦ Riconoscimento vocale: La text analytics si sta rapidamente espandendo per includere l’analisi delle conversazioni parlate con implicazioni di vasta portata per i clienti, lo sviluppo dei prodotti, le opportunità di marketing e le vendite.

L’impatto di questi cambiamenti nell’analisi del testo è duplice. In primo luogo, producono collettivamente una trasformazione globale in modo che l’analitica del testo sia più accessibile a una gamma più ampia di utenti di quanto fosse possibile in precedenza. Inoltre, hanno il merito di aver normalizzato l’analitica del testo in modo che le aziende possano sfruttare abitualmente una delle fonti più preziose di conoscenza aziendale per un vantaggio strategico.

Secondo Marco Varone, CTO di expert.ai, “La comprensione del linguaggio è sempre il passo più importante per cercare di far progredire un sistema informatico allo stato dell’arte e per sbloccare, per le aziende, l’enorme quantità di conoscenza e di informazioni utilizzabili che è disponibile in qualsiasi tipo di comunicazione linguistica, testo, documento o messaggio”.

Il problema non strutturato

Forse la più grande barriera per sbloccare la conoscenza che si trova nel testo è il fatto che è ampiamente considerato come dati non strutturati che non sono conformi alla tradizionale rappresentazione tabellare dei dati Secondo Wayne Thompson, chief data scientist di SAS, tuttavia, le organizzazioni possono facilmente trasmutare il testo in dati strutturati rendendo i documenti “righe” e i termini in essi contenuti “colonne”. Il punto è quantificare quanto spesso ogni parola appare in ogni riga.

“Per esempio, ogni articolo che qualcuno ha scritto è una riga in una tabella e ogni colonna, di cui ce ne sono molte, è un termine”, ha detto Thompson. “Come ‘semantico’ sarebbe una colonna e poi ci sarebbero parole a bassa informazione che elimineremmo come ‘in’ e ‘essere’ e ‘ma’. Sommando il numero di volte in cui i termini appaiono nelle righe del documento, le organizzazioni ottengono rappresentazioni numeriche del testo che si adattano ai modelli relazionali in modo da poter trattare il testo come dati strutturati per avviare certi modelli NLP e i loro casi d’uso”.

Classificare, estrarre e analizzare

Indipendentemente dall’approccio utilizzato, le basi dell’analitica del testo rimangono il processo a tre fasi che Tom Wilde, CEO di Indico Data, ha chiamato “classificare, estrarre e analizzare”. Queste procedure supportano un numero enorme di casi d’uso dell’analisi del testo, dall’automazione intelligente dei processi alle applicazioni di AI conversazionale delle query in linguaggio naturale dei set di dati. Impiegando l’NLP per capire la grammatica di base e la struttura delle frasi del testo, le organizzazioni possono classificare i documenti e le entità specifiche in essi, estrarle come necessario e analizzarle per la loro applicazione a valle di scelta.

“Al di fuori dei casi d’uso tradizionali dell’analitica come la voce del cliente e l’analitica dei media, alcuni dei casi d’uso più interessanti per questo approccio sono l’analitica dei contratti e la gestione delle conoscenze”, ha osservato Victoroff. È fondamentale rendersi conto che quasi ogni forma di NLP segue il suddetto processo in tre fasi, che potrebbe coinvolgere quello che il CEO della Semantic Web Company Andreas Blumauer ha caratterizzato come “riconoscimento delle entità dei nomi e tagging basato sui concetti”. Ciò che differisce è l’approccio utilizzato. Alcuni NLP sono basati sull’apprendimento automatico avanzato, mentre altre forme di NLP si basano pesantemente su tassonomie e regole.

Si prega di abilitare JavaScript per visualizzare i commenti forniti da Disqus.

Ciao, sono Michele!

Sono molto felice di saperti qui.
Ogni giorno ti raccontiamo qualcosa di nuovo sull'AI e sulle nuove tecnologie. Seguici sui social o iscriviti alla newsletter!

Iscriviti alla newsletter!

Iscrivendoti accetti la nostra Privacy Policy

Ti va di rimanere aggiornatə?

Niente spam, niente pubblicità. Ogni tanto una mail. Tutto qui.
(Ah, ovviamente i tuoi dati non verranno mai ceduti)

Iscrivendoti accetti la nostra Privacy Policy