AI

Fallimento narrativo nell'analisi dei dati

  • Redazione
  • 13/01/2022
  • Tempo di lettura: 5 minuti

Un’analisi dei dati può fallire se non presenta una storia coerente e “chiude tutte le porte”. Un tale fallimento non è semplicemente un problema di comunicazione, ma spesso indica un problema con i dettagli dell’analisi stessa.

Nell’analisi dei dati c’è spesso una distinzione tra fare l’analisi dei dati e comunicare l’analisi dei dati. L’idea è quella di analizzare i dati e poi di elaborare una sorta di narrazione che spieghi cosa sta succedendo con i dati. C’è un senso in cui queste sono fasi distinte di un processo.

Tuttavia, considerare la narrazione o la storia di un’analisi dei dati può contribuire a migliorare la qualità di un’analisi dei dati e quindi dovremmo riconsiderare se l’idea di storia e l’idea di analisi non sono correlate.

Quello di cui non stiamo parlando qui è di adattare l’analisi dei dati per raccontare una storia specifica. Il pericolo che la maggior parte delle persone teme è che si arrivi prima ad una storia e poi si scelgano gli elementi di un’analisi dei dati che sono allineati con quella storia (e si rimuovano gli elementi che contraddicono la storia).

Il tipo di storia di cui stiamo parlando qui coinvolge la spiegazione della sequenza di passi che vengono fatti come parte dell’analisi. Se si dovessero esaminare i passi compiuti in un’analisi dei dati, si potrebbe inventare una sorta di “storia” o narrazione che potrebbe essere raccontata su quei passi.

Per esempio, una breve analisi dei dati potrebbe essere così:

Abbiamo letto i dati, poi abbiamo fatto un istogramma di x, e poi abbiamo fatto una regressione lineare di y su x.

Questa è la “storia” dell’analisi. Qualsiasi analisi reale dei dati avrà probabilmente una storia più complessa, ma l’idea di una storia o narrazione rimane. È importante pensare alla storia che si sta costruendo mentre si analizzano i dati. Può servire come un modo per organizzare i vostri passi e può guidarvi nella pianificazione dei passi futuri.

Come per ogni storia, la storia o la narrazione dell’analisi dei dati deve avere un senso. Il problema con la storia che ho appena raccontato è che non ha senso. Perché abbiamo fatto un istogramma? Perché non un boxplot o uno scatterplot? Perché abbiamo fatto una regressione? Perché non usare un approccio più flessibile? Queste domande non riguardano la storia di come vengono interpretati i risultati, ma la storia dell’analisi stessa.

Chiudere tutte le porte

Nel documentario Showrunners: The Art of Running a TV Show, Bill Prady, creatore della lunga serie televisiva comica The Big Bang Theory, parla delle sfide di scrivere commedie rispetto al dramma. Sostiene che scrivere commedie è più difficile che scrivere drammi perché nella commedia spesso si mettono le persone in situazioni ridicole. Ma semplicemente mettere qualcuno in una situazione ridicola non è intrinsecamente divertente. Piuttosto, devi scrivere la storia in modo che il personaggio debba essere messo in quella situazione Dice Prady:

Il nostro gergo nella sala [degli sceneggiatori] è che devi chiudere tutte le altre porte, in modo che l’unica porta disponibile per questo personaggio sia quella che conduce alla grande scena comica in blocco che vuoi fare…. Devi arrivare al punto in cui il pubblico direbbe: “Sai cosa, se fossi in quella situazione, dannazione se non farei la stessa identica cosa!

Supponiamo che tu stia guardando un film su una rapina in banca di notte e che i rapinatori abbiano tutti i tipi di problemi perché è buio. Forse è divertente, ma non se stai pensando tra te e te: “Perché non hanno portato delle torce elettriche? Se vi trovate a fare questa domanda, allora questo è un fallimento narrativo. Gli autori della storia non hanno chiuso tutte le porte. Non hanno trovato una ragione per spiegare perché i rapinatori non avessero delle torce, tanto per cominciare.

I fallimenti narrativi in un film o in uno show televisivo rappresentano dei vuoti di logica che lo spettatore deve imputare o semplicemente essere confuso. In entrambi i casi, non è qualcosa che vuoi che lo spettatore faccia. Si vuole che la storia abbia un senso e che ogni sequenza della storia segua gli eventi precedenti.

Lo stesso vale per l’analisi dei dati. Se avete mai visto una presentazione di un’analisi dei dati e avete pensato: “Perché non hanno semplicemente…” allora il presentatore non ha chiuso una porta. Per esempio, quante presentazioni di machine learning sofisticate avete visto dove avete pensato: “Perché non hanno semplicemente eseguito una regressione logistica?

Tipi di fallimento dell’analisi dei dati

Non esiste una porta perfetta.

Un fallimento narrativo in un’analisi dei dati è un fallimento nel giustificare il percorso scelto nell’analisi rispetto a qualsiasi numero di percorsi alternativi plausibili che avrebbero potuto essere presi. Se queste alternative non sono state escluse, allora rimane una lacuna e il pubblico sarà confuso sul perché l’alternativa non è stata provata. È compito dell’analista eseguire alcune di queste analisi alternative o presentare alcune prove sul perché non sono preferibili. Escludere queste analisi alternative fa parte della costruzione di una narrazione di successo dell’analisi dei dati.

L’idea del fallimento narrativo arriva a un aspetto difficile dell’analisi dei dati che gli studenti hanno difficoltà a capire, cioè che raramente c’è un unico modo “giusto” o “migliore” di fare un’analisi. In altre parole, raramente c’è una sola “porta” da attraversare. Spesso, ci sono molte porte da attraversare, e quasi non importa quale porta si sceglie, basta che si riesca a chiudere tutte le altre lungo la strada. Se scegli la porta 1, la gente potrebbe chiederti: “Perché non hai scelto la porta 2? E se scegliete la porta 2 allora la gente vi chiederà della porta 1. Non c’è una porta perfetta da attraversare, devi solo chiuderne una e attraversare l’altra.

Ciao, sono Michele!

Sono molto felice di saperti qui.
Ogni giorno ti raccontiamo qualcosa di nuovo sull'AI e sulle nuove tecnologie. Seguici sui social o iscriviti alla newsletter!

Iscriviti alla newsletter!

Iscrivendoti accetti la nostra Privacy Policy

Ti va di rimanere aggiornatə?

Niente spam, niente pubblicità. Ogni tanto una mail. Tutto qui.
(Ah, ovviamente i tuoi dati non verranno mai ceduti)

Iscrivendoti accetti la nostra Privacy Policy