Skip to main content

Per mestiere, mi occupo da anni di ricerca e di comunicazione scientifica, con una predilezione per il ruolo delle donne nella scienza, per cui non sono certo a digiuno di certi temi legati alla produzione scientifica, all’elaborazione statistica, alla neutralità e alle tante forme che le discriminazioni possono assumere.

Ma più passa il tempo, più mi rendo conto che il mio lavoro ha fortissime implicazioni sociali, con buona pace della mia formazione iniziale in biologia, specializzazione zoologia dei rettili.
L’autoformazione, già parte integrante del mio lavoro di divulgatrice, si è imposta ancor di più quando ho sentito di voler contribuire attivamente a un cambiamento, a un’evoluzione della società, anche attraverso la mia appartenenza all’associazione francese Donne e scienza (Femmes & Sciences).

È quindi con grande interesse e curiosità che ho cominciato (e terminato due ore e mezza dopo) il saggio Quando i dati discriminano di Donata Columbro – giornalista e docente di data journalism e data visualization – edito da Il Margine.

libro dati che discriminano di donata columbroPenso che questa piacevole lettura, chiara e accessibile, sostanziosa e sintetica allo stesso tempo (qualità rara), diventerà per me un vocabolarietto da consultare all’occorrenza, non solo per la bibliografia e le numerose citazioni, ma anche perché ha messo ordine alle mie conoscenze e ha fornito una conferma circonstanziata alle opinioni professionali che ho maturato negli anni.

Veniamo al contenuto del libro. Lo riassumo aggiungendo qualche mia considerazione e passando brevemente in rassegna quelli che, secondo me, sono i due grandi temi tramite i quali l’autrice spiega i bias e i pregiudizi presenti in grafici, statistiche e algoritmi.

Che cos’è un dato e come viene prodotto?

Nel pamphlet di Donata Columbro scopro che la parola “dato”, in lingua inglese, appare per la prima volta nel 1646 in un trattato religioso per indicare un dogma, un’informazione immutabile. Ma un dato non è qualcosa che, come suggerirebbe il nome, ci viene dato, non è qualcosa di puro e già pronto che scende dal cielo come la manna.

Un dato è qualcosa che è stato raccolto, per cui ha molta importanza chi l’ha raccolto, come, perché e anche quando. Anche con le migliori intenzioni di imparzialità, i dati non saranno gli stessi se raccolti da diversi gruppi umani – per esempio gruppi dominanti o minoritari – o in diverse epoche storiche.

Questo perché la raccolta dei dati presuppone una scelta, una decisione. Cosa raccolgo? In che periodo e luogo? Con quali strumenti? Con quale scopo? E la situazione non migliora se il dato è stato selezionato da un software, un’applicazione o un’intelligenza artificiale, perché anche questi sono prodotti creati dagli esseri umani in seguito a scelte precise, anche se non sempre conosciute o evidenti.

Ecco che nasce il concetto di dati situati. Anch’io, come Donata Columbro nei suoi scritti, cito la filosofa della scienza e femminista Donna Haraway nei miei corsi di formazione alla comunicazione scientifica, quando si parla di neutralità.

“La conoscenza situata” scrive Haraway “implica l’interrogarsi sulla posizione del soggetto produttore di conoscenza, sui limiti della sua visione, sulle relazioni di potere in cui è inserito. È prendendo coscienza della situazione dello studioso e del luogo da cui parla che si ha la possibilità di raggiungere una maggiore obiettività.”

Come possono dei semplici dati portare a una discriminazione?

Vi propongo un esempio semplificato al massimo, legato al precedente discorso sui dati situati. Finché la ricerca in medicina si è creduta neutra, imparziale e universale, essa non ha capito né preso in considerazione le differenze nelle malattie e nelle cure legate a corpi diversi dal corpo considerato medio, ossia il corpo giovane, maschile e bianco.

Solo mettendo in discussione i bias di cui la ricerca era vittima, si è potuto scoprire che altri corpi, femminili, neri o altro, potevano presentare diversità fisiologiche e patologiche e reagire diversamente alle medicine o a diversi trattamenti. Questo è uno dei numerosi casi in cui la mancanza di dati, o una scelta sbagliata nel raccoglierli, determina una forte discriminazione, con conseguenze anche gravi sulle persone.

Dal canto suo, Donata Columbro prende come esempio l’invisibilizzazione della situazione finanziaria di donne che guadagnano molto meno del marito e che in famiglia non hanno una posizione dignitosa, cioè non hanno libero accesso alle risorse economiche comuni e non hanno un conto bancario personale. Queste donne non rientrano nel conteggio delle persone povere. Non ci sono dati su di loro, si conteggia solo il livello economico della famiglia. Qui la mancanza di dati determina l’assenza di dispositivi di aiuto economico per queste persone in caso di divorzio, per esempio. Sarebbe utile ottenere statistiche disaggregate, cioè che tengano conto delle differenze nei sottogruppi di popolazione all’interno della popolazione totale.

Anche gli algoritmi discriminano? Certo che sì ! Non so come siate capitati sul mio sito. Forse mi conoscete, forse avete già lavorato con me o forse siete arrivati qui immettendo qualche parola chiave in un motore di ricerca. Quando ho costruito il sito, mi sono posta il problema del referenziamento, o SEO, ossia di come rendere il mio sito visibile e raggiungibile da potenziali clienti. Sapevo di avere meno possibilità di essere contattata rispetto a un collega uomo, visto che dappertutto si legge divulgatrice, comunicatrice, formatrice. Chi digita su Google cercasi divulgatrice (ma anche cercasi biologa, avvocata, idraulica)? Solo qualcuno che cerca specificamente una divulgatrice donna, per esempio per garantire la parità in un programma della televisione pubblica italiana. È successo a me e non è una mia congettura, mi è stato spiegato dalla persona quando ho chiesto come mi aveva trovata.

Ma allora?

Se i dati non sono neutri, tutto è relativo? Non si può contare su niente di certo? La scienza ci mente? Potrebbe chiedersi qualcuno, anzi si chiedono già molte persone, troppo facilmente etichettate come complottiste o ignoranti.

E qualche ricercatore o ricercatrice, medico o medica, divulgatore o divulgatrice, potrebbe domandarsi se non sarebbe meglio lavare in casa i panni sporchi, evitando di esporre al pubblico i limiti della ricerca, dalla raccolta dei dati, alle frodi, agli errori, alla comunicazione fuorviante dei risultati.

La scienza è un fenomeno complesso, ma soprattutto è un fenomeno umano. Per quanto molto controllato e generalmente affidabile, ha tutti i difetti umani. Ciononostante io – come Donata Columbro e molti altri – non faccio parte delle persone che pensano che il pubblico medio (qualsiasi cosa questo voglia dire) non debba sapere certe cose perché può interpretarle male.

Ci vengono in aiuto la trasparenza, come forma di onestà intellettuale e rispetto del pubblico, e la riflessività, intesa come valutazione critica del proprio lavoro.
Per esempio, in fase di raccolta ed elaborazione dei dati, come suggerisce Donata Columbro, deve prevalere un impegno attivo per evitare di selezionare informazioni parziali, riconoscendo i propri privilegi e i propri bias. Ancora una volta la conoscenza situata.

 

Se hai trovato questo articolo utile o interessante, condividilo sui tuoi social o mandalo a qualcuno che potrebbe averne bisogno, grazie!