La culturomica e i limiti della ricerca
«La tendenza degli ultimi anni, nella scienza, sono i ‘big data’, e l’arrivo dei dati non cambia solo i dettagli, ma è un mutamento di paradigma, cambiano proprio le domande che ci possiamo porre» spiega Cristianini. I primi ad avvertire questo cambiamento sono stati i biologi: «Lo spostamento tra genetica e genomica è stato fortissimo: l’idea di poter studiare simultaneamente ogni singolo gene e i suoi prodotti è stato uno shock culturale».
La culturomica, prosegue Cristianini, ha la stessa ambizione della genomica: prendere «tutti i dati, tutti i libri, tutti i giornali, tutte le canzoni e vedere se c’è qualche tendenza, qualche schema culturale».
Gli storici come reagiscono a questo cambiamento di paradigma? «Uno storico legge dei documenti, li giudica nel contesto e compone una storia, “produce” una narrazione, non una formula o una previsione… C’è uno “scontro culturale”, all’interno di questo campo di studi che stiamo creando, le Digital humanities, dove si confrontano culture molto diverse». Ma, prosegue Cristianini, «per comprendere il significato delle domande, e delle risposte, occorre un essere umano, non una macchina: nel nostro team avevamo un sociologo e uno storico, con cui abbiamo scelto, singolarmente, i giornali da includere, le parole da cercare e analizzato tutti i dati».
La necessità di essere aperti
Cristianini aveva accennato ad alcuni vincoli che hanno condizionato la ricerca, e tra questi c’è il libero accesso a tutte le informazioni: «Per pubblicare un risultato, bisogna renderlo completamente riproducibile, aprendo i dati… è una tendenza che si è imposta negli ultimi anni». Perché è un vincolo? «Perché i dati dei giornali sono soggetti al diritto d’autore: io non posso consegnare al mondo tutti gli articoli di giornale; abbiamo dovuto limitarci a quel tipo di cose che possiamo divulgare, come la serie temporale delle parole o i nomi delle persone: una analisi più profonda sul significato dei termini non l’avremmo potuta pubblicare per problemi di copyright».