TECH | 23 Mag 2017

Quanto sono importanti i dati nell’economia di oggi?

Come l'Open Source Intelligence favorisce la raccolta di dati di valore

Se ne parla da molti anni. Già nel 2006 sono nate discussioni sul ruolo delle informazioni nell’economia di mercato. Una delle visioni era questa: “I dati sono proprio come il greggio. È prezioso, ma se non ancora lavorato non può veramente essere utilizzato. Deve essere trasformato in gas, plastica, prodotti chimici, ecc. per creare una preziosa entità che porta un’attività redditizia. Così i dati devono essere suddivisi, analizzati per avere valore”. Così diceva allora Clive Humby, matematico di Sheffield, fondatore di Dunnhumby e di Starcount, aziende che del trattamento di dati hanno fatto un lucroso business.

Lo stesso concetto è stato ripreso nel tempo innumerevoli volte. Basta fare una ricerca su Google con la chiave Data is the new oil per rendersi conto che il concetto “dato=denaro” è assai diffuso e condiviso anche ad alti livelli, vedi ad esempio il paper pubblicato per il World Economic Forum 2011.

Ma davvero i dati sono denaro?

C’è chi non la pensa allo stesso modo. Neil Lawrence sostiene infatti: “Data is the new coal”, i dati sono il nuovo carbone.

Lawrence era professore alla Sheffield University fino allo scorso anno prima di essere assunto da Amazon e già questo la dice lunga sul valore delle sue idee. Spiega l’analogia fra carbone e dati in questo modo. Quando fu inventato il motore a vapore da Newcomen, nel 1712, coloro che ne trassero un effettivo vantaggio furono i proprietari di miniere di carbone. Infatti, anche se il motore a vapore poteva apportare benefici ad altri tipi di imprese, l’acquisto del carbone necessario al suo funzionamento lo rendeva antieconomico. Per i dati è la stessa cosa, dice Lawrence. Creare un nuovo algoritmo, ideare un nuovo metodo per analizzare i grafi social o, per esempio, trovare un modo per prevenire il cancro analizzando i dati delle persone (come avviene in The Circle, Dave Eggers, 2013) è poco utile se non si hanno a disposizione dati da analizzare.

Ad ogni modo, comunque la si voglia vedere, che si tratti di carbone, petrolio, dati, possiamo dire che ogni epoca ha un suo “carburante” capace di far girare un motore. E qui far saltare il discorso ai motori di ricerca su Internet è fin troppo facile.

Cosmo, il personaggio del film “I signori della truffa” (Sneakers, 1992) dice: “C’è una guerra là fuori, amico mio. Una guerra mondiale. E non ha la minima importanza chi ha più pallottole, ha importanza chi controlla le informazioni. Ciò che si vede, si sente, come lavoriamo, cosa pensiamo, si basa tutto sull’informazione!” Informazione è potere. Potere economico, potere militare, potere politico. Pensiamo ad esempio di poter conoscere in anticipo le mosse del nemico, dove sono le truppe ed i mezzi militari. Pensiamo agli scontri politici, a base di rivelazioni più o meno imbarazzanti. Pensiamo alle operazioni di marketing, che potrebbero essere pensate in base alle informazioni raccolte sui propri competitor. Significa anche avere la possibilità di contrastare criminalità e terrorismo utilizzando le tecniche proprie delle agenzie di intelligence.

Dove trovare le informazioni?

Facile risposta. Su Internet si trova di tutto. Profili personali sui social, open data della pubblica amministrazione, big data da organizzazioni di varia estrazione, leaks, …

Il secondo problema è individuare i dati necessari, verificarli, valutarli, filtrarli. Il dato preso da solo potrebbe non avere significato pratico, quindi essere senza valore. Avere grandi quantità di dati non relazionati fra loro o non correlati con altri dati non crea quel valore aggiunto che ha invece un’informazione verificabile e quindi “actionnable”. E’ questo un neologismo che e me piace molto. Significa “that can be used as the basis for taking action”. Un informazione “usabile” per un qualche scopo.

Le tecniche che vengono utilizzate per trovare le informazioni utili o necessarie per uno scopo preciso vanno sotto il nome di “OSINT”, ovvero “Open Source INTelligence”. È doveroso sottolineare che “Open Source” non si riferisce alle licenze aperte del software bensì al tipo di fonti consultate ed analizzate per raccogliere le informazioni cercate. In OSINT vengono utilizzate solo le fonti liberamente consultabili, senza fare uso di tecniche di spionaggio o illegali. Con l’avvento di Internet le possibilità di trovare le informazioni cercate si sono moltiplicate grazie all’immensa quantità di dati riversati ogni secondo dagli utenti sui propri account oltre che da ogni azienda, ente, istituto di qualsiasi tipo, senza dimenticare i media tradizionali, i quali hanno trovato nuova ragione d’essere nei servizi online.

Le tecniche utilizzate sono quelle classiche dell’intelligence unite a buone conoscenze informatiche, immaginazione, tenacia, intuizione ed un pizzico di buona sorte. Si potrebbe restare stupiti dalle informazioni che è possibile estrarre ad esempio da una foto pubblicata sul sito aziendale o dall’analisi dei post sui social.

Per concludere, stiamo chiudendo il cerchio: abbiamo un immenso contenitore di informazioni e le tecniche per estrarle. Dobbiamo solo fare le domande giuste.