Quando facciamo qualcosa online, lasciamo sempre una traccia. Cerchiamo un indirizzo su Google Maps, un prodotto su Amazon o un ristorante su Tripadvisor; clicchiamo “mi piace” sul post di un contatto su Facebook, ricondividiamo un tweet, pubblichiamo una foto su Instagram e la descriviamo con un hashtag; leggiamo e rispondiamo a una mail, chattiamo con amici e conoscenti su Whatsapp e Messenger, a volte interagiamo con chatbot aziendali per avere informazioni che ci interessano. Facciamo un’ora di corsa e utilizziamo una app acquistata sullo store Apple che sfrutta il GPS del nostro smartphone per sapere a che velocità abbiamo corso e quante calorie abbiamo consumato. Se facciamo una ricerca su Google mentre siamo loggati con il nostro account, i risultati saranno diversi da quelli pubblici perché in parte tarati su ciò che il motore di ricerca sa già di noi.
I servizi che utilizziamo registrano i nostri comportamenti d’acquisto, le nostre preferenze e le nostre relazioni sociali, per cercare di sapere con più precisione chi siamo. L’obiettivo è quello di accumulare informazioni in grande quantità, da far gestire a sistemi in grado di incrociare in modo efficiente i dati via via raccolti. Lo scopo è duplice: conoscere i singoli individui e avere informazioni accurate sui gruppi sociali più ampi, anche a scopo predittivo. Siamo naturalmente nel campo dei cosiddetti Big Data: se ne parla da qualche anno a proposito dell’aumento vertiginoso del volume di dati e della velocità dei flussi di informazioni in rete.
Avere a che fare con Big Data – e non semplicemente con dati – significa avere a che fare con insiemi di informazioni talmente grandi e complessi da richiedere la definizione di nuovi strumenti e metodologie per poterle gestire, estrapolare e processare in tempi rapidi. Quel che accade ogni giorno su Facebook equivale a miliardi di scritture e riscritture continue su immense banche dati: tutti i like, i commenti, le reazioni, le preferenze espresse, i check-in e le geolocalizzazioni, i tempi di permanenza su pagine e contenuti video, i tag e le modifiche alle reti di contatti vengono salvati in tempo reale e immagazzinati sulle memorie di migliaia di computer sparsi per il mondo. La maggior parte del valore che l’azienda creata da Mark Zuckerberg estrae dalle nostre azioni è gestita dal software in modo automatico: i suggerimenti di nuove amicizie o la pubblicità che ci viene proposta, per esempio, vengono gestiti da algoritmi periodicamente aggiornati. Nessun essere umano sarebbe in grado di gestire la mole di informazioni che viene processata in tempo reale dai software di Facebook, per poi ricavarne dati utili: agli umani resta per ora il controllo delle segnalazioni e delle controversie politiche, etiche e morali.
Perché i Big Data non sono semplicemente dati, e perché le nostre società si reggono sempre più sugli algoritmi?
E ancora, senza entrare in tecnicismi, cosa sono esattamente gli algoritmi? Per capirlo meglio possiamo usare un riferimento cinematografico: in una scena del film The Social Network di David Fincher (2010), Mark Zuckerberg e Eduardo Saverin – che in seguito diventeranno i cofondatori di Facebook – discutono del possibile adattamento di un algoritmo creato da Saverin. L’idea di Zuckerberg è quella di applicare un algoritmo sviluppato dall’amico – pensato per classificare giocatori di scacchi – a un altro contesto: la classificazione di ragazze del college. Si tratta della nascita di FaceMash, il predecessore di Facebook. Il sito viene creato nel 2003, durante il secondo anno di college di Zuckerberg, per consentire agli studenti di Harvard di confrontare immagini di studentesse e indicare di volta in volta la più attraente. L’algoritmo di FaceMash non è altro che l’insieme di regole seguite dal software per proporre le immagini all’utente. Da lì alla versione online e interattiva dell’annuario scolastico con nomi e volti degli studenti il passo è stato breve: da FaceMash a TheFacebook, e infine a Facebook, la creazione di Zuckerberg è qualcosa che oggi riguarda la vita di miliardi di persone in tutto il mondo.
Sappiamo dunque che un algoritmo ha a che fare con un insieme di regole. Ma di che regole si tratta, e perché usiamo questa parola? Il termine algoritmo ha le sue radici nel latino medievale e fa riferimento al nome al-Khuwārizmī, dato al matematico persiano del 9° secolo Muḥammad ibn Mūsa perché nativo di Khwarizm, regione dell’Asia Centrale. Nel Medioevo con il termine derivato algorismus venivano indicati i procedimenti di calcolo numerico fondati sull’uso delle cifre indo-arabiche. Oggi con il termine algoritmo vengono indicati genericamente i metodi sistematici di calcolo: nello specifico, schemi uniformi e procedimenti matematici per la risoluzione di una data classe di problemi. In termini un po’ più tecnici, un algoritmo è un procedimento di calcolo esplicito e descrivibile con un numero finito di regole che conduce al risultato dopo un numero finito di operazioni. Le operazioni non sono altro che applicazioni delle regole date, che in termini informatici vengono chiamate anche “istruzioni”. L’algoritmo informatico è quindi un insieme di istruzioni che deve essere applicato per poter eseguire una elaborazione o per risolvere un problema. Non si devono confondere gli algoritmi con i software, perché questi ultimi possono contenere algoritmi al proprio interno ma contengono anche elementi non-algoritmici.
Quale il ruolo degli algoritmi oggi?
Ci si può chiedere a questo punto in che modo dei metodi sistematici di calcolo ed elaborazione di istruzioni specifiche sono diventati elementi sempre più importanti per la nostra economia, per l’informazione, per la cultura e la conoscenza, per la salute, per l’educazione e per quasi ogni aspetto della nostra vita in comune. Siamo davanti a trasformazioni che sono state a lungo ignorate dalle istituzioni scolastiche e accademiche, a volte lontane da una efficace comprensione e gestione dei processi di digitalizzazione progressiva della conoscenza e delle nostre relazioni sociali. Le conseguenze di queste “rivoluzioni inavvertite” possiamo riscontrarle anche nella distanza tra generazioni, nelle complicazioni relative ai rapporti genitori-figli e nell’educazione familiare, sempre più caratterizzata anche dalla mediazione tecnologica. Il problema educativo, in particolare, è centrale per comprendere appieno cosa significa affidare totalmente le nostre vite a software e algoritmi. Scuola e università sono capaci di rispondere alle sfide poste dalla società in rete e dalle infrastrutture digitali della conoscenza?
Mario Pireddu