TECH | 14 Giu 2018

AI: la battaglia tra dati e algoritmi

C'è uno scontro in corso tra dati e algoritmi? Chi sta vincendo?

Non c’è dubbio che quello dell’Intelligenza Artificiale sia uno dei settori tecnologici più effervescenti. Secondo lo studio di Gartner “The Business Value of Artificial Intelligence, Worldwide, 2017-2025”, nel 2018 il giro d’affari delle soluzioni aziendali costruite su piattaforme di Intelligenza Artificiale crescerà vertiginosamente in tutto il mondo, con un incremento del 70% rispetto al 2017. Cifra destinata più che a triplicare nel 2022, quando il business dovrebbe valere 3.900 miliardi di dollari. L’esplosione dell’Intelligenza Artificiale come strumento di profonda trasformazione della società moderna, che ha come acceleratori la sempre maggiore capacità computazionale e la continua e crescente mole di dati e informazioni oggi a nostra disposizione, avrà effetti su tutti gli aspetti della nostra vita e sarà una delle tecnologie più disruptive dei prossimi anni.

È evidente che per me, che guido una azienda votata ad accompagnare i propri clienti nella Digital Transformation, l’adozione di soluzioni che fanno uso di Intelligenza Artificiale è alla base delle attività quotidiane e motivo di confronto con colleghi e clienti. Oggi, leggendo la stampa specializzata e i forum di discussione su Internet, pare essere in corso una battaglia tra dati e algoritmi per supportare le migliori applicazioni basate su AI. Si leggono, quasi fossero espressioni di fazioni opposte, articoli che parteggiano per il primato dei dati sugli algoritmi o viceversa.

Ciò che caratterizza l’Intelligenza Artificiale da un punto di vista tecnologico è il metodo/modello di apprendimento con cui l’intelligenza diventa abile in un compito o azione (da qui poi la distinzione tra i vari Machine Learning, Deep Learning, ecc.). Alla base dello sviluppo di un’applicazione AI based sono necessari pertanto sia dati che algoritmi.

Esiste davvero una battaglia tra dati e algoritmi?

È passato molto tempo da quando ho lasciato la facoltà di Scienze Statistiche a Bologna, ma con tutti gli investimenti che stiamo facendo in azienda nel campo del Machine Learning e dell’Intelligenza Artificiale in generale, sono spesso coinvolto su questi ambiti in interessanti discussioni di progetto dai miei colleghi, fortunatamente molto più esperti di me, che guidano il nostro dipartimento Digital.

Dal mio punto di vista, se è vero che – come sosteneva Geraldo Salandra – “l’Intelligenza Artificiale è il razzo, ma i dati sono il carburante”, è anche vero e innegabile come AI sia una combinazione di dati e algoritmi.

Non c’è dubbio che senza il carburante (ovvero i dati) non si va da nessuna parte, ma si tenga a mente che è anche vero che la scelta del giusto algoritmo può compensare una scarsa qualità dei dati, ed è altrettanto certo che la scelta di un algoritmo sbagliato può impoverire gli effetti di dati eccellenti.

Dobbiamo desumere che i dati siano più importanti degli algoritmi?

Non credo sia sempre così. Comprendo il valore fondamentale dell’infrastruttura dei dati e degli analytics per alimentare gli algoritmi di Intelligenza Artificiale. Nella nostra esperienza quotidiana “la raccolta e la preparazione dei dati” sono, infatti, le attività che richiedono più tempo per lo sviluppo di applicazioni basate sull’Intelligenza Artificiale, rispetto a quelle per la selezione e messa a punto di un modello. Ecco perché abbiamo investito così tanto per essere in grado di fornire ai nostri clienti la migliore infrastruttura di dati per alimentare e addestrare gli algoritmi.

Ma sugli algoritmi è necessario un grande lavoro: nessuno può dire con certezza quale algoritmo avrà il rendimento migliore senza prima averne provati diversi. Elaborare e confrontare algoritmi e modelli per scegliere quelli adatti è un’attività cruciale per definire il successo di una soluzione di AI:

  • Quale algoritmo dovrei usare?
  • Quante ore di addestramento dell’algoritmo ho a mia disposizione?
  • Qual è il tipo, la qualità e la dimensione dei dati a mia disposizione?

La qualità del set di dati influenzerà direttamente il successo del modello predittivo. Concentrandosi sui dati, è possibile trasformare un database povero in uno che valga la pena di essere utilizzato nell’applicazione di Intelligenza Artificiale, ma è anche fondamentale scegliere l’algoritmo e il modello corretti che si adattino ai dati a disposizione e che siano coerenti con gli obiettivi di business.

Eccoci al dunque: il business. La parola che spesso manca negli articoli che ho letto, dove si dibatte del primato dei dati sugli algoritmi o viceversa, è proprio “business”. La disponibilità di una grande quantità di dati di buona qualità e algoritmi pertinenti consente di ottenere migliori informazioni e applicazioni; ma ottenere questo tipo di dati e algoritmi non è solo una questione tecnica: sono necessarie profonde competenze di business per generare valore e applicazioni di AI significative per le aziende.

Dati e algoritmi non sono avversari ma alleati in una strategia orientata al business.

Filippo Di Cesare