TECH | 9 Mar

La collaborazione multidisciplinare ai tempi del Machine Learning

Se l’analista è colui che traduce messaggi in simboli, l’esperto aiuta ad interpretarne il contenuto.

M. fu una donna che nacque verso la fine dell’Ottocento e che ebbe diversi figli. Lei raccontò che per ben tre volte uno dei suoi figli, prima di morire, venne sostituito da un sosia già moribondo. M. sosteneva di essere discendente di Luigi XVIII, re delle Indie, di possedere una fortuna di 125 miliardi di franchi e, sentendosi minacciata, riteneva di essere sotto sorveglianza, e che tutte le persone che incontrava fossero sosia, o sosia dei sosia. Nel giro di pochi anni, le venne diagnosticata una malattia nota come “Sindrome di Capbras”. La donna identificava fisicamente e a livello cognitivo i propri cari, ma non li riconosceva come tali, in quanto era incapace di qualsiasi intuizione emotiva e di “senso di familiarità” al punto da accettare l’ipotesi di impostura dei propri familiari.

Oggi sappiamo che nel genere umano i processi di apprendimento e decisionali sono complessi e nascono sempre da forme di interazione tra zone del cervello “cognitive” ed “emozionali”.

Esistono disturbi complementari a quello descritto. La prosopagnosia, riconosciuta all’inizio degli anni ’90, impedisce il riconoscimento di individui, anche familiari, nonostante le persone coinvolte provino sensazioni inconsce di familiarità (per esempio un aumento del battito cardiaco). In questi casi, le persone devono affidarsi – anche in modo inconsapevole – a strategie “meccaniche” che aiutino il riconoscimento: “se la persona che mi viene a trovare in ospedale ha questa particolare forma del viso, o quella particolare voglia sul volto, deve essere mio marito”. Il fatto di affidarsi a forme di riconoscimento “consapevole” di dettagli, che consentano di riconoscere oggetti o individui, è fondamentale in caso di deficit “cognitivo”. Tanto più un problema diventa complesso, tanto più è necessario “scomporlo” in tasselli che consentano di comprenderlo a fondo.

L’identificazione di un set di caratteristiche fondamentali (o features), che consentano di ricondurre un problema nuovo ad uno familiare, è una prerogativa essenziale di ogni sistema di apprendimento, e di conseguenza, anche dei metodi di machine learning, grazie ai quali, disponendo di una adeguata informazione di partenza (training set), è possibile insegnare ad una macchina ad effettuare previsioni o calcoli in base a stimoli raccolti in precedenza. I sistemi di machine learning in prima istanza usano i training set per imparare a conoscere problemi complessi, semplificandoli tramite strutture di features, perché i gli stessi stessi possano essere identificati e compresi in un secondo tempo.

Consideriamo l’algoritmo di Viola e Jones, uno dei primi algoritmi per l’individuazione (detection) automatica di volti – visti di fronte – in tempo reale. Per riconoscere la presenza di un viso, l’algoritmo parte da una caratteristica essenziale dei volti, ben nota sia in ambito figurativo, sia nel campo dell’image processing: i visi sono grossolanamente “schematizzabili” in zone d’ombra e di luce, che coinvolgono gruppi di pixel rettangolari. La zona del naso, ad esempio, è in genere più luminosa di quella degli occhi. Queste aree di pixel vengono cercate ed elaborate (Haar Features), mentre un efficiente algoritmo (detto “di boosting”) seleziona solo le features più adatte per caratterizzare il training set. L’individuazione del volto si ha quando la presenza di features analoghe a quelle definite viene rilevata all’interno di nuove immagini, e l’algoritmo verifica che “siano confrontabili” con quelle del traning set.

L’algoritmo di Viola e Jones parte da presupposti facilmente comprensibili (la caratteristica contrapposizione luce/ombra nei volti). La sua implementazione presuppone una solida conoscenza sia delle tecniche di classificazione, sia del mondo dell’image processing e della fotografia.

Gli addetti ai lavori sanno che l’individuazione di un set di features di partenza, che consentano di caratterizzare un problema, o di effettuare previsioni nel modo più generale possibile, raramente è un compito banale ed è lo “zoccolo duro” nell’implementazione di un sistema di Machine Learning di successo.

Esistono alcuni criteri che consentono di scegliere quali siano le features “più importanti” da considerare all’interno di training set, per ottenere risultati coerenti con i dati a disposizione. Non si tratta mai di una scelta banale o da effettuare esclusivamente in base alla scelta di una regola generale e in molti casi è necessaria la supervisione di un analista. Anche la scelta dei criteri in base a cui effettuare questa selezione spetta all’analista ed è determinante per definire la bontà dell’algoritmo.

E’ evidente che la scelta delle features di partenza non è un’attività puramente tecnica, in quanto il “punto di vista” dell’analista stesso potrebbe influenzare l’analisi del problema. Poiché punti di vista diversi possono portare a diverse conclusioni, può persino accadere che, partendo da diversi modelli, si ottengano risultati comunque ragionevoli, sebbene non sempre concordanti. Ciò può essere tanto più rilevante quando il numero delle features potenzialmente utili cresce, o quando, ad esempio, non si può ricondurre un problema a un semplice confronto tra serie storiche di dati.

E’ in casi come questi che la conoscenza del contesto diventa fondamentale. Se da un lato è certamente auspicabile che un analista disponga della conoscenza di base necessaria alla comprensione dei fenomeni in cui viene coinvolto per individuarne le features di base, è altrettanto importante che si stabilisca, dove possibile, un dialogo costruttivo fra analista ed esperto di dominio, che possiede quel bagaglio di competenze necessario a fornire al primo il “migliore punto di vista” sul problema.

Se l’analista è colui che traduce messaggi in simboli, l’esperto aiuta ad interpretarne il contenuto, comunicando una visione contribuendo a trasformare i dati in valore.

Ciò presuppone che analisti ed esperti di dominio parlino un linguaggio comune. Questo dialogo, che assume connotazioni fortemente multidisciplinari, può non essere sempre facile, nel Business come nella Scienza. Eppure questo dialogo è il presupposto per trasformare la conoscenza di settore in valore aggiunto.

Grazie alla collaborazione tra analisti ed esperti di dominio è così possibile riconoscere con certezza un principio di causalità in un nesso di correlazione, oppure la struttura semplificata di un processo reale nella schematizzazione di un modello e, infine, obiettivi e azioni concrete all’interno di una visione comune.


Michele Gabusi


Da leggere per approfondire:
“To Understand Facebook, Study Capgras Syndrome”, by Robert Sapolsky, Nautilus, November 2016; tradotto da Internazionale n° 1190, 3/9 febbraio 2017, con il titolo: ”Mio Marito è un impostore”.
Paul Viola, Micheal J. Jones, “Robust Real-Time Face Detection”, International Journal of Computer Vision, 2004, 57(2), 137-154