Un po’ statistico, un po’ matematico, un po’ hacker: questo è il modo classico di considerare il Data Scientist, la professionalità più ricercata nelle industrie che vogliono affrontare adeguatamente le sfide dell’economia digitale e la crescente disponibilità di grossi moli di dati, i cosiddetti Big Data.
La professione del Data Scientist, con le sue conoscenze e competenze per analizzare e interpretare i Big Data che ogni giorno sono disponibili, è destinata a diventare una figura centrale in tutte le imprese dell’economia digitale, in ogni attività socio-economica, quali il commercio (sia on-line che di prossimità), i servizi finanziari, la sanità, il comparto energetico, le telecomunicazioni, il web e i social media, la gestione aziendale e la consulenza strategica, fino alla robotica industriale e la cosiddetta Fabbrica Intelligente auspicata nel Piano Nazionale Industria 4.0.
Abbiamo provato qualche tempo fa a chiarire cosa si intenda per Data Science, un campo della conoscenza che si è venuto affermando in questi ultimi anni e che raccoglie competenze, skill e capacità da varie altre scienze: la curiosità dal mondo della ricerca, la prospettiva economica dal mondo della ricerca, oltre alle note competenze dal mondo della Statistica, Matematica e Computer Science.
I benefici dell’introduzione di figure specializzate sui dati nell’organigramma aziendale è stimato in una media del 40% di incremento del fatturato e riduzione dei costi (McKinsey, febbraio 2016). Le aziende sono consce di queste necessità e si stima in circa 1 milione di nuovi posti da Data Scientist per le industrie europee fino al 2020 (PwC, aprile 2016). Ma quando le imprese e la pubblica amministrazione devono interagire con le università e i centri di formazioni per colmare i gap di competenze nel proprio organico si trovano di fronte alla difficoltà di cosa chiedere. Al di là del titolo professionale è chiaro che i processi in un dominio non sono sempre uguali a quelli in un altro, il ruolo in una grande azienda di chi analizza dati è più specializzato e focalizzato di quello in una piccola o media impresa dove spesso ci si barcamena a fare un po’ di tutto.
Come formare Data Scientist?
Nasce il bisogno di un linguaggio comune, di concetti chiari e condivisi, di regole e definizioni che consentano di evitare ambiguità sia nella richiesta di formazione che nell’offerta. Questo è stato fatto nel recente passato da un gruppo di studiosi il cui sforzo è confluito in un framework educativo chiamato eCompetence Framework (eCF, oggi alla versione 3.0). Tale framework identifica 23 diverse professionalità all’interno del mondo ICT (divise in 4 famiglie) e per ogni professionalità ne definisce competenze e livelli di apprendimento. Le competenze sono raggruppate in 5 aree che corrispondono alle cinque fase di un processo ICT (Plan, Build, Operate, Use and Manage). Ogni competenza è descritta in termini operativi, del saper fare, del sapere affrontare un compito: per ogni competenza sono specificati specifici skills e le conoscenze che supportano il saper fare, ma anche il livello di apprendimento per questa competenza, che posso variare a seconda del profilo o della seniority. L’eCF si è rivelato uno strumento talmente utile che è in corso un evoluzione del gruppo di esperti che lo aggiornano periodicamente verso una struttura che ne curi anche gli sfruttamenti commerciali.
Lo stesso framework è stato usato da un gruppo di accademici e imprese, tra le quali Engineering, del progetto EDISON per identificare le competenze per il Data Scientist. Dopo un primo tentativo di analizzare questa figura professionale, tramite survey, desk-research e interviste con esperti del campo, ci si è accorti che in realtà la complessità dei domini (incluso il mondo della ricerca) conferma la complessità di questa professione. Il mantra dei vari blog, paper e studi divulgativi (non sempre basati su studi statistici) vuole il Data Scientist collettore di tutte le competenze di vari domini. Questo non è propriamente vero e come dice il saggio “la virtù sta nel mezzo”.
L’analisi fatta dal team di EDISON ha identificato altre 22 professioni, ognuna degna di rilievo e considerazione, collocando il concetto di Data Scientist (nella struttura e linguaggio dell’eCF) a livello di nuova “famiglia”. In questo modo si riesce a formalizzare la complessità di competenze e livelli di familiarità di queste che da tante parti ha sollevato critiche, assimilando la ricerca del Data Scientist alla ricerca dell’unicorno.
Quali le sfide per chi voglia usare eCompetence Framework?
- In un mondo – quello dei dati – che è in fervente evoluzione, come assicurare che nuovi modelli, nuove tecniche e nuovi strumenti non rendano rapidamente obsoleta e non adatta alle esigenze delle imprese e dei centri di ricerca le competenze come sono descritte?
- Come tradurre la lista di competenze e skill in uno strumento utile a insegnanti e professori per strutturare corsi adatti ai vari profili?
- Come supportare la mappatura delle competenze di ogni lavoratore, ricercatore o studente con le varie professioni per identificare eventuali gap ma soprattutto come raccomandare percorsi efficaci per colmare tali gap?
- Come aiutare i manager nel capire, a partire dalle attività proprie delle aziende o dei progetti in cui lavorano, di quali figure abbiano realmente bisogno?
EDISON sta lavorando con le Università e le imprese nel promuovere tale framework e capire come rispondere a queste e altre domande. Recentemente si è tenuta all’Università Carlos III a Madrid, Spagna, la seconda conferenza dei “champions”, ovvero docenti e formatori che, in vari contesti, dalle scienze applicate alle biblioteche formano i data-professional di domani.
Martedì 4 aprile, dalle ore 9 alle 13, si terrà un workshop presso l’Aula Magna del Dipartimento di Ingegneria dell’Università di Perugia con esperti del settore e imprese, tra le quali Engineering e altre realtà locali, per condividere le esperienze in corso. In particolare sarà presentato il lavoro che il Dipartimento ha fatto nell’applicare il framework di EDISON per la realizzazione di un Master sulla Data Science e come questo lavoro possa essere replicato in futuro.
In particolare l’evento di Perugia sarà il primo a livello nazionale che inizia il dialogo Università-imprese sul tema della formazione sulla Data Science. L’auspicio di tutti è che non ci si fermi alle intenzioni o a esperienze isolate ma che si trovino gli strumenti per coinvolgere e contaminare i formatori e i docenti dell’intero territorio nazionale, così da assicurare una omogeneità dell’offerta didattica e la possibilità di colmare, rapidamente, l’atteso gap di competenze digitali nella prossima economia digitale.
Andrea Manieri, Francesco Saverio Nucci