Oggi si parla molto di Data Governance e quasi sempre l’attenzione si concentra su due aspetti fondamentali: il rispetto della legislazione attuale e futura e la sicurezza. Ma è davvero solo questo? In realtà, c’è molto di più.
Se seguiamo l’approccio di dama.org nella gestione dei dati, la governance è l’elemento centrale. Non c’è gestione dei dati senza di essa.
Cos’è la Data Governance?
La Data Governance ci prepara al processo di trasformazione digitale, poiché i dati non sono più bloccati in sistemi proprietari, né in un’unica fonte di dati o Data Warehouse, la complessità delle organizzazioni moltiplica la quantità di informazioni e soprattutto ora “i dati sono il business”. Ci sono aziende che devono tutto il loro valore ai dati come Airbnb o Booking, che gestiscono informazioni e non hanno beni immobili ma rappresentano il reale mercato del turismo.
La Data Governance ci aiuta a prendere decisioni efficienti fornendo informazioni credibili e sicure. Che cos’è il margine lordo? Come si calcola? Dove trovo questi dati? Quali fonti mi assicurano questi dati?
Provenendo dalla Business Intelligence ho vissuto momenti di vera frustrazione quando, dopo interminabili processi di standardizzazione, qualità e aumento dei dati, i report e le analisi presentavano risultati inaffidabili. È sempre stata colpa dei dati: non tracciati, non consolidati, non reali. Chi si occupa di vendite può dire che una vendita c’è quando avviene una transazione, ma per la logistica chi decide? Chi controlla? Chi verifica? Benvenuti nell’era del CDO. La Data Governance ci permette di migliorare i processi e il risultato tangibile è sempre la riduzione dei costi.
I dati al tempo della trasformazione digitale
Sempre più fonti di dati (Big Data, IoT, ERP dipartimentali con tecnologie disparate, dati gestiti con Cloud) ci impediscono di lavorare in modo efficiente con il classico approccio Kimball-Data Warehouse, ed è per questo che diverse piattaforme di virtualizzazione e orchestrazione dei dati come Denodo, Querona o Talend stanno crescendo.
Da un lato analisti affamati di dati, dall’altro CIOs, CDOs, CTOs sempre attenti alle risorse, all’uso delle macchine e ai flussi di informazioni. Senza un’orchestrazione o uno strumento di Data Governance sarebbe difficile conformarsi in modo affidabile alle normative (GDPR, RDA) sempre più restrittive e alla missione data-driven. Senza dimenticare che sta diventando sempre più facile cambiare piattaforme tecnologiche o lavorare con più piattaforme tecnologiche allo stesso tempo. In entrambi gli scenari, è fondamentale controllare gli asset informativi con una visione unificata.
Un aiuto concreto nel processo decisionale
Lavorare con dati che siano stati definiti senza ambiguità è un fattore decisivo per l’analisi. Alcuni pensano che si tratti di un processo quasi verticale a partire dai diversi reparti dell’azienda, altri ne dichiarano la completa trasversalità all’interno dell’organizzazione e ne difendono l’adozione totale dal primo giorno.
È necessario controllare una definizione precisa delle informazioni, come la capacità di spiegare il processo di costruzione di un indicatore, le fonti di informazione e le operazioni che sono state effettuate nel processo di trasformazione. Tutto ciò garantisce il successo nel dare credibilità alle informazioni fornite. Gli analisti devono disporre di dati affidabili e passare attraverso un processo di certificazione interna.
Per poter lavorare con i dati necessari è essenziale osservare l’evoluzione dei risultati della qualità dell’informazione con continui processi di miglioramento e verifica. Se il livello dei dati sul fatturato passa dal 90% al 40%, avrà ancora senso analizzare l’evoluzione delle vendite? Quale credibilità avrà un’analisi predittiva alimentata da dati di scarsa qualità?
È necessario essere in grado di ottenere un valore aziendale quantificabile dalle informazioni, riconoscendo i dati come un ulteriore asset dell’organizzazione, o come l’asset più importante.
Il processo di trasformazione dei dati in informazioni rilevanti e sicure
La creazione di un collegamento tra l’utente e il motore dei dati riduce i tempi delle soluzioni ed elimina il ritrattamento, pertanto è necessario generare accordi e definire le responsabilità, per eliminare la duplicazione delle funzioni oltre che malintesi in merito al ruolo e alle responsabilità di ciascuno. Questo nonostante la varietà di dati che abbiamo nei nostri sistemi, con una chiara adozione di un sistema di dati anagrafici e metadati. Il risultato è una sostanziale diminuzione del tempo dedicato alla ricerca e alla comprensione delle informazioni, che riduce drasticamente lo sforzo dei gruppi di lavoro.
Lavorare con dati governati significa meno repliche di dati, meno processi, meno report, meno capacità di calcolo e di conseguenza meno struttura.
Massimizzare il potenziale di generazione di reddito dei dati e sfruttare la Data Lineage
Una politica di gestione dei dati e un sistema di acquisizione dati consentono la trasformazione dei dati in informazioni. Sfruttando il Data Lineage e la gestione dei metadati non si ottengono solo performance migliori, ma anche una strategia vincente. Se i dati sono strutturati e governati diventano credibili e vengono usati. In caso contrario sarà tutto lavoro sprecato.
Tipicamente, la governance e la gestione dei dati determinano l’ambito del Data Lineage in base alle normative, alla strategia di gestione dei dati dell’azienda, all’impatto dei dati, agli attributi di reporting e agli elementi critici dell’organizzazione.
Il lignaggio dei dati fornisce un audit trail dei punti di dati al più alto livello granulare, ma la presentazione del lignaggio può essere fatta a vari livelli di profondità per semplificare la vasta informazione. Il Data Lineage può essere visualizzato a vari livelli in base alla granularità della vista. A un livello molto alto, il Data Lineage individua quali sistemi interagiscono con i dati prima di raggiungere la destinazione. Man mano che la granularità aumenta, raggiunge il livello del punto di dati, dove può fornire dettagli sul comportamento storico, proprietà degli attributi, tendenze e qualità dei dati.
Quale il futuro del Data Management?
Secondo Gartner “le richieste di dati sono in costante aumento all’interno delle organizzazioni: si va dalla richiesta di un accesso più facile e flessibile ai dati, attraverso una maggiore governance dei dati, fino alla speranza di poter quantificare il valore dei dati e venderli. Queste diverse aspettative in un panorama sempre più complesso e distribuito stanno spostando l’attenzione delle organizzazioni alla gestione dei metadati, sperando che se i dati sono ingestibili, i metadati saranno più facili da gestire”.
Queste sono le sfide che gli strumenti devono affrontare:
- varietà e portata dei metadati supportati
- estensione del campo di applicazione dei metadati attraverso l’automazione (Machine Learning) e capacità di ricerca semantica, processi standard e crowdsourcing
- formalismo semantico (noto anche come ontologia formale) per migliorare l’interoperabilità
- comprensione condivisa tra più domini
- nuove modalità di acquisizione e visualizzazione dei metadati (la preparazione dei dati per l’analisi è alla base di questo requisito)
- trasferimento della proprietà dei metadati dal CIO al CDO, o una funzione simile.
In MDM, per esempio, non esiste uno standard per la migrazione dei dati tra i diversi strumenti. Nell’ambito delle attività di dama.org si intende promuovere l’uso di alcuni formati di dati come XML, in modo che sia possibile gestire tutto questo facilmente.
Una cosa è certa: avere uno strumento di governance non è un’opzione, è un’evoluzione naturale in uno scenario di fonti di dati multipli che la virtualizzazione stessa ha incoraggiato.
Michele Iurillo