PEOPLE | 9 Mag 2017

L’attività investigativa passa dai dati

Come la piattaforma SINTESYS aiuta a trovare informazioni preziose per sconfiggere la criminalità

Il crime-as-a-service è un vero e proprio modello di business su Internet, in particolare nel deep web, ovvero la parte non indicizzata e più nascosta della rete (come nuovi siti, siti privati aziendali, contenuto dei social network, ecc.) e nel dark web, la parte alla quale si può accedere attraverso specifici protocolli che garantiscono l’anonimato e dove si trova anche tanto materiale illegale finalizzato a traffici illegali, supporto finanziario al crimine e molto altro.

Molte delle attività criminali avvengono (o sono discusse) nel deep web, anche se l’analisi delle conversazioni e dei contenuti presenti anche nel web pubblico consente l’intercettazione di materiale utile per le indagini svolte dagli organi di polizia. Ascoltare il web per cercare le tracce lasciate inconsapevolmente dagli autori di crimini, in pratica.

La vastità dei contenuti della Rete – afferma Vito Morreale, responsabile del Laboratorio Intelligent Systems and Social Software for Security, Enterprise, Transport, Infrastructure di Engineering – non consente una facile intercettazione di materiale rilevante e interessante, ma soprattutto non permette di unire agevolmente i puntini, come diciamo spesso noi, ovvero cercare un filo logico, una storia che unisca contenuti presenti in diverse parti di Internet.

Cosa manca per dare vita a una buona attività di investigazione?

Molte delle attività investigative e d’intelligence svolte da diverse forze dell’ordine europee sono fatte manualmente e quelle automatiche sono spesso basilari, mentre servirebbe analisi dei Big Data, collaborazione intra e interforze, oltre al monitoraggio di nuovi strumenti che i criminali utilizzano, al fine intercettare in tempo i segnali che la vastità di Internet racchiude. Oltre a questo servono strumenti utili a estrarre e analizzare le informazioni che arrivano da sorgenti aperte come social media e web site, ma anche sull’analisi di dati estratti dal deep web e dalle dark nets.

SINTESYS (Security Intelligence System) è una piattaforma open source che rende possibile tutto questo, dando la possibilità di intercettare le informazioni rilevanti anche attraverso l’utilizzo di tecniche di text mining e data mining, che permettono di riconoscere per esempio lo stile di scrittura di una persona che ha lasciato tracce su diverse fonti, al fine di unire i puntini appunto e poter fare collegamenti e correlazioni importanti.

Oltre, quindi, a scoprire informazioni rilevanti, attraverso SINTESYS è possibile estrarre e analizzare i dati per generare la conoscenza necessaria agli investigatori per rilevare eventi e crimini che lasciano tracce sulla rete e quindi avere diverse tipologie di visualizzazioni utili a supportare il processo decisionale.


SINTESYS – già in fase di sperimentazione in Scotland Yard e Polizia di Madrid (nel progetto LASIE) e prossimamente anche presso i Carabinieri (ROS), Guardia Civil e Policia Judiciaria (nell’ambito del progetto DANTE) – è pensata per essere adattabile in tutti gli ambiti della sicurezza pubblica: dalla prevenzione di attentati terroristici alla prevenzione della criminalità comune e di atti di micro-criminalità come il bullismo. Aiuta per esempio a individuare: frasi e contenuti testuali minacciosi su forum, blog e chat; soggetti pericolosi in contenuti multimediali pubblicati su social media; particolari suoni impulsivi (urla, spari, vetri infranti, ecc.) in file audio; oggetti pericolosi (armi, valigie abbandonate, ecc.) in immagini e video, oltre che relazioni tra individui sospetti.

Quali gli strumenti utili a estrarre informazioni?

La piattaforma integra diverse tecnologie utili all’analisi testuale, condotta con approcci diversi, in relazione della fase investigativa che si sta conducendo. Ma, attraverso partnership strategiche, si utilizza anche l’analisi semantica profonda, che permette di comprendere il senso complessivo dei testi frammentati anche in presenza di termini mancanti o di parole utilizzate con significato traslato, o l’analisi di immagini/video/audio per l’estrazione di informazioni rilevanti da contenuti multimediali.

Oltre questo sono utilizzati approcci di machine learning, sentiment analysis e una nuova metodologia per la contestualizzazione sociale di documenti testuali funzionale alla modellazione dei gruppi sociali, per scoprire per esempio quali persone sono in relazione sociale o criminale tra di loro.

Le informazioni analizzate dalla piattaforma – afferma Ernesto La Mattina, responsabile dello sviluppo di SINTESYS – si potranno navigare attraverso interfacce grafiche intelligenti, in grado di adattarsi alle varie tipologie di sorgenti informative, alle effettive necessità investigative e agli specifici percorsi di indagine seguiti dagli analisti tramite un’apposita ricognizione delle loro abitudini e sulla base di uno studio psicologico sui modelli di interazione.

SINTESYS è un esempio di come l’analisi dei Big Data possa portare a migliorare l’ecosistema Rete e quindi la qualità della vita delle persone.

Sonia Montegiove