MARKET | 6 Giu

Analisi dei dati contrasta false recensioni

Uno studio della San Jose State University evidenzia il ruolo dell'analisi dati nella rilevazione delle false recensioni degli utenti su aziende e prodotti.

La quantità di dati disponibili sul comportamento del cliente e sulle scelte di acquisto sono preziose per tutte le aziende, ma uno dei settori più interessati sembra essere, secondo un recente studio, quello alimentare che intravede in questo un fattore abilitante in grado di sovvertire gli schemi sui fronti critici della sicurezza alimentare, dello sviluppo dei prodotti e della gestione della supply chain. La lettura organica dei dati tra marketing, vendite e assistenza diventa cruciale per poter elaborare e disegnare il profilo dati dei clienti basato su informazioni complete e accurate che possono e devono essere recuperate attraverso nuove forme di interazioni utente-azienda.

Le reti sociali e le interazioni tra consumatori sono predominanti nel settore ristorazione, dove le recensioni diventano occasione di approfondimento sui comportamenti e le scelte di acquisto, utili a migliorare l’offerta dei prodotti e dei servizi aziendali.

Ma quanto le recensioni on line sono affidabili?

Alcuni studi hanno stimato che quasi un terzo di tutte le recensioni scritte dai consumatori sono false. Questo determina un’alterazione dei rating che promuove e distrugge la reputazione delle strutture ricettive o delle aziende senza alcun controllo, in maniera artificiosa e fraudolenta. I vantaggi economici ottenuti dalle false recensioni hanno persino dato vita ad un mercato di utenti ben pagati per falsificare le recensioni, per promuovere un’impresa piuttosto che un’altra o per frenare la vendita dei prodotti delle aziende concorrenti. Questo atteggiamento potrebbe essere identificato collettivamente come frode in termini di opinione o spam che possono turbare e modificare le attività commerciali e di acquisto.

L’astroturfing è una pratica di marketing che vede il coinvolgimento di persone pronte a commentare, twittare, scrivere recensioni anche con account differenti con l’obiettivo di produrre falso consenso. Mentre nei Paesi dell’Unione Europea è stata già catalogata come pubblicità ingannevole e concorrenza sleale e in Italia è stata recepita come tale, negli Stati Uniti è ancora una pratica legale. Tuttavia, rilevare una falsa recensione non è cosa semplice poiché per ogni giudizio espresso si ha un testo di riferimento, la data di pubblicazione e il grado di valutazione e talvolta l’autore è in modalità anonima. In passato la criticità legata alla rilevazione delle false recensioni è stata affrontata concentrandosi sulla revisione delle informazioni all’interno del testo e analizzando gli approcci comportamentali degli utenti ritenuti fake.

Uno studio del 2016 condotto dall’Università del Texas a San Antonio aveva cercato un modo per rilevare questa pratica analizzando statisticamente diversi campioni di scrittura attraverso un sistema binario “n-gramma”, che già in passato si era dimostrato efficace per identificare gli autori di determinati testi. Il sistema legge un testo come una sequenza di simboli: si analizzano le lettere, i segni di interpunzione, gli spazi tra le parole, senza considerare il testo o le regole della grammatica. Contando quante volte ciascun n-gramma compare in un dato testo, si può costruire un indicatore che delinea un determinato autore, visto che è proprio la differenza numerica degli n-grammi a determinare le differenze stilistiche tra scrittori diversi. Applicando questo sistema al campo dei social media, gli studiosi hanno dimostrato statisticamente che alcuni autori operativi su diverse piattaforme erano in realtà la stessa persona. Dopo aver campionato gli stili di alcuni dei commentatori più “prolifici” su numerosi siti web di notizie hanno scoperto che molte di quelle persone potevano essere collegate a uno stretto numero di utenti singoli che avevano creato account diversi.

Il ruolo delle reti neurali

I ricercatori della San Jose State University hanno effettuato uno studio analizzando il caso della piattaforma YELP, uno dei principali siti web di revisione dei consumatori che da solo contiene più di 100 milioni di revisioni d’imprese, con un mercato pari a circa quattro miliardi di dollari. I ricercatori del Department of Computer Engineering hanno analizzato e studiato gli utenti della piattaforma social verificando gli impatti del loro comportamento in merito alla classificazione di possibili fake e spammer. Le caratteristiche comportamentali interattive social sono state analizzate e confrontate tra due gruppi di utenti: uno per un gruppo di revisori le cui recensioni sono state filtrate come recensioni non spam e un altro gruppo che invece le ha valutate come tali anche per migliorare il risultato della classificazione sui dati dell’algoritmo usato dal sito per filtrare le recensioni false e sospette. Tutti queste caratteristiche comportamentali e sociali sono state analizzate attraverso l’uso di una rete neurale per stimare la genuinità dell’utente e prevederne l’attività sociale. Lo studio dimostra come una rete neurale possa essere considerata una buona misura per questi casi.

Il modello basato su ANN

Nel campo del machine learning, una rete neurale artificiale (Artificial Neural Network – ANN) è un modello matematico costituito da un gruppo di interconnessioni d’informazioni costituite da neuroni artificiali e processi che utilizzano un approccio di connessionismo di calcolo. Spesso una rete neurale artificiale è un sistema adattivo che cambia la propria struttura, basata su informazioni esterne o interne che scorrono attraverso la rete, durante la fase di apprendimento. Le reti neurali sono strutture non-lineari di dati statistici organizzate come strumenti di modellazione e possono essere utilizzate per simulare relazioni complesse tra ingressi e uscite che altre funzioni analitiche non riescono a rappresentare.

Una rete neurale artificiale riceve segnali esterni su uno strato di nodi (unità di elaborazione) d’ingresso, ciascuno dei quali è collegato con numerosi nodi interni, organizzati in più livelli. Ogni nodo elabora i segnali ricevuti e trasmette il risultato ai nodi successivi. Le reti neurali, ampiamente utilizzate per applicazioni di elaborazione delle immagini come il riconoscimento facciale o nella guida autonoma dei veicoli, riescono a imitare la modalità con cui il nostro cervello apprende nuove conoscenze e le consolida per un uso futuro applicandole quando necessario.

Il recente modello sviluppato per il rilevamento di spam o di false recensioni su Yelp utilizza le funzioni di comportamento di interazione social rilevando attività fraudolente anche attraverso l’analisi di numero di amici e di follower, la quantità di foto, i complimenti e i voti ricevuti. L’algoritmo si è dimostrato secondo i ricercatori adatto a rilevare le criticità legate allo spam e alle recensioni fasulle. Ma questo vale per Yelp. La possibilità di usare la stessa metodologia su altre piattaforme non necessariamente porterebbe a uno stesso positivo risultato.

Emma Pietrafesa