Dal blog https://progressoscientifico.wordpress.com/
INTRODUZIONE
Negli ultimi anni, le fake news sono aumentate notevolmente nei social media. Ciò ha richiesto la necessità di sviluppare degli algoritmi di rilevamento capaci di evitare la loro diffusione. Le reti neurali convoluzionali (CCN) hanno riscontrato un grande successo nel contesto artificiale e stanno ricevendo sempre più attenzione per le loro caratteristiche utili all’elaborazione del linguaggio naturale (PNL). In particolare, sono state implementate nell’attività di rilevamento di fake news grazie a CapsNet (Capsule Neural Network). Si tratta di un sistema di rete neurale artificiale (ANN) che fornisce aiuto nell’ottimizzazione delle relazioni gerarchiche. Il suo scopo è quello di aggiungere delle strutture chiamate “capsule” ad una CCN, le quali, avviato il loro ciclo produttivo, produrranno un vettore in output. Esso manderà dei dati alle capsule del livello successivo e così via. L’approccio consiste nel tentativo di imitare, nei limiti del possibile, l’organizzazione neurale biologica.
LIAR – IL CORPO DEL MODELLO
Il modello, denominato “LIAR”, è composto da 12.836 etichette ed è costituito da una CNN per l’estrazione di caratteristiche dal testo delle notizie e da una rete BiLSTM (LTSM bidirezionale, permette la propagazione del segnale in modo sequenziale) per l’estrazione di ulteriori caratteristiche dai metadati. I fattori estratti vengono quindi concatenati e inseriti in uno strato gestito con softmax, per ottenere una visione obiettiva sulle notizie correlate.
TECNICHE UTILIZZATE
Viene sfruttato il word embedding, ovvero un insieme di tecniche di modellazione in cui le parole o le frasi vengono mappate in vettori di numeri reali. Il word embedding statico viene utilizzato per mappare notizie brevi, mentre il word embedding dinamico, che consente l’uptraining e l’aggiornamento incrementale nella fase di formazione, viene utilizzato per dichiarazioni di notizie di lunghezza media-lunga. Una volta distribuiti, i contenuti vengono analizzati, procedendo alla loro approvazione/disapprovazione.
RISULTATI OTTENUTI
I modelli proposti sono valutati su due recenti set di dati impiegati nel campo: ISOT e LIAR. I risultati mostrano prestazioni incoraggianti, superando i metodi all’avanguardia sul set di test dei dati.