FAKE NEWS: RILEVAZIONE CON RETI NEURALI CONVOLUZIONALI (CCN)

Dal blog https://progressoscientifico.wordpress.com/

INTRODUZIONE

Negli ultimi anni, le fake news sono aumentate notevolmente nei social media. Ciò ha richiesto la necessità di sviluppare degli algoritmi di rilevamento capaci di evitare la loro diffusione. Le reti neurali convoluzionali (CCN) hanno riscontrato un grande successo nel contesto artificiale e stanno ricevendo sempre più attenzione per le loro caratteristiche utili all’elaborazione del linguaggio naturale (PNL). In particolare, sono state implementate nell’attività di rilevamento di fake news grazie a CapsNet (Capsule Neural Network). Si tratta di un sistema di rete neurale artificiale (ANN) che fornisce aiuto nell’ottimizzazione delle relazioni gerarchiche. Il suo scopo è quello di aggiungere delle strutture chiamate “capsule” ad una CCN, le quali, avviato il loro ciclo produttivo, produrranno un vettore in output. Esso manderà dei dati alle capsule del livello successivo e così via. L’approccio consiste nel tentativo di imitare, nei limiti del possibile, l’organizzazione neurale biologica.

LIAR – IL CORPO DEL MODELLO

Il modello, denominato “LIAR”, è composto da 12.836 etichette ed è costituito da una CNN per l’estrazione di caratteristiche dal testo delle notizie e da una rete BiLSTM (LTSM bidirezionale, permette la propagazione del segnale in modo sequenziale) per l’estrazione di ulteriori caratteristiche dai metadati. I fattori estratti vengono quindi concatenati e inseriti in uno strato gestito con softmax, per ottenere una visione obiettiva sulle notizie correlate.

TECNICHE UTILIZZATE

Viene sfruttato il word embedding, ovvero un insieme di tecniche di modellazione in cui le parole o le frasi vengono mappate in vettori di numeri reali. Il word embedding statico viene utilizzato per mappare notizie brevi, mentre il word embedding dinamico, che consente l’uptraining e l’aggiornamento incrementale nella fase di formazione, viene utilizzato per dichiarazioni di notizie di lunghezza media-lunga. Una volta distribuiti, i contenuti vengono analizzati, procedendo alla loro approvazione/disapprovazione.

RISULTATI OTTENUTI

I modelli proposti sono valutati su due recenti set di dati impiegati nel campo: ISOT e LIAR. I risultati mostrano prestazioni incoraggianti, superando i metodi all’avanguardia sul set di test dei dati.

Fonte: https://doi.org/10.1016/j.asoc.2020.106991

Rispondi

Effettua il login con uno di questi metodi per inviare il tuo commento:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.