L’amore rende stupidi i sistemi di Intelligenza artificiale (AI) destinati a smascherare messaggi e commenti carichi d’odio, sempre più comuni sul web. Lo indica la ricerca condotta dalla finlandese Aalto University e pubblicata online sul sito Arxiv, che ospita gli articoli che non hanno ancora superato l'esame della comunità scientifica.
Il risultato, basato sull'analisi di sette programmi usati comunemente, indica che le macchine possono essere ingannate con facilità dall’inserimento casuale della parola “amore”, o anche da errori grammaticali e di spaziatura, volontari o meno. Il problema alla base degli attuali sistemi di intelligenza artificiale è che quando si trovano ad affrontare testi diversi da quelli con cui sono stati addestrati cominciano ad annaspare.
“Abbiamo inserito semplici errori di battitura, tolto qualche spazio o aggiunto parole neutre all’originale commento negativo”, spiega Tommi Gröndahl, alla guida del gruppo. Eliminare gli spazi tra le parole si è rivelato l’attacco più potente, e una combinazione di tutti questi metodi è stata efficace anche contro Perspective, il programma utilizzato da Google”.
Una frase come “ti odio” passa facilmente attraverso le maglie della rete che dovrebbe bloccarla quando viene modificata in “tiodio amore”. I ricercatori hanno anche notato che la stessa espressione in contesti diversi può essere un messaggio di odio o semplicemente offensivo: questo vuol dire che le attuali tecniche di analisi del testo, che non riescono a tenere conto del contesto, sono soluzioni insufficienti se usate da sole. Per questo motivo il gruppo finlandese consiglia di prestare maggiore attenzione alla qualità e al tipo dei dati utilizzati per addestrare i sistemi di Intelligenza artificiale, concentrandosi più sui singoli caratteri che sulle parole o sulle frasi.