Le premier webinaire « toolbox » du projet PRACTICIES était une présentation de « l’outil d’analyse des contenus extrémistes » développé pour le projet par Gradiant, une entreprise basée en Galice (Espagne) spécialisée en technologies de communication. La présentation était donnée par Adrián Abalde et Joaquín Lago de Gradiant.
> L’espace numérique : un canal essentiel de propagation des contenus extrémistes
Le cyberespace est devenu un canal de communication essentiel pour la propagation des contenus extrémistes. L’application développée par Gradiant pour le projet PRACTICIES permet aux forces de police et autres agences de sécurité et d’intelligence de récolter de grandes quantités de données en ligne pour détecter des contenus suspects ou violents. Il est à noter que pour des raisons de sécurité et d’éthique, ce software est strictement réservé aux agences en question et n’est pas disponible pour le grand public.
> Des technologies pour identifier les signes de radicalisation sur les réseaux sociaux
Afin d’identifier les signes de radicalisation sur les réseaux sociaux, Gradiant utilise :
- des technologies de fouille de données (text mining) et de traitement du langage naturel qui structure le discours humain de façon que l’ordinateur le comprenne. Ceux-ci offrent une série d’indicateurs de radicalisation ;
- des technologies de vision par ordinateur (computer vision technologies) qui analysent automatiquement les images et détectent des signes et des comportements indiquant des situations possibles de radicalisation.
> Comment ça marche ?
Imaginons un agent de police chargé de surveiller les contenus suspects sur le web. Il trouve un site ou un forum suspect. Il lui suffit de copier le domaine et de le soumettre à l’application, qui analyse trois aspects différents : les textes, les images et le comportement des utilisateurs.
Pour ce faire, l’outil comprend deux modules : le module de capture développé par le Centre de Recherche de l’Université du Pirée (GR), et le Radical Content Analysis Module (module d’analyse des contenus radicaux), développé par Gradiant, qui analyse l’information obtenue avec l’outil de capture.
> Les contenus texte et images suspects sont signalés
L’agent de police a copié le nom d’un domaine dans l’application. En quelques secondes, l’appli publie une liste de contenus qui sont soit signalés comme suspects, avec un signe d’alerte orange, soit validés parce qu’inoffensifs, avec un logo vert. Le policier peut aussi utiliser un outil de filtrage qui examine les contenus au travers de trois catégories : par tâche, domaine ou statut. Chaque élément trouvé fait l’objet d’une analyse des images et du texte.
> Identifier les « termes pertinents » ou les images ou comportements suspects
Dans la catégorie d’analyse de texte, l’appli signalera par exemple un « discours agressif » ou un « langage suspect » et listera tous les « termes pertinents » identifiés (par exemple « musulmans », « terrorisme », « haine », « tuer »…). L’appli identifie également les auteurs de contenus agressifs ou suspects, ce qui permet de passer en revue l’historique de leurs publications en ligne.
Cette analyse est fondée sur trois bases de données développées en collaboration avec l’Université de Toulouse-Jean Jaurès, coordinatrice du projet PRACTICIES, et le cabinet de conseil Bouzar Expertise spécialisé dans les questions d’islam et de radicalisation. Ces bases de données sont respectivement relatives au langage, aux discours agressifs, et aux discours radicaux. Outre l’identification des mots suspects, l’appli analyse les images en détectant les contenus violents (par exemple une bagarre de rue ou une voiture incendiée).
Cette analyse du texte et des images permet de détecter non seulement les contenus radicaux mais aussi tout type de contenu violent ou extrémiste mis en ligne, par exemple, par des hooligans ou des extrémistes de droite.
Un autre aspect de l’outil est qu’il détecte les comportements suspects chez les utilisateurs, comme par exemple une activité accrue pendant une période spécifique, ou un grand nombre de posts sur un sujet en particulier. L’outil peut analyser les comportements suspects sur plusieurs années.
Cet outil développé par Gradiant a été testé dans le cadre du projet PRACTICIES avec des forces de police, qui ont réagi de façon très positive et l’ont jugé utile pour leur travail quotidien.
>>> En savoir plus sur le projet PRACTICIES
>>> En savoir plus sur les webinaires PRACTICIES