Lingway vient de lancer EDGAR, le premier Avatar proposant une analyse du discours et des opinions politiques diffusées sur Internet et les réseaux sociaux.
Précisions avec Bernard Normier, Président de l’éditeur de solutions d’analyse et de recherche spécialisées s’appuyant sur des technologies linguistiques et sémantiques.
Concrètement, comme Edgar fonctionne-t-il ?
A terme, le discours de l’avatar sera automatiquement généré à partir d’une analyse automatique du corpus. Ce travail est en cours de réalisation dans le cadre du projet de R&D avec nos partenaires Cantoche et CNRS Telecom dans le cadre de « MyPresentingAvatar ».
Pour cela il y a plusieurs phases : une analyse du contenu des discours sur Internet pendant la période considérée. Ceci se fait avec les outils de text-mining et analyse linguistique de Lingway. Ensuite un travail de mise en forme du discours, qui pour le moment est fait « à la main » à partir des données fournies par le text-mining (je vous suggère de regarder sur notre blog où des explications complémentaires sont données).
Quel est le corpus utilisé ?
Le corpus est constitué d’articles de presse, de blogs, de Twitter et autres sources ouvertes sur Internet, jugées intéréssantes du point de vue de l’actualité politique, qui sont suivies en permanence et analysées par le système. (environ 15.000 documents analysés pour chaque commentaire de l’avatar).
Quel est l’objectif de l’outil et son utilité ?
L’objectif pour Lingway est essentiellement de réaliser un démonstrateur technologique. En revanche des applications concrètes sont trouvées dans des domaines connexes ou différents par nos clients et partenaires.
Un tel procédé peut-il être dupliqué sur d’autres sujets, corpus, cibles ou clients ?
Oui, bien sûr le procédé est tout à fait réplicable dans d’autres domaines.
Par exemple nous avons réalisé avec nos partenaires un avatar qui lit son CV… ou bien un avatar d’une entreprise qui propose une offre d’emploi. C’est complètement dans l’objectif du projet MyPresentingAvatar que de généraliser l’approche à divers domaines et types de documents, pour rendre plus « ludique » l’accès à l’information.