ner_twitter_by_viseo
LinkedIn Google Plus Twitter Email

Traitement du Langage: Le centre de Recherche VISEO récompensé

Lors d’un concours sur la reconnaissance d’entités nommées sur Twitter
09 Novembre 2016

Deuxième place pour les équipes VISEO lors de ce concours dans le cadre de la conférence phare du traitement du langage naturel, au Japon

Lors de la deuxième édition d’un concours sur la reconnaissance d’entités nommées sur Twitter, réalisé dans le cadre de la 26ème conférence phare du traitement du langage naturel, au Japon, les équipes du centre de recherche de VISEO ont terminé deuxième, derrière l’université de Cambridge.

Lors de ce concours, les équipes en présence devaient détecter et étiqueter des entités dans des textes de type Twitter: le concours consistait à attribuer un type particulier (entreprises, personnes, film, produits, etc.) aux mots dans des Tweets.

Filtrer des tweets avec une entité nommée

«Chaque équipe devait développer des systèmes pour de la reconnaissance dans des tweets», nous explique Ioannis Partalas, côté VISEO.

Il s’agissait pour le centre d’extraire ce qu’on appelle les entités nommées -noms de personnes, de produits- de textes dit bruités comme Twitter :

-La tache 1 consistait à repérer ces entités/concepts;
-La tache 2 à leur donner un type (personnes, produits etc.)

Concrètement, les équipes devaient donc filtrer des tweets avec une entité nommée. «Tous les tweets qui comprennent le mot « Trump » (ndlr : interview réalisée le 9 novembre) remonteront dans le tableau en entité "personne"».

Ce système de reconnaissance est historiquement connu sous le nom de NER ou Named-Entity Recognition et visait initialement des textes à la construction grammaticale correcte. Cette reconnaissance devient aujourd’hui un vrai challenge car les tweets ne sont pas toujours bien écrits ou bien construits.

«Dans un second temps, après le filtrage, on peut poursuivre d’autres tâches d’analyse, comme celle des sentiments, poursuit Iaonnis Partalas. S’agit-il d’un tweet mélioratif, péjoratif?».