LinkedIn Google Plus Twitter Email

Recherche

Big data, unstructured data, linked data, open data, private data, Semantics, Analytics, Business intelligence
C’est une évidence : depuis le début de l'humanité, les données, sous toutes leurs formes, sont la base même de la connaissance et l'ingrédient principal de l'innovation. Les données servent donc la cause de la recherche, dont l’activité est la production des connaissances, et de l’innovation dont l’activité est la capacité à créer de la valeur en apportant quelque chose de nouveau, issu ou non de la recherche.

Quelle recherche sur les données ?

La définition même de données a évolué au cours de l'histoire. Nous adoptons ici la définition générale des données comme étant des symboles tels que des mots, des chiffres, des codes ou des tables, des images. Ces symboles (données) peuvent être reliés en phrases, de paragraphes, en équation, former des concepts et des idées pour, à la fin, donner naissance à l'information. L'information peut ensuite encore être structurée et interprétée jusqu’à devenir de la connaissance.

On comprend bien qu’une fois ces données collectées il va falloir les stocker les protéger, pour certaines d’entre elles contrôler leur accès, faire en sorte de pouvoir les analyser, les croiser, les organiser, les relier, les enrichir en continu, les retrouver, y naviguer. Le but ultime étant de leur donner du sens, de les comprendre afin de mieux gérer l’information qu’elles véhiculent et de prendre les meilleures décisions, d’adopter les meilleures stratégies ou de gérer au mieux les risques, et ce, dans différents domaines et différents marchés verticaux.

Le but principal et ambitieux de l’analyse intelligente de données est d’extraire de la connaissance de différentes sources de données. Ceci implique de s’intéresser à analyse de ces données, à leur organisations, à leurs liens, à comment raisonner sur ces données. Tout cela dans le but de soutenir les entreprises dans tous les aspects de leur métier, comme par exemple, la connaissance du marché, de la compétition, la connaissance de ce que pense leur client, la connaissance de leurs données  chiffrées etc. Tout cela dans le but de leur donner tous les atouts pour prendre les meilleures décisions que ce soit au niveau marketing, financier ou technique.

Les données, nous l’avons vu, sont multiformes, nous nous concentrons prioritairement sur l’analyse des données textuelles y compris chiffrées sous leurs formes structurées et non structurées. Notre objectif dans ce domaine est d’étudier différents types d’approches permettant l’extraction et la compréhension de données non structurées et ceci à un niveau sémantique.

L’analyse intelligente des données est un domaine interdisciplinaire axé sur les méthodes permettant d’extraire des connaissances utiles à partir de données brutes qu’elles soient structurées ou non structurées. Il ne s’agit pas de simplement collecter des mots-clés à partir de textes mais bien d’extraire de l’information c’est-à-dire des faits, des intentions et d’aider à leur donner une interprétation. Les applications de ce thème de recherche sont désormais légion au sein des entreprises, on citera par exemple, l'analyse des tendances, le traitement des demandes dans les centres d’appel, le traitement des FAQ , des courriers, des factures ou encore des opinions des clients. Plusieurs types d’approches sont utilisés pour faire une analyse fine des données comme par exemple, les approches statistiques, l’apprentissage automatique, les approches symboliques, les approches hybrides, les différents types de logique ou la représentation des connaissances. Nous ne nous attachons pas à un formalisme particulier notre but étant de produire des techniques d’analyses de données qui soit robustes, fines et puissent s’appliquer à un grand nombre de données et d’applications

Quel est le lien à l'innovation et au positionnement de VISEO?

De nos jours, l'innovation est généralement associée à deux ingrédients principaux: des technologies, d’une part, et des clients prêts à acheter ou à utiliser ces technologies, d’autre part. Contrairement à l’invention, l’innovation se doit d’avoir une

valeur commerciale, elle est associée à l'idée de profit. Le groupe VISEO est premier acteur multispécialiste des systèmes d’information. A ce titre, les données sont depuis longtemps au cœur des métiers du groupe. Par exemple, les ERP stockent des données structurées pour différents buts : la gestion des stocks, du personnel, des finances. La BI fournit des outils pour visualiser et comprendre ces données et au bout du compte faciliter la prise des décisions, gérer les risques, comprendre et anticiper les besoins des clients. Aujourd’hui toute entreprise innovante traitant d’information ou de systèmes d’informations doit être en mesure d’offrir à ses clients une analyse la plus fine possible de ses données.

VISEO, grâce à ses recherches en analyse intelligente des données, va pouvoir élargir son offre et proposer à ses clients un soutien dans la compréhension de leurs données, afin d’en faire le meilleur usage dans le marketing, le développement technique, les décisions stratégiques ou la gestion des risques.

Les projets collaboratifs en cours reliés à cette thématique:

GALATEAS: Le but de GALATEAS est d’offrir aux fournisseurs de contenus numériques une approche innovante leur permettant de mieux comprendre le comportement de leurs utilisateurs à travers l’analyse des informations textuelles contenues dans les journaux de transactions. Cette information permet aux utilisateurs de GALATEAS d’améliorer aussi bien la navigation à travers leur site web que la recherche multilingue de leurs contenus. Les objectifs de GALATEAS sont les suivants:

  • Analyse des journaux de requêtes. Analyser les logs contenant les requêtes des moteurs de recherche d’un fournisseur de contenu afin de produire des rapports sur mesure sur les utilisateurs ayant accès à cette agrégation particulière. L’analyse est basée sur des données aussi bien linguistiques que statistiques.
  • Traduction de requêtes : Traduire des requêtes provenant d’un moteur de recherche externe en plusieurs langues cibles. Ce moteur externe utilise ces traductions pour retourner des résultats dans des langues autres que celle de la requête initiale. Les langues choisies pour GALATEAS sont: l’italien, le français, l’anglais, l’allemand, le néerlandais, l’arabe moderne et le polonais.

LEILAS: L’objectif du projet LEILAS est de proposer une fonctionnalité de géo- référenciation multi-langues sur le contenu de pages web ou de documents, permettant ainsi de leur apporter une dimension géographique. Le projet LEILAS propose de développer la recherche appliquée sur l’identification et la normalisation des entités géographiques. Le projet développera une technologie qui permettra de reconnaitre automatiquement les références à des entités géographiques, telles que par exemple pays, région, villes, adresses, dans les documents Web et de leur associer des coordonnées spatiales.

Lire l'article complet

Porteur de l’Offre
Frédérique SEGOND

Titulaire d'un doctorat en mathématiques appliquées de l'Ecole des Hautes Etudes en Sciences Sociales Frédérique SEGOND rejoint VISEO en 2011.

Frédérique a travaillé pendant 18 ans au Centre européen de recherche de Xerox à Grenoble, France. En 2003, elle est Principal Scientist & Area Manager du groupe de recherche Parsing & Semantics spécialisé dans l’analyse de documents textuels.

Tout au long de sa carrière de chercheuse elle a défini, travaillé et dirigé une vingtaine de projets de recherche collaboratifs tels qu’ALADIN, Europeanna, Galateas et CACAO. Elle a également travaillé au centre scientifique d’IBM France et au centre de recherche d’IBM Watson à Yorktown où elle a étudié les liens entre syntaxe et sémantique.

Frédérique est co-auteur de six ouvrages, de plus de 50 articles scientifiques et de 5 brevets. Elle fait partie du comité de pilotage CONTINT à l'Agence Nationale pour la Recherche (ANR), présidente de l'Association pour le Traitement Automatique des Langues (ATALA), membre du Conseil d’administration d’ELRA (European Language Resources Association), membre du conseil d'administration de l'Université Stendhal, et fournit également son expertise scientifique à la Commission européenne.

Publications et Brevets

Curriculum Vitae