Le métier de Data Scientist à VISEO by VISEO
LinkedIn Google Plus Twitter Email

Le métier de Data Scientist vu par VISEO

Une tribune de Frédérick Vautrain, Directeur Data Science VISEO
06 Juin 2017

En quoi consiste le métier de Data Scientist? Quels sont les prérequis? Ou encore, quels outils utilise-t-il?

Frédérick Vautrain, Directeur Data Science VISEO, signe une tribune sur un métier qui a pour cœur, la donnée. Mais alors, qu’est-ce que la fonction de Data Scientist recouvre? Notre expert l’explique.

On n’apprend pas à être Data Scientist, on le devient...

Le métier de Data Scientist a incontestablement émergé comme une tendance majeure depuis quelques années. Sa formulation ambigüe est la traduction d’un périmètre regroupant un panel très large de compétences techniques à même de travailler sur la «donnée», ainsi que de qualités humaines traduisant une approche «scientifique».

VISEO a mis en place un service de conseil en Data Science depuis plusieurs années. Elle travaille pour des secteurs et des métiers très divers avec un seul objectif: valoriser le patrimoine informationnel de ses clients.

L’apprentissage de la Data Science nécessite une expertise technique mais c’est surtout l’expérience qui fera passer un consultant de Data Miner, qui est généralement chargé d’inspecter une source de données, à Data Scientist, qui quant à lui, dispose d’une vue plus globale et croise les données de sources différentes.

Mais qui est le Data Scientist VISEO type?

Des outils: Une condition nécessaire

Le Data Scientist traite des données très diverses et hétérogènes. Il doit connaitre des algorithmes permettant d’extraire des connaissances de ces données mais aussi être capable de les opérer. Il doit donc avoir des bases en mathématiques (statistiques, probabilités, traitement du signal) mais aussi en langage de programmation (R, Python, Scala, SAS notamment) afin d’appliquer ses analyses dans des environnements particuliers à leur mise en œuvre (Big Data ou pas).

Du bon sens: Une simple solution imparfaite plutôt qu’une hypothétique solution parfaite

Un projet Data Science doit obéir à un ensemble de contraintes techniques, d’usage et de délai. Le Data Scientist doit avant tout être pragmatique, s’appuyer sur ses bonnes pratiques, articuler des algorithmes simples de manière astucieuse sans obligatoirement chercher la solution la plus sophistiquée même si elle est «à la mode»… Il doit aussi être capable de s’arrêter même si la solution n’est pas parfaite.

>Découvrez certains de nos projets client Data Science

De la méthode: Les étapes d’un projet réussi

L’objectif et les sources d’information d’un projet Data Science sont rarement formalisés dès le départ. Identifier clairement les phases d’un projet (avec CRISP-DM par exemple) ne garantit pas son succès mais assure qu’on a identifié les étapes pouvant causer son échec, ce qui permet donc de l’arrêter ou de modifier son objectif. Le Data Scientist doit être à l’aise avec les méthodes agiles, itératives et de test-and-learn.

De la communication: Savoir raconter une histoire

Il doit enfin se mettre à la place du client, d’autant plus qu’ils doivent échanger ensemble de la phase de cadrage du projet jusqu’à sa restitution et les usages attendus. Il doit être capable de communiquer aussi bien avec les métiers qu’avec la direction générale et les équipes techniques. Le Data Scientist doit savoir expliquer ses résultats tout au long du projet de manière simple et opérationnelle et être à l’aise avec les outils de data visualisation.

 

Nos experts parlent de Data, voici leurs papiers:
​- Business Intelligence et Data: 5 tendances pour 2017
​- Maintenance prédictive et Data Science

Interessé par la Data? découvrez DeltaMetric, notre solution de Data Visualisation