Related image

 

Dans le cadre de la formation sur l’intelligence artificielle pour les consultants/étudiants du Master 2 Consulting de l’EDHEC, j’ai découvert une nouvelle façon d’appréhender le machine learning.

Le machine learning est devenu une composante incontournable ces dernières années de la productivité en entreprise créant un marché à lui seul de plus de 8 milliards d’euros dans le monde. La data, cet or du XXIè siècle, est le moteur de cette nouvelle technologie. Elle apporte énormément de valeurs dans les industries comme la santé ou l’éducation mais également dans des milieux où il est moins évident de voir son impact de façon horizontal dans le métier de consultant. Il suffit de jeter un coup d’0œil au job board de datajob pour comprendre que le marché du travail est en pleine métamorphose et que les consultants doivent également maîtriser cette technologie.

Mais je ne vous apprends rien. Data et machine learning… ce sont deux buzzwords que nous utilisons à tort et à travers…  alors qu’ils sont en réalité les deux faces d’une même pièce, non seulement complémentaires mais inhérents l’un à l’autre. C’est pourquoi il est important de définir le machine learning, les acteurs de sa chaîne de valeur et comment la donnée nourrit ce processus. Aujourd’hui, un projet d’automatisation réunit certaines technologies qui permettent à une machine d’apprendre en fonction d’exemples passés pour expliquer un événement (but descriptif) ou anticiper un événement futur (but prédictif).

 

 

Pour définir le machine learning, j’aime utiliser cette analogie avec les approches stratégiques : Top down vs Bottom up.

Historiquement, un ingénieur utilisait l’approche Top down afin d’arriver à un résultat suffisamment sophistiqué d’automatisation en établissant un système de règles que la machine enregistrait et suivait à la lettre. Elle partait des règles préétablies pour descendre petit à petit vers un modèle prédictif.

Data + Logic = Output

Aujourd’hui, le machine learning repense complètement la façon dont nous concevons l’automatisation et l’apprentissage. C’est l’approche Bottom up. La machine part des résultats, des données et de l’expérience pour déduire en remontant un modèle qui permettra de réaliser ces prédictions.

Data + Output = Logic

Afin de vulgariser ces concepts et d’aborder de manière pédagogique la relation donnée-machine learning, nous avons donc décidé de décomposer ici les acteurs de cet écosystème dans un article içi : les “paramètres et technologies” qui correspondent à la matière première, les “orchestrateurs“ qui sont les outils et enfin les produits. Cette technique va nous permettre d’expliquer leurs rôles au sein même de la chaîne.

 

Machine learning-value chain

 

 

Quelles que soient les infrastructures utilisées (pipeline traditionnelle vs plateforme clé en main) c’est le même processus :

  1. On récolte la donnée via les outils d’acquisition si elle est externe à l’entreprise ou bien en connectant les différentes applications (CRM, ERP) via des APIs (c’est le moyen de communication entre deux programmes) pour établir un lac ou une base de données.
  2. On nettoie, prépare et structure cette donnée pour la rendre exploitable par un modèle d’analyse : les modèles sont souvent fournis en open source (surtout dans les plateformes clés en main) mais la différence et l’intelligence d’un apprentissage efficace résident surtout dans la création de “features” pertinentes (ce sont les paramètres utilisés par le modèle que l’ingénieur va choisir) via la préparation en amont de cette donnée. Cette étape est importante et c’est souvent un très gros point de différenciation.
  3. Une fois la donnée préparée, on choisit le modèle selon le cas d’utilisation voulu et on entraîne le modèle sur cette donnée : c’est la phase d’apprentissage.
  4. Une fois le modèle entraîné — on le déploie sous forme de produit
  5. L’utilisateur aide à améliorer la pertinence du produit parce qu’il fournit de la donnée qui traverse la chaîne et permet d’entraîner le modèle en continu via l’effet de réseau de réseau décrit ci-dessous :

 

 

Plus l’utilisateur utilise le produit, plus il fournit de la donnée qualifiée, plus les algorithmes deviennent pertinents, plus le produit s’améliore, plus l’utilisateur utilise le produit… Le machine learning est devenu la pierre angulaire d’un projet d’automatisation et le support de nombreuses sociétés de services. Mais avant de l’utiliser, encore faut-il comprendre où se cache la valeur, comment et où l’utiliser.