De nombreuses entreprises et leurs dirigeants pensent que la seule exploitation des données client donne un avantage concurrentiel imbattable. 7 questions à se poser pour construire des barrières à l’entrée avec l’utilisation des données.

Plus vous avez de clients, plus vous pouvez recueillir de données, et plus l’apprentissage automatique (machine learning) vous permet d’offrir un meilleur produit qui attire plus de clients. Et ainsi vous marginalisez éventuellement vos concurrents. Ainsi va la pensée dominante. Souvent cependant, cette hypothèse est fausse. La plupart du temps les gens surestiment l’avantage que les données confèrent.

Oui l’avènement du numérique et du cloud permettent aux entreprises de traiter rapidement et d’exploiter de grandes quantités de données. Oui les algorithmes d’apprentissage automatique en analysant cette abondance de données permettent à l’entreprise d’ajuster son offre et même de la personnaliser à la granularité du client. Cependant, l’apprentissage automatique ne garantit pas forcément des barrières à l’entrée défendables.

A l’heure où les entreprises ont construit des datalake, nommé des Chief Data Officer et recueilli plus de données que jamais pensant ainsi devenir une data-driven company il est important de prendre du recul, avec un prisme business et marketing, sous peine de se noyer dans ce fameux datalake.

L’excellent article d’Andrei Hagiu et Julian Wright paru dans la version US d’HBR de janvier/février 2020 (https://hbr.org/2020/01/when-data-creates-competitive-advantage) établit 7 conditions pour que l’utilisation de la data et du machine learning crée une différenciation durable ; 7 situations dans lesquelles les données et leur exploitation peuvent apporter de la valeur (monétisable) à votre entreprise.

En voici une traduction synthèse.

  1. Quelle est la valeur ajoutée des données clients par rapport à la valeur autonome de l’offre ?

Nous pouvons illustrer cette condition avec la société Mobileye – fournisseur de systèmes avancés d’aide à la conduite (ADAS, prévention des collisions et avertissements de sortie de voie). Recueillir le maximum de données de test auprès des clients constructeurs automobiles et l’apprentissage automatique sont essentiels pour améliorer la précision du système dans ce contexte où la sécurité est primordiale. La valeur des données clients est très élevée.

À l’inverse, la valeur de l’apprentissage auprès des clients est relativement faible pour les fabricants de téléviseurs intelligents. Jusqu’à présent, les consommateurs ne se soucient pas beaucoup de fonctionnalités fournies autour de la data qui sont également proposées par des fournisseurs de services de streaming tels qu’Amazon et Netflix. Ils prennent plus en compte la taille du téléviseur, la qualité de l’image, la facilité d’utilisation et la durabilité lors des décisions d’achat.

Ainsi, bien que les informations provenant des données soient importantes, elles ne garantissent pas des barrières à l’entrée défendables si elles n’apportent pas de valeur ajoutée à l’offre.

  1. Avec quelle rapidité la valeur marginale de l’apprentissage fondé sur les données diminue-t-elle ?

Ou en combien de temps les données clients supplémentaires n’augmentent plus la valeur d’une offre ?

Une entreprise peut constater que quelques clients et un nombre de test modéré sont suffisants pour atteindre une précision de 90%, mais que beaucoup plus de tests avec un plus grand nombre de constructeurs automobiles sont nécessaires pour atteindre 99%.

Si nous sommes dans le cas de Mobileye, où la sécurité est primordiale, la valeur marginale des données client ne diminue pas rapidement bien sûr. Et il serait difficile pour un concurrent de reproduire les données.

Un contre-exemple d’une entreprise où la valeur marginale des données des utilisateurs diminue rapidement est celui des thermostats intelligents. Ces produits n’ont besoin que de quelques jours pour connaître les préférences de température des utilisateurs tout au long de la journée. Dans ce contexte, l’apprentissage basé sur les données ne peut pas fournir un avantage concurrentiel important. Nest pionnier des thermostats intelligents en 2011 fait maintenant face à une concurrence importante.

Assurez-vous donc que la valeur marginale de l’apprentissage fondé sur les données ne diminue pas rapidement avec le temps.

 

  1. À quelle vitesse la pertinence des données utilisateur se déprécie-t-elle ?

Si les données deviennent rapidement obsolètes, toutes choses étant égales par ailleurs, il sera plus facile pour un rival d’entrer sur le marché, car il n’aura pas besoin de réaliser les efforts correspondant aux années d’apprentissage des données par l’entreprise leader en place.

Toutes les données accumulées par Mobileye au fil des ans auprès des constructeurs automobiles restent précieuses dans les versions actuelles de ses produits. Il en va de même des données sur les utilisateurs du moteur de recherche que Google a collectées au cours des décennies.

Pour les jeux de gaming cependant, la valeur de l’apprentissage à partir des données des utilisateurs a tendance à diminuer rapidement. Zynga réputée pour s’appuyer fortement sur l’analyse des données des utilisateurs pour prendre des décisions de conception, n’a pas réédité le succès de FarmVille : l’utilisation des enseignements tirés d’un jeu apporte peu de valeur pour le suivant. Les jeux de gaming sont sujets à des modes, et les préférences des utilisateurs changent rapidement au fil du temps, ce qui rend difficile la création d’avantages concurrentiels durables basés sur les données de jeu de gaming.

  1. Les données sont-elles propriétaires, ce qui signifie qu’elles ne peuvent pas être achetées auprès d’autres sources, facilement copiées ou rétro-conçues ?

Il est essentiel de disposer de données client uniques avec peu ou pas de substituts pour créer une barrière à l’entrée défendable. Pensez à Adaviv, une start-up qui propose un système de gestion des cultures qui permet aux cultivateurs de surveiller en permanence les plantes individuellement. Le système repose sur l’IA, un logiciel de traitement de l’image par ordinateur et une technique propriétaire d’annotation des données pour suivre la biométrie des plantes non visible à l’œil humain, comme les premiers signes de maladie ou le manque de nutriments adéquats. Il traduit ensuite les données en informations que les producteurs peuvent utiliser pour prévenir les épidémies et améliorer les rendements.

La situation concurrentielle des fournisseurs de filtres anti-spam, n’est pas la même. Ils peuvent acquérir des données utilisateur à un prix relativement bas et calibrer rapidement leur solution. Cela explique l’existence de dizaines de ces fournisseurs sur ce domaine.

Le progrès technologique peut également menacer une position basée sur des données uniques ou propriétaires. Longtemps le logiciel de reconnaissance vocale devait être formé par les voix des individus : plus une personne l’utilisait, plus il devenait précis. Les pionniers étaient leaders. Toutefois, au cours de la dernière décennie, des améliorations technologiques ont été apportées aux systèmes de reconnaissance vocale indépendamment du locuteur, qui peuvent maintenant être entrainés sur des ensembles de données vocales accessibles au public et prendre un temps minimal ou nul pour apprendre à comprendre la voix d’un nouveau locuteur. Ces avancées ont permis à de nombreuses entreprises de fournir de nouvelles applications de reconnaissance vocale, sapant la position dominante des pionniers.

  1. Est-il difficile d’imiter des améliorations de produits basées sur les données des clients ?

Même lorsque les données sont uniques ou propriétaires et produisent des informations précieuses, il est difficile de créer un avantage concurrentiel durable si les améliorations qui en résultent peuvent être copiées par des concurrents sans données similaires.

Deux facteurs affectent la capacité des entreprises à surmonter ce défi. La première est de savoir si les améliorations sont cachées ou profondément intégrées dans un processus de production complexe, ce qui les rend difficiles à reproduire. Pandora, service de streaming musical, permet de personnaliser les stations de radio selon les préférences de chaque utilisateur. Plus un utilisateur écoute ses stations, mieux Pandora peut adapter les sélections musicales à cet utilisateur. Une telle personnalisation ne peut pas être facilement imitée par aucun rival.

Le deuxième facteur est la rapidité avec laquelle les informations provenant des données des clients changent. Plus elles le font rapidement, plus elles sont difficiles à imiter pour les autres. Par exemple, de nombreuses fonctionnalités de conception de l’interface de Google Maps peuvent être facilement copiées. Mais un élément clé de la valeur de Google Maps est sa capacité à prédire le trafic et à recommander des itinéraires optimaux, ce qui est beaucoup plus difficile à copier car il exploite les données utilisateur en temps réel qui deviennent obsolètes en quelques minutes.

  1. Les données d’un utilisateur contribuent-elles à améliorer le produit pour le même utilisateur ou pour d’autres ?

Idéalement, il fera les deux, mais la différence entre les deux est importante. Lorsque les données d’un utilisateur améliorent le produit pour cette personne, l’entreprise peut le personnaliser individuellement, créant un coût au changement pour l’utilisateur. Lorsque les données d’un utilisateur améliorent le produit pour d’autres utilisateurs, cela peut, mais pas nécessairement, créer des effets de réseau. Les deux types d’améliorations contribuent à fournir une barrière à l’entrée, mais la première rend les clients existants très captifs, tandis que la seconde offre un avantage clé dans la concurrence pour de nouveaux clients.

L’apprentissage des données dans le cas de Pandora est limité à chaque utilisateur du service. En revanche, Spotify qui s’est beaucoup concentré sur la fourniture aux utilisateurs de fonctionnalités de partage et de découverte, telles que la possibilité de rechercher et d’écouter les stations d’autres personnes, créent des effets de réseau directs et attirent des clients supplémentaires.

De toute évidence, la personnalisation basée sur l’apprentissage à partir des données d’un utilisateur individuel permet de garder captifs les clients existants, mais elle ne conduit pas au type de croissance exponentielle que produisent les effets de réseau.

  1. À quelle vitesse les informations provenant des données des utilisateurs peuvent-elles être intégrées aux produits ?

Les cycles d’apprentissage rapides empêchent les concurrents de rattraper leur retard, surtout si plusieurs cycles d’amélioration des produits se produisent pendant le contrat du client. Mais lorsqu’il faut des années ou des générations de produits successives pour apporter des améliorations basées sur les données, les concurrents ont plus de chance d’innover entre-temps et de commencer à collecter leurs propres données utilisateur. Ainsi, l’avantage concurrentiel des données client est plus fort lorsque l’apprentissage des clients d’aujourd’hui se traduit par des améliorations fréquentes du produit pour ces mêmes clients plutôt que pour les clients futurs du produit ou du service.

Un contre-exemple est offert par les prêteurs en ligne directs, tels que LendUp et LendingPoint, qui apprennent à prendre de meilleures décisions de prêt en examinant l’historique de remboursement des utilisateurs et comment il est en corrélation avec divers aspects du profil et du comportement des utilisateurs. Ici, le seul apprentissage pertinent pour les emprunteurs actuels est celui des précédents emprunteurs, qui se reflète déjà dans les contrats et les taux proposés aux emprunteurs actuels. Il n’y a aucune raison pour que les emprunteurs se soucient de tout apprentissage futur dont le prêteur pourrait bénéficier, car leurs contrats existants n’en seront pas affectés.

CONCLUSION

A l’heure du « tout connecté » bien sûr que l’apprentissage basé sur les données sera de plus en plus utilisé pour améliorer et personnaliser les offres. Cependant, les entreprises ne bâtiront de positions concurrentielles solides qu’à la condition que la valeur ajoutée des données clients soit élevée et durable, que les données soient propriétaires et conduisent à des améliorations de produits difficiles à copier, ou que l’apprentissage basé sur les données crée des effets de réseau.

Dans les décennies à venir, l’amélioration des offres avec les données des clients sera un prérequis pour rester dans le jeu, et cela peut donner aux entreprises historiques un avantage sur les nouveaux entrants. Mais dans la plupart des cas, cela ne générera pas de dynamique où le gagnant prend tout le marché. Au lieu de cela, les entreprises avec le plus de valeur et les plus puissantes dans un avenir prévisible seront celles qui sont à la fois construites sur des effets de réseau et améliorées par un apprentissage basé sur les données, comme les places de marchés d’Alibaba et d’Amazon, l’App Store d’Apple et les réseaux sociaux de Facebook.

Chronique synthèse du texte original d’Andrei Hagiu et Julian Wright paru dans la version US d’HBR de l’édition de janvier/février 2020 (https://hbr.org/2020/01/when-data-creates-competitive-advantage

Andrei Hagiu est professeur agrégé de systèmes d’information à la Questrom School of Business de l’Université de Boston.

Julian Wright est professeur d’économie à l’Université Nationale de Singapour.

<<< À lire également : Vous ne Pouvez Pas Contrôler Vos Données Personnelles, Vendez-Les ! >>>