La semaine dernière Amazon a annoncé “Echo Show”, la mise à jour majeure de son haut-parleur intelligent “Echo”, dont la voix est celle de l’assistant digital d’Amazon appelé Alexa. Avec 70% de part de marché, Amazon domine le secteur du haut-parleur intelligent.

Echo Show est une version qui comprend l’ajout d’une caméra et d’un écran, élevant ainsi le niveau en faisant passer l’interface vocale à l’état d’application vidéo. En même temps que cette annonce, Amazon a évoqué d’autres avancées: l’appel vidéo main-libre, l’apparition de listes d’achats et de paroles de chansons pendant l’écoute de musique, des caméras de surveillance, et bien d’autres choses encore.

Nous pourrions être à l’orée d’un moment similaire à celui connu avec l’iPhone. La sortie de l’iPhone il y a dix ans a marqué le commencement d’une transformation radicale du marché de la téléphonie mobile: nous sommes passés des téléphones sans fil à un nouvel outil informatique de communication, qui est maintenant dominant, surtout auprès du jeune public. Dans la foulée, cela a changé le monde des affaires et donné naissance à une nouvelle portée de géants technologiques. Il semblerait que quelque chose de très ressemblant soit sur le point de se produire.

Le fondateur de l’entreprise IdeaLab, entreprise aussi surnommée “l’incubateur technologique”, considère que les ventes du produit Echo suivent le rythme des ventes de l’iPhone lors de sa première année sur le marché, et cela même si Echo est au service d’un foyer entier, quand l’iPhone est individuel.

La reconnaissance vocale a franchi un seuil il y a quelques années, en étant appliquée à des outils non-spécialisés comme les haut-parleurs intelligents.

J’utilise Google Voice depuis plus de cinq ans. Entre autres choses, Google Voice transcrit vos messages vocaux et vous les envoie par email. Il y a cinq ans, les transcriptions étaient déjà effectives: vous pouviez généralement savoir qui vous avait appelé et à quel sujet; mais elles étaient criblées de fautes, souvent assez drôles. Aujourd’hui les transcriptions de Google Voice sont très claires et atteignent fréquemment la perfection. La transcription de l’oral à l’écrit est la technologie permettant aux haut-parleurs intelligents d’introduire des instructions vocales dans un système informatique qui fournit un service, comme Echo. Cette technologie est maintenant prête à connaître son heure de gloire.

La reconnaissance vocale va sûrement beaucoup enrichir le marché des services digitaux du cloud, ce qui inclue la majeure partie des activités d’Amazon, Google, Facebook, Snap etc. Dans le monde développé presque tout le monde possède un smartphone digne de ce nom aujourd’hui, mais les grandes innovations du secteur de la téléphonie mobile ont le plus souvent lieu au sein de la génération Y. Cette génération est non seulement celle des enfants du digital, mais aussi celle des enfants nés à l’ère des téléphones portables (du moins les plus jeunes d’entre eux). Une grande partie de la culture de cette génération s’est développée au moyen du smartphone, et ils sont généralement meilleurs à taper sur leur portable que nous autres les vieux. Cependant, la maison intelligente, dont Echo est reine, attire les gens de toutes les générations.

De plus, les appareils fonctionnant avec cette technologie vocale libèrent les utilisateurs du clavier-écran. Dans mon cercle d’amis, ce ne sont pas uniquement les jeunes geeks qui se vantent d’avoir acheté Echo et qui sont si enthousiastes à l’idée de le montrer; c’est une large intersection, où tout le monde se rencontre.

L’outil de la reconnaissance vocale est un moyen puissant d’enraciner l’Internet des objets (l’extension d’Internet à des lieux ou à des objets du monde physique). Les éléments technologiques de l’Internet des objets (IdO) sont disponibles depuis plus d’une décennie. Il a fallu attendre une application optimale pour rendre ce marché accessible à tous, comme les feuilles de calcul l’ont fait pour les PC.

Jusqu’à il y a peu, seulement un champ limité des moyens d’utilisation de l’IdO se trouvait sur le marché. Aujourd’hui nous assistons à l’explosion des outils de la domotique, avec l’arrivée d’Echo, d’Alexa et d’autres. Si cela engendre une masse importante de logiciels installés et d’utilisateurs, de nombreux autres outils de l’IdO peuvent émerger, et à un rythme bien plus rapide.

La partie la plus décisive de la reconnaissance vocale est étroitement liée au domaine de l’IdO. Amazon facilite la commande en ligne de produits pour les utilisateurs d’Echo en identifiant le besoin: “Alexa, il nous faut plus de couches. S’il-te-plaît, réitère notre dernière commande. Planifie la livraison pour demain.” Echo permet à Amazon d’accéder à la liste des courses du foyer et d’y répondre le premier. Nous ne faisons que commencer à découvrir ce qui peut être fait au moyen de cet outil; c’est le point même où se trouvait le smartphone vers 2008.

Ainsi, pour presque n’importe quel entrepreneur ou dirigeant d’entreprise, il est important de réaliser les implications de la reconnaissance vocale dans le cas où celle-ci devient le prochain moyen informatique de communication, et si nous nous trouvons en effet à un tournant semblable à celui initié par l’iPhone. Explorons ensemble quelques unes des questions pouvant s’avérer utiles:

  • Comment le commerce en ligne (ou tout autre type de commerce) sera t-il affecté par la reconnaissance vocale ? Les portables ont profondément changé le commerce. Par exemple, la stratégie de “l’achat dans l’instant” d’Amazon est un aperçu du nouveau genre de commerce en ligne créé par la reconnaissance vocale. Qui dit mieux ?
  • Quel en sera l’impact sur nos moyens de communication? Les portables ont permis l’arrivée de nouveaux modes de communication, basés sur les photos, comme Instagram et Snapchat. L’écran et la caméra desquels l’Echo Show sera muni indiquent qu’Amazon visera les outils de communication: cela pointe dans la direction d’appels vidéo main-libre et d’appels réalisés depuis n’importe quelle pièce de la maison en utilisant les extensions de l’outil Echo.
  • Comment la recherche en ligne et la publicité évolueront-elles ? La recherche par reconnaissance vocale est déjà un élément clé des haut-parleurs intelligents. La publicité est drastiquement différente sur des appareils mobiles où l’utilisation d’Internet est telle qu’il n’y a pas toujours de place pour l’apparition de publicité. Ce n’est qu’après un dur labeur que les plateformes mobiles de réseaux sociaux comme Facebook ont finalement pu comporter de la publicité dans leur flux. Est-ce que mon haut-parleur intelligent commencera à me présenter des publicités audio, comme certaines pages web le font ? Si c’était le cas, je serais tenté de régler cela à coups de marteau, à moins que je ne sois accro à ce que j’obtiens de l’outil.
  • Qu’en est-il du divertissement ? Alexa joue déjà de la musique. Avec des écrans connectés à internet, la même chose pourrait être possible pour la vidéo. Echo devient un canal de distribution pour les médias – Amazon accorde un emplacement de choix à ses produits, et collecte les données d’utilisation. Que Netflix prenne note.

Cette liste de questions est prématurée et non exhaustive. L’outil de la reconnaissance vocale prenant de l’ampleur, les entrepreneurs doivent conserver un œil affûté sur la façon dont cela va changer leurs entreprises, sur les menaces que cela implique et, surtout, sur les opportunités créées. Il pourrait s’agir du nouveau Big Bang du monde de l’information, duquel les échos nous parviennent déjà.