Si vous avez déjà communiqué avec une intelligence artificielle, via la parole ou l’écrit, vous avez donc indirectement utilisé ses capacités en matière de traitement automatique du langage naturel ou TALN. L’IA capable de communiquer par le langage s’appuie sur des algorithmes différents de ceux de machine Learning classiques car les données qu’ils doivent traiter sont moins bien ordonnées. Alors que les IA sont d’ordinaire alimentées de données structurées, organisées en lignes ou en colonnes, les IA de TALN font face à des données désordonnées, des textes non structurés, des styles différents, des fautes, des accents, etc.

Cet article se concentre essentiellement sur les algorithmes dédiés à la compréhension du langage naturel écrit, mais les concepts sont facilement transposables au traitement du langage oral. Voici quatre concepts indispensables pour comprendre comment fonctionnent les machines capables de lire et d’écrire.


 

1. Le contexte est primordial

Les mots peuvent avoir différents sens en fonction du contexte. Par exemple, le mot « mortel » peut être utilisé de différentes manières et être assez ambigu. En général, cela ne pose pas de problèmes aux humains mais les machines ont du mal à gérer ces ambiguïtés. Un concept clé a été développé ces dernières années : l’imbrication de vecteurs de mots. Les méthodes de deep Learning telles que Word2vec (Google) ou GloVe (Stanford) créent des représentations numériques de mots hors contexte afin de mieux les appréhender.

Ce concept est appliqué à de simples associations de mots. Par exemple : « Les hommes sont aux rois ce que les femmes sont aux ___ », la même logique s’applique aux vecteurs de mots. Les modèles d’IA peuvent utiliser les représentations numériques des mots pour les replacer dans leur contexte afin de mieux comprendre les textes lus.

 

2. L’IA agit par mimétisme

L’IA apprend à lire et à écrire en s’appuyant sur des expériences humaines. Pour leur entraînement, les modèles d’IA sont alimentés de conversations historiques afin d’enseigner à la machine ce qui est bien écrit et ce qui ne l’est pas. L’utilisation des données d’entraînement pour former et affiner les modèles n’est pas nouvelle mais cela limite les capacités de l’IA à traiter et créer des textes. En général, l’IA est seulement capable de répéter ce que les humains ont déjà dit mais elle ne peut pas générer de nouvelles séquences de mots ou des raisonnements. Très récemment, un nouveau concept de deep Learning, l’apprentissage de séquence en séquence, permet d’ingérer et de générer des séquences de données, et améliore sensiblement les capacités de l’IA à reconnaître les « styles » d’écriture et à produire par la suite de nouveaux textes.

 

3. Les métadonnées et les systèmes interconnectés

Il est possible de répondre de plusieurs manières à une même question en fonction des informations encadrant le message : les métadonnées. Si le client d’un site de vente en ligne demande à suivre sa commande, l’IA peut lui demander de quelle commande il s’agit, regarder le suivi et donner le résultat. L’IA pourrait également aller un peu plus loin et regarder l’historique de la conversation de cet utilisateur. Si elle allait encore plus loin, elle pourrait remarquer que ce client a posé trois fois la même question la semaine passée et répondre avec empathie : « Je suis désolé que vous ayez dû poser cette question plusieurs fois ». Les métadonnées peuvent inclure l’heure à laquelle le message a été envoyé ou le moyen de communication utilisé (un tweet ou un courriel).

 

4. L’étendue du vocabulaire

La quantité de combinaisons de mots ou de caractères est pharamineuse et nécessite beaucoup de temps et de puissance pour être traitée. Le problème est d’autant plus visible lorsqu’une machine doit mémoriser tous les mots possibles et imaginables, les combinaisons de mots et les fautes les plus courantes. Elle doit donc se souvenir de millions de combinaisons. Pour éviter ce travail fastidieux, une technique de réduction de dimension peut être utilisée pour extraire la structure latente d’un texte afin d’optimiser les performances et la vitesse de traitement. Ce genre de techniques est utilisé pour comprendre les sujets complexes et les utiliser pour fournir de meilleures réponses. 

Des technologies comme Alexa, Siri ou les chatbot se servent, entre autres, de ces quatre concepts afin de communiquer avec nous au quotidien. Le traitement du langage naturel continuera de présenter de nouveaux obstacles et d’inspirer de nouvelles solutions et de belles découvertes dans le domaine de l’IA et du deep learning.