Pionnier mondial du XML et fondateur de Docugami, Jean Paoli annonce l’ouverture de la filiale européenne de sa deep tech spécialisée dans l’intelligence documentaire. Avec cette installation en France, il renoue avec ses racines scientifiques tout en inscrivant Docugami dans un débat stratégique : comment bâtir une IA ouverte, utile aux entreprises, et respectueuse de la souveraineté des données ? Rencontre avec un bâtisseur discret de l’infrastructure numérique mondiale.
Forbes France : Vous avez débuté à l’INRIA après une formation aux Ponts, avant de partir aux États-Unis. Qu’est-ce qui a motivé ce grand saut, et que retenez-vous de cette transition entre la recherche publique française et la tech américaine ?
Jean Paoli : Je suis né à Beyrouth, j’ai étudié à l’École des Ponts puis fait un master dans une école créée par l’INRIA à Sophia-Antipolis. C’est là que j’ai rencontré Gilles Kahn, un grand chercheur qui m’a beaucoup appris et m’a ouvert les portes de l’écosystème des startups techniques de l’époque. J’ai toujours été un ingénieur au service de la recherche, et ces premières années dans les startups del’INRIA m’ont formé en profondeur : j’y ai appris à penser les documents comme des graphes semi-structurés, à comprendre que dans les documents métier — contrats d’assurance, rapports nucléaires, protocoles médicaux — se cache une information hiérarchique, complexe, qu’on peut modéliser.
Puis, en décembre 1995, lors d’une conférence, Microsoft m’a repéré. Ils m’ont proposé de rejoindre aux Etats-Unis l’équipe d’Internet Explorer, en pleine bataille contre Netscape. C’est aussi à cette époque que j’ai contribué à créer le XML, une technologie qui a permis de structurer l’information sur le web, en complément du HTML. Le XML a posé les bases de l’e-commerce : il fallait un langage pour visualiser, mais aussi pour échanger des données transactionnelles.
Vous êtes co-créateur du XML et avez contribué aux formats docx ou pptx. À l’époque, aviez-vous conscience de construire les fondations d’un internet structuré ?
J.P. : Oui, en partie. Ce que nous faisions avec XML, c’était de construire une grammaire universelle pour que les machines puissent enfin comprendre les documents, pas seulement les afficher. J’ai ensuite porté cette logique dans plusieurs produits chez Microsoft : InfoPath, pour permettre aux utilisateurs de créer des formulaires structurés ; la transition des formats Word, Excel, PowerPoint vers docx, xlsx, pptx — ce “x”, c’est pour XML — ; et même dans l’écosystème cloud. J’ai aussi fondé Microsoft Open Technologies, une filiale dédiée à l’ouverture de Microsoft vers l’open source.
Chez Microsoft, vous avez créé des unités stratégiques et porté l’ouverture au logiciel libre. Qu’avez-vous appris à cette échelle que vous appliquez aujourd’hui en tant qu’entrepreneur avec Docugami ?
J.P. : Microsoft est pragmatique : à l’époque du lancement d’Azure, j’ai compris que l’adoption passait par l’ouverture. Le cloud ne pouvait pas être propriétaire. C’est pourquoi j’ai œuvré pour qu’Azure soit compatible open source, et que Microsoft entre en dialogue avec ces communautés. Cinq ans plus tard, ils ont racheté GitHub. Le monde a changé.
Mais il y a une tension structurelle dans l’open source : comment innover tout en restant économiquement viable ? Il y a plusieurs pistes, comme par exemple un cœur technologique ouvert, pour encourager la recherche et l’interopérabilité, et une couche différenciante protégée, pour garantir la pérennité du modèle.
Vous avez vécu plusieurs révolutions technologiques. Qu’est-ce qui distingue selon vous l’intelligence artificielle actuelle des précédentes vagues d’innovation ?
J.P. : Ce qui change avec les LLMs, c’est leur capacité à interpréter des contenus ambigus, longs, denses. J’ai quitté Microsoft en 2017, pris six mois de recul, puis fondé Docugami en mars 2018, trois mois après la publication des Transformers par Google. Mon idée était simple : marier ces nouveaux modèles avec ma connaissance des documents complexes, et structurer cette information via XML enrichi.
Nous avons été parmi les premiers à utiliser des LLM open source, et à les adapter à des cas métier. Aujourd’hui, cette approche agentique — où l’IA comprend les enjeux métier, le contexte juridique ou réglementaire d’un document — est clé pour les entreprises. Mais cela demande des années de travail. Quand ChatGPT est arrivé, cela a validé ce que nous construisions depuis longtemps.
Avec Docugami, vous attaquez un problème ancien : les documents métiers. Qu’est-ce qui a changé aujourd’hui pour qu’on puisse enfin les rendre “compréhensibles” par l’IA ?
J.P. : La technologie est enfin au point pour comprendre les documents métier à grande échelle. Un contrat, un rapport, un cahier des charges : ce sont des objets vivants, ambigus, riches de sens. Ce que permet l’IA aujourd’hui, c’est de transformer ces textes en graphes de connaissances, lisibles par les machines. Mais il faut que ce soit transparent, auditable, explicable. Docugami combine des LLMs open source, des agents spécialisés et des structures sémantiques pour atteindre ce niveau de précision.
Vous misez sur des modèles open source, une IA agentique et des graphes de connaissance. Ce sont des choix très marqués : relèvent-ils d’une conviction philosophique autant que technologique ?
J.P. : Les deux. Je pense qu’il faut sortir des modèles opaques. Une IA souveraine, c’est une IA que l’on comprend, que l’on contrôle, et qui respecte nos documents. Je suis convaincu que l’Europe peut devenir le centre de gravité de cette approche. Nous utilisons LLAMA, Mistral, et d’autres modèles selon les cas. Ce n’est pas juste un choix technologique, c’est une question de société.
Pourquoi avoir choisi la France comme siège européen de Docugami ? Est-ce un retour aux sources ou une décision stratégique ?
J.P. : Les deux. Je suis un pur produit de l’excellence française. Et je crois qu’il y a ici une dynamique exceptionnelle autour de l’IA open source. Quand je vois ce que font des acteurs comme Mistral, Hugging Face, les laboratoires publics… je me dis que la France a un rôle à jouer. J’ai aussi passé du temps à rencontrer des chercheurs, des institutions, et des partenaires potentiels. On va recruter ici en premier un scientifique de haut niveau et l’entourer de stagiaires doctorants pour collaborer avec les laboratoires francais et en un deuxième temps un responsable commercial. Je veux créer de la propriété intellectuelle en France, contribuer à cette souveraineté numérique dont on parle tant.
Avec le recul, quel conseil donneriez-vous à un(e) jeune ingénieur·e français·e qui veut entreprendre à l’international aujourd’hui ?
J.P. : Ne vous posez pas trop de limites. Soyez curieux, cherchez les ponts entre les mondes. La France forme des esprits brillants, mais il faut aller voir ailleurs, comprendre d’autres cultures, puis revenir avec cette richesse. Et surtout, restez fidèles à vos intuitions profondes : c’est souvent là que se cache l’innovation.
À lire aussi : Future of AI | La nouvelle guerre de l’IA : 5 leçons pour la doctrine de l’OTAN

Abonnez-vous au magazine papier
et découvrez chaque trimestre :
- Des dossiers et analyses exclusifs sur des stratégies d'entreprises
- Des témoignages et interviews de stars de l'entrepreneuriat
- Nos classements de femmes et hommes d'affaires
- Notre sélection lifestyle
- Et de nombreux autres contenus inédits