Claude de Loupy « Les technologies de création de contenu sont un vrai danger qu’il va falloir surveiller et il faudra sans aucun doute légiférer dessus ».

Claude de Loupy est le CEO et cofondateur de Syllabs, une entreprise de création de contenu combinant intelligence artificielle et expertise linguistique. Titulaire d’un doctorat en informatique après un parcours d’ingénieur informaticien, à la fin de sa thèse, il choisit de travailler en entreprise plutôt que de poursuivre la recherche en université.

Pouvez-vous nous parler de votre parcours et comment en êtes-vous arrivé à créer Syllabs ?

À mon sens, après mon doctorat en informatique, travailler en entreprise ouvrait un peu plus de perspectives, c’est donc ce que j’ai choisis, même si je travaille toujours avec des collègues qui sont dans la recherche. Puis au bout de 5 ans, je me suis demandé quoi faire et comme j’avais des idées et des projets que personne d’autre ne voulait faire, je me suis lancé et j’ai créé Syllabs.Ma famille est une famille de littéraire alors que j’ai une appétence pour les mathématiques, avec Syllabs, j’ai réussi à faire la conjonction des deux en travaillant sur le traitement et l’analyse des langues de manière automatique.

En quoi consiste Syllabs ?  

Au départ, Syllabs était un laboratoire de recherche privé, mais petit à petit, nous avons évolué pour devenir une start-up. Notre produit principal est la génération automatique de contenu. C’est-à-dire que nous allons produire automatiquement des textes en plusieurs langues et sur différents sujets à partir de données.Par exemple, nous allons produire les articles des résultats d’élections à partir des données qui proviennent du ministère de l’Intérieur. Nous allons prendre les données de chaque commune et nous produisons le contenu correspondant pour chaque commune, en temps réel et pour plusieurs médias. Aux dernières élections législatives en 2022, nous avons produit plus de 300 000 textes en 4 heures. Toujours pour les médias, nous rédigeons des articles de météo, des résultats sportifs, des descriptifs de commune en fonction des données de l’INSEE. Nous travaillons aussi sur des descriptifs de produits, des descriptifs automobiles, des descriptifs d’appareils photo, y compris sous un angle de news. Par exemple, Syllabs peut rédiger des articles qui parlent de la sortie du dernier téléphone de Google ou d’Apple. Nous produisons également du contenu pour des agences immobilières, près de 2700 agences utilisent Syllabs quotidiennement pour produire leurs annonces.

Comment Syllabs utilise-t-elle l’IA pour générer du contenu ?


Il y a plusieurs types d’intelligence artificielle, l’une à base de machine Learning, qui va apprendre automatiquement des comportements, des analyses ou apprendre quelque chose à partir d’exemples. Et il y a des méthodes dites symbolique, c’est-à-dire que des humains vont dire à la machine ce qu’elle doit faire. À Syllabs, nous utilisons les deux, je m’occupe plutôt du côté machine learning et mon associé du côté méthode symbolique (les règles à donner au logiciel). À Syllabs, nous utilisons soit l’une soit l’autre des méthodes soit les deux combinées en fonction des besoins et de ce qui est le plus performant. Pour la génération automatique de contenu, nos clients nous ont demandé d’avoir des textes parfaits qu’ils puissent publier sans relecture, ce qui n’est pas faisable en utilisant simplement du machine learning. La machine commet toujours des erreurs, même avec les dernières avancées technologies cela ne reste pas complètement fiable. Pour que ce soit fiable, nous avons besoin de passer par des humains et d’avoir quelque chose de complètement traçable.

Quels sont les futurs projets de Syllabs ?

Nous sommes en train de travailler sur un nouveau projet où l’idée est de produire des contenus sur d’autres sujets, suffisamment ouverts pour que nous ne soyons pas obligés de vérifier. Cela consisterait à produire des articles sur du jardinage, des travaux de maison ou les nouvelles technologies par exemple.

Pourquoi avoir choisi de travailler dans le domaine de l’intelligence artificielle ?


Je suis entré dans l’intelligence artificielle, car c’est un moyen de simuler comment fonctionne les humains. En chirurgie, nous pouvons découper le corps humain et voir comment il fonctionne, alors que pour l’intelligence, nous ne savons pas. Nous pouvons l’étudier notamment grâce à l’imagerie neuronale. Mais on n’a toujours pas compris exactement comment l’intelligence fonctionne. L’intérêt de l’intelligence artificielle est que nous arrivons à dire que peut-être que l’intelligence fonctionne comme ça, car avec la machine nous arrivons à la faire. L’intelligence artificielle est un lien fabuleux entre la technique et l’étude de l’humain. Y compris philosophique, chez Syllabs en tout cas nous nous posons plein de questions sur l’éthique et sur la sociologie.


Est-ce qu’il y a des risques d’une mauvaise utilisation de Syllabs ?


Tant que la direction de Syllabs est celle qui est actuellement, non il n’y a pas de risques quant à une mauvaise utilisation de Syllabs. Nous surveillons énormément ce que nous faisons. Nous avons déjà refusé l’utilisation de Syllabs à plusieurs reprises face à des demandes qui n’étaient clairement pas éthiques. Mais ce genre de technologie peut évidemment être utilisée à des fins non éthiques voire dangereuses pour la démocratie. La production d’information est effectivement centrale à la connaissance et à la vision que les gens ont du monde qui les entourent. Nous avons vu ce que ça a pu donner récemment avec la manipulation d’information. C’est catastrophique ! Nous mettons en garde à chaque fois que nous le pouvons sur l’utilisation néfaste de cette technologie. Selon moi les technologies de création de contenu sont un vrai danger qu’il va falloir surveiller et il faudra sans aucun doute légiférer dessus.

Y-a-t-il un risque d’homogénéisation des articles ?

Effectivement, il y a un risque d’homogénéisation des articles, mais c’est parfois quelque chose de revendiqué, dans le domaine de l’immobilier par exemple. Pour les médias il y a clairement une problématique d’homogénéisation qui se pose, mais nous ne sommes pas encore arrivés au stade où tous les articles seront rédigés par Syllabs. La rédaction d’un article à propos d’un petit match local par un humain coûte beaucoup trop cher. Ces outils-là sont un moyen d’aider la presse écrite régionale à trouver un modèle plus viable, car la PQR, il y a très peu de lecteur, mais énormément de travail, et ce qui intéresse vraiment les lecteurs, c’est qu’on parle du local, pour ce faire, il faut parler du petit match local qui s’est joué ici, de l’accident qui a eu lieu là, les journalistes sont débordés par de petits faits importants dont il faut parler. Ils sont donc du mal à trouver du temps pour aller interviewer une personne ou enquête sur d’autres sujets. Les médias locaux sont de plus en plus fragiles, l’homogénéisation est donc un moyen d’éviter leurs disparitions. Leurs disparitions peut être dangereuses. Aux États-Unis, après les élections, des études ont montré que presque partout où les médias locaux ont disparu, Trump arrivait en tête des scrutins. Il y a une importance fondamentale des médias locaux pour la démocratie. Or, le modèle économique est très complexe, les journalistes ne peuvent pas traiter tous les sujets et donc la génération automatique de textes est très utile pour assurer la survie de ces petits médias.

L’intelligence artificielle, a-t-elle beaucoup évolué par rapport à vos débuts ?


Oui, l’intelligence artificielle a énormément évolué, ça a plus rien avoir avec l’intelligence artificielle d’il y a 14 ans quand je suis rentré dans l’intelligence artificielle. Les technologies sont effrayantes, car ce sont des boites noires et comment on va arriver à contrôler, mais cela est fascinant.


Propos recueillis par Antoine Le Gouz de Saint Seine et Alexandre Perier