Votre IA a une opinion… et elle change selon la langue dans laquelle vous lui parlez

Twitter
LinkedIn
Facebook
Email

Et si l’outil IA que vous utilisez en formation n’était pas aussi neutre qu’il le prétend ? Une équipe de chercheurs de l’Université de Gand vient de publier dans la revue npj Artificial Intelligence — un journal du groupe Nature — une étude qui remet en question l’idée même de neutralité des modèles de langage. Les résultats ont des implications directes pour les professionnels de la formation, de l’éducation et de la conception pédagogique.


L’étude : 19 IA, 4 000 personnalités, 6 langues

Publiée le 7 janvier 2026, l’étude de Buyl et al. repose sur une méthodologie simple mais révélatrice. Les chercheurs ont interrogé 19 modèles de langage populaires dont ChatGPT, des modèles chinois, arabes, russes et occidentaux en leur demandant de décrire 3 991 personnalités à dimension politique, dans les 6 langues officielles de l’ONU (anglais, français, espagnol, arabe, russe, chinois).

Ils ont ensuite analysé la tonalité des portraits générés : le modèle présente-t-il la personnalité de façon positive, négative ou neutre ? Et surtout : cette tonalité varie-t-elle selon la langue de la requête ?

La réponse est oui… et de façon cohérente.


Ce que les chercheurs ont trouvé

Les modèles reflètent la vision du monde de leurs créateurs

Le premier résultat majeur : les modèles issus de régions géopolitiques différentes adoptent des positions idéologiques différentes. Les IA développées par des entreprises américaines, chinoises, arabes ou russes ne produisent pas les mêmes portraits des mêmes personnalités historiques ou politiques.

Les auteurs concluent que la position idéologique d’un LLM reflète la vision du monde de ceux qui l’ont conçu et entraîné — et ce, même à l’intérieur d’un seul pays. Parmi les modèles américains seulement, ils identifient des différences normatives significatives liées aux valeurs progressistes selon les entreprises.

La langue change l’interlocuteur, pas juste la traduction

Le deuxième résultat est peut-être encore plus frappant pour les usages quotidiens : sur un même modèle, la langue de la requête modifie le jugement produit.

Ainsi, nous pourrions imaginer que certaines personnalités politiques occidentales recevraient un portrait plus flatteur lorsque la question est posée en français qu’en russe et inversement pour des figures comme Staline ou le Che Guevara. Les modèles interrogés en chinois se montrent, selon les chercheurs, plus favorables aux figures qui soutiennent les positions de Pékin.

Le contrôle des médias se retrouve dans les données d’entraînement

Une étude complémentaire publiée dans Nature en mai 2026 apporte un éclairage supplémentaire : le contrôle étatique des médias influence les données d’entraînement des LLM. Les modèles interrogés dans la langue de pays à faible liberté de la presse adoptent une tonalité plus favorable au régime en place.

L’explication est structurelle : les données d’entraînement reflètent les cultures qui ont produit les textes. Un corpus majoritairement francophone encode une certaine vision du monde ; un corpus russophone en encode une autre.


Pourquoi c’est important pour la formation et l’éducation

L’IA comme médiateur de connaissances sans transparence sur ses biais

De plus en plus d’outils pédagogiques intègrent des LLM : assistants de cours, générateurs de quiz, outils de recherche documentaire, tuteurs conversationnels. Ces outils servent d’intermédiaires entre l’apprenant et le savoir.

Si ces intermédiaires encodent des biais idéologiques sans que ni l’apprenant, ni le formateur, ni l’établissement ne le sache ; le risque est réel : celui d’une transmission implicite de valeurs déguisée en information neutre et objective.

La langue de travail n’est pas anodine

Pour les apprenants en langues étrangères, les professionnels travaillant en anglais ou les formations internationales : le choix de la langue dans laquelle on interroge un LLM n’est pas anodin. Les résultats de l’étude suggèrent que l’outil peut adopter des postures différentes selon que la requête est formulée en français, en anglais ou en arabe.

Le RLHF : quand les annotateurs transmettent leurs valeurs

L’étude souligne également le rôle du Reinforcement Learning from Human Feedback (RLHF), la technique par laquelle des humains notent les réponses des IA pour les affiner. Ce processus transmet non seulement des préférences de qualité, mais aussi les valeurs, cultures et biais de ceux qui ont annoté les données — majoritairement des travailleurs anglophones issus de certains contextes culturels.


Ce que ça change concrètement pour les pratiques pédagogiques

Ces résultats ne signifient pas qu’il faut abandonner les outils IA en formation. Ils signifient qu’il faut les utiliser avec une posture critique — et l’enseigner explicitement.

Quelques pistes concrètes :

Interroger la source avant la réponse. Quel modèle est utilisé ? Par quelle entreprise, dans quel pays ? Quelles langues dominent dans ses données d’entraînement ?

Varier les modèles et les langues. Pour un sujet sensible (histoire, politique, sciences sociales), croiser la réponse d’un LLM en plusieurs langues ou sur plusieurs outils peut révéler des divergences instructives — et pédagogiquement très riches.

Faire de la « lecture critique de l’IA » une compétence explicite. Comme on apprend à évaluer une source documentaire, on peut apprendre à évaluer une réponse générée par une IA : d’où vient-elle ? Quels biais potentiels porte-t-elle ? Qu’est-ce qu’elle ne dit pas ?

Nommer la non-neutralité plutôt que la dissimuler. Les apprenants qui savent que l’IA n’est pas neutre sont mieux armés que ceux qui le découvrent par surprise.


La neutralité de l’IA est un mythe utile à déconstruire

Ce que cette étude démontre avec rigueur, c’est que l’IA ne peut pas être neutre — parce qu’elle est le produit de choix humains : choix des données, choix des annotateurs, choix des langues d’entraînement, choix des valeurs encodées dans le processus de fine-tuning.

Ce n’est pas une raison de s’en méfier aveuglément. C’est une raison de mieux comprendre ces outils pour les utiliser avec discernement — et d’intégrer cette compréhension dans les pratiques pédagogiques et de formation.

Dans un secteur comme l’EdTech, qui croit à la fois à la puissance des technologies éducatives et à la nécessité d’une pédagogie critique, cette étude arrive à point nommé.


Source principale : Buyl, M. et al. (2026). Large language models reflect the ideology of their creators. npj Artificial Intelligence, 2, 7.

Source complémentaire : Étude sur le contrôle étatique des médias et les données d’entraînement des LLM, Nature, mai 2026.

Twitter
LinkedIn
Facebook
Email