Listen to the article
« Ben là, tu veux que j’te jase en québécois ? Pas de trouble. » Inviter ChatGPT à parler québécois vous plongera dans un florilège riche – quoique un peu cliché – d’expressions locales. Si votre agent conversationnel sait parfaitement montrer qu’il maîtrise la langue et ses subtilités, mieux vaut ne pas se fier aux apparences. « C’est trompeur. Il s’agit d’une simulation de l’accent et non d’une compréhension fine des spécificités locales, juge Luc Lespérance, chargé d’enseignement au département de technologies de l’information de HEC Montréal. L’intelligence artificielle [IA] n’a pas de réelle compréhension de la culture québécoise. »
Et pour cause, la majorité des modèles d’IA sont conçus et développés en anglais, souvent depuis les Etats-Unis. Les bases de données, qui servent à entraîner les IA génératives, sont elles aussi massivement anglophones. Luc Lespérance cite en exemple une étude de 2024, selon laquelle la version 3 de ChatGPT aurait été entraînée avec moins de 8 % de contenu non anglophone. « La raison principale est que l’anglais est la langue majoritaire sur Internet, mais aussi en sciences et en recherche », estime le professeur.
Il vous reste 79.35% de cet article à lire. La suite est réservée aux abonnés.






7 commentaires
Plusieurs modèles d’IA prétendent parler québécois, mais est-ce vraiment qu’une imitation superficielle?
Exactement, c’est pourquoi les scientifiques soulignent l’importance de bases de données locales.
Je trouve troublant que seulement 8% des contenus non anglophones soient utilisés pour former l’IA. Quelles solutions?
Des initiatives québécoises cherchent à remédier à ce déséquilibre.
L’article souligne un problème plus large : la fragmentation des langues sur Internet.
Intéressant de voir comment la domination de l’anglais influence même l’IA. Le français devient-il une langue de seconde classe?
Est-ce que l’IA peut vraiment capturer les nuances culturelles sans comprendre la culture ?