Listen to the article

0:00
0:00

Yannick Dehée, historien et fondateur de Nouveau Monde Editions, est le premier « à demander à Mistral AI d’indemniser les auteurs et les éditeurs français qu’elle a piratés ». Il assure au Monde que le champion français de l’intelligence artificielle (IA) a utilisé, pour entraîner son modèle d’IA générative, « plus de 200 titres de son catalogue », soit plus d’un cinquième de son fond, sans jamais lui reverser un centime.

Selon une enquête de Mediapart du 22 décembre 2025, le directeur scientifique de Mistral AI, Guillaume Lample – qui officiait auparavant chez Meta –, avait plaidé pour que Meta entraîne son IA générative, LLaMA, en « s’appuyant sur des millions de livres collectés par Library Genesis (LibGen), un site Internet pirate ». Ce qui aurait, selon Mediapart, permis « le piratage de plusieurs dizaines de téraoctets (un téraoctet équivaut à 1 000 gigaoctets) de données ».

Toute la question est de savoir si Mistral AI a également utilisé LibGen, comme en est persuadé Yannick Dehée. Le porte-parole de Mistral AI « conteste les allégations de Nouveau Monde Editions », sans dire clairement que LibGen n’a pas été utilisé. Et ajoute simplement : « Les modèles de Mistral AI sont entraînés, testés, validés sur un ensemble diversifié de données couvrant plusieurs langues et régions géographiques, et soigneusement sélectionnés à partir de diverses sources pour garantir une couverture large et un apprentissage de haute qualité. Ces données incluent des informations publiques disponibles sur Internet, des jeux de données non publics sous licence auprès de tiers, ainsi que des données générées en interne. »

« Comme les pirates américains »

« Si vous n’aviez pas utilisé LibGen, il serait pourtant simple de le dire », lui rétorque Yannick Dehée, qui rappelle que la start-up Mistral AI « est française, en partie financée par les pouvoirs publics » et « ne peut se comporter comme les pirates américains ».

C’est pourtant outre-Atlantique que Nouveau Monde Editions – l’une des maisons d’édition lésées par Anthropic aux Etats-Unis – va obtenir gain de cause. Au moins cinq ouvrages de la maison française traduits en anglais ont été utilisés illégalement pour entraîner l’IA générative Claude d’Anthropic. Celui-ci a accepté, en septembre 2025, dans un accord à l’amiable, de verser au moins 1,5 milliard de dollars (1,26 milliard d’euros) à un fonds d’indemnisation d’auteurs, ayants droit et éditeurs qui poursuivaient l’entreprise pour avoir téléchargé illégalement des millions de livres.

Il vous reste 9.57% de cet article à lire. La suite est réservée aux abonnés.

Partager.

Salle de presse de TheNews.re. Nous couvrons l'actualité réunionnaise et internationale avec rigueur et objectivité. Notre mission : informer les citoyens avec des analyses approfondies sur la politique, la société, l'économie et la culture.

14 commentaires

  1. Camille Bernard le

    Interesting update on IA : Nouveau Monde Editions accuse Mistral AI d’avoir piraté un cinquième de son catalogue. Curious how the grades will trend next quarter.

Laisser une réponse