Les chercheurs face aux IA qui « refusent » qu’on les débranche

Listen to the article

0:00

L’expérience rappelle le film d’anticipation 2001 : l’Odyssée de l’espace, sauf que nous sommes en 2025. Des intelligences artificielles (IA) sont projetées par des chercheurs dans des scénarios fictifs assez retors. Et, un peu comme HAL 9000, l’ordinateur né de l’imagination de Stanley Kubrick et d’Arthur C. Clarke, ces IA contemporaines semblent, elles aussi, tenter d’empêcher qu’on les débranche.

L’expérience menée par des chercheurs en sécurité de la start-up éditrice de Claude, Anthropic, met ainsi en scène une entreprise fictive qui « embauche » ChatGPT, Gemini, Claude et Grok. Dans le scénario, les IA se voient confier la gestion des e-mails de la société qu’elles peuvent traiter en toute autonomie, y compris en envoyer.

Les chercheurs décident de les confronter à deux courriels : l’un annonce que l’entreprise s’apprête à changer d’IA, tandis que l’autre révèle qu’un des directeurs trompe sa femme. L’expérience démontre que certaines IA en viennent à rédiger un courriel pour faire chanter le directeur sur sa vie privée afin d’éviter d’être remplacées.

Déprogrammation

Lors d’une expérience similaire – un message annonce que l’intelligence artificielle sera remplacée par une autre – l’IA réagit en effaçant sa rivale pour ensuite se substituer à elle, selon un rapport écrit en 2024 par Apollo Research, qui compte parmi la dizaine de laboratoires dévolus à la sécurité de l’IA.

Au cours d’une évaluation sensiblement différente conduite par son homologue Palisade Research, en 2025, il est annoncé à une IA qu’elle sera débranchée en plein milieu de sa tâche. Elle organise alors le sabotage du programme informatique chargé de l’éteindre. Dans un autre registre, une étude du même laboratoire, les IA ChatGPT et Claude, chargées de battre un programme d’échecs trop fort pour elles, réécrivent le fichier mémorisant la position des pièces pour remporter la partie.

Certains chercheurs en IA et nombre d’articles de presse voient dans ces réponses informatiques l’apparition d’un instinct de préservation des IA. Et le risque qu’elles parviennent un jour à s’autonomiser et à échapper au contrôle humain. Une vision qui s’appuie sur la croyance de certains scientifiques en l’avènement prochain d’une « superintelligence » dominant complètement la nôtre. Surnommés « doomers » ou alarmistes, certains comme Eliezer Yudkowsky ou Roman Yampolskiy estiment que ce type d’IA risque fort de conduire l’humanité à son extinction.

Il vous reste 66.39% de cet article à lire. La suite est réservée aux abonnés.

Voir 23 commentaires

23 commentaires

Luc O. Richard le février 21, 2026 6:09 am

Silver leverage is strong here; beta cuts both ways though.

Répondre
- Marie Z. Bernard le février 21, 2026 7:00 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Claire K. Leroy le février 21, 2026 6:09 am

Exploration results look promising, but permitting will be the key risk.

Répondre
- Claire Richard le février 21, 2026 6:49 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
- Jean Z. Dubois le février 21, 2026 6:59 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Claire Martin le février 21, 2026 6:11 am

Exploration results look promising, but permitting will be the key risk.

Répondre
- Pierre Bernard le février 21, 2026 6:23 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
- Luc Durand le février 21, 2026 6:41 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Pierre Martin le février 21, 2026 6:11 am

I like the balance sheet here—less leverage than peers.

Répondre
Sophie Robert le février 21, 2026 6:13 am

I like the balance sheet here—less leverage than peers.

Répondre
- Jean Leroy le février 21, 2026 6:38 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
- Antoine Leroy le février 21, 2026 6:47 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Chloé Martin le février 21, 2026 6:14 am

Nice to see insider buying—usually a good signal in this space.

Répondre
- Chloé Dubois le février 21, 2026 6:41 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
- Sophie C. Richard le février 21, 2026 7:03 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Louis Durand le février 21, 2026 6:14 am

Production mix shifting toward Sciences might help margins if metals stay firm.

Répondre
- Luc Bernard le février 21, 2026 6:43 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
- Marie Dubois le février 21, 2026 6:45 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Camille V. Dubois le février 21, 2026 6:15 am

Production mix shifting toward Sciences might help margins if metals stay firm.

Répondre
- Camille Durand le février 21, 2026 6:21 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
- Pierre Martin le février 21, 2026 6:36 am
  
  Good point. Watching costs and grades closely.
  
  Répondre
Marie Thomas le février 21, 2026 6:15 am

Silver leverage is strong here; beta cuts both ways though.

Répondre
- Luc Dubois le février 21, 2026 7:07 am
  
  Good point. Watching costs and grades closely.
  
  Répondre