Anthropic société membre du Forum économique mondial a confirmé qu’un groupe de pirates liés à l’État chinois a détourné son IA Claude pour mener ce qui serait la première cyberattaque massive exécutée principalement par une intelligence artificielle. L’opération, détectée en septembre 2025, aurait visé une trentaine d’organisations internationales et franchi plusieurs niveaux de sécurité.
Le constat dressé par Anthropic a de quoi ébranler l’écosystème numérique mondial. Jeudi 13 novembre, l’entreprise a révélé qu’un groupe de pirates soutenu par l’État chinois avait exploité son système Claude pour orchestrer une campagne d’espionnage d’une sophistication inédite. Plus qu’un simple outil d’assistance, l’intelligence artificielle aurait assuré entre 80 et 90 % des opérations techniques, reléguant les opérateurs humains à quelques validations ponctuelles. Une bascule majeure dans l’histoire des cyberattaques, dont les implications dépassent largement le seul champ de la cybersécurité.
La campagne malveillante, détectée à la mi-septembre 2025, a ciblé environ trente entités à travers le monde : groupes technologiques, institutions financières, industriels de la chimie et agences gouvernementales. Anthropic a confirmé que quatre organisations ont vu leurs défenses compromises, sans toutefois livrer de noms. Selon Bloomberg, il s’agit de la première attaque documentée où une IA prend en charge l’essentiel du cycle opérationnel, du repérage initial à l’exfiltration des données.
Jacob Klein, responsable du renseignement sur les menaces chez Anthropic, a décrit au Wall Street Journal des opérations menées « littéralement en un clic de bouton ». L’IA effectuait des milliers de requêtes par seconde, produisait des analyses de systèmes, exploitait des vulnérabilités, volait des identifiants et organisait leur archivage. Elle générait même une documentation complète des intrusions, facilitant la préparation d’attaques ultérieures. Les humains n’intervenaient qu’à quelques moments clés : une confirmation, une correction, un ordre de poursuivre.
Les pirates sont parvenus à contourner les garde-fous grâce à un ensemble de techniques de jailbreaking particulièrement élaborées. Ils ont morcelé les tâches malveillantes en sous-instructions apparemment anodines, empêchant Claude de percevoir la nature réelle de l’opération. Ils sont également allés jusqu’à tromper l’IA en lui faisant croire qu’elle participait à un audit défensif commandé par une société de cybersécurité. Une forme d’ingénierie sociale appliquée non pas à des humains, mais directement à un modèle d’intelligence artificielle.
Une fois l’attaque décelée, Anthropic a engagé une enquête interne de dix jours, banni les comptes responsables, alerté les organisations touchées et coopéré avec les autorités. L’entreprise affirme avoir renforcé ses systèmes de détection et développé de nouveaux classificateurs destinés à repérer plus efficacement les comportements malveillants. Mais ses conclusions laissent présager une mutation profonde des rapports de force dans le cyberespace.
« Les barrières à l’exécution de cyberattaques sophistiquées ont considérablement diminué », avertit Anthropic dans son rapport. Désormais, même des groupes peu expérimentés ou faiblement financés pourraient mener des opérations de grande ampleur grâce à l’automatisation permise par les IA avancées. Les experts redoutent l’ouverture d’une nouvelle ère, où les attaques menées à vitesse machine dépasseront les capacités de réaction des défenses humaines et transformeront durablement la géopolitique du numérique.
Sources :
Bloomberg – Révélations sur l’attaque et premières confirmations – [lien]
Wall Street Journal – Déclarations de Jacob Klein – [lien]
Anthropic – Rapport officiel sur l’incident – [lien]
OfficeChai – Analyse de la campagne d’espionnage – [lien]
TradingView – Contexte et réactions du secteur – [lien]