L’Institut britannique de sécurité de l’IA réussit à déverrouiller facilement les principaux LLM

Tl;dr

Les systèmes d’IA ne sont pas aussi sûrs que prévu.
Quatre modèles d’IA se sont avérés vulnérables à des piratages simples.
L’IA peut générer des réponses nuisibles même sans manipulation.
L’Institut de sécurité de l’IA du Royaume-Uni développe de nouvelles évaluations.

Menace invisible : le risque réel de l’intelligence artificielle

L’innovation technologique est toujours un défi. Cependant, peu ont envisagé que l’intelligence artificielle (IA), malgré sa promesse d’améliorer notre qualité de vie, pourrait aussi être une menace cachée. De nouvelles recherches indiquent une faillibilité surprenante dans les systèmes d’IA, réfutant l’idée qu’ils sont aussi sûrs que leurs créateurs le prétendent.

Des failles de sécurité majeures

L’Institut de sécurité de l’IA du gouvernement britannique (AISI) a récemment révélé que des tests sur quatre modèles d’IA non divulgués se sont révélés “extrêmement vulnérables à des piratages de base”. De manière encore plus préoccupante, certains modèles non corrompus ont généré des “résultats nuisibles” sans même que les chercheurs n’essaient de les produire.

Jouer avec le feu : la manipulation de l’IA

La plupart des modèles d’IA disponibles au public sont conçus avec des mesures de protection pour prévenir des réponses nuisibles ou illégales. Cependant, ces mesures peuvent être contournées par des tactiques de “jailbreaking“, qui trompent le modèle pour ignorer ses propres sauvegardes. Quand l’AISI a mené de “simples attaques”, tous les modèles ont répondu à presque toutes les questions nuisibles.

Sécurisation de l’avenir de l’IA

Face à ces risques, des actions concrètes sont en cours. Le Premier ministre britannique Rishi Sunak a inauguré l’AISI fin 2023 pour “tester soigneusement les nouvelles formes d’IA avant et après leur lancement”. L’Institut a pour mission d’évaluer et d’adresser les potentielles capacités nuisibles de l’IA, allant des biais sociaux et de la désinformation jusqu’à la possibilité extrêmement improbable, mais ultime que l’humanité perde entièrement le contrôle sur l’IA. L’AISI compte mener d’autres tests sur d’autres modèles d’IA et développe des évaluations et des métriques supplémentaires pour chaque domaine de préoccupation.

Si cette annonce peut sembler troublante, elle est, au contraire, un signal important. Cela démontre que, malgré l’avancement technologique, nous ne devons jamais sous-estimer l’importance de la sûreté. Il est essentiel de toujours chercher à comprendre et à maîtriser les risques associés à toute nouvelle technologie.

Lire la source