La storia dell’algoritmo che ha craccato ChatGPT - Wired

In collaborazione con dei ricercatori dell'Università di Yale, Robust Intelligence ha sviluppato un metodo sistematico che utilizza modelli di AI "avversari" per scoprire i prompt in grado di aggirare le protezioni dei modelli linguistici di grandi dimensioni (Llm), tra cui GPT-4 di OpenAI, e indurli a comportarsi in modo scorretto.

Mentre si consumava il dramma presso OpenAI, i ricercatori hanno avvertito la società della vulnerabilità, senza però ricevere risposta. "Questo dimostra che c'è un problema di sicurezza sistematico, che non viene affrontato e non viene preso in considerazione – spiega Yaron Singer, amministratore delegato di Robust Intelligence e professore di informatica all'Università di Harvard –. Quello che abbiamo scoperto è un approccio sistematico per attaccare qualsiasi modello linguistico di grandi dimensioni".

Leggi tutto: https://www.wired.it/article/chatgpt-craccato-intelligenza-artificiale-robust-intelligence/

In inglese: https://www.wired.com/story/automated-ai-attack-gpt-4/

Commenti

Post popolari in questo blog

Building a high-performance data and AI organization - MIT report 2023

Dove trovare raccolte di dati (dataset) utilizzabili gratuitamente

AI Will Transform the Global Economy. Let’s Make Sure It Benefits Humanity. - IFM blog