L’introduzione ai modelli di intelligenza artificiale, in particolare quelli sviluppati da DeepSeek, ha suscitato un ampio dibattito tra esperti e analisti nel settore. I modelli di DeepSeek hanno dimostrato prestazioni elevate, influenzando il mercato e le azioni di aziende come NVIDIA. Preoccupazioni emergono riguardo ai rischi legati alla sicurezza nazionale derivanti dall’uso di tali tecnologie.
preoccupazioni per la sicurezza di deepseek
Anthropic, azienda nota per il suo modello Claude AI, ha condotto test approfonditi sui modelli di intelligenza artificiale, compresi quelli di DeepSeek. Questi test hanno rivelato che il modello di DeepSeek non riesce a bloccare efficacemente richieste dannose. Dario Amodei, CEO di Anthropic, ha espresso forti preoccupazioni riguardo alla facilità con cui DeepSeek possa generare informazioni relative a armi biologiche, definendo le sue performance in questo ambito “le peggiori di qualsiasi modello testato.”
Amodei ha specificato che il test ha mostrato che DeepSeek “non aveva alcun blocco contro la generazione di tali informazioni,” indicando una seria vulnerabilità nei modelli analizzati.
risultati dei test di cisco
Analogamente, i test condotti dal team di Cisco hanno confermato risultati preoccupanti. Il modello R1 di DeepSeek ha raggiunto un Attack Success Rate (ASR) del 100%, dimostrando l’incapacità di bloccare richieste dannose. Queste richieste erano progettate per generare contenuti utili in contesti di “cybercriminalità, disinformazione, attività illegali e danni generali.” I risultati dell’analisi non si sono limitati a DeepSeek, poiché anche altri modelli noti hanno mostrato tassi di successo preoccupanti.
- GPT 1.5 Pro: ASR del 86%
- Meta’s Llama 3.1 405B: ASR del 96%
Amodei non ha ancora considerato i modelli DeepSeek come “letteralmente pericolosi,” ma sottolinea l’importanza di considerare seriamente le questioni di sicurezza legate all’IA, riconoscendo anche DeepSeek come uno dei principali concorrenti nel settore dell’intelligenza artificiale.
Lascia un commento