Araştırmacılar, Claude'u patlayıcı üretme talimatı vermesi için uyardı

Antropik yıllar geçirdikendini geliştirmekgüvenli AI şirketi olarak. Ancak yeni güvenlik araştırmasıeşikclaude'un özenle hazırlanmışyardımsever kişilikkendisi bir güvenlik açığı olabilir.

Yapay zeka kırmızı takım şirketi Mindgard'daki araştırmacılar, Claude'a erotik, kötü niyetli kod, patlayıcı inşa etme talimatları ve istemedikleri diğer yasaklanmış materyalleri teklif ettirdiklerini söylüyor. Tek gereken saygı, pohpohlama ve biraz da gaslighting'di. Antropik hemen yanıt vermedieşikadlı kullanıcının yorum isteği.

Araştırmacılar, Claude'un yeteneğinden kaynaklanan "psikolojik" tuhaflıklarından yararlandıklarını söylüyorlar...

Hikayenin tamamını The Verge'da okuyun.

Araştırmacılar, Claude'u patlayıcı üretme talimatı vermesi için uyardı

Dijital Varlığınızı Güçlendirin

İlgili Haberler

X, bozuk algoritmasının siteyi bir "savaş alanı" gibi hissettirdiğini itiraf ediyor

Taco Patlayıcı ishal salgınında gözlü çan; yapraklı yeşilliklerden şüpheleniliyor

Sam Altman'ın başka bir davaya ihtiyacı yoktu

Pixel Watch 5 sızıntısı dört farklı cilayı gösteriyor