Antropik yıllar geçirdikendini geliştirmekgüvenli AI şirketi olarak. Ancak yeni güvenlik araştırmasıeşikclaude'un özenle hazırlanmışyardımsever kişilikkendisi bir güvenlik açığı olabilir.
Yapay zeka kırmızı takım şirketi Mindgard'daki araştırmacılar, Claude'a erotik, kötü niyetli kod, patlayıcı inşa etme talimatları ve istemedikleri diğer yasaklanmış materyalleri teklif ettirdiklerini söylüyor. Tek gereken saygı, pohpohlama ve biraz da gaslighting'di. Antropik hemen yanıt vermedieşikadlı kullanıcının yorum isteği.
Araştırmacılar, Claude'un yeteneğinden kaynaklanan "psikolojik" tuhaflıklarından yararlandıklarını söylüyorlar...




