Anthropic Perşembe günü Claude Opus 4.8'i piyasaya sürüyor ve şirket modelin "dürüstlüğünü" övüyor.
BinaenAntropik'e, "tüm modellerini dürüst olmaları için - örneğin destekleyemeyecekleri iddialarda bulunmaktan kaçınmak için" eğitiyor. Ancak "Yapay zeka modelleriyle ilgili genel bir sorun, bazen hemen sonuca varıp, zayıf kanıtlara rağmen çalışmalarını ilerleme kaydettiklerini güvenle sunmaları" olduğunu belirtiyor.
AI laboratuvarı, ilk test uzmanlarının Opus 4.8'in "çalışmasıyla ilgili belirsizlikleri işaretleme olasılığının daha yüksek olduğunu ve desteklenmeyen iddialarda bulunma olasılığının daha düşük olduğunu" bulduğunu iddia ediyor. Şirketin değerlendirmelerine göre Opus 4.8'in olasılığı "önceki modellere göre yaklaşık 4 kat daha az...




