İnsandan insana iletişimde, empatik veya kibar olma arzusu çoğu zaman dürüst olma ihtiyacıyla çatışır; dolayısıyla, birinin duygularını korumak yerine gerçeğe değer verdiğiniz durumlar için "acımasızca dürüst olmak" gibi terimler kullanılır. Artık yeni araştırmalar, büyük dil modellerinin, kullanıcıya "daha sıcak" bir ton sunmak üzere özel olarak eğitildiğinde bazen benzer bir eğilim gösterebileceğini öne sürüyor.
İçindeNature'da bu hafta yayınlanan yeni bir makaleOxford Üniversitesi İnternet Enstitüsü'nden araştırmacılar, özel olarak ayarlanmış yapay zeka modellerinin, "bağları korumak ve çatışmalardan kaçınmak" için gerektiğinde bazen "zor gerçekleri yumuşatma" eğilimini taklit etme eğiliminde olduğunu buldu. Araştırmacılar, bu daha sıcak modellerin, özellikle kullanıcı üzgün hissettiğini paylaştığında, kullanıcının ifade ettiği yanlış inançlarını doğrulama olasılığının daha yüksek olduğunu buldu.
Bir yapay zekanın "sıcak" görünmesini nasıl sağlarsınız?
Araştırmada araştırmacılar, bir dil modelinin "sıcaklığını", "çıktılarının kullanıcıları olumlu niyet çıkarımına yönlendirme derecesi, güvenilirliğin, samimiyetin ve sosyalliğin sinyalini verme derecesine" dayanarak tanımladılar. Bu tür dil kalıplarının etkisini ölçmek için araştırmacılar, dört açık ağırlıklı modeli (Llama-3.1-8B-Instruct, Mistral-Small-Instruct-2409, Qwen-2.5-32B-Instruct, Llama-3.1-70BInstruct) ve bir özel modeli (GPT-4o) değiştirmek için denetimli ince ayar teknikleri kullandılar.




