Başka bir gün, Google'dan başka bir yapay zeka modeli. Google DeepMind bu kez yeni bir üyeyi yayınladı.Gemma 4 açık model ailesiancak serinin geri kalanından temel olarak farklı. DiffusionGemma çoğu yapay zeka modelinde olduğu gibi çıktıları doğrusal olarak üretmez. Bunun yerine paralel olarak bir metin bloğunun tamamını üretebilir.Google diyorbu, Nvidia DGX veya mütevazı bir oyun GPU'su gibi yerel donanım üzerinde çalışırken onu daha hızlı ve daha verimli hale getirir.
Çoğu yapay zeka modeli otoregresif olacak şekilde tasarlanmıştır; her seferinde bir jeton olmak üzere soldan sağa metin üretirler. DiffusionGemma'nın, statik ile başlayan ve daha sonra istenen içeriği oluşturmak için gürültüyü gideren görüntü oluşturma modelleriyle daha fazla ortak noktası vardır. Bu model, olası belirteçleri oluşturmak ve bunları diğerlerinin tahminini geliştirmek için kullanmak için tuval üzerinde birden çok kez çalışan yer tutucu belirteçlerden oluşan bir alanı alır. Sürecin sonunda model, token çıktılarını tek bir büyük blokta, yani "denoised" metin tuvalinde sonlandırır.
DiffusionGemma, Google'ın açık modelleri arasında oldukça büyüktür. Bu, toplam 26 milyar parametreye sahip bir Uzmanlar Karması (MoE) modelidir, ancak çıkarım sırasında yalnızca 3,8 milyarı etkinleştirilir. Bu, üst düzey bir GPU'nun 18 GB ram tahsisine sığması gerektiği anlamına gelir. DiffusionGemma, RTX 5090 ile yapılan testlerde saniyede yaklaşık 700 jeton dağıtıyor. Tek bir Nvidia H100 AI hızlandırıcıyla DiffusionGemma saniyede 1.000'den fazla token üretebilir. Bu, benzer büyüklükteki otoregresif Gemma modellerinin çıktısının yaklaşık dört katıdır.




