Google'ın en yeni DiffusionGemma açık yapay zeka modeli 4 kat hız artışıyla geliyor

Başka bir gün, Google'dan başka bir yapay zeka modeli. Google DeepMind bu kez yeni bir üyeyi yayınladı.Gemma 4 açık model ailesiancak serinin geri kalanından temel olarak farklı. DiffusionGemma çoğu yapay zeka modelinde olduğu gibi çıktıları doğrusal olarak üretmez. Bunun yerine paralel olarak bir metin bloğunun tamamını üretebilir.Google diyorbu, Nvidia DGX veya mütevazı bir oyun GPU'su gibi yerel donanım üzerinde çalışırken onu daha hızlı ve daha verimli hale getirir.

Çoğu yapay zeka modeli otoregresif olacak şekilde tasarlanmıştır; her seferinde bir jeton olmak üzere soldan sağa metin üretirler. DiffusionGemma'nın, statik ile başlayan ve daha sonra istenen içeriği oluşturmak için gürültüyü gideren görüntü oluşturma modelleriyle daha fazla ortak noktası vardır. Bu model, olası belirteçleri oluşturmak ve bunları diğerlerinin tahminini geliştirmek için kullanmak için tuval üzerinde birden çok kez çalışan yer tutucu belirteçlerden oluşan bir alanı alır. Sürecin sonunda model, token çıktılarını tek bir büyük blokta, yani "denoised" metin tuvalinde sonlandırır.

DiffusionGemma, Google'ın açık modelleri arasında oldukça büyüktür. Bu, toplam 26 milyar parametreye sahip bir Uzmanlar Karması (MoE) modelidir, ancak çıkarım sırasında yalnızca 3,8 milyarı etkinleştirilir. Bu, üst düzey bir GPU'nun 18 GB ram tahsisine sığması gerektiği anlamına gelir. DiffusionGemma, RTX 5090 ile yapılan testlerde saniyede yaklaşık 700 jeton dağıtıyor. Tek bir Nvidia H100 AI hızlandırıcıyla DiffusionGemma saniyede 1.000'den fazla token üretebilir. Bu, benzer büyüklükteki otoregresif Gemma modellerinin çıktısının yaklaşık dört katıdır.

Makalenin tamamını okuyun

Yorumlar

Google'ın en yeni DiffusionGemma açık yapay zeka modeli 4 kat hız artışıyla geliyor

Dijital Varlığınızı Güçlendirin

İlgili Haberler

ABD Savunma Bakanı Hegseth: İran artık bombalarla karşı karşıya kalacak

Apple ve Google Thread 1.4 için destek ekledi

Kalshi, bazı tahmin piyasası bahisleri için gerekli istihdam doğrulamasını ekledi

Logitech'in katlanabilir faresi, yanında fare taşımayı reddeden kişiler içindir