RAG'ın Ötesinde: Neden her yapay zeka arama platformu artık aracıdır ve bunun içeriğiniz için anlamı nedir?

İki buçuk yıl önce yazmıştım. Search Engine Land için, aramanın geleceğinin nasıl erişimle artırılmış nesil (RAG) olduğu hakkında bir makale. Bu parça, RAG'ın Google'ın ChatGPT'ye tepkisel yanıtı olmadığını savundu. Bu, Ağustos 2020'deki REALM raporundan bu yana inşa ettikleri mimariydi. SGE (şimdiki AI Genel Bakışı), üretimin tezahürüydü. O günden bu yana yaşananlar bunu doğruladı.

O makalede anlattığım tek seferlik RAG ardışık düzeni, sorgu → alıcı → en iyi k parçaları → Yüksek Lisans → alıntılarla yanıtlama artık geçmişte kaldı. Tüm büyük yapay zeka arama platformları yoluna devam etti. Google AI Modu, ChatGPT Araması, Perplexity Pro Araması, Bilgisayar Kullanımıyla Claude, Gemini Deep Research, hatta Microsoft Yardımcı Pilot Araştırmacısı ve Analist aracıları, hepsi artık farklı bir mimariyi çalıştırıyor. Plan yapıyorlar. Aletler arasında rota çiziyorlar. Alırlar, okurlar, sonra tekrar alırlar. İlk taslaklarına kendi notlarını veriyorlar ve daha fazlası için geri dönüp dönmeyeceklerine karar veriyorlar. İlk dalgayı tanımlayan bir kez al sonra oluştur modeli artık geçerliliğini yitirmiştir.

Bu ajan RAGve artık varsayılandır.

GEO programınız hâlâ tek seferde erişim için optimize edilmişse, artık var olmayan bir sistem için optimizasyon yapıyorsunuz demektir. Daha da kötüsü: Ajan RAG'da kapı bekçilerinin sizi reddettiğini göremezsiniz. Yalnızca son cevaba ulaşıp ulaşmadığınızı görürsünüz. Geleneksel tersine mühendislik taktik kitabı (sıralama kontrolü, alıntı sayma, hatta istem bazında örnekleme) çok aşamalı bir boru hattının yalnızca son aşamasını görür. Yukarı yönde gerçekleşen her şey bir kara kutudur.

Bu sayfanın sonuna ulaştığınızda, ajansal RAG'ın çalışan bir zihinsel modeline, Google'ın bu mimariyi ürettiğine dair patent kanıtına, her büyük platformun gerçekte ne yaptığına, içerik mühendisliğinde zorladığı altı somut değişime ve bu hafta kendi markanıza karşı gerçekleştirebileceğiniz tekrarlanabilir bir denetime sahip olacaksınız. Ayrıca tüm yıl boyunca yayınladığım en güçlü görüşe de sahip olacaksınız: ilerlemenin tek dürüst yolu, modeli damıtmaHer gün

Search Engine Land makalesinde neler doğru çıktı ve neler değişti?

Ekim 2023 tezi hâlâ geçerliliğini koruyor. Geçiş düzeyindeki erişim ilgi birimidir. Bilgi grafikleri LLM'lerle simbiyotiktir; bir kez işaretleyip unuttuğunuz bir onay kutusu değildir. Statik IR puanları geçerliliğini yitirmiştir. Bir arama sisteminin görevi, Delphi maliyetleri, bir kullanıcının bir cevaba ulaşmak için ödediği maliyet ve Google'ın düzenleme ilkesi her zaman trafiğin bir amaç değil, gerekli bir kötülük olduğu yönünde olmuştur. Tartışmanın bu kısmının revizyona ihtiyacı yok.

Değişen şey şu şekil geri alma boru hattından.

2023'te RAG doğrusal bir montaj hattıydı. Bir sorgu geldi, bir yerleştirme modeli onu kodladı, bir vektör dizini en üstteki pasajları döndürdü, bu pasajlar LLM'nin bağlam penceresine dolduruldu ve model bir cevap üretti. Alıntı izleme basitti çünkü alıntı kümesi erişim kümesiydi. İçeriğiniz ilk k'deyse bir şansınız vardı. Eğer değilse, yapmadın. Bu, o yazıda anlattığım çerçeveydi ve o zamanlar doğruydu.

Ama işler değişti.

Boru hatları artık doğrusal mimaride bulunmayan dört özelliğe sahiptir: planlama, araç kullanımı, çok atlamalı yineleme ve yansıma. Bunun anlamı, geri almanın artık tek bir olay olmadığıdır. Tek bir kullanıcı sorgusu beş ile yirmi arasında dahili alt alımı tetikler. Temsilci bunları düzenler, ara sonuçları değerlendirir ve yalnızca kanıt temelinin yeterli olduğuna karar verdikten sonra nihai yanıtı sentezler.

Bu, benim parçamın önceden haber verdiği ancak adını vermediği yükseltmedir.

Saf RAG neden bozuldu?

Alma kalitesi çıktı kalitesini belirler ve saf RAG'ın daha düşük kaliteli sonuçlar veren dört hata modu vardır.

Klasik, tek geçişli RAG, bileşik sorulara hizmet edemez - {50 yaşın altındaki bir LLC sahibi için 1031 borsası SEP IRA ile nasıl etkileşime girer?} gibi bir istemin bir değil beş kez alınması gerekir. Bir vektör dizinine yönelik tek bir yerleştirme sorgusu, 1031 değişimle ilgili belgelere ulaşacak veya SEP IRA'lar ve model tutarsız olacak çünkü model, hiç yapmadığı iki alımı köprülemeye zorlanacak.
Klasik RAG kötü bir ilk çekişten sonra toparlanamaz – Gömme mesafesi kapalı olduğu için veya yığın sınırları ilgili pasajı ikiye böldüğü için veya kullanıcının tam anlamıyla sormadığı bir sorguda rakip içeriğin daha agresif bir parçası daha yüksek puan aldığı için ilk erişim kanonik kaynağı kaçırırsa, o zaman modelin parametrik bilgisi dışında dayanacak hiçbir şeyi yoktur. İşte o zaman halüsinasyonlar art arda gelir.
Klasik RAG, alma araçları arasında yönlendirme yapmıyordu –Vektör arama bazı alt sorular için doğru cevap iken bazıları için tamamen yanlıştır. "Bugünkü ipotek oranı nedir?" geçiş aramasına değil, yapılandırılmış veri API çağrısına ihtiyaç duyar. "IRS Bölüm 179 hakkında ne diyor?" benzerliğe değil, yetkili bir kaynak filtresine ihtiyaç duyar. "Mart ayında hizmete giren 50.000 ABD Doları değerindeki bir aracın amortisman planını hesaplayın" için bir kod yorumlayıcısına veya hesap makinesi aracına ihtiyaç vardır. Tek bir av köpeği bu seçimleri yapamaz.
Classic RAG kendi çalışmasına not veremez – Cevap oluşturulduktan sonra saf RAG onu gönderir. Eleştirmen yok. İkinci geçiş yok. Hayır, “bir dakika, bu iki paragraf yukarıda alıntıladığım kaynakla çelişiyor.” Model yanlış anlarsa kullanıcı yanlış cevabı görür.

Bu dört hata modu, her ciddi dağıtımın farklı bir mimariye taşınmasının nedenidir. Her birinin karşılık gelen bir düzeltmesi vardır ve düzeltmelerin tümü ajansal RAG'dir.

Ajansal RAG'da 'ajantik' ne anlama gelir?

“Ajan” kelimesi gevşek bir şekilde kullanılıyor. Bunu yapısal olarak halledelim. RAG'yi ajansal RAG'a dönüştüren dört özellik vardır ve bir sistemin bu etiketi hak etmesi için dördünün hepsine ihtiyacı vardır.

1. Planlama

Herhangi bir erişim gerçekleşmeden önce sistem, kullanıcı sorgusunu bir araştırma planına ayrıştırır. Alt sorgular oluşturulur, araçlar önceden seçilir, alma sırası belirlenir. AI Modu bölümünde buna "gizli bir çoklu sorgu olayı” sorgu yayılımını tartışırken.

Agentic RAG bir adım daha ileri gidiyor: sistem sadece yayılmakla kalmıyor, aynı zamanda planlar yelpaze çıkışı. Temel belge ReAct (Yao ve diğerleri, 2022), hareketi doğrudan çerçeveleyen: "Hem muhakeme izlerini hem de göreve özgü eylemleri aralıklı bir şekilde oluşturmak için LLM'lerin kullanımını araştırıyoruz ve bu ikisi arasında daha fazla sinerjiye olanak tanıyoruz: muhakeme izleri modelin eylem planlarını tetiklemesine, izlemesine ve güncellemesine yardımcı olurken eylemler onun bilgi tabanları veya ortamlar gibi harici kaynaklarla arayüz oluşturmasına olanak tanıyor."

Bu serpiştirme planlayıcıdır. Üretim versiyonu artık her sınır modelinde ve ayrıca LangGraph ve LlamaIndex'in standart hale getirdiği planlayıcı-yürütücü modelleri var.

2.Araç kullanımı, işlev çağırma olarak da adlandırılır.

Erişim birçok araçtan biridir. Temsilci, bir vektör indeksini sorgulamayı, bir BM25 indeksine ulaşmayı, bir yapılandırılmış veri API'sine girmeyi, kod çalıştırmayı, canlı bir web sayfasına göz atmayı, bir MCP sunucusunu aramayı veya başka bir temsilciyi aramayı seçebilir. Her aracın bir şeması vardır ve aracı, doğru alt sorgu için doğru olanı seçer.

Takım Oluşturucu (Schick ve diğerleri, 2023) konuyu açıkça ortaya koydu: "Dil modelleri, basit API'ler aracılığıyla harici araçları kullanmayı kendilerine öğretebilir ve her iki dünyanın da en iyisine ulaşabilirler. Hangi API'lerin çağrılacağına, ne zaman çağrılacağına, hangi argümanların aktarılacağına ve sonuçların gelecekteki belirteç tahminine en iyi şekilde nasıl dahil edileceğine karar vermek için eğitilmiş bir model." Bu cümle, daha sonra tartışacağımız her yönlendiricinin spesifikasyonudur.

3.Yineleme, bazen çok atlamalı erişim olarak da adlandırılır

Aracı geri gelenleri alır, okur ve öğrendiklerine göre tekrar alır. Köprü varlıkları veya ilk erişimde ikinci alımın araştırması gereken varlıklar, uç durumlar değil, birinci sınıf davranış haline gelir.
IRCoT (Trivedi ve diğerleri, 2022) döngüyü şu şekilde tanımladım "Geri alma işlemini bir düşünce zincirindeki adımlarla (cümlelerle) birleştirmek, geri alma işlemini CoT ile yönlendirmek ve ardından alınan sonuçları CoT'yi iyileştirmek için kullanmak." Aynı makale, döngü uygulandığında çok atlamalı QA veri kümelerinde 21 noktaya kadar erişim iyileşmesi bildirdi.

4.Yansıma, aynı zamanda özeleştiri olarak da adlandırılır

Bir yanıt taslağı hazırlandıktan sonra temsilci yanıta not verir. Yeterlilik, çelişki, tazelik, kaynak çeşitliliği. Eleştirmen bir sorunu işaret ederse temsilci geri döner ve daha fazlasını alır.

Self-RAG (Asai ve diğerleri, 2023) bu çizgide en çok alıntı yapılan makale ve en temiz ifadedir: "Geri alma ve kendini yansıtma yoluyla bir dil modelinin kalitesini ve gerçekçiliğini artıran, Kendini Düşünen Geri Alma-Artırılmış Nesil adı verilen yeni bir çerçeve… çerçeve, isteğe bağlı olarak pasajları uyarlanabilir bir şekilde alan ve yansıma belirteçleri kullanarak geri alınan pasajlar ve kendi nesillerini üreten ve yansıtan tek bir rastgele LM'yi eğitir."

KAYALIK, Refleks ve Kendini Artırma aynı modeli farklı yönlere doğru genişletir, ancak temel mekanizma tam da buradadır.

Anthropic'in Aralık 2024 tarihli makalesi “Etkili aracılar oluşturmak” aynı dört özelliği daha temiz bir terminoloji altında tanımlıyor ve satırlarından biri bu yıl her GEO destesine ait: "Acenteler, LLM'lerin kendi süreçlerini ve araç kullanımını dinamik olarak yönlendirdiği, görevleri nasıl yerine getirdikleri üzerinde kontrol sahibi oldukları sistemlerdir." Bir aracının ne olduğu ya da aracının ne anlama geldiğine dair çok fazla kafa karışıklığı varken, hadi bunu geçerli tanım olarak kullanalım. Sonuçta terminoloji satıcıya göre değişir; dört özellik bunu yapmaz.

Bir resim yukarıdaki tanım listesinden daha değerlidir. Klasik RAG mimarisini sağa işaret eden tek bir ok olarak hayal edin: sorgu bir uçtan girer, yanıt diğer uçtan çıkar. Şimdi ajansal RAG'yi beş etiketli duraktan (planlayıcı, yönlendirici, erişim araçları, eleştirmen, sentezleyici) ve aracının eleştirmen imzalayana kadar herhangi bir durağı tekrar ziyaret etmesine olanak tanıyan çift yönlü oklardan oluşan bir döngü olarak hayal edin. Bu döngü, içeriğinizin hayatta kalması için gereken şeydir.

Ajansal RAG referans mimarisi

Kanonik bileşenlerin üzerinden geçelim çünkü çizemediğiniz bir sisteme tersine mühendislik yapamazsınız.

Planlayıcı / orkestratör – Kullanıcı sorgusunu okur, bir araştırma planı oluşturur. Sistemin geri kalanıyla aynı LLM, planlayıcıya özel bir istemle çalıştırılır. Alt sorguların bir listesini ve her biri için bir araç atamasını çıktı olarak verir.
Yönlendirici – Her bir alt sorguya hangi alma aracının uyacağına karar verir. Vektör arama? Sözcüksel mi? Hibrit bir av köpeği mi? Canlı bir web getirme mi? Yapılandırılmış bir veritabanına karşı SQL sorgusu mu? Hesap makinesine bir işlev çağrısı mı? Etki alanına özgü bir API'yi açığa çıkaran bir MCP sunucusu mu? Temsilciler arası bir görüşme mi? Yönlendirici, tüm yığındaki en az önemsenen bileşendir çünkü içeriğinizin geri alınma şansına sahip olup olmayacağını belirler. Etki alanınızda bir araç yüzeyi varsa ve siz bunu açığa çıkarmazsanız yönlendirici sizi atlar.
Alma araçları – Her araç kendi alt sistemidir. Vektör alıcıları yoğun yerleştirmeler üzerinde kosinüs benzerliğini çalıştırır. Sözcüksel alıcılar BM25'i veya sıralaması değiştirilmiş TF-IDF'yi çalıştırır. Yapılandırılmış araçlar API'leri çağırır ve satırları döndürür. Kod yorumlayıcıları komut dosyalarını yürütür. Web tarayıcıları canlı URL'leri getirir. Temsilci hepsine aynı şekilde davranıyor: girdi giriyor, kanıt çıkıyor.
Hafıza - Tipik olarak iki bellek katmanı vardır. Mevcut araştırma konusu için kısa vadeli karalama defteri. Bu, hangi alt sorguların çalıştırıldığı, hangi kanıtların geri geldiği, eleştirmenin neyi işaretlediği gibi şeyleri içerir. Sonra kullanıcı için uzun süreli hafıza var
Eleştirmen / yansıtma modülü – Taslak cevabın yeterliliği ve kalitesi. Bu bazen ayrı bir model olsa da çoğunlukla eleştirmene özgü bir istemle aynı modeldir. Yansıma modülü gönderilip gönderilmeyeceğine veya yeniden sorgulanıp sorgulanmayacağına karar verir. Eleştirmen, kimsenin bahsetmediği bekçidir ve son yanıtlardan en fazla içeriği çıkaran da bekçidir

Sentezle – Çoğunlukla hayatta kalan adaylara göre ikili olarak yeniden sıralama yapıldıktan sonra, satır içi alıntılarla nihai yanıtı oluşturur.

Devam etmeden önce bir açıklama. Çoğu üretim sistemi gerçek anlamda çok etmenli takımyıldızlar değildir. Bunlar, her aşamada farklı istemlerle ve araç çağırmayla sıkı döngüler çalıştıran tek bir LLM'dir. "Ajanlı"yı "çoklu-ajanlı" ile karıştırmayın.

Çoklu aracı kurulumları mevcuttur. Anthropic'in araştırma yığını ve Microsoft'un Araştırmacı/Analist çifti de bunları kullanıyor, ancak baskın üretim modeli tek yüksek lisans, çok istemli, çok araçlı. Pazarlama ekibi size yapay zekalarının "çoklu aracı" olduğunu söylediğinde, on kişiden dokuzu "bir planlayıcı istemimiz ve bir kritik istemimiz var" demek ister.

Patent kanıtı: Google gerçekte ajansal RAG'yi nasıl yapıyor?

Google yıllardır bu mimariyi sessizce geliştiriyor ve patent kaydı, §3'teki dört özellik tanımıyla neredeyse net bir şekilde eşleşiyor. Beş Google LLC patenti işin ağır yükünü üstleniyor. Bunları bu sırayla okuduğunuzda, aracı döngünün IP dosyalarında her seferinde bir bileşen olmak üzere bir araya gelmesini izleyebilirsiniz.

Planning — query decomposition and fan-out. US11663201B2 — Eğitimli bir Üretken Model Kullanarak Sorgu Varyantları OluşturmaNisan 2018'de dosyalanmış ve Mayıs 2023'te yayınlanmıştır. Gönderilen tek bir sorgudan çalışma zamanında sorgu değişkenleri üretmek için eğitimli bir üretken model kullanan sistemleri açıklar. Patent, eşdeğer, takip, genelleştirme, kanonikleştirme, dil çevirisi, gereklilik, spesifikasyon ve açıklama sorguları olmak üzere sekiz değişken türünü sıralıyor ve düşük gönderim sıklığına sahip "kuyruk" sorgularını açıkça ele alıyor. Planlayıcı bu. AI Modu bir sorgu alıp bunu beş ila yirmi alt sorguya ayırdığında, patentin tanımladığı mekanizma çalışıyor. Eşlik başvurusu, WO2024064249A1 — Çeşitli Erişim için İsteme Dayalı Sorgu Oluşturmaya Yönelik Sistemler ve Yöntemler, aynı fikrin Google Araştırma versiyonudur. Çeşitli alanlarda çift kodlayıcılı alıcıları eğitmek için sentetik sorgular oluşturmak üzere birkaç atışlık LLM istemini kullanan "Promptagator". Planlayın ve ardından genişletin, ürün haline getirin.
Araç kullanımı — erişim kaynakları arasında yönlendirme. US20240362093A1 — Özel Bir Derlem Kullanarak Sorgu YanıtıGoogle LLC'ye atanan ve 31 Ekim 2024'te yayınlanan, yığındaki en temiz yönlendirici patentidir. Sistem LLM'nin bir kullanıcı sorgusunu işlemesine ve harici uygulamalara API çağrıları oluşturma, her biri ilgili özel derlem erişimine sahiptir. Harici uygulamalar, LLM'nin oluşturma bağlamı olarak kullandığı belgeleri döndürür. Araç seçimi. API çağrıları. Çoklu korpora. Artık her öncü satıcının "işlev çağrısı" etiketi altında sunduğu davranış, bu patentte Google tarafından dosyalandı.
Bellek — durum bilgisi olan, çok turlu orkestrasyon. US20240289407A1 — Durum Bilgili Sohbet ile AramaMart 2024'te Google LLC'ye atanan , geleneksel aramanın, birden fazla sohbet sırasında kullanıcı bağlamını koruyan ve güncelleyen "üretken bir yardımcı" ile zenginleştirilmesini açıklıyor. Patent, devam eden duruma göre uyarlanmış sentetik sorgu oluşturmayı açıkça ele alıyor. Bu, §4'teki mimarinin uzun süreli bellek katmanıdır; ChatGPT'nin Bellek adını verdiği ve Gemini'nin Kaydedilen Bilgiler adını verdiği katmanın aynısıdır. Google, herhangi biri bunun için bir kullanıcı arayüzü göndermeden önce mekanizmanın patentini aldı.
Yansıma - döngü içinde ikili sıralama. US20250124067A1 — İkili Sıralama İstemiyle Metin Sıralaması YöntemiEkim 2024'te Google LLC'ye devredilen patent, kapsamına aldığım patenttir. Yapay Zeka Modu Nasıl Çalışır?. Sistem, pasajları bir yüksek lisans kurumunun ikili karşılaştırmalar yapmasını sağlayarak sıralıyor - "bu sorgu için bu iki pasajdan hangisi daha iyi?" - ve karşılaştırmaları son derecelendirilmiş bir listede toplar. Bu göreceli, model aracılı, olasılığa dayalı bir sıralamadır ve aracının yansıma ve sentez aşamalarında çalışan iç döngüdür. İçeriğiniz tek başına rekabet etmiyor. Her iki pasajı da okuyan ve bir kazanan seçen bir Yüksek Lisans tarafından hayatta kalan diğer adaylarla bire bir karşılaştırılıyor.

Sentez – elde edilen kanıtlara dayanan üretken yanıtlar. US11769017B1 — Arama Sonuçları için Üretken ÖzetlerMart 2023'te dosyalanmış ve aynı yılın Eylül ayında yayınlanmıştır. Patent, yanlışlıkları azaltmak ve özet kalitesini artırmak için ek içeriğin işlenmesine yönelik açık hükümlerle birlikte LLM'leri kullanarak arama sonuçlarının doğal dilde özetlerinin oluşturulmasını açıklamaktadır. Sektör analistleri bunu SGE ve AI Genel Bakış ürününün altındaki patent temeli olarak doğru bir şekilde tanımladılar. "Yanlışlıkları azaltmak için ek içeriği işleyin" dili erken bir biçimde yansımadır; sentezleyici, yanıtı göndermeden önce kendi çalışmasını kontrol eder.

Beş patent. Bir planlayıcı tamircisi. Bir yönlendirici tamircisi. Bir hafıza tamircisi. Bir yansıma tamircisi. Bir sentez mekaniği. Bunları dört özellik tanımının üstüne koyarsanız, Google'ın aracılık döngüsünün her bileşenine ilişkin IP başvurusunda bulunduğu açıktır. Aracı yığını, açık kaynak aracı ekosisteminden ödünç alınan bir başlangıç-satıcı çerçevesi değildir. Google'ın 2018'den bu yana patent başvurularında oluşturmaya çalıştığı bir üretim mimarisidir.

Diğer büyük platformlar aynı patent alanına sahip değil ancak aynı mimariye sahipler. Patentler kanıttır, sınır değil. Google'ın IP'yi bu belirli alt sistemlere kaydetmeyi seçmesi, size hangi alt sistemlerin stratejik olduğunu düşündüklerini ve AI Modunda alıntılanmak istiyorsanız içeriğinizin hangi alt sistemlerde kazanması gerektiğini söyler.

Her büyük platform gerçekte ajansal RAG'ı nasıl kullanıyor?

Farklı platformlar döngünün farklı parçalarını vurgular. Platform bazında okuma önemlidir çünkü aynı içerik, hangi kapı denetleyicisinin en ağır işi yaptığına bağlı olarak bir sistemde kazanabilirken diğerinde kaybedebilir.

Google AI Modu – Üretimdeki en agresif ajan uygulaması. Planlayıcı odaklı yayılma. Aramaya çok geçişli erişim. US20250124067A1'e göre ikili olarak yeniden sıralama. Eleştirmeni başarısızlığa uğratan kaynakları bırakan bir yansıma modülü. Görünür "genişletme" kullanıcı arayüzü size alt sorguların bir kısmını gösterir, ancak gerçek yayılım daha geniştir. Bu, genişliğin ve ikili olarak hayatta kalmanın en önemli olduğu platformdur.
Google AI Genel Bakış – Daha hafif bir ajan deseni. Daha kısa döngüler. AI Modundan daha az yineleme. AIO, tam ajanlı RAG'dan ziyade klasik yayılmaya daha yakındır, ancak gidişat açıktır; her AIO güncellemesi daha fazla yansıma ve daha fazla yönlendirici zekası ekler.
ChatGPT Arama ve Derin Araştırma – Derin Araştırma, modelin kullanıcıya yönelik en net gösterimidir. Kelimenin tam anlamıyla planlamasını, alt sorgularını ve görünür kullanıcı arayüzündeki yansımasını ortaya çıkarır. Temsilcinin sorunuzu ayrıştırmasını, araçlara yönlendirmesini ve kendi ilerlemesini not etmesini izlersiniz. Standart ChatGPT Arama, görünür plan olmadan aynı hattın daha küçük bir versiyonunu çalıştırır. Ajan RAG'ı ampirik olarak incelemek istiyorsanız Deep Research aracılığıyla on sorgu çalıştırın ve izi okuyun.
Perplexity Pro Arama ve Derin Araştırma – Başından beri ajan. Çok adımlı erişim, tasarıma göre kaynak çeşitlendirme, taslak eleştirisi. Şaşkınlık, kaynak ilişkilendirme konusunda en cömert olma eğilimindedir; bu da onu, içeriğinizin ara erişimlerde bulunup bulunmadığı konusunda en iyi kanarya yapar.
Bilgisayar Kullanımı, Projeleri ve Becerileri ile Claude – Birinci sınıf bir ilkel olarak alet kullanımı. Claude, geri almanın eylemle birleştiği, uzun süren, çok adımlı görevleri içerir. Sistem aynı görev içinde bir sayfayı okuyabilir, farklı bir sayfa getirmeye karar verebilir, kod çalıştırmaya karar verebilir, bir API'yi sorgulamaya karar verebilir. Claude, eylem katmanının alma katmanı kadar önemli olduğu kurumsal dağıtımlarda fazlasıyla temsil edilmektedir.
İkizler Derin Araştırması – Açık araştırma-planla-sonra-yürüt döngüsü. Çok kaynaklı toplama. Taslak eleştirisi. Gemini Derin Araştırmasındaki görünür plan yararlı bir teşhistir. İçeriğiniz planlanan alt sorguların hiçbirinde görünmüyorsa, yalnızca alıntıyı kaybetmezsiniz, aynı zamanda dikkate alınanları da kaybedersiniz.
Grok Derin Arama – X verilerine dayanan, ortaya çıkan gerçek zamanlı bir aracılı model. Geri alma yüzeyi, yapılandırılmış bir genel yapı üzerinden yeni sosyal sinyaller kullanması açısından temel olarak farklıdır, ancak döngü mimarisi aynıdır.
Microsoft Copilot Araştırmacısı ve Analist temsilcileri – SharePoint, Microsoft Graph ve açık web üzerinden kurumsal aracı RAG. Araştırmacı ve Analist ikilisi, gerçek bir çoklu aracı kurulumuna bu listedeki diğerlerinden daha yakındır. Her biri kendi araç yığınına sahip, tek bir araştırma hedefi üzerinde koordineli çalışan iki uzman ajan.

İşte sekiz ana platform arasındaki karşılaştırma. Yineleme derinliği, minimumdan (hafif yeniden sıralama ile tek geçiş) derine (birden fazla kritik döngüye sahip 10'dan fazla alt sorgu) kadar beş puanlık bir ölçekte derecelendirilir. Görünürlük derecelendirmeleri, 2026 ortası itibarıyla kullanıcıya yönelik kullanıcı arayüzünde açığa çıkanları yansıtır.

platformu	Planlayıcı görünürlüğü	Yönlendirici stratejisi	Yineleme derinliği	Yansıma görünürlüğü	Alıntı yüzeye çıkarma
Google Yapay Zeka Modu	Kısmi (genişletme görünümü bazı alt sorguları gösterir)	Dahili Arama dizini + yapılandırılmış veri araçları + Bilgi Grafiği	Derin (5-20 alt sorgu)	Gizli (ikili olarak yeniden sıralama + her ikisi de dahili olarak eleştirilsin)	Satır içi bağlantılar, genellikle talep başına
Google AI'a Genel Bakış	Gizlenmiş	Arama dizini, AI Modundan daha hafif	Orta (3-8 alt sorgu)	Gizlenmiş	Satır içi bağlantılar, daha az ayrıntılı
ChatGPT Arama	Gizlenmiş	Bing dizini + birinci taraf araçlar	Orta	Gizlenmiş	Satır içi bağlantılar, bazen bir kaynak paneli
ChatGPT Derin Araştırması	Tamamen açıkta (canlı plan + alt sorgular + muhakeme)	Bing dizini + göz atma + kod yorumlayıcısı	Derin (genellikle 20'den fazla alt sorgu)	Kısmen açıkta (temsilcinin görevin ortasında yansıttığını görüyorsunuz)	Tam kaynak listesiyle numaralı referanslar
Şaşkınlık Pro Araması	Kısmi (alt soru listesi oluşturuldu)	Çok kaynaklı web + yapılandırılmış araçlar	Orta-derin arası	Gizli ama kaynak bulma konusunda cömert	Satır içi numaralı bağlantılar, tam kaynak paneli
Şaşkınlık Derin Araştırması	Tamamen açıkta	Çok kaynaklı web + göz atma + yapılandırılmış araçlar	Derin	Kısmen açıkta	Satır içi + kapsamlı kaynak paneli
Claude (Bilgisayar Kullanımı, Projeler, Beceriler)	Gizlenmiş	Birinci sınıf ilkel araç kullanımı (arama, kod, göz atma, MCP)	Değişken, çok derin olabilir	Gizlenmiş	Araçlar bunları döndürdüğünde satır içi alıntılar
İkizler Derin Araştırması	Tamamen açıkta (yürütmeden önce oluşturulan araştırma planı)	Google Arama + yapılandırılmış araçlar	Derin	Kısmen açıkta	Satır içi + yapılandırılmış kaynak listesi
Grok Derin Arama	Kısmi	X verileri + açık web	Orta	Gizlenmiş	Satır içi bağlantılar, X ağırlıklı
Microsoft Yardımcı Pilot Araştırmacısı / Analisti	Kısmi (bazı yüzeylerde çoklu ajan izleri)	SharePoint + Microsoft Graph + açık web	Derin	Kısmen açıkta	Satır içi alıntılar, kurumsal belge ağırlıklı

Dürüst özet: Her büyük yapay zeka arama sistemi artık ajanstır. Farklılıklar hangi bekçileri açığa çıkardıkları ve hangilerini gizledikleriyle ilgilidir. Hiçbiri beşini de açığa çıkarmıyor. ChatGPT, Gemini ve Perplexity Pro'daki Deep Research yüzeyleri, kullanıcı arayüzündeki planlayıcıyı ve kısmi yansımayı gösterdikleri için üretimdeki aracı-RAG davranışını incelemek için sahip olduğunuz en yararlı teşhislerdir. Derin olmayan yüzeyler çoğu kullanıcının gerçekte çalıştırdığı yüzeylerdir ve bunlar neredeyse her şeyi gizler.

Bu, İlgi Mühendisliği açısından neleri değiştirir?

Seni dava edilebilir bir şey olmadan bırakmayacağımı biliyorsun. İşte yukarıdaki her şeyin ardından gelen altı somut değişim.

Bir değil, birçok alt alımda kazanmanız gerekiyor.Tek bir “iyi sıralama” sayfası artık yeterli değil. Ajan sistemleri, konunuzu beş ila yirmi alt sorguya ayırır ve her birine bağımsız olarak yanıt verir. Kapsamın genişliği ve topikal derinlik artık hoş karşılanacak şeyler değil, yapısal gereklilikler. Çevreleyen alt konu grafiğinde derinliği olmayan bağımsız sütunlar olarak var olan sayfalar belki bir kez alıntılanır ve daha sonra bir sonraki alt sorguda değerlendirme kümesinden çıkarılır. Yoğun, iyi bağlantılı güncel bir mahalleyi destekleyen sayfalar aynı yanıtta beş kez alıntılanıyor.
Atomik, kapsamlı pasajlar monolitik makaleleri yener ve artık ikili olarak kazanmaları gerekir. Her aracı alt sorgusu sayfaları değil parçaları alır. Daha sonra bu parçalar, her ikisini de okuyan bir Yüksek Lisans tarafından rakip kaynaklardan gelen rakip parçalara göre ikili olarak sıralanır. Yapay Zeka Modu yazısında kullandığım cümle şunu ifade ediyor: pasajlarınız ikili incelemede hayatta kalmak. Bu, bağımsız bir mantığa, önceden adlandırılmış varlıklara ve açık kapsam koşullarına ("500'ün altında çalışanı olan işletmeler için") ihtiyacınız olduğu anlamına gelir. Ayrıca, bir Yüksek Lisans'ın belirsizlik olmadan alıntı yapabileceği kanıt yoğunluğuna, tablolara ve listelere de ihtiyacınız var. Bir insanın bağlam için iki paragrafı yukarı kaydırmasını gerektiren herhangi bir şey, bunu yapmayan bir pasaj karşısında ikili olarak kaybedilecektir.
Köprü varlıkları çoklu atlamanın dahil edilmesini belirler. Temsilcinin ilk erişimi A Varlığı'na ulaştığında, ikinci erişim A'nın ilişkileriyle ilgilidir. İçeriğiniz A ve B arasındaki kanonik köprü ise, kullanıcının markanızı hiç yazmadığı yanıtlarda alıntılanırsınız. Bu, bugün sektörde en az kullanılan GEO yüzeyidir. Başka bir yazımda bundan daha detaylı bahsedeceğim.

Düşünme döngüleri kaynak çeşitliliğini ve çelişkilerin ele alınmasını ödüllendirir. Eleştirmen taslağı derecelendirdiğinde, doğrulama ve çelişki arar. Karşı argümanları, uç durumları ve "bu geçerli olmadığında" açıkça ele alan içerik, tek taraflı kaynakları ortadan kaldıran yansıma geçişlerinden sağ kurtulur. Başarısızlık modlarının kabul edilmediği satış içerikli içerik, eleştirmene kaynağın taraflı olduğunu ve önyargılı kaynakların filtrelendiğini söyler.
Araçla çağrılabilir içerik yeni bir içerik türüdür. Hesap makineleri. Yapılandırılmış veri uç noktaları. API'ler. Karşılaştırma motorları. Bir araç mevcut olduğunda, yönlendirici düzyazıdan alıntı yapmak yerine aracı çağırır. Mortgage oranları, ilaç etkileşimleri, vergi dilimleri, ürün özellikleri, ETF performansı, fon özellikleri gibi bir aracın makaleden daha faydalı olduğu bir alandaysanız, aracı oluşturmalısınız. Ve bir MCP sunucusu, bir API ve yapılandırılmış veriler aracılığıyla kullanıma sunar. Bunu görmezden gelip 2.500 kelimelik “nihai rehber” yazıları yazmaya devam eden markalar, cevapta bir işlev çağrısıyla değiştirilecek.

Tazelik bir yansıma aşaması kapısıdır. Eleştirmen tazeliği açıkça kontrol eder. dateModified'ı şemanızda belirtin. Gövde kopyasındaki sürüm numaraları. Düzyazıda açık "[tarih] itibariyle" çerçevelemesi. Bunların hiçbiri kozmetik değil. Bunların tümü, aracı kaynak kalitesini derecelendirirken içeriğinizin yansıma geçişinden sağ çıkıp çıkmayacağını doğrudan etkiler. Eski içerik, ikili yeniden sıralamayı kazansa bile eleştirmenin eline düşer çünkü eleştirmen ona güvenemeyeceğine karar verir.

Altısının da altındaki birleştirici nokta: bir anlık karar için optimize edilmiş klasik SEO içerik mühendisliği - SERP. Agentic RAG içerik mühendisliğinin, yayılmadaki her alt sorgu için beş farklı anda kazanması gerekir: planlayıcı, yönlendirici, alma, ikili, eleştirmen. Bu kabaca çok daha fazla yüzey alanı anlamına geliyor ve bunun için geliştirilen markalar, alıntıların daha da arttığını görecek.

Opaklık sorunu ve damıtmanın neden ileriye yönelik akıllı yol olduğu

Henüz kimsenin yazmaya istekli olmadığı kısım burası, çünkü bunu yüksek sesle söylemek tüm GEO ölçüm kategorisi için rahatsız edici sonuçlar doğuruyor.

Tek çekimli RAG'da en azından girişleri ve çıkışları gözlemleyebilirsiniz. Sayfanız ya erişim kümesinde göründü ya da görünmedi. Yeterli sayıda sorgu örnekleyerek alıcıya tersine mühendislik uygulayabilirsiniz. İçerik değişikliklerini alıntı değişiklikleriyle ilişkilendirebilirsiniz. Sistem bir kara kutuydu ama ölçülebilir girdileri ve ölçülebilir çıktıları olan bir kara kutuydu.

Ajansal RAG'da, kullanıcı sorgusu ile son cevap arasındaki her kapı denetleyicisi opaktır.

Planlayıcının hangi alt sorguları oluşturduğunu bilmiyorsunuz. Yönlendiricinin her alt sorgu için hangi aracı seçtiğini bilmiyorsunuz. Hangi derlemin arandığını, hangi pasajların geri döndüğünü veya içeriğinizin ikili yeniden sıralamada hangi rakip pasajlara kapıldığını bilmiyorsunuz. Eleştirmenin neyi işaretlediğini bilmiyorsunuz. Eleştirmenin sentezden önce hangi kaynakları bıraktığını bilmiyorsunuz. Yalnızca nihai cevaba ulaşıp ulaşmadığınızı bilirsiniz.

Bu ima rahatsız edicidir. Geleneksel tersine mühendislik - "sıralama kontrolü", "alıntı takibi", hatta geniş ölçekte anlık örnekleme bile yalnızca son aşamayı görür. Her alıntı izleyici, yayınlanan yanıtta nelerin göründüğünü izler. Hepsi filtreyi gözlemlemeden beş aşamalı bir filtreden sağ kalanları ölçüyorlar. Bir kara kutunun arkasındaki kara kutuya göre optimizasyon yapıyorsunuz.

İlerlemenin dürüst yolu modeli damıtmaHer gün

Basit bir dille damıtma: Daha büyük, opak bir modelin davranışını taklit etmek için daha küçük, gözlemlenebilir bir modelin eğitilmesi. Google'ın planlayıcısının içini göremezsiniz, ancak girdiler ve gözlemlenen çıktılar üzerinde kendi planlayıcı-yönlendirici-eleştirel yığınınızı oluşturabilir, bunu üretimde gerçekte gördüğünüz alıntılara göre kalibre edebilir ve kullanabilirsiniz. O diyagnostik koşum takımı olarak. Yerel temsilcinizin planlayıcısı, aynı istem için görünür Derin Araştırma planıyla yakından eşleşen on alt sorgu oluşturduğunda, üretim sistemlerindeki yukarı akış kapı denetleyicileri için kalibre edilmiş bir proxy'ye sahip olursunuz. Proxy, üretim sistemi değildir ancak gözlemlenebilirdir ve gözlemlenebilir, görünmezden üstündür.

Bir GEO programı için pratikte bu neye benziyor:

Google Gemma 4'te yerel bir referans temsilcisi oluşturun; mantık doğruluğunun önemli olduğu planlayıcı ve eleştirmen döngüleri için 31B Yoğun varyantı veya gecikme ve maliyetin hakim olduğu durumlarda 26B A4B MoE varyantı. Aracı çerçevesi için LangGraph veya LlamaIndex ile, barındırılan bir yerleştirme modeliyle ve konunuza yönelik açık web üzerinden küçük bir özel dizinle eşleştirin. Burada yüksek sesle dile getirmeye değer tematik bir nokta var: Google, Google'ın kendi üretim yığınında tersine mühendislik yapmak için kullanılan yerel damıtma donanımına güç sağlayan açık ağırlık modelini piyasaya sürüyor. Bu bir tesadüf değil. Akıllı ajansların ve yazılım şirketlerinin sahip olacağı bir kategori açılıyor.

Sıralamayı önemsediğiniz istemleri koşum takımına besleyin. Planlayıcı çıktısını gözlemleyin. Yönlendiricinin oluşturduğu her alt sorguyu günlüğe kaydedin. Her aşamada geri alma adaylarını yakalayın. İkili karşılaştırmaları puanlayın. Eleştirmenin notlarını okuyun. Yerel temsilcinizin davranışı, Derin Araştırma planı, Şaşkınlık alt soru listesi, Yapay Zeka Modu genişletmesi gibi üretim sisteminin görünür davranışıyla eşleştiğinde, kalibre edilmiş bir donanıma sahip olursunuz. Farklılaştığı yerde bir kalibrasyon hedefiniz vardır. İçeriğiniz yönlendiriciyi veya damıtılmış yerel temsilcinizdeki eleştirmeni geçemezse, bu, üretimde başarısız olduğunun güçlü bir işaretidir.

Bu, şu anda baskın olan "ChatGPT'de daha fazla spam istemi gönderme ve alıntıları sayma" şeklindeki mevcut taktik kitabına göre bir nedenden dolayı tercih edilir: damıtma size nedensel içeriğin her aşamada neden başarısız olduğuna dair hikaye. Alıntı sayımı size yalnızca korelasyonel hayatta kalanların hikayesi. Bir müşteri "Neden Yapay Zeka Modunda Rakip X'e kaybediyoruz" diye sorduğunda, "pasajlarınız hesap makinesi-oran alt sorgusunda ikili karşılaştırmaları kaybetmeye devam ediyor" cevabı savunulabilir. “Bu ay atıf sayımız yüzde 12 azaldı” cevabı değil.

Samimi uyarı: damıtma ücretsiz değildir. Mühendislik yatırımı, değerlendirme donanımı ve üretim sistemi davranışına karşı sürekli kalibrasyon gerektirir. Bu yeteneği geliştiren ajanslar ve şirket içi GEO ekipleri artık birleşen bir ölçüm hendeğine sahip olacak. Bekleyenler, rakiplerinin kullandığı kontrol panelini kullanacak ve raporlarının yöneticilerin sorduğu sorulara neden cevap veremediğini merak edecek.

Gözlemleyemediğinizi optimize edemezsiniz. Üretim kara kutusuna tersine mühendislik yapmak bir çıkmaz sokaktır. Kendi versiyonunuzu damıtmak, dayanıklı GEO performansına giden tek yoldur.

Bu ölçüm açısından neyi değiştirir?

Ölçüm kategorisi parçalanacak ve parçalanmanın doğru tarafını seçen markalar önümüzdeki iki yıl için önemli bir avantaja sahip olacak.

Atıf sayıları, aracılı sistemlerde gerçek ayak izinizi üç ila on kat eksik rapor ediyor. On iki alt alımın dördünde yer alırsanız ancak son yanıtta bir kez alıntı yapılırsa, klasik alıntı izleme gerçek etkinizin yüzde 75'ini kaçırır. Daha da kötüsü, özlüyor neden. Sağlıklı görünen bir alıntı oranına ve çökmekte olan bir alt sorgu kapsama oranına sahip olabilirsiniz ve bundan bir yıl sonra bu çöküş alıntılarda ortaya çıkar ve hiçbir uyarı almazsınız.

Yeni metrik katmanının ihtiyaçları:

Alt sorgu kapsamı — Temsilcinin planladığı yayılımın yüzde kaçı kaynaklarınızdan en az birini içeriyor?
Alma-alıntı oranı — içeriğinizin erişim kümesinde olduğu alt sorgular için, ne sıklıkta alıntıya kadar hayatta kaldığı.
Yansıma hayatta kalma oranı — sentez havuzunu oluşturan içerik için eleştirmen onu ne sıklıkta bırakıyor?
Köprü varlık merkeziliği — içeriğinizin konu grafiğinizdeki önemli varlıklar arasındaki kanonik bağlantı olarak konumlandırılıp konumlandırılmadığı.
Araç çağrısının dahil edilmesi — bir araç alt sorguya uyduğunda yönlendiricinin uç noktalarınızı çağırıp çağırmadığı.
Damıtma aşaması başarısızlık oranı - içeriğinizin en sık devre dışı bırakıldığı yerel temsilciden.

Mevcut araçlar beş aşamalı bir filtreden kurtulanları izliyor. Yeni nesil GEO ölçüm altyapısı, kısmen Derin Araştırma ve Yapay Zeka Modunun görünür kullanıcı arayüzü aracılığıyla, kısmen de üretim sistemlerinin gizlediği her şeyi dolduran damıtılmış bir yerel aracı aracılığıyla bunların altında oturacak ve filtrenin kendisini izleyecek.

Bu hafta gerçekleştirebileceğiniz tekrarlanabilir bir test

Sana her zaman uygulanabilir bir şey bırakmak istediğimi biliyorsun. Yapay Zeka Arama performansınızı iyileştirmek için yapabileceğiniz iki şey var. İlki mühendislik gerektirmez. İkincisi ise mühendislik açısından hafif, tek mühendisli çabadır.

Bölüm A — Gözlemlenebilir Ajans RAG Denetimi.

Birincisi, veri toplamanız ve ajansal RAG sistemleri tarafından nasıl yorumlandığınızı görmeniz için bir çalışma kitabıdır. İşte adımlar:

Beş yüksek değerli sorgu seçin. Alıntıların işinizi gerçekten harekete geçirdiğini seçin. Satış ekibinizin sıralamada yer almanızı istediği sorgular, demoları yönlendiren sorgular, müşteri destek bildirimlerinde görünen sorgular. Bunların ölçülmesinin zor olduğunun farkındayım, bu nedenle gerekiyorsa geleneksel arama sorgularınızı proxy olarak kullanın.
Her sorguyu, araştırma modu etkinken ChatGPT Deep Research, Gemini Deep Research ve Perplexity Pro aracılığıyla çalıştırın.
Her biri için görünür araştırma planını yakalayın. Derin Araştırma ve Şaşkınlık bunu doğrudan gösteriyor; AI Modu, genişletme görünümü aracılığıyla onu kısmen ortaya çıkarır.
Aracının gönderdiği her alt sorguyu günlüğe kaydedin. Bunları bir e-tabloya, her alt sorgu için bir satır, üç platform için üç sütun olacak şekilde kaydedin.
Her bir alt sorgu için bunu bağımsız bir arama olarak çalıştırın ve içeriğinizin en üstteki erişim kümesinde görünüp görünmediğini kontrol edin. Evet ise, isabeti işaretleyin. Hayır ise, özledim seçeneğini işaretleyin.
Alt sorgu kapsamınızı orijinal beş sorgudaki son alıntı oranınızla karşılaştırın. Boşluk, yansıma kaybı probleminiz veya içeriğinizin geri alınabildiği ve ardından ikili olarak kaybettiği veya eleştirmende başarısız olduğu yerlerdir.
Tamamen kaçırdığınız her alt sorgu için nedenini sınıflandırın: konuyla ilgili içerik yok, içerik çok geniş, yetersiz parçalama, eksik şema, eksik araç yüzeyi, tazelik farkı. Sınıflandırma, gelecek çeyreğe ilişkin içerik yol haritanızın girdisidir.

Bu size sürecin neresinde kaldığınıza ve içeriğinizde ne gibi iyileştirmeler yapmanız gerektiğine dair bir fikir verecektir.

Bölüm B - Damıtma Denetimi.

Bu yaklaşım daha tekniktir. Bölüm A, yapım acentelerinin açıkça kabul ettiği şeyleri size anlattı. Bölüm B size neyi yapmadıklarını anlatıyor. Okuyamadığınız planlayıcı alt sorguları, göremediğiniz yeniden sıralama kararları, içeriğinizin düştüğü belirli aşama.

Emniyet kemerini sizin aşağıdakileri yapmak zorunda kalmamanız için yaptım: https://github.com/iPullRank-dev/agentic-rag-audit. Bu, üretim sistemlerinin aynı beş düğümlü şekille (planlayıcı, yönlendirici, geri getirici, ikili yeniden sıralayıcılı sentezleyici, yansımalı eleştirmen) Ollama aracılığıyla Google Gemma 4'te, SerpAPI tohumları, Scrapling getirme, Trafilatura çıkarma ve isteğe bağlı bir LangExtract parçalayıcı ile çalıştırdığı ajan-RAG döngüsünün yerel, gözlemlenebilir bir versiyonudur. Kesin konuşmak gerekirse bu, model damıtma değil, yapısal damıtmadır. Önemli olan tanısaldır; uçtan uca gözlemlenebilir.

Düzenlemek. Python3.10+, Ollama bir iş istasyonu GPU'sunda (8GB+ VRAM iyidir), bir SerpAPI anahtarında, marka alan adınızda çalışır.

Sistem ortamı değişkenlerinizde OLLAMA_CONTEXT_LENGTH=8192 ayarını yapın ve Ollama'yı yeniden başlatın; 2048 varsayılanı istemleri sessizce keser. Ollama ps ile modelin %100 GPU'ya ulaştığını doğrulayın.

Bölüm A'daki aynı beş sorguyu çalıştırın. Birer birer:

Sorgu başına yaklaşık 90-120 saniye sürer. Terminalinizde sekiz tanılama bölümü (plan ve yönlendirme, erişim hunisi, ikili kararlar, marka yolculuğu, eleştirmen kararı, ardışık düzen zamanlaması, son yanıt, alıntılar) artı bir izleme JSON'u ve bir günlük dosyası bulunur.

İşte örnek bir terminal çıktısı:

Marka yolculuğunu okuyun.Burası sizin için geldiğiniz bölüm. Ortaya çıkan URL'lerinizin her biri için, onu hangi alt sorguların bulduğunu, parçalayıcının gerçekte neyi çıkardığını, yeniden sıralama havuzuna girip girmediğini, onu adlandıran bire bir kararları ve sonunda alıntı yapılıp yapılmadığını gösterir. İçeriğiniz düştüğünde, URL'nizin gerçek açılış pasajını, gözlemlenebilir farka (açılış cümlesi, sorgu terimi çakışması, pasaj yoğunluğu) dayalı olarak hedeflenen önerilerle havuz oluşturan URL'lerle yan yana görürsünüz.
Sorgu kümesindeki metrikleri toplayın. Beş Kısım A sorgusunun tümünü çalıştırdıktan sonra:

Altı ölçüm elde edeceksiniz: alt sorgu kapsamı, alma-alıntı oranı, yansıma hayatta kalma oranı, araç çağrısının dahil edilmesi ve aşamaya göre aşama başarısızlığı oranı. İşte bir örnek:

Aşama başarısızlık oranı, içerik yol haritasını yönlendiren şeydir. Geri getirmede başarısız olmak bir tür iştir; planlayıcının oluşturduğu belirli alt sorgular için geleneksel SEO. Yeniden sıralamada başarısız olmak başka bir şeydir; geçiş düzeyinde içerik yoğunluğu ve doğrudanlık. Sentez seçiminde başarısız olmak üçüncü bir benzersiz sinyal kapsamıdır. Her biri farklı bir çalışma gerektiriyor.

Bölüm A'ya göre kalibre edin. Her üretim Derin Araştırma planını YAML olarak yakalayın (examples/prodüksiyon-template.yaml adresindeki şablon) ve diff:

İkisinin birleştiği yerde kalibre edilmiş bir koşum takımınız var. Keskin bir şekilde farklılaştıklarında, planlayıcı isteminizin veya başlangıç sayfası sağlayıcınızın çalışmaya ihtiyacı vardır. Üç ayda bir veya herhangi bir önemli değişiklikten sonra yeniden kalibre edin.

Not: Yerel temsilci üretim sistemi değildir. Gemma 4 E2B en küçük varyanttır; Yeniden sıralama kalitesi ve kritik kararları, E4B (.env'de tek satırlık model değişimi) ile önemli ölçüde iyileşir. Retriever SerpAPI'ye bağlıdır, bu nedenle marka görünürlüğü hala zor bir ön koşuldur. Küçük modellere ilişkin ikili kararlar otoriter değil, yönlendiricidir. Güveni değerlendirmek için her çalışmanın 3. bölümündeki asıl gerekçeyi okumalısınız.

Bu size Kısım A'nın sağlayamadığı şeyi verir: içeriğinizin düştüğü belirli aşama, kazananlarla karşılaştırıldığında URL'nizin gerçek çıkarılan pasajı, bire bir kafa kafaya kaybettiğinizde yeniden sıralayanın belirttiği mantık ve konu çevrenizin henüz kapsamadığı belirli alt sorgular. Bu, bir içerik yol haritasına dönüştüreceğiniz teşhis temel çizgisidir.

Son olarak, paylaştığım tüm açık kaynak kodlarda olduğu gibi, muhtemelen daha sağlam bir dahili sürümümüz var. Buna bir başlangıç noktası olarak bakmalı, kendi çözümlerinizi bunun üzerine oluşturmalı ve bunları toplulukla paylaşmalısınız.

Denetim paketini alın ve konuşalım

Klasik SEO taktikleri artık geçerliliğini yitirmiştir. Tek atışlık RAG taktik kitapları artık geçerliliğini yitirmiştir. 2026 ve sonrasında kazanan markalar, damıtılmış ölçüm altyapısı üzerinde ajansal-RAG bilinçli içerik mühendisliği yürütecek ve yıllar boyunca biriken alıntı çekimine kilitlenecekler. Önümüzdeki iki yıl boyunca bunun neden sadece SEO olduğunu tartışarak ve alıntı sayılarını izleyerek harcamayacak markalar giderek azalıyor.

İndir Bölüm A Denetim Sayfası ve eğer daha teknik bir klon iseniz (ve katkıda bulunuyorsanız) Kısım B damıtma başlangıç deposu. Henüz yapmadıysanız, şuraya göz atın: Yapay Zeka Arama Kılavuzu Bu makalede tartıştıklarımızın çoğuna ilişkin daha uzun biçimli referans için.

Bir kerelik geri alma taktik kitabı bitti. Aracı döngü yeni varsayılandır. Sonuçları artırma konusunda ciddi olmak istiyorsak, bunu oluşturmanın ve analiz etmenin zamanı geldi.

Bu makale ilk olarak şu tarihte yayınlanmıştır: iPullRank blogu ve izin alınarak yeniden yayınlanmaktadır.