2024'te bir Air Canada müşterisi bir chatbot'a ölüm ücretleri hakkında sorular sordu. Bot ona kendinden emin bir şekilde var olmayan bir geri ödeme politikası sundu. The airline refused to honor it. A tribunal ruled in the customer’s favor. The bot hadn't decided anything; eğitim verilerindeki kalıplara dayanarak bir cevap tahmin etmişti. The company treated that prediction as policy.
Günümüzde yapay zeka ile tasarım yapmanın temelinde yatan risk budur:Deterministik arayüzlere sarılmış olasılıksal sistemler. Yapay zeka bir tahmin sunar, arayüz bunu gerçekmiş gibi sunar ve kullanıcı veya kuruluş buna göre hareket eder.
İnsanlar deterministik düşünceye göre programlanmıştır. Geçmişteki eylemlerin gelecekteki sonuçları belirlediğine inanmayı tercih ediyoruz. Bir parayı 999 kez atar ve her seferinde tura gelir; determinist zihin, paranın hileli olduğunu varsayar. Olasılıkçı zihin, 1000. taklanın her iki yönde de olabileceğini kabul eder. Bu ikinci zihniyete tutunmak daha zordur, ancak tasarımcıların şu anda tam olarak ihtiyaç duyduğu şey budur.
Ürünler karmaşık, doğrusal olmayan ortamlarda çalışır ve yapay zeka bu karmaşıklığı hızlandırır. Tasarımcılar ve ürün ekipleri, yapay zeka çıktılarını birçok olası yanıttan biri yerine yanıt olarak ele aldıklarında hassas deneyimler oluştururlar ve tıbbi teşhis veya finansal tahmin gibi bazı durumlarda gerçekten tehlikeli deneyimler oluştururlar.
Bu makale pratik bir rehberdir.designing probabilistically with AI as a partner. It is about using AI to sharpen your thinking rather than outsource it, accounting for model bias, human sentiment, and perceived risk along the way.
Probabilistic Thinking + AIYapay zekaya sorduğumuz soruların çoğu ikili yanıtlar üretmiyor. Verilerdeki kalıplara dayalı olasılıklar üretirler. If you ask, “Do aliens exist?” Cevap makul ile belirsiz arasında bir yerde olacaktır. Bilim insanları evrenin başka yerlerinde yaşamın olası olduğunu düşünüyor ancak herhangi bir somut kanıt olmadan bunu doğrulayamayız. The answer doesn’t resolve the question; it frames it as a probability.
Designers should read AI outputs the same way. Bunlarsinyaller, sonuçlar değil,olası sonuçlarbunların ürün hedefleri, kullanıcı davranışı ve iş kısıtlamaları bağlamında yorumlanması gerekir.
Pek çok dijital ürün zaten bu şekilde çalışmaktadır.netflixdeğilBilmekeğleneceksinSüpermarketçünkü izledinOfis; olasılığı tahmin eder ve başlığı buna göre ortaya çıkarır. Arayüz bir tahmine yanıt veriyor.
Tasarım kararları da aynı mantığı takip edebilir. Yapay zeka modelleri, belirli sonuçların olasılığını tahmin etmek için davranışsal analitiği araştırma öngörüleriyle birleştirebilir ve bu olasılıklar, tasarım stratejisi için bir ölçüt görevi görebilir. Analitiklerin, kullanıcıların bir satın alma işlemini tamamlayacağına dair güvenin %60'a karşın %90 olduğunu gösterdiği bir senaryoyu düşünün. %60'ta tasarımın daha ikna edici bir çalışma yapması gerekir; referanslar, açıklamalar, karşılaştırmalar ve güvence sinyalleri kullanıcının bir karara doğru ilerlemesine yardımcı olabilir. %90'da kullanıcı zaten motive olmuş durumda ve eylemin hızlı bir şekilde gerçekleşebilmesi için tasarımın sürtünmeyi ortadan kaldırmaya başlaması gerekiyor. Aynı ekran, çok farklı tasarım sorunu.

Yapay zeka ayrıca siz bir yön belirlemeden önce geçmiş verileri ve davranış modellerini kullanarak sonuçları simüle edebilir. Bu simülasyonların değeri büyük ölçüde istemlerin nasıl yapılandırıldığına, tanımladıkları bağlama, test edilen hipoteze, kullanıcı motivasyonuna ve vurgulanmasını istediğiniz uç durumlara bağlıdır.
Böyle pratik bir kullanım aklıma geliyor: Özellikle tasarım yaptığınız kullanıcı grubuna doğrudan erişiminiz olmadığında, erken tasarımları yapılandırılmış yönlendirmeler aracılığıyla değerlendirmek. Aşağıdaki bilgi istemi, bir tasarımı nörodivergent kullanıcıların bakış açısından da değerlendirmek için bir başlangıç noktasıdır. Bunu bir şablon olarak değerlendirin, kullanıcı grubunu, kriterleri ve çıktı formatını ürününüze uyarlayın ve bunu bir karar vermek yerine ekibinizle sohbet başlatıcı olarak kullanın.
[Tasarım dosyasını veya web bağlantısını] kullanılabilirlik, erişilebilirlik ve içerik uygunluğu açısından otizm spektrum bozukluğu, DEHB, öğrenme güçlükleri vb. gibi nörodivergent kullanıcıların bakış açısından değerlendirin.
Lütfen aşağıdaki kriterleri göz önünde bulundurun:
- Düzen ve gezinme nörodivergent kullanıcılar için sezgisel mi?
- Dil ve içerik nörodivergent kullanıcılar için uygun ve ilgi çekici mi?
- Bu grubun siteyi kullanırken karşılaşabileceği herhangi bir engel (teknik, bilişsel veya duyusal) var mı?
- Site, nörodivergent kullanıcıların özel ihtiyaçlarını veya hedeflerini ne kadar iyi karşılıyor?
Bir SWOT analizi, nörodivergent kullanıcılar tarafından başarılı bir şekilde kullanıma yönelik olasılık puanı ve iyileştirmeye yönelik herhangi bir öneri sağlayın.
Not: Bu, fikrin aşırı basitleştirilmesidir. Lütfen ürününüzün karmaşık ayrıntılarına dikkat edin ve uygun değişiklikleri yapın.
Bu dedi ki,simülasyonlar deneyin yerini almaz. Modeller geçmiş verilere göre eğitildiğinden, gelecekteki değişiklikleri tahmin etmekten çok geçmiş davranışları daha güçlü yansıtırlar. Dokunmatik ekranlarla mücadele eden yaşlı kullanıcılar için bir ses arayüzü tasarladığınızı hayal edin. Mobil etkileşim verileri üzerine eğitilmiş bir model, fikrin değerden yoksun olması nedeniyle değil, veri kümesinin farklı kullanıcı davranışını yansıtması nedeniyle düşük etkileşimi tahmin edebilir. Simülasyonlar her zaman varsayımları ortaya çıkarmalı, yeniliği engellememelidir.
Yapay Zekayı Kullanarak Çarpık Olasılıksal Düşünceye Karşı Dikkatli OlunYapay zeka sistemleri, geçmiş verilere, daha spesifik olarak da eğitildikleri veri kümelerine dayanmaktadır. Bu temel, aldığımız çıktıları şekillendirir. Fransa'daki Yapay Zeka Zirvesi sırasında Hindistan Başbakanı Narendra Modi bunu iyi gösteren bir örneği paylaştı. Bir yapay zeka modelinden sol eliyle yazan bir kişinin görüntüsünü oluşturmasını isterseniz, çıktı yine de sağ eliyle yazan bir kişiyi gösterebilir. Bunun nedeni istatistiksel: çoğu insan sağ elini kullanıyor ve eğitim verileri de bunu yansıtıyor. Bu zamanla düzelmiş olabilir, ancak konu geçerliliğini koruyor. Benzer modellerle görseller oluştururken hala ara sıra bu davranışı görüyorum.
Aldığınız şey gerçek değil. Buistatistiksel olarak en muhtemel sonuçgiven the data available. Her zaman geçmiş verilerin gelecekteki davranışları anlamlı bir şekilde tahmin edip etmediğini sorun. Ek bağlam tahmini iyileştirebilecekse, onu ekleyin. Without context, the output is just one of many possible answers dressed up as the only one.

Confidence scores deserve the same scrutiny. Yüksek güvenilirliğe sahip bir çıktıya aşırı güvenmek Air Canada'nın durumuna yol açar. Güvenilirliği düşük bir sinyali göz ardı etmek, ekiplerin gürültülü veriler arasında gömülü gerçek bir sinyali kaçırmasına neden olabilir. %90 güvene sahip bir tahmin mutlaka doğru olmayabilir ve %40 sinyalin mutlaka işe yaramaz olduğu da söylenemez. Tasarımcılar yine de olasılıkları tartmalı, önlerindeki durumu değerlendirmeli ve yapay zekanın önerilerine göre karar vermelidir.
Şeffaflıkis how you make that possible. Yapay zeka sistemleri kararları giderek daha fazla şekillendirirken, insanların çıktıların nasıl oluşturulduğu, kaynaklar, gerekçeler ve bir önerinin arkasındaki özetler hakkında görünürlüğe ihtiyacı var. Kara kutu sistemleri güvensizliği doğurur. Akıl yürütmelerini ortaya koyan sistemler, kullanıcıların çıktıları kendilerinin değerlendirmesine olanak tanır. Bu şeffaflık iyi bir tasarım ve etik uygulamadır. İnsanların bu araçlara duyduğu güvene saygı duyar.
Olasılıkları düşünmek çoğu zaman hızlı cevapların cazibesine direnmek anlamına gelir. Yapay zeka, araştırmaları ve yüzey modellerini her zamankinden daha hızlı hızlandırabilir, ancak bu çıktılarbaşlangıç noktaları, nihai kararlar değil.
Yapay Zeka ile Olasılıksal Tasarım Uygulaması YapınTasarım, bir ürünün nihai olarak nasıl deneyimlendiğini şekillendirir; tasarımcıların verdiği kararlar, deneyimin yeterli, sezgisel veya olağanüstü olup olmadığını belirler. Ve tasarım doğası gereği varsayımlarla ve bahislerle doludur. En titiz araştırmalar bile aynı soruna her biri farklı başarı olasılığı taşıyan birden fazla geçerli çözüm sağlayabilir.
Olasılığa dayalı düşünmek, tasarım kararlarının nadiren ikili sonuçlar ürettiğini kabul etmek anlamına gelir. Bunlar bir dizi olası sonuca yol açar ve tasarımcının rolü bu olasılıkları yönlendirmek ve değer yaratması en muhtemel yolu belirlemektir. Bu zihniyet aynı zamandauyarlanabilirlik: Kullanıcı ihtiyaçları gelişir, stratejiler değişir ve bazen fikirler başarısız olur. Veri sinyallerine, denemelere ve öğrenme döngülerine dayanan ekipler, en etkili çözüme doğru daha hızlı ilerler.
Pratik ilkelerden önce bir temel fikir:
Tasarım kararları kesinliğe değil, olasılığa göre optimize edilmelidir.
Kesinliğe Değil Olasılığa Göre Tasarım
Her tasarım kararı bir garantidir, bir garanti değildir. Kararlar araştırma ve verilerle belirlense bile, yine de daha küçük örneklere ve kullanıcıların geniş ölçekte nasıl davranacağına ilişkin varsayımlara dayalıdır. İyi araştırılmış bir fikir gerçek dünyada hâlâ başarısız olabilir.
Girişteki Air Canada sohbet robotu, yasal olduğu kadar bir tasarım dersidir. Bot, dil modellerinin yaptığını yaparak makul metinleri tahmin ediyordu. Ancak arayüz, bu tahmini hiçbir uyarı olmadan, hiçbir uyarı olmadan, tam bir güvenle iletti."Politikamız genellikle şunu söylüyor"insana giden bariz bir yol yok. Kullanıcı güveni bağlılık olarak algıladı ve yasal olarak mahkeme de aynısını yaptı.
Olasılıksal sistemler deterministik arayüzlere sarıldığında olan şey budur. Arayüz olasılığı kesinliğe dönüştürür ve riskin ortaya çıktığı yer burasıdır.
Olasılığa göre tasarım yapmak, arayüzün belirsizliğini sürdürmesine izin vermek, insan desteğinde gözle görülür geri dönüşler sağlamak ve içerik yapay zeka tarafından üretildiğinde net etiketleme anlamına gelir; böylece öngörülemeyen sorunlar önlenir.
Tasarımcılar ikili düşünceden kaçınmalıdır; harika bir fikir, garantili başarı anlamına gelmez ve tanıdık bir fikrin başarısız olacağı garanti değildir. Bunun yerine varyasyonları, güven düzeylerini ve uç durumları inceleyin. Yapay zeka, farklı yorumları ortaya çıkaran, riskleri vurgulayan ve yapılandırılmış öneriler üreten bir portföy düşünme motoru olarak hareket ederek bu konuda kesinlikle yardımcı olabilir. Amaç kesinlik için değil değer için optimizasyon yapmaktır: her zaman böyle olmalıdırdeğer odaklı.
İçinde bulunduğunuz anı düşününYenilmezler: Sonsuzluk SavaşıDoctor Strange, Tony Stark'a milyonlarca olası gelecekten yalnızca birini kazanacaklarını söylediğinde. Yapay zeka size geleceği söyleyemez ancak olası yolları keşfetmenize yardımcı olabilir. Bir fikrin başarılı olup olmayacağını sormak yerine yapay zekadan şunu isteyin:olasılığı tahmin etVepuan almakve bu sinyalleri kararlara rehberlik etmek için kullanın.
Veriyi Harita Değil Pusula Olarak Kullanın
Gerçek bir olasılık bile nihai bir cevap değildir. Bir yapay zeka modelinin, kullanıcıların minimum ödeme deneyimini tercih etme olasılığının %80 olduğunu tahmin ettiğini düşünün. Bu, çözümün basitçe "minimum bir ödeme oluşturmak" olduğu anlamına gelmez. Veriler harita değil pusula görevi görmelidir.
- Model neden bu tahmini üretti?
- Hangi veriler onu etkiledi?
- Hangi varsayımlara dayanıyor?
- Gerçekte hangi kullanıcı davranışını tespit ediyor?
Bu sorular tasarımcıların tahminlerini doğrulamalarına yardımcı olur.kullanılabilirlik testive ek araştırma. Yapay zeka, kalıpları belirlemede başarılıdır ancak bu kalıpların neden var olduğunu nadiren açıklar. Motivasyonu anlamak hâlâ insan merkezli bir araştırma görevidir.
Buradaki en açık uyarıcı hikayeAmazon'unModelin kadınların özgeçmişlerini düşürmeyi öğrendiğini keşfettikten sonra şirketin hurdaya çıkardığı bildirilen deneysel AI işe alım aracı. Yaklaşık on yıllık tarihsel işe alım kararlarından oluşan eğitim verileri erkek adaylara yönelikti ve model bu çarpıklığı miras aldı. "Kadın satranç kulübü kaptanı" gibi "kadın" kelimesini içeren özgeçmişleri cezalandırmaya ve erkeklerin özgeçmişlerinde daha yaygın olarak bulunan dili tercih etmeye başladı. Sistem kasıtlı olarak önyargılı değildi -verileröyleydi. Amazon'un bunu düzeltmeye çalıştığı ve sonunda başka ayrımcı kalıpların ortaya çıkmayacağını garanti edemedikleri için projeyi kapattığı bildirildi.
Bunun gibi örnekler, yapay zeka çıktılarının yorumlanmasının neden bu kadar önemli olduğunu gösteriyor. Tasarımcıların şunu anlaması gerekiyor:bir tahminin arkasındaki verilerve bağımlı oldukları modellerin güvenilirliğini değerlendirebilirler. Bir öneri yalnızca üzerinde eğitim aldığı veriler kadar iyidir ve bu verinin ne sakladığını bilmenin tek yolu sormaktır.
Bir Öğrenme Sistemi Olarak Deney Yapın
Deney genellikle bir tasarım kararını doğrulamanın bir yolu olarak çerçevelenir. Bir CTA'nın tıklama oranını artırmak mı istiyorsunuz? Bir A/B testi çalıştırın. Olasılıksal düşünme bunu yeniden çerçeveliyor. Deneyler sadece çözümleri doğrulamamalı, aynı zamanda belirsizliği de azaltmalıdır.
- Geleneksel yaklaşım:Başarıyı doğrulamak için özellikleri test etme.
- Olasılıksal yaklaşım:Belirsizliği azaltmak için varsayımların test edilmesi.
Geleneksel A/B testi pahalıdır. Özellikle kaybedilen bir varyant hedef kitlenizin önemli bir kısmıyla karşılaştığında, mühendislik süresine, trafik tahsisine ve kullanıcıya maruz kalma maliyetine mal olur. Yapay zeka simülasyonları, deneyleri daha verimli hale getirerek daha zayıf fikirlerin üretime ulaşmadan önce filtrelenmesine yardımcı olabilir. Kullanıcının sürekli değişime ihtiyacı vardır ve en etkili ekipler hızlı bir şekilde yinelenir.
Yapay zeka, geçmiş ve davranışsal verilere dayalı potansiyel sonuçları modelleyerek varsayımların erken değerlendirilmesine yardımcı olabilir. Bu simülasyonlar, mühendislik çabasına yatırım yapmaya değer yönlere işaret eden bir hipotez filtresi görevi görür. Bu aynı zamanda kişiselleştirmeyi de destekler; farklı kullanıcılar farklı deneyimlere daha iyi yanıt verebilir. Sürüm A, yüksek niyetli kullanıcılarda yankı uyandırabilirken, sürüm B, keşif amaçlı kullanıcılar için daha iyi çalışır. Çoklu deneyimlerin yan yana yaşaması bir kusur değildir; kasıtlı bir strateji olabilirler.
Yapay zeka, senaryoları ortaya çıkararak, olasılık puanları atayarak ve geniş ölçekte kişiselleştirmeyi mümkün kılarak olasılıksal düşünceyi güçlendirir. Deney, sürekli bir geri bildirim döngüsüne dönüşür:
Tahmin → Test Et → Öğren → Ayarla → Tekrarla!
Çalışması için birkaç adım:
Çerçeveyi kaydırın
- Yani şunu söylemek yerine: Bu özellik başarılı olacak mı?
- Sorun: Hangi varsayımları test ediyoruz?
Hipotezi tanımlamak için bu şablonu kullanın:
[Davranışsal varsayımın] [metriği] etkileyeceğine inanıyoruz çünkü [sebep]. [kanıt] olduğunda haklı olduğumuzu bileceğiz.
Örnek: İlk katılım akışını 5 adımdan 3 adıma basitleştirmenin tamamlama oranını artıracağına inanıyoruz çünkü kullanıcılar çok fazla seçenek sunulduğunda karar yorgunluğu yaşıyor. Etkinleştirme oranında herhangi bir düşüş olmadan adım adım dönüşümde en az %15'lik bir artış gördüğümüzde haklı olduğumuzu anlayacağız.- Yapay zeka simülasyonları
- Bazı varsayımları tahmin etmek için yapay zekayı kullanın.
- Daha sonra, hipotezi test etmek amacıyla en iyi adayları belirlemek için öğrendiklerinizi kullanın.
- Çoklu versiyonları benimseyin
- İki canlı versiyonun olması kesinlikle iyidir.
- Hızlı başarısız ol
- Öğrenmeye karşı başarıyı ödüllendirin.
- Çok sayıda büyük değişiklik yerine daha küçük deneyleri normalleştirin. Bu nedenle riskli bir bahise girmek yerine birkaç olasılık seçin ve bunları test edin.
- Olasılığı görselleştirin
- Tüm değişiklikleri takip etmek için her değişkenin olasılıklarını ve başarı tahminini içeren bir olasılık tablosu oluşturun.
Belirsizliği Açıkça İfade Edin
Tasarımcılar için en zor şeylerden biri belirsizliği anlaşılır ve uygulanabilir hale getirmektir. Belirsizlik gizlendiğinde kullanıcılar yapay zeka çıktılarını gerçekler olarak ele alır. Açıkça iletildiğinde güven artar.
Aralıklar, tahminler ve güven göstergeleri uzun bir yol kat ediyor. "Cuma'dan Pazartesi'ye" teslimat penceresi, kimseyi yanıltmadan değişkenlik hakkındaki gerçeği söylerken, kayan belirli bir zaman damgası her zaman güveni aşındırır. “Bu Pratik’e benziyor değil mi?” diyen yüz tanıma özelliği. fotoğrafı yalnızca bir adla etiketlemekten daha dürüst beklentiler oluşturur.

Belirsizliğin iletilmesi güveni zayıflatmaz, aksine güçlendirir. Amaç belirsizliği ortadan kaldırmak değil, ona göre tasarım yapmaktırakıllıca.
Farklı kullanıcılar belirsizliğe farklı tepkiler verir ve tasarımınız bunu hesaba katmalıdır:
| Kullanıcı türü | Risk | Tasarım hedefi |
|---|---|---|
| Kullanıcılara aşırı güvenmek | Çok hızlı hareket ediyorlar ve yapay zeka sonuçlarına kolaylıkla güveniyorlar./ | Belirsizliği daha belirgin bir şekilde gösterin. |
| Güvensiz kullanıcılar | Yapay zekayı tamamen görmezden geliyorlar. | Geçmiş doğruluğu veya güven düzeylerini gösterin. |
| Şüpheci/dengeli kullanıcılar | Yapay zekayı kural olarak değil rehber olarak kullanır. | Yapay zeka desteğini güçlendirin ve çerçeveleme türüne onların karar vermesine izin verin. |
Yapay zeka insan muhakemesini güçlendirmeli ve kesinlikle onun yerini almamalıdır. En güvenilir sistemler, insanların makine önerilerini inceleyebileceği, sorgulayabileceği, düzeltebileceği veya geçersiz kılabileceği net anlarla tasarlanmıştır.Döngüdeki insan (HITL)bir güvenlik ağı değil, biriyileştirme motoru. Her geçersiz kılma, düzeltme veya reddetme, modeli zaman içinde geliştiren yüksek kaliteli geri bildirime dönüşür.
Kontrolevlat edinmenin ön şartıdır. Kullanıcılar bir önerinin nasıl oluşturulduğunu anladıklarında, sonuçlarını değerlendirebildiklerinde ve kolayca müdahale edebildiklerinde yapay zekaya güvenmeye daha istekli olurlar. İyi tasarlanmış ürünler şunu açıkça ortaya koyar: Kim harekete geçiyor, öneri yanlışsa ne olacak ve kullanıcının nereye müdahale edebileceği.
Bu etkileşimler aynı zamanda sistemin iyileştirilmesi için de kritik öneme sahiptir. Her kabul etme, reddetme veya düzenleme güçlü bir sinyaldir ve pasif analizle karşılaştırıldığında bu tür geri bildirimler çok daha anlamlı eğitim verileri üretir. Gerçek dünya kullanımı ile model performansı arasındaki döngüyü kapatır.
HITL Pratikte Neye benziyor?
GitHub Copilot iyi bir günlük örnektir. Geliştiricilerin bir sekmeyle kabul edebileceği, düzenleyebileceği veya tamamen görmezden gelebileceği satır içi kod önerileri sunar. Sistem hiçbir zaman kullanıcı adına kod işlemez. Yazarlık insanlarda kalır. Her veri noktası, hangi önerilerin yararlı olduğu konusunda örtülü geri bildirim haline gelir. Gmail'in Akıllı Yazma özelliği de benzer şekilde çalışır; tahmin edilen metni isteğe bağlı olarak sunar, ton ve amacı kullanıcının elinde tutar.
Daha yüksek riskli bağlamlarda HITL daha açık hale gelir. Risk ve dolandırıcılık sistemleri genellikle kararları yönlendirmek için olasılık puanlarını kullanır: düşük risk: otomatik olarak ilerleyin; orta riskli: ek doğrulamayı tetikleyin; ve yüksek risk: Gerçek kişi olan incelemeciye iletin. Bu, gözetimi ortadan kaldırmadan hız ile muhakemeyi dengeler.
Sağlık hizmetleri gibi güvenliğin kritik olduğu alanlarda insan gözetimi tartışılamaz. Yapay zeka anormallikleri işaretleyebilir veya bir teşhis önerebilir ancak nihai yetki klinisyene aittir. Ayrıntıları açıklayan araçlar, uygulayıcının bir önerinin neden yapıldığını anlamasına yardımcı olur.Sorumluluğu ortadan kaldırmadan güveni güçlendirmek.
İnsan Yargısına Göre Tasarlamak
UX perspektifinden bakıldığında HITL, etkileşim modelini risk düzeyiyle eşleştirmekle ilgilidir. Basit kabul/reddetme olanakları, gerçek sonuçlara yol açmadan hızı artıran düşük riskli öneriler için işe yarar. Verileri, parayı veya insanları etkileyen riskler arttıkça önizleme ve onay adımları zorunlu hale gelir. Açıklamalar, kullanıcıların çıktıları körü körüne kabul etmek yerine güveni kalibre etmelerine yardımcı olur.
Perde arkasında yaşananlar da bir o kadar önemli. Sistem, kullanıcı kararlarını bağlamla birlikte yakalamalı, bunları öğrenme iş akışlarına beslemeli ve denetlenebilirlik için geçersiz kılmaları günlüğe kaydetmelidir. Ekipler zamanla geçersiz kılma oranı, güven doğruluğu, onaya kadar geçen süre ve algılanan güven gibi sinyalleri izleyebilir. Yüksek geçersiz kılma oranı kullanıcı hatası değildir. Tasarımın veya modelin dikkat edilmesi gerektiğinin bir işaretidir.
Yanlış Anlama Riski
Kötü uygulanmış HITL sistemleri, incelikli şekillerde başarısız olabilir. İnsan incelemesi bir lastik damgaya dönüşebilir. İş akışları o kadar yavaşlayabilir ki kullanıcılar güvenlik önlemlerini atlayabilir. Geri bildirimler dar bir kullanıcı alt kümesine yönelik olabilir. Bu riskler gerçektir ancak bunlar HITL'yi kaldırmanın nedeni değil, tasarım sorunlarıdır.
Amaç insan katılımını en üst düzeye çıkarmak değildir. Belirsizliğin, etkinin veya etiğin gerektirdiği yere odaklanmaktır. HITL'i korumak kontrolden çok,açıklık: Kimin karar vereceği, belirsizliğin ne zaman önemli olduğu ve sorumluluğun insanlar ile makineler arasında nasıl paylaşıldığı konusunda netlik.
Yalnızca Dönüşüm İçin Değil, Dayanıklılık için de Optimize Edinİyi tasarım, manzara değiştikçe uyum sağlar. Ürün tasarımı, özellikle yapay zeka destekli sistemlerde, artık yalnızca kısa vadeli dönüşüm ölçümlerini optimize etmeye gücü yetmiyor. Kullanıcının amacı değişkendir ve sürekli değişmektedir, ortamlar hızla değişmektedir ve olasılıksal sistemler de sürekli olarak gelişmektedir. Bugün işe yarayan şey yarın sessizce bozulabilir. Dayanıklılık için tasarım yapmak, varsayımlar, veriler ve kullanıcı davranışları değişse bile güvenilir, güvenilir ve kullanışlı kalan ürünler oluşturmak anlamına gelir.
Dayanıklı tasarımsoruyu şu şekilde değiştiriyor:
Bu ölçümü şu anda nasıl maksimuma çıkarırız? →Bu sistem zaman içinde, stres altında ve belirsizlik altında nasıl davranır?
Dayanıklı bir sistem şu özelliklere sahiptir:
- Yeni veriler ve davranışlar ortaya çıktıkça uyum sağlar.
- Felaket yerine güvenli bir şekilde başarısız olur.
- Şeffaf ve açıklanabilir olmaya devam ediyor.
- Kırılgan, aşırı optimize edilmiş etkileşim modellerini önler.
- İkinci dereceden ve istenmeyen etkileri öngörür.
Sadece son çeyreğin rakamlarını düşünmeyin. Değişimi belirlemek ve buna göre değişiklikler yapmak için sonraki çeyreklere göz atın.
Olasılıklar Değiştikçe Uyum Sağlayan Sistemler Oluşturun
Olasılıklar sürekli değişir, yapay zeka modelleri sürüklenir, bağlamlar gelişir ve kullanıcı ihtiyaçları da olgunlaşır; dolayısıyla koşullar sabitmiş gibi tasarlamak olasılıksal ortamlarda kırılganlık yaratır. Esnek bir yaklaşım şunları varsayar:varsayılan olarak oynaklık.
Tavsiye sistemlerinin nasıl gelişme eğiliminde olduğunu düşünün. İçerik akışının ilk sürümü etkileşim için optimize edilir ve etkileşim bir süreliğine artar. Daha sonra kullanıcılar feed'in dar, tekrarlı ve hatta yorucu olduğunu fark etmeye başlar. Dayanıklı sistemler yeniden dengelenir, yenilik getirir, sinyalleri çeşitlendirir ve kısa vadeli tıklamaların yanı sıra uzun vadeli memnuniyet önlemlerini de alır.
Tasarımcılar değişim bekleyen arayüzler, dinamik yeniden sıralama, bağlamsal açıklamalar ve eski kişiselleştirme döngülerinden kaçış yolları yaratmalıdır; bunların tümü, olasılıklar değiştikçe sistemlerin kullanışlı kalmasına yardımcı olur.
Sadece Kısa Vadeli Kazanımlar İçin Değil, Uzun Vadeli Sonuçlar için de Optimize Edin
Kısa vadeli dönüşüm kazanımları genellikle uzun vadeli maliyetleri gizler. Katılımı hızlandırmak kavramayı azaltabilir. Bildirim TO'sunu en üst düzeye çıkarmak güveni zedeleyebilir. Etkileşimi optimize etmek tek başına sağlıksız kullanım kalıpları üretebilir. Kırılgan sistemler, ikinci dereceden etkileri, yani haftalar veya aylar sonra ortaya çıkan sonuçları göz ardı ederek sayıları en üst düzeye çıkarır.
Duolingo'nun kalp sistemi buna karşı tasarım yapmanın güzel bir örneğidir. Sürtüşmeye neden olur: Çok fazla hata yaparsanız, kalbiniz biter ve daha fazla kazanmak için beklemeniz veya eski materyaller üzerinde pratik yapmanız gerekir. Kağıt üzerinde bu bir dönüşüm katili gibi görünüyor: oturum başına daha az ders. Uygulamada ekip, bir öğrenme uygulaması için gerçekten önemli olan ölçüm olan uzun vadeli motivasyonu ve elde tutmayı nasıl desteklediğini kamuya açık bir şekilde tartıştı. Kısa vadeli katılım düşüyor, ancak uzun vadeli sonuçlar iyileşiyor.
Meta da daha isteksiz de olsa benzer bir değişiklik yaptı. Şirket, yalnızca "harcanan zamana" göre optimizasyon yapmanın istenmeyen duygusal ve toplumsal etkiler yarattığını ve bunun da yol gösterici bir ölçü olarak "anlamlı sosyal etkileşimlere" doğru bir dönüşe yol açtığını kamuoyu önünde kabul etti. Bu değişimin tam olarak gerçekleşip gerçekleşmediği tartışmaya açık, ancak asıl önemli olan bunun kabul edilmesi: yanlış şeyi ölçekte optimize etmenin gerçek bir alt maliyet maliyeti var.
Bu nedenle tasarımcıların rutin olarak şu soruyu sorması gerekir:
- Hangi davranışları istemeden pekiştiriyoruz?
- Bu etkileşim geniş ölçekte tekrarlanırsa hâlâ sağlıklı olacak mı?
- Ekosistemin refahı için mi yoksa yalnızca bir sonraki tıklama için mi optimizasyon yapıyoruz?
Belirsizliği Ölçeklendirmeyi Planladığınız Şekilde Planlayın
Ekipler rutin olarak trafik artışlarını planlar, ancak nadiren belirsizlik artışlarını planlarlar. Ancak yapay zeka sistemleri bozuluyor, düşmanca davranışlar gelişiyor ve dış şoklar kullanıcı davranışını bir gecede yeniden şekillendirebiliyor. Dayanıklı tasarım değişkenliği varsayar ve buna hazırlanır.
Bu, şu anlama gelir:güvenin azalması. Yapay zeka emin olmadığında arayüzünüz ne yapıyor? Sessizce başarısız mı oluyor yoksa zarif bir şekilde devrediyor mu? Yapay zeka desteği tamamen ortadan kalksa bile deneyim hâlâ anlamlı mı? İyi bir geri dönüş stratejisi mutlu yol kadar önemlidir.
Bazı pratik eylemler:
- Güveni azaltacak tasarım.
Geri dönüş durumlarını gösterin, manuel geçersiz kılmalara izin verin ve belirsizliği önemli olduğu yerde görselleştirin. - Uzun vadeli kullanıcı sağlığını ölçün.
Yalnızca dönüşümü değil memnuniyeti, elde tutma kalitesini ve istenmeyen davranışları izleyin. - Uyarlanabilirlik oluşturun.
Segmentler arasında ayarlanabilir sıralama kurallarını, dinamik durumları ve sürekli denemeleri kullanın. - İkinci derece etkileri erkenden modelleyin.
Her optimizasyonun bir gölgesi vardır; göndermeden önce yüzeye çıkarın. - Lansmandan önce bir dayanıklılık kontrol listesi kullanın.
Sistem düşük yapay zeka güveni altında nasıl davranıyor? Güvenli geri dönüş nedir? Hangi sürüklenmeleri bekliyoruz?
Bir sonraki tasarım incelemenizde bu makaleden bir şeyi alırsanız, onu şu şekilde yapın:
"Bu işe yarayacak mı?" diye sormayı bırakın. ve "Bunun işe yarama olasılığı ne kadar ve işe yaramadığında ne olacak?" diye sormaya başlayın.
Bu tek yeniden çerçeve, hipotez yazma şeklinizi, yapay zeka çıktısını yorumlama şeklinizi, deneylerin kapsamını ve sistemin hatalı olduğu anlara yönelik tasarım şeklinizi değiştirir. Bu haftadan başlayarak, kabul ettiğiniz her yapay zeka önerisinin ardındaki varsayımı adlandırın, ürününüzde olasılıksal çıktının kesin olarak sunulduğu bir yer bulun, çerçeveyi düzeltin ve mutlu yoldan önce geri dönüşü tasarlayın.
Deterministik tasarımdan olasılıksal tasarıma geçiş, yeni araçlardan çok yeni araçlarla ilgilidir.yeni duruş. Yapay zeka dünyamıza belirsizlik getirmedi. Her zaman orada olan belirsizliği görmezden gelmeyi imkansız hale getirdi. Yapay zeka tahmin edebilir, simüle edebilir ve tavsiyelerde bulunabilir, ancak neyin önemli olduğuna, hangi kullanıcıların gözden kaçırıldığına veya dünün verileriyle eğitilmiş bir modele karşı hangi alışılmadık fikrin savunulmaya değer olduğuna karar veremez. Bunlar kaldıinsan sorumlulukları. Noktaları değil aralıkları düşünün. Özellikleri değil, varsayımları test edin. Mükemmellik için değil, uyum için geliştirin. Tahminin ucuz ve yargılamanın nadir olduğu bir dünyada, bir tasarımcının yapabileceği en değerli şey sormaya devam etmektir,Başka ne doğru olabilir?




