Ara

Yapay Zeka Sohbetleri Daha Tartışmacı Olunca Daha mı Akıllı Oluyor?

Yapay zeka (YZ) ajanlarının daha insan odaklı iletişim kurmasına izin verildiğinde, daha etkili birer tartışma ortağı haline geldikleri ve daha doğru sonuçlara ulaştıkları bilim insanları tarafından ortaya kondu. İnsan iletişimi duraksamalar, ani söz kesmeler, tereddütlü sessizlikler ve belirsizliklerle doludur. Buna karşılık YZ, bilgisayarların resmi iletişim stilini benimser: komutu işler, yanıtı formüle eder, çıktıyı sunar ve bir sonraki komutu sabırla bekler.

Araştırmanın ortak yazarlarından biri yaptığı açıklamada, "Mevcut çoklu ajan sistemleri, insan sohbetinin karmaşık ve gerçek zamanlı dinamiklerinden yoksun olduğu için genellikle yapay hissettiriyor. Ajanlara, konuşmayı bölme veya sessiz kalma gibi varsayılan sosyal ipuçları vermenin kolektif zekalarını geliştirip geliştirmeyeceğini görmek istedik." dedi.

Araştırmacılar, büyük dil modellerinin (LLM'ler) bilgisayar iletişiminin sırayla ve bekleme prensibine uymak zorunda kalmadığı bir çerçeve önerdi. Bunun yerine, bir LLM'ye sırasını beklemeden konuşabilen, diğer konuşmacıları bölebilen veya sessiz kalabilen bir kişilik atanabiliyordu.

Daha insansı YZ iletişim yöntemleri yaratmanın ötesinde, araştırmacılar bu esnekliğin standart LLM'lere kıyasla karmaşık görevlerde daha yüksek doğruluk sağladığını buldu.

Bir Dizi Kişilik

Ekip, LLM'lere klasik psikolojideki "büyük beşli" kişilik tipleri olan açıklık, bilinçlilik, dışadönüklük, uyumluluk ve nevrotizm özelliklerini entegre ederek başladı. Bir sonraki adım, metin tabanlı LLM'leri yanıtları tam bir yanıt üretmeden önce cümle cümle işlemesi için yeniden programlamak oldu. Bu, araştırmacıların tartışmanın akışını dikkatlice kontrol etmelerine olanak tanıdı. Ayrıca, üç konuşma ortamı arasındaki sonuçları karşılaştırdılar: sabit konuşma sırası, dinamik konuşma sırası ve kesintiye izin verilen dinamik konuşma sırası. Sonuncusu, modelin konuşmayı gerçek zamanlı olarak kavrayıp işlemesine olanak tanıyan bir "acil durum puanı" hesaplamasını sağladı.

Acil durum puanı, konuşmada çeşitli şekillerde ifade edildi. Model bir hata veya tartışma için kritik gördüğü bir noktayı fark ettiğinde acil durum puanı yükselirse, kimin konuşma sırası olduğuna bakılmaksızın bunu hemen belirtebiliyordu. Acil durum puanı düşükse, model bunu ekleyecek somut bir şey olmadığı şeklinde yorumluyordu ve bu da kendi lehine konuşma "karmaşasını" azaltıyordu.

Araştırmacılar, ekibin performansı, bilim ve beşeri bilimler dahil olmak üzere farklı alanlardan soruları kapsayan bir YZ muhakeme testi olan Massive Multitask Language Understanding (MMLU) kıyaslamasından alınan 1.000 soru kullanarak değerlendirdiğini belirtti.

Araştırmacılar, "Bir ajan başlangıçta yanlış bir cevap verdiğinde, sabit sıradaki tartışmada genel doğruluk %68,7, dinamik sırada %73,8 ve kesintiye izin verildiğinde %79,2 idi. Daha zorlu bir ortamda, iki ajan başlangıçta yanlış cevap verdiğinde, sabit sırada doğruluk %37,2, dinamik sırada %43,7 ve kesintiye izin verildiğinde %49,5 idi" dedi.

Kişilik odaklı modellerin geleneksel YZ sohbet botlarından daha doğru olduğunu gösteren araştırmacılar, şimdi bu yeni bulguların pratikte nasıl uygulanabileceğini keşfetmek istiyor. Ekip, "dijital kişiliklerin" bir grup içindeki karar verme süreçlerinde nasıl rol oynayabileceğinin dinamiklerini anlamak için bulgularını çeşitli yaratıcı işbirliği ortamlarına uygulamayı planlıyor.

Araştırmacılar, "Gelecekte, YZ ajanları birbirleriyle ve insanlarla işbirliği ortamlarında giderek daha fazla etkileşimde bulunacak. Bulgularımız, gerektiğinde konuşmayı bölme yeteneği de dahil olmak üzere, kişilik tarafından şekillendirilen tartışmaların bazen kesinlikle sıraya dayalı ve tekdüze nazik alışverişlerden daha iyi sonuçlar üretebileceğini gösteriyor." dedi.

Önceki Haber
OpenAI'den Pentagon ile Anlaşma: Yapay Zeka Güvenlik Sınırlarında Yeni Dönem
Sıradaki Haber
Vulkan Oyunlarına AMD FSR 4 Desteği Optiscaler ile Geldi: Detaylı Kurulum Rehberi

Benzer Haberler: