Ara

Yapay Zeka Kullanımı Üzerine Şaşırtıcı Araştırma: Yeteneklerimiz Hakkında Daha Fazla Yanılabileceğimiz Ortaya Çıktı

Her birimiz, belirli bir konuda ne kadar iyi olduğumuzu değerlendirmemiz istendiğinde, tahminlerimizde genellikle yanılırız. Bu evrensel insani eğilim, en çok yeteneği düşük olan kişilerde belirginleşir. İlk kez psikologlar tarafından incelenen bu olgu, Dunning-Kruger etkisi olarak bilinir. Bu etki, bir görevi yeterince iyi yapamayan kişilerin aşırı özgüvenli olmasına karşın, yüksek yeteneğe sahip kişilerin kendi becerilerini küçümsemesi anlamına gelir. Genellikle dikkat, karar verme, muhakeme ve dil gibi yetenekleri ölçen bilişsel testlerle ortaya çıkar.

Ancak Finlandiya'daki Aalto Üniversitesi'nden bilim insanları (Almanya ve Kanada'daki araştırmacılarla birlikte) yaptıkları yeni bir araştırmada, yapay zeka (YZ) kullanımının Dunning-Kruger etkisini neredeyse tamamen ortadan kaldırdığını, hatta tersine çevirdiğini keşfettiler.

Araştırmalarına göre, yaygın olarak kullanılan sohbet robotlarıyla (chatbot) problemler çözüldüğünde, tüm katılımcılar (yetenek seviyelerinden bağımsız olarak) yanıtların kalitesine aşırı derecede güvendiler. Hatta en deneyimli YZ kullanıcıları bu güveni daha fazla sergiledi. Ekip bulgularını, Computers in Human Behavior dergisinin Şubat 2026 sayısında yayımladı.

Büyük dil modellerinin (LLM) yaygınlaşmasıyla hepimiz daha fazla YZ okuryazarı haline gelirken, araştırmacılar katılımcıların YZ sistemleriyle etkileşim kurmada daha iyi olmalarının yanı sıra, bunları kullanırken performanslarını değerlendirmekte de daha başarılı olacaklarını bekliyordu. Aalto Üniversitesi bilgisayar bilimcisi ve araştırmanın ortak yazarlarından Robin Welsch, bir açıklamada, "Bunun yerine, bulgularımız YZ kullanırken performansımızı doğru bir şekilde değerlendirmede önemli bir yeteneksizlik olduğunu ortaya koyuyor" dedi.

Etkiyi Azaltmak

Çalışmada, bilim insanları 500 katılımcıya Law School Admission Test'ten mantıksal akıl yürütme görevleri verdi. Katılımcıların yarısına popüler yapay zeka sohbet robotu ChatGPT'yi kullanma izni verildi. Her iki gruba da daha sonra YZ okuryazarlıkları ve kendi performanslarını ne kadar iyi değerlendirdikleri soruldu. Kendi performanslarını doğru değerlendiren katılımcılara ek tazminat vaat edildi.

Bulguların arkasındaki nedenler çeşitlidir. YZ kullanıcıları genellikle yalnızca bir soru veya komuttan sonra verdikleri yanıttan memnun kaldıkları ve yanıtı daha fazla incelemeden veya doğrulamadan kabul ettikleri için, bu durumun "bilişsel yük boşaltma" olarak adlandırılabileceği belirtiliyor. Bu, soruları daha az derinlemesine düşünerek, daha "yüzeysel" bir yaklaşımla ele almak anlamına geliyor.

Kendi muhakememize daha az dahil olmamız (buna "üstbilişsel izleme" denir), eleştirel düşüncenin olağan geri bildirim döngülerini atlamamız demektir. Bu da performansımızı doğru bir şekilde ölçme yeteneğimizi azaltır.

Daha da dikkat çekici olanı, zekamızdan bağımsız olarak hepimizin YZ kullanırken yeteneklerimizi abartmamızdı. Yüksek ve düşük beceri seviyesindeki kullanıcılar arasındaki fark küçülüyordu. Araştırma, LLM'lerin herkese bir dereceye kadar daha iyi performans göstermelerine yardımcı olmasıyla bu duruma bağlandı.

Araştırmacılar bu konuya doğrudan değinmese de, bu bulgu, bazı yaygın LLM'lerin fazla uyumlu olup olmadığına dair bilim insanlarının sorduğu sorularla aynı zamana denk geliyor. Aalto ekibi, YZ daha yaygın hale geldikçe ortaya çıkabilecek birkaç potansiyel sonuç konusunda uyardı.

Öncelikle, genel olarak üstbilişsel doğruluk zarar görebilir. Sonuçlara titizlikle sorgulamadan daha fazla güvenmeye başladıkça, kullanıcı performansının artması ancak görevlerdeki başarının anlaşılmasının azalması arasında bir denge ortaya çıkıyor. Sonuçları düşünmeden, hata kontrolü veya daha derinlemesine muhakeme yapmadan, bilgiyi güvenilir bir şekilde kaynak bulma yeteneğimizi zayıflatma riskiyle karşı karşıyayız. Bilim insanları, araştırmada bu noktaya dikkat çekti.

Dahası, Dunning-Kruger Etkisindeki bu düzelme, hepimizin YZ kullanırken yeteneklerimizi abartmaya devam edeceği anlamına geliyor. YZ konusunda daha bilgili olanlarımız bunu daha da fazla yapacak. Bu durum, yanlış hesaplanmış karar verme ikliminin artmasına ve becerilerin aşınmasına yol açacaktır.

Araştırmanın, bu tür bir düşüşü durdurmak için önerdiği yöntemlerden biri, YZ'nin kendisinin kullanıcılarda daha fazla sorgulamayı teşvik etmesidir. Geliştiriciler, "Bu cevaptan ne kadar eminsiniz?" veya "Neleri gözden kaçırmış olabilirsiniz?" gibi sorular sorarak veya güven puanları gibi önlemlerle daha fazla etkileşimi teşvik ederek yanıtları yeniden yönlendirebilir.

Bu yeni araştırma, Kraliyet Cemiyeti'nin yapay zeka eğitiminin sadece teknik becerileri değil, aynı zamanda eleştirel düşünceyi de içermesi gerektiğini savunduğu artan inanca daha fazla ağırlık katıyor. Bilim insanları, "Metakognitif izlemeyi geliştirmek için, kullanıcılara performansları hakkında eleştirel bir şekilde düşünme olanağı vererek etkileşimli YZ sistemleri için tasarım önerileri sunuyoruz" dedi.

Önceki Haber
Huawei'nin Yeni Kirin 9030 Çipi 2026'da Piyasada Olabilir: 3nm Üretim Söylentileri Doğru mu?
Sıradaki Haber
Apple'dan iPhone Kılıflarında Devrim: Dokunmaya Duyarlı Tasarım Geliyor!

Benzer Haberler: