Bilim dünyası, yapay zekanın (YZ) hipotez geliştirme ve test etme süreçlerine entegrasyonuyla önemli bir adım atıyor. Yapılan iki yeni çalışma, YZ'nin bilim insanlarına sunduğu desteği gözler önüne seriyor. Bu sistemlerden ilki, Google'ın geliştirdiği ve araştırmacıların yargılarını düzenli olarak kullanarak sistemi yönlendirdiği "Co-Scientist" olarak adlandırılıyor. İkinci sistem ise, belirli deney sınıflarından gelen biyolojik verileri değerlendirebilen ve bu anlamda bir adım öne çıkan, FutureHouse adlı bir sivil toplum kuruluşu tarafından geliştirilmiş.
Her iki sistem de mevcut durumda biyolojik verilerle çalışıyor ve temel olarak "bu ilaç şu hastalığa iyi gelir" gibi basit hipotezler üzerine odaklanıyor. Amaç, bilim insanlarını veya bilimsel süreci tamamen ortadan kaldırmak değil, bunun yerine YZ'nin en güçlü olduğu alanlardan faydalanmak: İnsanların başa çıkmakta zorlanacağı devasa bilgi kümelerini işlemek.
Bu Gelişmeler Ne İşe Yarıyor?
Her ne kadar iki sistem arasında farklılıklar bulunsa da, her ikisi de "ajanlık" prensibiyle çalışıyor. Yani, arka planda çalışarak farklı araçları çağırıyorlar. Bilimsel yayınların kolaylaşmasıyla birlikte dergi sayısı ve dolayısıyla makale sayısı patlamış durumda. Herhangi bir araştırmacının kendi alanındaki gelişmeleri takip etmesi zorlaştı. Farklı alanlardaki potansiyel olarak ilgili materyalleri bulmak ise gerçek bir mücadele. Örneğin, göz gelişimi üzerine odaklanan bir araştırmacı, böbrekte de rol oynayan bir sinyal sistemini ve bu sistem hakkındaki keşifleri gözden kaçırabilir.
FutureHouse ekibinin de belirttiği gibi, "farklı alanlar arasındaki gizli bağlantıları belirleyerek 'kombinatoryal sentez'e odaklanmak, bilimsel bilginin parçalanmışlığı nedeniyle insan uzmanların gözden kaçırabileceği 'kolay kazanımları' hedefliyor." Bu, YZ için oldukça uygun bir görevdir. Araştırmacılar başka işlerle meşgulken, YZ akran denetimli literatürü tarayabilir. Bu, YZ'nin bir görevi insandan daha iyi mi yoksa daha kötü mü yapacağı sorusu değil, daha çok herhangi bir insanın bu tür aramaları yapıp yapmayacağı sorunudur.
Farklı araştırmalar arasındaki yeterli bağlantıyı bularak, bu araçlar biyolojiye dair hipotezler oluşturabiliyor. Bu, biyolojik davranışların altında yatan süreçleri ve bu süreçleri düzenleyen yolları ve ağları içerebilir. Bu çalışmalarda ise akut miyeloid lösemi ve bir tür makula dejenerasyonu gibi hastalıklı hücrelerdeki bu yolları hedefleyebilecek bilinen ilaçların önerilmesi söz konusu.
Co-Scientist
Google'ın sistemi, şirketin Gemini büyük dil modeline dayanıyor. Bu model, insan bilim insanları tarafından sağlanan araştırma hedeflerini yorumlamasına ve ilgili bilgileri arayarak hipotezler oluşturmasına yardımcı oluyor. Bu hipotezler daha sonra bir "turnuvada" birbirine karşı değerlendiriliyor ve sonuçlar bir "Reflection" ajanı tarafından inceleniyor. Bir "Evolution" ajanı ise hayatta kalan fikirlerde iyileştirmeler yapabiliyor ve bu süreç tekrar başlatılabiliyor.
Bu süreç boyunca anahtar kriterler arasında makullük, yenilik, test edilebilirlik ve güvenlik yer alıyor. "Reflection" aracı, harici arama araçlarına erişime sahip olması sayesinde, "görünüşte yeni ama makul olmayan hipotezlerin halüsinasyon görmesini engellediği" belirtiliyor.
Çalışmaya göre, bilim insanları her zaman sürecin içinde tutuluyor. Lösemiyi hedefleyen potansiyel ilaçların aranmasında, sistemin yaptığı öneriler, Co-Scientist'in önerilerini formüle etmek için kullandığı literatüre erişimi olan uzmanlardan oluşan bir panel tarafından önceliklendirildi.
Sonuçlar, kanser tedavilerinden beklendiği gibiydi. Tespit edilen ilaçlardan bazıları, lösemi hücrelerinden oluşan bir panele karşı etkili oldu, ancak yalnızca alt gruplarda. Bu durum, kontrolsüz büyümeye giden birden fazla yol olduğu göz önüne alındığında şaşırtıcı değil. Bir hücre tipinin izlediği yolu bloke eden ilaçlar, farklı bir yol izleyen hücrelerde etkili olmayabilir.
Google ayrıca sistemin, bakterilerde virülans genlerinin yayılması gibi ilaç içermeyen daha genel hipotezler de oluşturabileceğini belirtti, ancak bu çalışmanın ayrıntıları oldukça sınırlıydı.
Sistem, modelden bağımsız olacak şekilde ayarlanmış olup, YZ sistemleri geliştikçe daha iyi performans gösteren modellere geçiş yapılmasına olanak tanıyor. Ancak şirket, "Co-Scientist'in ayrıca, modellerinin içsel sınırlamalarını, kusurlu gerçekliği ve halüsinasyon potansiyeli de dahil olmak üzere miras aldığını" da uyarıyor.
Ve Robin
FutureHouse'un sistemi bazı benzerlikler taşısa da, ajan araçlarının hepsini kuş isimleriyle adlandırmanın ötesinde birkaç kritik farkı var. Ana sistem olan Robin, özel literatür arama araçlarına erişim sağlıyor. Bunlardan ilki olan Crow, makalelerin özetini çıkarırken, Falcon makaledeki bilgilerin derinlemesine bir genel bakışını sunuyor. Sistemi anlatan makale, buradaki avantajların net bir resmini sunuyor: "Robin, insan için tahmini 540 saatlik bir süreye kıyasla 30 dakika içinde 551 makaleyi analiz ediyor."
Bu özetleri kullanarak Robin, makula dejenerasyonu için hastalık mekanizmaları hakkında bir dizi hipotez oluşturdu ve bu araçları her mekanizma için kanıtların ayrıntılı bir raporunu sunmak üzere kullandı. Ardından bir büyük dil modeli (LLM) yargıcı, hipotezler arasında ikili karşılaştırmalar yaparak, Google'ın turnuva sistemine benzer göreceli sıralamalar elde etti.
Benzer bir şekilde, sistem makula dejenerasyonunun bir modelini sağlayabilecek hücre hatlarını ve kültür koşullarını önermek için yeniden konuşlandırıldı ve 30 aday ilaç hakkında raporlar hazırladı. FutureHouse ekibine göre, "Bu raporlar, her ilacın in vitro modelde temsil edilen hastalığın mekanizmasını hafifletmek için neden uygun olduğuna dair gerekçeleri ve ilacın oluşturabileceği potansiyel sınırlamaları içeriyordu." Yine bu raporlar, hangi testlerin yapılacağına karar vermek için insan uzmanlar tarafından değerlendirildi.
Robin ayrıca, ilaçları test etmek için deneyler de önerdi ve bu deneyler insanlar tarafından değerlendirildi (çoğu durumda önerilenlerin varyantlarının kullanıldığı görülüyor).
Robin'in en önemli farkı, akış sitometrisi ve RNA-seq gibi bazı standart biyolojik tarama deneylerinden gelen verilerin değerlendirilmesini otomatikleştirebilen Finch adlı bir araç içermesidir. Yani, testleriniz Finch'in işleyebildiği deneylerden birini içerdiği sürece, sistem tarafından ek bir adım gerçekleştirilebilir.
Yukarıda belirtildiği gibi, Robin benzersiz bir hipotez ortaya attı: Retinal hücrelerin hücre dışındaki döküntüleri toplama yeteneğini artırmak, hastalığa karşı bir miktar koruma sağlayabilir. Ve önerdiği deneylerde tam da bu tür bir artış sağlayan bir ilaç tespit etti.
Google'ın da bulduğu gibi, bilimsel literatürle arayüz oluşturmak üzere özel olarak tasarlanmış araçlara sahip olmak önemliydi. Crow'u OpenAI'nin o4-mini ile değiştirmek, halüsinasyon gören referans oranını sıfırdan yüzde 45'e çıkardı. FutureHouse, OpenAI'nin araştırmaya odaklı aracının performansına da baktı ve Robin'in henüz bulamadığı ilaçları önerdiği tüm durumlarda, bu ilaçların hücreler üzerinde etkisiz kaldığını gördü.
Peki Bu Bize Neyi Gösteriyor?
Öncelikle, bu başarıların ilaç geliştirmenin daha kolay kısımlarında geldiğini belirtmek önemlidir (bu kısımlardan herhangi birinin kolay olduğu söylenemez). YZ'den tamamen yeni moleküller tasarlaması istenmedi ve çoğu ilaç, hücre kültüründe test edilmesinden ziyade hayvan ve klinik denemeler aşamasında başarısız oluyor. Mevcut ilaçların yeniden konumlandırılmasının bir önemi olmadığı anlamına gelmiyor; bu moleküller için zaten güvenlik profillerimiz ve onaylarımız var ve birçoğu patent dışı olduğu için ucuzdur. Ancak YZ'nin zorlu problemleri çözdüğü bir noktada değiliz.
Bu tür hipotezler, yani "bu mekanizma şu hastalığın altında yatıyor ve oradaki ilaç bunu hedefleyebilir" şeklindeki hipotezler, biyolojideki en somut hipotez biçimlerinden biridir. Bir bilim insanı olarak kariyerimde, "bu mutasyona sahip farelerin çok farklı dokularda bir sürü kusuru var; bunlara tek bir mekanizma mı yol açıyor?" veya "bu genin ifadesinin sınırında, hücrelerin bu sinyal molekülüne yanıtını değiştiren ne oluyor?" gibi şeyleri ele almak üzere hipotezler geliştirmem gerekti. Bu sistemlerin bu tür daha açık uçlu bilimsel sorunları nasıl ele alabileceği belirsiz.
Bununla birlikte, literatür yüklemesi sorunu birçok alanda gerçek bir sorundur ve bu sorunu ele almak üzere tasarlanmış sistemler, ihtiyacımız olan tüm bilginin bir düzine yıl boyunca ortalıkta durup kimse tarafından birleştirilemediği bir durumdan kaçınmamıza yardımcı olabilir. YZ'nin büyüyen sancılarıyla hala uğraşırken, bu sorunu ele alan en az iki bağımsız olarak geliştirilmiş sistemin olması ve sonuçları karşılaştırabilmemiz beni memnun ediyor.