Bir uzay gemisini otonom bir ajan olarak yönetiyorsunuz. İlk duyduğunuzda kulağa bilim kurgu gibi geliyor, değil mi?
Ancak bu, araştırmacıların ChatGPT'nin bir uzay aracını ne kadar iyi pilotluk yapabileceğini görmek için kullandığı ilk komuttu. Şaşırtıcı bir şekilde, bu geniş dil modeli (LLM), otonom uzay aracı simülasyon yarışmasında ikinci sırayı alarak olağanüstü bir performans sergiledi.
Araştırmacılar uzun zamandır uydu kontrolü ve uzay aracı navigasyonu için otonom sistemler geliştirmekle ilgileniyor. Gelecekte insan eliyle kontrol edilemeyecek kadar çok uydu olması bekleniyor. Ayrıca derin uzay keşifleri için ışık hızının sınırlamaları, uzay araçlarını gerçek zamanlı olarak doğrudan kontrol edemeyeceğimiz anlamına geliyor.
Eğer uzayda gerçekten ilerlemek istiyorsak, robotların kendi kararlarını vermelerine izin vermemiz gerekiyor.
Yeniliği teşvik etmek amacıyla, havacılık araştırmacıları son yıllarda popüler Kerbal Space Program video oyununa dayalı "Kerbal Space Program Diferansiyel Oyun Yarışması"nı oluşturdular. Bu yarışma, topluluğun otonom sistemleri (bir ölçüde) gerçekçi bir ortamda tasarlamasına, denemesine ve test etmesine olanak tanıyan bir tür platform görevi görüyor. Yarışma, bir uyduyu takip edip durdurma görevi ve tespit edilmekten kaçınma görevi gibi çeşitli senaryoları içeriyor.
Yakında yayınlanacak bilimsel bir makalede, uluslararası bir araştırmacı ekibi kendi adaylarını açıkladı: ChatGPT ve Llama gibi ticari olarak temin edilebilen bir geniş dil modeli.
Araştırmacılar, geniş dil modellerini kullanmaya karar verdiler çünkü otonom sistemler geliştirmeye yönelik geleneksel yaklaşımlar, birçok eğitim, geri bildirim ve iyileştirme döngüsü gerektiriyor. Ancak Kerbal yarışmasının doğası gereği mümkün olduğunca gerçekçi olması gerekiyor ve bu da saatler süren görevler anlamına geliyor. Bu durum, bir modeli sürekli olarak iyileştirmenin pratik olmadığını gösteriyordu.
Ancak geniş dil modelleri, zaten büyük miktarda insan yazılı metni üzerinde eğitildikleri için çok güçlüdür. Bu nedenle, en iyi senaryoda, belirli bir durum için doğru bağlamı yakalamak için sadece küçük bir miktar dikkatli komut mühendisliği ve birkaç deneme yeterli oluyor.
Peki, böyle bir model gerçekten bir uzay aracını nasıl pilotluk yapabilir?
Araştırmacılar, uzay aracının mevcut durumunu ve hedefini metin biçimine çevirmek için bir yöntem geliştirdiler. Ardından bu metni geniş dil modeline ileterek, uzay aracının nasıl yönlendirileceği ve manevra yapacağı konusunda tavsiyeler istediler. Daha sonra, geniş dil modelinin metin tabanlı çıktısını, simüle edilmiş aracı çalıştırabilecek işlevsel bir koda dönüştüren bir çeviri katmanı geliştirdiler.
Küçük bir dizi komut ve bazı ince ayarlar sayesinde, araştırmacılar ChatGPT'nin yarışmadaki testlerin çoğunu tamamlamasını sağladı ve sonuç olarak yakın zamandaki bir yarışmada ikinci sırayı aldı. (Makaleye göre, birincilik farklı denklemlere dayalı bir modele gitti).
Tüm bunlar, ChatGPT'nin en son modeli olan sürüm 4'ün piyasaya sürülmesinden önce yapıldı. Özellikle "halüsinasyonlar" (istenmeyen, anlamsız çıktılar) gibi hatalardan kaçınmak için hala yapılması gereken çok iş var; zira bu tür hatalar gerçek dünya senaryolarında felaketle sonuçlanabilir. Ancak bu çalışma, piyasada bulunan geniş dil modellerinin bile, devasa miktarda insan bilgisini sindirdikten sonra beklenmedik şekillerde kullanılabileceğinin gücünü gösteriyor.