Yapay zeka alanında öncü isimlerden OpenAI, ikinci nesil video üretim modeli Sora 2'yi duyurdu. Bu yeni model, senkronize diyalog ve ses efektleriyle çeşitli tarzlarda videolar oluşturma yeteneğiyle dikkat çekiyor. OpenAI ayrıca, kullanıcıların kendi görüntülerini yapay zeka tarafından üretilen videolara entegre etmelerini sağlayan yeni bir iOS sosyal uygulaması da kullanıma sundu. Bu özellik, şirket tarafından "cameo" olarak adlandırılıyor.
OpenAI, Sora 2'nin yeteneklerini sergilemek için yapay zeka tarafından oluşturulan bir video yayınladı. Videoda, şirketin CEO'su Sam Altman, hafifçe yapay duran bir sesle kameraya konuşurken görülüyor. Arka planda ise rekabetçi ördek yarışları ve parıldayan mantar bahçeleri gibi fantastik manzaralar yer alıyor.
Sora 2, "sofistike arka plan ses manzaraları, konuşma ve yüksek derecede gerçekçiliğe sahip ses efektleri" oluşturabiliyor. Bu alanda, geçtiğimiz aylarda Google'ın Veo 3 ve Alibaba'nın Wan 2.5 gibi modellerinin de senkronize ses ve video üretme yetenekleri dikkat çekmişti. Şimdi ise OpenAI, Sora 2 ile bu alanda önemli bir adım daha atıyor.
Model, önceki versiyona göre görsel tutarlılıkta belirgin iyileştirmeler sunuyor. Ayrıca, birden fazla sahne arasında tutarlılığı koruyarak daha karmaşık talimatları takip edebiliyor. OpenAI, Sora 2'yi metin üretim modellerindeki "ChatGPT anına" benzeterek, yapay zeka video üretiminde yeni bir dönüm noktası olduğunu vurguluyor.
Sora 2'nin, fiziksel doğruluk konusunda da önemli gelişmeler kaydettiği belirtiliyor. Modelin, Olimpik jimnastik rutinleri ve üçlü atlayışlar gibi karmaşık fiziksel hareketleri gerçekçi fizik kurallarına uygun şekilde simüle edebildiği iddia ediliyor. OpenAI, önceki modellerde gözlemlenen ve nesnelerin tuhaf şekillerde değişmesi gibi hataların Sora 2 ile giderildiğini belirtiyor. Örneğin, bir basketbol oyuncusunun atışı kaçırması durumunda, topun potaya kendiliğinden ışınlanması yerine geri sekeceği ifade ediliyor.
OpenAI, Sora 2'nin hala hatalar yapabildiğini kabul etse de, modeli yapay sinir ağlarını video verileriyle ölçeklendirmenin, şirketin gerçekliği simüle etme hedefine yaklaştığının bir kanıtı olarak görüyor. Şirket, Sora 2'yi "genel amaçlı dünya simülatörleri ve robotik ajanlar" yönündeki ilerlemenin bir parçası olarak konumlandırıyor ve bu teknolojilerin "toplumu temelden yeniden şekillendireceğine" inanıyor.
Sosyal Medyaya Farklı Bir Yaklaşım
Görsel ve işitsel yükseltmelere ek olarak OpenAI, yeni modeli ortalama kullanıcılar için daha erişilebilir hale getirmek adına büyük bir adım atıyor. Sora 2, yapay zeka tarafından üretilen içeriklerin oluşturulması ve paylaşılmasına odaklanan bir sosyal iOS uygulamasıyla paketlenmiş durumda.
Bu yeni iOS uygulaması, davetiye tabanlı bir dağıtımla ABD ve Kanada'da kullanıma sunuldu. Uygulama üzerinden kullanıcılar, erişim müsait olduğunda bildirim almak için kaydolabiliyor. Hizmet başlangıçta ücretsiz olacak ve "cömert sınırlar" sunacak. Ancak, talep mevcut hesaplama kaynaklarını aştığında ek üretimler için ücretli seçenekler sunulması planlanıyor.
Kullanıcılar uygulama aracılığıyla video oluşturabilir, diğer kullanıcıların içeriklerini yeniden karıştırabilir ve üretilen videoların özelleştirilebilir bir akışını gezinebilirler. Daha önce bahsedilen Cameo özelliği sayesinde, kullanıcılar kendi video ve seslerini kaydederek, bu görüntüleri Sora tarafından oluşturulan herhangi bir sahneye entegre edebiliyorlar.
Web sitesi ve uygulamadaki temel Sora 2 modeline ek olarak, ChatGPT Plus aboneleri daha yüksek kaliteli deneysel bir model olan Sora 2 Pro'ya erişebilecek. OpenAI ayrıca Sora 2'yi geliştiriciler için API aracılığıyla da sunmayı planlıyor. Eski Sora 1 Turbo modeli kullanılmaya devam edecek ve mevcut içerikler kullanıcıların Sora kütüphanelerinde kalacak.
Yeni Zorluklar Kapıda
İnsanların kolayca yapay zeka tarafından üretilen videolara kendilerini ekleyebileceği bir uygulama ile neler yanlış gidebilir? Muhtemelen her şey. Kötüye kullanımla mücadele, şirket için zorlu bir konu olacak. Yakın geçmişte, rıza dışı yapay zeka derin sahtekarlık örnekleri, zorbalık davalarına, cezai yaptırımlara ve hatta intiharlara yol açmıştı.
OpenAI bu konuda önlemler alıyor. Son zamanlarda yaşanan hassasiyetler göz önüne alındığında, OpenAI, Sora 2'nin genç kullanıcılar için özel korumalar içerdiğini belirtiyor. Bu korumalar arasında varsayılan günlük üretim sınırları ve cameo özelliği için katı izinler bulunuyor. OpenAI, potansiyel zorbalık veya kötüye kullanım vakalarını incelemek için hem otomatik güvenlik sistemleri hem de insan moderatörleri konuşlandırdığını ifade ediyor.
Özellikle, OpenAI cameo özelliği için güvenlik katmanları oluşturmuş. Kullanıcıların kendi benzerlikleri üzerindeki kontrolü elinde tutabileceğini belirtiyor: Kimlerin kendi cameo'larını videolarda kullanabileceğine karar verebilirler ve istedikleri zaman erişimi iptal edebilir veya kendi benzerliklerini içeren videoları kaldırabilirler. Kullanıcılar ayrıca, başkaları tarafından oluşturulan taslaklar da dahil olmak üzere, kendi cameo'larını içeren tüm videoları görüntüleyebilirler.
Derin sahtekarlıkların ötesinde, yeni Sora uygulamasının aşması gereken başka bir engel daha var. Günümüzde sosyal medya, toplumsal etkileri nedeniyle genellikle olumlu görülmüyor. Belki de bu algıya tepki gösteren OpenAI, yeni uygulamayı, kullanıcıların doğal dil talimatlarıyla kontrol edebildikleri "yeni nesil öneri algoritmaları" ile tasarladığını iddia ediyor. Bu sayede, geleneksel etkileşim metriklerine dayanmak yerine, kullanıcıların zaman geçirmesini değil, yaratıcılığını en üst düzeye çıkarmayı hedefliyorlar.
OpenAI, "Akışta geçirilen süreyi optimize etmiyoruz ve uygulamayı tüketim değil, yaratımı en üst düzeye çıkaracak şekilde açıkça tasarladık" açıklamasında bulundu.