Müziğin, insanlığın evrensel dili olup olmadığı tartışılırken, bu dilin artık makineler tarafından da konuşulmaya başlanması yeni bir dönemin habercisi. Google, en yeni yapay zeka müzik modeli Lyria 3'ü, Gemini uygulamasına entegre ederek yapay zeka ile müzik üretiminin erişilebilirliğini önemli ölçüde genişlettiğini duyurdu.
Google DeepMind, uzun süredir üzerinde çalıştığı Lyria modelini daha önce Vertex AI gibi geliştirici odaklı ürünlerde sınırlı olarak sunuyordu. Lyria 3, önceki sürümlerine kıyasla daha yetenekli olmasının yanı sıra kullanım kolaylığıyla da öne çıkıyor. Gemini uygulaması veya web arayüzündeki yeni "Müzik Oluştur" seçeneği ile kullanıcılar, istedikleri müziği birkaç saniye içinde hayata geçirebiliyorlar. Hatta istenen atmosferi yakalamak için bir görsel bile yüklenebiliyor.
Lyria'nın önceki versiyonlarından farklı olarak, bu yeni modelde şarkı sözlerini kullanıcı tarafından belirtme zorunluluğu bulunmuyor. Kullanıcılar daha genel komutlar verebiliyor ve model, yaklaşık 30 saniyelik şarkılar için uygun sözleri otomatik olarak üretiyor. Bu kısa süreli parçalar, daha çok "jingle"ları andırıyor.
Müzik oluşturma süreci, Nano Banana modeli tarafından üretilen albüm kapağı tarzı bir görsel ile de zenginleştiriliyor. Gemini'de ayrıca önceden yüklenmiş bir dizi yapay zeka şarkısı bulunuyor ve kullanıcılar bu şarkıları diledikleri gibi yeniden düzenleyebiliyor. Lyria 3 araçları, YouTube Shorts için sunulan Google'ın Dream Track aracına da entegre ediliyor ve bu da yapay zeka video seçenekleriyle uyumlu bir deneyim sunuyor.
Gemini'nin oluşturduğu şarkı örnekleri arasında şunlar bulunuyor:
"Plantain Kadar Tatlı“
Komut: Nostaljik hissediyorum. Çocuklukta yaşadığımız harika zamanları ve annemin yaptığı muzlu yemeklerin anılarını anlatan bir parça yarat. Gerçek bir Afrika havasıyla eğlenceli bir afrobeat parçası olsun.
„Motown Parodisi“
Komut: Temsili 1970'ler Motown ruhu. Zengin, orkestral R&B prodüksiyonu. Melodik dolgularla sıcak bas hattı, ritmik bir davul groove'una kilitlenmiş, canlı trampet ve tef. Vintage org armonik alt yapısı. Üçlü pirinç bölümü. Karakterli, gospel etkili erkek tenor solisti.
„Pop Titreşimi“
Komut: Hüzünlü ve havadar. Yumuşak, nefesli kadın vokalleriyle samimi bir his. Hızlı davul ve bas ritmi, alçak geçişli ve yumuşatılmış. Derin, sıcak bas dalgalanmaları. Rüya gibi elektrikli piyano akorları ve ince çan dokuları. Yağmurlu şehir atmosferi.
„Deniz Şantisi“
Komut: Güçlü bir erkek korosunun geleneksel çağrı-yanıt formatında söylediği, otantik a capella bir deniz şantisi. Parça tamamen vokal üzerine kurulu, ritmik nabzı sağlamak için senkronize edilmiş ahşap güverteye vurulan ayak seslerine ve keskin el çırpmalarına dayanıyor. Lider, anlatı "chant" satırlarını söyleyen pürüzlü bir tona sahip yaşlı bir bariton erkek. Ona hemen, "yanıt" satırlarını söyleyen zengin, sert armonilerle güçlü bir erkek korosu eşlik ediyor. Vokaller, ahşap bir geminin güvertesinin akustik ortamını simüle eden doğal bir oda yankısıyla kaydedilmiş, vokallere rezonanslı, atmosferik bir kalite kazandırıyor. Performans enerjik ve sürükleyici, koro, odaklanmış, toplu bir çaba hissi yaratmak için ritimlere dayanıyor. Hiçbir enstrüman yok, yalnızca tenor, bariton ve bas aralığında yer alan kolektif erkek seslerinin katmanlı dokuları, hepsi kendinden emin, monolitik bir sese katkıda bulunuyor.
Ekşi Notlar
Yapay zeka tarafından üretilen müzik yeni bir olgu değil. Birçok şirket, insan tarafından yaratılmış müzikleri işleyip homojenleştiren modeller sunuyor ve ortaya çıkan parçalar oldukça "gerçek" duyulabiliyor, ancak biraz aşırı üretilmiş hissi verebiliyor. Müzik platformları şimdiden sahte yapay zeka sanatçılarıyla dolup taşmış durumda ve bazılarının, dinledikleri müziğin bir karıştırıcıdan çıktığı kadar saf olabileceğinin farkında olmayan binlerce dinleyicisi var.
Ancak bu tür araçları bulmak gerekiyor. Google ise benzer yetenekleri Gemini uygulamasına getiriyor. En popüler yapay zeka platformlarından biri olarak, muhtemelen internette daha fazla yapay zeka müziği görmeye başlayacağız. Google, Lyria 3 ile oluşturulan parçaların içinde, Google'ın SynthID teknolojisinin bir ses versiyonunun yerleştirilmiş olacağını belirtiyor. Bu, bir ses parçasının Google'ın yapay zekası tarafından mı yoksa başka bir yöntemle mi oluşturulduğunu, görseller ve videolar için SynthID etiketlerini kontrol etmeye benzer şekilde Gemini'ye yükleyerek her zaman kontrol edebileceğiniz anlamına geliyor.
Google ayrıca, telif hakkına ve iş ortağı anlaşmalarına saygı duyan bir müzik yapay zekası yaratmaya çalıştığını da belirtiyor. Eğer komutunuzda belirli bir sanatçıdan bahsederseniz, Gemini o sanatçının tarzını kopyalamaya çalışmayacak. Bunun yerine, bunu "geniş yaratıcı ilham" olarak alacak şekilde eğitilmiş. Ancak bu sürecin kusursuz olmadığını ve orijinal ifadenin bazı durumlarda bir sanatçıyı fazla taklit edebileceğini de ekliyor. Bu gibi durumlarda Google, kullanıcıları bu tür paylaşılan içerikleri bildirmeye davet ediyor.
Lyria 3, bugün Gemini web arayüzünde kullanıma sunuluyor ve birkaç gün içinde mobil uygulamada da erişilebilir olması bekleniyor. İngilizce, Almanca, İspanyolca, Fransızca, Hintçe, Japonca, Korece ve Portekizce dillerinde çalışıyor, ancak Google yakında daha fazla dil eklemeyi planlıyor. Tüm kullanıcılar müzik üretimi için bir miktar erişime sahip olurken, AI Pro ve AI Ultra aboneliği olanlar daha yüksek kullanım limitlerine sahip olacak, ancak detaylar henüz net değil.