2023, müzik yapay zeka yılı: metinden sese ve mükemmel şarkı için metin arama

amerikali

Yeni Üye


  1. 2023, müzik yapay zeka yılı: metinden sese ve mükemmel şarkı için metin arama

Bir Mannheim DeepTech girişimi olan Cyanite, serbest metin aramalarına dayalı olarak kitaplıklarda ve kataloglarda müzik bulan bir arama motoru geliştirdi. Stable Diffusion, Midjourney veya DALL E gibi AI sanat programlarından bilindiği gibi, sorgu doğal dilde çalışır. Teknoloji bir öneri motorunun ötesine geçer, arama motoru ayrıca daha uzun metin girişleri için uygun müzik parçaları önermelidir. Akla gelebilecek senaryolar çeşitlidir:


Kısa sahneleri tanımlayabilir, müzik özetleri yükleyebilir veya bir müzik parçası için fikir yazabilirsiniz. Cyanite, API erişimi aracılığıyla uygun başlıkların bir listesini oluşturur. İstekler farklı şekillerde yapılandırılabilir, giriş dili İngilizce’dir: “Ormanda güneşli bir gün”, bir film klibi için müzik bulmaya yönelik daha karmaşık bir manzara açıklaması kadar mümkündür: “Kuzey Amerika’da yoğun bir şehir, kalabalık karanlık bir ruh halindeki insanlarla, vahşi ve çürümeyle çevrili, kıyamet öncesi bir ortamda ve deniz yakında onu sahiplenecek”.


Ücretsiz metin arama ile müzik veritabanlarında arama yapın


Bu test istemi ile editörler, bazıları açıklanan ruh haline çok iyi uyan anlık Spotify önerileri aldı. Liste, dosya adına ek olarak ritim, anahtar ve tür ile (şarkı söyleme durumunda) ses profili hakkında bilgi sağlar. Metin isteminin melankolik havasına uygun olarak, önerilerin çoğu küçük anahtardadır. Public Memory, “Afterlife” ve Juju & Jordash, “Quasi” kulağa özellikle uygun geliyordu – gruplardan şarkılar ve yazara yabancı bir tür (elektro dans). Muhtemelen onları kendi başına bulamazdı.




API'nin Arkasında: Cyanite'in yapay zeka destekli müzik araması, Serbest Metin Araması



Cyanite’nin müzik arama motoru, daha uzun bir doğal metin şablonuyla eşleşen başlıkları listeler (bir test çalışmasının ekran görüntüsü).



Müzik endüstrisi: “O mükemmel şarkıyı bulun”


Schwarzer, “Mükemmel bir şarkıyı bulun” son yıllarda ayrı bir iş alanı (B2B) haline geldi. Tipik kullanımları sorulduğunda, oyun geliştirme, stok müzik (stok görüntülerin eşdeğeri), film ve televizyon, reklamcılık ve markalaşmadan alıntı yaptı. Kendisi bu dünyanın müziğini “anlayan ve tavsiye eden” bir “müzik zekası”ndan bahsediyor. Daha basit bir ifadeyle, Cyanite’nin arama motoru, Spotify gibi büyük kataloglardan veya kendi müzik arşivlerinizden ve veritabanlarınızdan parçalar bulmaya yarayan bir programdır. Cyanite bu havuzdan metin girişi için uygun başlık listeleri oluşturur.


Bu size Pandora’yı hatırlatmıyor mu? Sadece ilk bakışta: Öneri algoritmalarında paralellikler var, diye sorulduğunda Cyanite CEO’su Markus Schwarzer açıkladı. Öte yandan ABD müzik önerileri platformu, son müşterilere (B2C) odaklanan bir akış ve öneri hizmeti, kendi müzik akışı veri tabanıdır ve lisanslama nedenleriyle Pandora şu anda Avrupa’da mevcut değildir. Cyanite bir akış kataloğu sunmaz, ancak teknolojinin amacı, arama motoru kullanıcılarının kendi büyük kitaplıklarında ve kataloglarında hızlı bir şekilde arama yapmalarını sağlamaktır. Bir videoya ya da sinema fragmanına eşlik edecek belli bir ruh haline, duruma uygun müzik isimleri bulmak müzikal uzmanlığa değil, senaryoyu kurgulamaya bağlı olmalıdır. Arayüz doğal dildir.






(Resim: ymgerman/shutterstock.com)


Cyanite.AI, 2018 yılında Joshua Weikert (CTO), Jakob Höflich (CMO) ve Markus Schwarzer (CEO) tarafından Mannheim’da kuruldu. Teknoloji başlangıcı, AI destekli kategorizasyon ve metin girişi yoluyla müzik arama için yazılım sunar. Mannheim merkezli şirket kendi müzik kataloğunu sağlamaz, ancak kendileri büyük müzik kitaplıklarına sahip olan ve bunları profesyonel veya özel nedenlerle daha iyi kullanmak isteyen şirketler ve kişiler için bir araç sunar.

Ses teknolojisi ve müzik endüstrisinde uzmanlık


Weikert, Müzik ve Yaratıcı Endüstrilerde Master of Arts derecesine sahip bir yazılım geliştiricisidir, daha önce açık inovasyon projelerinde teknik müzik yapımcısıydı. Kibar, çok sayıda müziği elle etiketlemek zorunda kalan bir radyo editörü ve gazetecidir. Schwarzer işletmeden (iş idaresi) geliyor ve ayrıca Müzik ve Yaratıcı Endüstriler okudu, daha önce Lenny Kravitz, Kings of Leon ve Daft Punk gibi müzisyenler için müzik PR kampanyaları oluşturdu ve Springer-Verlag ile müzik endüstrisindeki iş modelleri üzerine bir uzmanlık kitabı yayınladı. .

Üç kurucu, Pop Academy Mannheim’da (“müzik endüstrisinin WHU’su”) okuduklarından birbirlerini tanıyorlar. Roman Gebhardt, bir AI ve veri uzmanı (AI Chief Officer) olarak gemide. Gebhardt, TU Berlin’de ses ve iletişim teknolojisi alanında yüksek lisans derecesine sahip bir elektrik mühendisidir ve burada bu alanda doktora yapmaya başlamış ve müzik teknolojisi üzerine araştırmalar yapmıştır.







Etiketler, lisanslar, yayıncılar: büyük müzik kataloglarını açın


Teknik olarak, arama motoru bir transformatör modeline dayanmaktadır ve AI görüntü oluşturucuları veya ChatGPT gibi araçlar için de benzer bir mimari kullanılmaktadır. Cyanite, müzik incelemeleri gibi karmaşık müzik açıklamalarıyla kullanılan Transformer modellerini eğitti ve AI sistemine her tür metin için uygun müzik önermeyi öğretti. Yeni olan, yazılımın sabit sınıflar yerine serbest metni işleyebilmesi ve metin içindeki anlamsal ilişkileri anlayıp müziğe atayabilmesidir. Arka uçta üç arama modu arasından seçim yapabilirsiniz: serbest metin girişi, benzerlik araması veya anahtar sözcükler için arama.

Mannheim merkezli şirkete göre, akıllarında daha az özel kişi var, ancak öncelikli olarak müzik ve eğlence sektörüne (B2B) hitap ediyorlar ve bu sektörü müşterilerine müzik önerileri ve projeler için çalma listeleri sunmak için kullanabiliyorlar: Büyük müzik şirketleri daha fazla AI destekli arama ile açılabilen büyük ve kapsamlı bir Arşiv repertuarına sahip olması muhtemeldir. Sorulduğunda, Markus Schwarzer birkaç referans müşterinin adını verdi: BMG, Schubert Music, Hollanda’dan Brilliant Classics, Kanada’dan Nettwerk Music Group gibi müzik yayıncıları ve plak şirketleri, ABD ve Büyük Britanya’daki müzik pazaryerleri ve bazı müzik markalama sağlayıcıları. bazıları Free Text Integrate aramasını doğrudan portföyünüze kullanır.

Siyanit: üç arama algoritmasının test edilmesi


ABD’de yaşamadığımız için editörler şu anda Cyanite’in daha iyi Pandora olup olmadığını söyleyemez – en azından mevcut. Cyanite şu anda ağırlıklı olarak Anglo-Amerikan ülkelerinde temsil edilse de, hizmet ülkeye özgü kısıtlamalara tabi değildir. Müziğe yakınlığı olan kullanıcılar böylece kendi kitaplıklarını açıyor ve müzik yayıncıları zaten kendi, halka açık olmayan arşivlerinde bahçecilik yapıyor. İsterseniz, sağlayıcının Cyanite web sitesindeki web uygulamasında bir Spotify veritabanıyla Serbest Metin Aramasını deneyebilirsiniz – bunun için kayıt olmanız gerekir (çift katılım olmadığı için, kişisel verilerinizi sağlamanız gerekmez) test ettiğimiz gibi ortaya çıkarın). İlgili taraflar, müziklerini burada kapsamlı bir şekilde etiketleyebilir, meta veriler sağlayabilir, yapay zeka tabanlı bir tam metin açıklaması oluşturabilir ve üç arama algoritması arasından seçim yapabilir. Sağlayıcıya göre, ayda beş analiz ücretsizdir.

ayrıca oku

Daha fazla göster



daha az göster



Tahmin 2023: Hızlı şeritte müzik ve ses yapay zekası


Müzik yapay zekasının gelişimi de bu yıl son derece dinamik: Metin ve görüntü senteziyle geçen bir yılı, sesli yapay zeka projelerinde bir atılım takip ediyor. Text-to-Tunes ve Text-to-Audio yükselişte, metin hazır ayarlarıyla yaratıcı içerik oluşturmak sanattan veya metin makinelerinden (ChatGPT, Claude, Lumi, …) zaten tanıdık. Google’ın AudioLM ve MusicLM (şarkılar için bir tür “DALL E”) ve Çinli TikTok sağlayıcısı ByteDance’ten Make-an-Audio gibi yeniliklerden sonra, teknik geliştirme görünüşe göre o kadar gelişmiş ki, yapay zeka sistemleri artık ses oluşturmak için metin özelliklerini kullanabiliyor. ses materyali, ancak giderek daha fazla müzik yaratabiliyor veya insan seslerini taklit edebiliyor (metinden konuşmaya, örneğin VALL·E ile).

Şarkı sesleri oluşturmak için bir AI yöntemi olan SingGAN, 2021’de Çin’de çoktan ortaya çıkmıştı. Artık ses senteziyle çalışan ilk radyo istasyonları ve podcast’ler var (Haberler’den bir meslektaş, “Kurz Infos” için sesini klonladı). İlk demolardan bazıları yoğun olarak kullanılır ve sistemler daha da rafine edilir. Bu arada, çıktı genellikle biraz rastgele görünür ve pek kontrol edilemez. Tüm bu yenilikler, müzik endüstrisinin lisansa dayalı ana işiyle rekabet edebilir, ancak aynı zamanda tüm müzik sahnesinde bir karışıklığa da yol açabilir.

Ses AI Zaman Çizelgesi


İsviçreli geliştirici Flavio Schneider, yeni çıkanları belgelemek için GitHub’da (Audio AI Timeline) AI müzik projeleri için bir zaman çizelgesi içeren bir depo oluşturdu. Schneider ayrıca müzik yapay zeka araştırmasında da aktiftir ve Ocak 2023’ün sonlarında yayınlanmıştır. Metin şablonlarından müzik üretmek için bir model olan Moûsai zengin içerikle (AI görüntü oluşturucu Stable Difüzyon gibi, gizli difüzyona dayanır). Müzik ve yapay zeka ile ilgilenen herkes, Sesli Yapay Zeka Zaman Çizelgesi’nde güncel bilgileri takip edebilir ve bakımcıyı kendi projeleri hakkında bilgilendirebilir.


(o)



Haberin Sonu