amerikali
Yeni Üye
DeepMind, oyun dünyaları yaratmaya yönelik yapay zekasının yeni nesli olan “Genie 2″yi tanıttı. “Temel Dünya Modeli” olarak adlandırılan bu model, tek bir görüntüden çeşitli karmaşık, üç boyutlu ortamlar oluşturabilmeli ve burada yapay zeka ajanları daha sonra etkileşimli olarak eğitilip test edilebilmelidir.
Reklamcılık
Genie 2'nin yarattığı 3 boyutlu dünyalar hem insanlar hem de yapay zeka ajanları tarafından klavye ve fare kullanılarak gezilebilir. Sistem, proje sayfasında sunulan demo videolarda çeşitli gelişmiş yetenekler gösteriyor: Yer çekimi, duman ve su yansımaları gibi fiziksel etkileri modelliyor, ortamın tutarlılığını koruyor ve hatta bilgisayar kontrollü karakterlerin (NPC'ler) davranışlarını simüle edebiliyor.
Önerilen editoryal içerik
İzniniz halinde buraya harici bir video (Kaltura A.Ş.) yüklenecektir.
Videoları her zaman yükle
Videoyu şimdi yükle
Proje sayfasındaki çok sayıda kısa örnekten biri: “Genie 2”, tek bir görüntüden etkileşimli bir 3 boyutlu ortam oluşturur.
(Kaynak: Deepmind)
Jack Parker-Holder'ın araştırma ekibi, Genie 2'nin teknik olarak ekibin büyük bir video veri seti ile eğittiği otoregresif, gizli bir difüzyon modeli olduğunu açıklıyor. Sistem, oluşturulan dünyaları bir dakikaya kadar tutarlı bir şekilde koruyabilir; web sitesindeki örneklerin çoğu 10 ila 20 saniye sürer.
“Genie 2”, büyük bir transformatör modelindeki bir otomatik kodlayıcı aracılığıyla işlenen hareketsiz bir görüntüden video görüntüleri oluşturur. “Sınıflandırıcısız rehberlik” adı verilen bir yöntem, oluşturulan eylemler üzerindeki kontrolün geliştirilmesine yardımcı olur. Geliştiricilere göre gösterilen örnekler, olasılıkları göstermek için sıkıştırılmamış bir modelden geliyor. Sıkıştırılmış bir sürüm gerçek zamanlı olarak kullanılabilir ancak daha düşük kalitede kullanılabilir.
(Resim: Deepmind)
2B'den karmaşık 3B dünyalara
Önceki modelle karşılaştırıldığında kaydedilen ilerleme oldukça önemli. Mart ayında tanıtılan “Genie”, Super Mario Bros tarzındaki 2D platform oyunlarıyla sınırlıydı. O zamanki model, yalnızca video materyaliyle (yüzlerce oyundan 30.000 saat) ve önceden işaretlenmiş giriş eylemleri olmadan eğitiliyordu. Ancak sistem saniyede yalnızca bir kareyle hâlâ çok yavaş çalışıyordu.
Deepmind'a göre Genie 2'nin optimize edilmemiş bir sürümü zaten düşük kalitede gerçek zamanlı olarak çalışıyor. Bu, Google'ın “Doom” nişancı oyununu motor olmadan yeniden yaratmayı başaran Google'ın GameNGen'i gibi önceki deneyleri hatırlatıyor – ancak bu sistem belirli bir oyunla sınırlıydı.
Yapay zeka eğitim aracı
Genie 2'nin ana hedeflerinden biri yapay zeka ajanlarını eğitmektir. Deepmind, diğer şeylerin yanı sıra, oluşturulan ortamlarda talimatları yürütebilen SIMA aracısı (Ölçeklenebilir Eğitilebilir Çoklu Dünya Aracısı) ile bunu göstermektedir.
Araştırma ekibi, Genie 2'yi, yapay genel zekaya (AGI) yönelik ilerlemeler için gerekli genişlik ve genelliğe ulaşırken akıllı sanal aracıların (bedenli aracıların) eğitimindeki yapısal bir sorunu çözmek için kullanmayı umuyor.
Ancak o zamana kadar Deepmind'in hala birkaç engeli aşması gerekiyor: Çıktının kalitesi önemli ölçüde dalgalanabilir ve daha uzun etkileşimler için sanal ortamların tutarlılığının daha da iyileştirilmesi gerekir.
(vza)
Reklamcılık
Genie 2'nin yarattığı 3 boyutlu dünyalar hem insanlar hem de yapay zeka ajanları tarafından klavye ve fare kullanılarak gezilebilir. Sistem, proje sayfasında sunulan demo videolarda çeşitli gelişmiş yetenekler gösteriyor: Yer çekimi, duman ve su yansımaları gibi fiziksel etkileri modelliyor, ortamın tutarlılığını koruyor ve hatta bilgisayar kontrollü karakterlerin (NPC'ler) davranışlarını simüle edebiliyor.
Önerilen editoryal içerik
İzniniz halinde buraya harici bir video (Kaltura A.Ş.) yüklenecektir.
Videoları her zaman yükle
Videoyu şimdi yükle
Proje sayfasındaki çok sayıda kısa örnekten biri: “Genie 2”, tek bir görüntüden etkileşimli bir 3 boyutlu ortam oluşturur.
(Kaynak: Deepmind)
Jack Parker-Holder'ın araştırma ekibi, Genie 2'nin teknik olarak ekibin büyük bir video veri seti ile eğittiği otoregresif, gizli bir difüzyon modeli olduğunu açıklıyor. Sistem, oluşturulan dünyaları bir dakikaya kadar tutarlı bir şekilde koruyabilir; web sitesindeki örneklerin çoğu 10 ila 20 saniye sürer.
“Genie 2”, büyük bir transformatör modelindeki bir otomatik kodlayıcı aracılığıyla işlenen hareketsiz bir görüntüden video görüntüleri oluşturur. “Sınıflandırıcısız rehberlik” adı verilen bir yöntem, oluşturulan eylemler üzerindeki kontrolün geliştirilmesine yardımcı olur. Geliştiricilere göre gösterilen örnekler, olasılıkları göstermek için sıkıştırılmamış bir modelden geliyor. Sıkıştırılmış bir sürüm gerçek zamanlı olarak kullanılabilir ancak daha düşük kalitede kullanılabilir.
(Resim: Deepmind)
2B'den karmaşık 3B dünyalara
Önceki modelle karşılaştırıldığında kaydedilen ilerleme oldukça önemli. Mart ayında tanıtılan “Genie”, Super Mario Bros tarzındaki 2D platform oyunlarıyla sınırlıydı. O zamanki model, yalnızca video materyaliyle (yüzlerce oyundan 30.000 saat) ve önceden işaretlenmiş giriş eylemleri olmadan eğitiliyordu. Ancak sistem saniyede yalnızca bir kareyle hâlâ çok yavaş çalışıyordu.
Deepmind'a göre Genie 2'nin optimize edilmemiş bir sürümü zaten düşük kalitede gerçek zamanlı olarak çalışıyor. Bu, Google'ın “Doom” nişancı oyununu motor olmadan yeniden yaratmayı başaran Google'ın GameNGen'i gibi önceki deneyleri hatırlatıyor – ancak bu sistem belirli bir oyunla sınırlıydı.
Yapay zeka eğitim aracı
Genie 2'nin ana hedeflerinden biri yapay zeka ajanlarını eğitmektir. Deepmind, diğer şeylerin yanı sıra, oluşturulan ortamlarda talimatları yürütebilen SIMA aracısı (Ölçeklenebilir Eğitilebilir Çoklu Dünya Aracısı) ile bunu göstermektedir.
Araştırma ekibi, Genie 2'yi, yapay genel zekaya (AGI) yönelik ilerlemeler için gerekli genişlik ve genelliğe ulaşırken akıllı sanal aracıların (bedenli aracıların) eğitimindeki yapısal bir sorunu çözmek için kullanmayı umuyor.
Ancak o zamana kadar Deepmind'in hala birkaç engeli aşması gerekiyor: Çıktının kalitesi önemli ölçüde dalgalanabilir ve daha uzun etkileşimler için sanal ortamların tutarlılığının daha da iyileştirilmesi gerekir.
(vza)