amerikali
Yeni Üye
Tıklayın, sürükleyin, bırakın, tamamlayın, görüntü düzenleme bu kadar kolay olabilir. Max Planck Bilgisayar Bilimleri Enstitüsü, Saarbrücken Görsel Hesaplama, Etkileşim ve Yapay Zeka Araştırma Merkezi (VIA), MIT CSAIL ve Pennsylvania Üniversitesi’nden araştırmacılar, yüz ifadeleri, pozlar, bakış açıları ile yapay zeka destekli bir görüntü işleme yöntemi sundular. ve fotoğraflardaki diğer özellikler, sürükle ve bırak kullanılarak esnek bir şekilde kontrol edilebilir. Photoshop ve diğer programlarda fotogerçekçi içeriğin düzenlenmesi daha önce büyük bir beceri gerektirirken, DragGAN ile bir fotoğraf üzerinde başlangıç ve bitiş noktalarını işaretlemek, örneğin gülümsemek, duruşu ayarlamak, kıyafetleri uzatmak veya bakış açısını değiştirmek için yeterlidir. dönüş. GAN, işaretlenen noktaları takip eder ve görüntü içeriği insanlar, hayvanlar, manzaralar veya araçlar gibi önceden eğitilmiş kategorilere karşılık geldiği sürece istenen değişikliklere karşılık gelen görüntüler üretir.
Maskeleme, GAN’ın manipüle edebileceği görüntü bölgelerini tanımlamak için DragGAN’da kullanılabilir. Örnekte bu, köpeğin yalnızca başını çevirmesini ve tüm görüntü perspektifinin ayarlanmadığını garanti eder.
(Resim: Bilişim için MPI)
Photoshop & Co.’nun geleceği?
Bilim adamları, bilgisayar için yayınlarında, “Bu manipülasyonlar, bir GAN’ın öğrenilmiş üretken görüntüleri üzerinde gerçekleştirildiğinden, belirsiz içerik halüsinasyonu ve nesnenin katılığını tutarlı bir şekilde takip eden deforme şekiller gibi zor senaryolarda bile gerçekçi sonuçlara yol açıyorlar” diye yazıyor. İlgili tarafların örneğin arXiv’den indirebilecekleri grafik fuarı SIGGRAPH23 Ağustos’ta. DragGAN’ın gerçekte ne kadar iyi çalıştığı henüz kendiniz denenemez, ancak Max Planck Bilgisayar Bilimleri Enstitüsü’nün DragGAN web sitesinden yalnızca örnek videoları izleyebilirsiniz:
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
DragGAN ile hayvanların pozları gerçekçi bir şekilde ayarlanabilmektedir.
(Kaynak: Bilişim için MPI)
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Giysinin uzunluğu da DragGAN ile fotogerçekçi olarak manipüle edilebilmelidir.
(Kaynak: Bilişim için MPI)
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Yüz ifadeleri, saç ve dönüş de ayarlanabilirken DragGAN, GAN’ın görüntünün yalnızca belirli kısımlarını dikkate alması için maskelemeyi destekler.
(Kaynak: Bilişim için MPI)
Daha önce basit olan GitHub proje sayfasında yapılan bir duyuruya göre, baş yazar Xingang Pan, Haziran ayında DragGAN için kaynak kodunu yayınlamayı planladığını duyurdu. Diğer birçok proje gibi, DragGAN da makine öğrenimi için optimize edilmiş Python kitaplığı PyTorch’u kullanır. Şu ana kadar donanım gereksinimleri hakkında hiçbir şey bilinmiyor. Yazarlar basitçe şunu yazıyor: “Yaklaşımımızın verimliliği sayesinde, kullanıcıların yalnızca birkaç saniye beklemesi gerekiyor ve tatmin olana kadar düzenlemeye devam edebiliyorlar.” DragGAN hala erken bir aşamadadır, bu nedenle sonuçların kalitesi, belirli bir tahmin etme yeteneğine rağmen, şu anda eğitim verilerinin çeşitliliğinden etkilenmektedir.
Kural olarak, DragGAN’ın amacı gerçekçi sonuçlar vermektir, ancak diğer içerikleri de halüsinasyona uğratabilir.
(Resim: Bilişim için MPI)
(vza)
Haberin Sonu
Maskeleme, GAN’ın manipüle edebileceği görüntü bölgelerini tanımlamak için DragGAN’da kullanılabilir. Örnekte bu, köpeğin yalnızca başını çevirmesini ve tüm görüntü perspektifinin ayarlanmadığını garanti eder.
(Resim: Bilişim için MPI)
Photoshop & Co.’nun geleceği?
Bilim adamları, bilgisayar için yayınlarında, “Bu manipülasyonlar, bir GAN’ın öğrenilmiş üretken görüntüleri üzerinde gerçekleştirildiğinden, belirsiz içerik halüsinasyonu ve nesnenin katılığını tutarlı bir şekilde takip eden deforme şekiller gibi zor senaryolarda bile gerçekçi sonuçlara yol açıyorlar” diye yazıyor. İlgili tarafların örneğin arXiv’den indirebilecekleri grafik fuarı SIGGRAPH23 Ağustos’ta. DragGAN’ın gerçekte ne kadar iyi çalıştığı henüz kendiniz denenemez, ancak Max Planck Bilgisayar Bilimleri Enstitüsü’nün DragGAN web sitesinden yalnızca örnek videoları izleyebilirsiniz:
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
DragGAN ile hayvanların pozları gerçekçi bir şekilde ayarlanabilmektedir.
(Kaynak: Bilişim için MPI)
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Giysinin uzunluğu da DragGAN ile fotogerçekçi olarak manipüle edilebilmelidir.
(Kaynak: Bilişim için MPI)
Önerilen Haber Amaçlı İçerik
İzninizle buraya harici bir video (Kaltura Inc.) yüklenecektir.
Her zaman video yükle
videoyu şimdi yükle
Yüz ifadeleri, saç ve dönüş de ayarlanabilirken DragGAN, GAN’ın görüntünün yalnızca belirli kısımlarını dikkate alması için maskelemeyi destekler.
(Kaynak: Bilişim için MPI)
Daha önce basit olan GitHub proje sayfasında yapılan bir duyuruya göre, baş yazar Xingang Pan, Haziran ayında DragGAN için kaynak kodunu yayınlamayı planladığını duyurdu. Diğer birçok proje gibi, DragGAN da makine öğrenimi için optimize edilmiş Python kitaplığı PyTorch’u kullanır. Şu ana kadar donanım gereksinimleri hakkında hiçbir şey bilinmiyor. Yazarlar basitçe şunu yazıyor: “Yaklaşımımızın verimliliği sayesinde, kullanıcıların yalnızca birkaç saniye beklemesi gerekiyor ve tatmin olana kadar düzenlemeye devam edebiliyorlar.” DragGAN hala erken bir aşamadadır, bu nedenle sonuçların kalitesi, belirli bir tahmin etme yeteneğine rağmen, şu anda eğitim verilerinin çeşitliliğinden etkilenmektedir.
Kural olarak, DragGAN’ın amacı gerçekçi sonuçlar vermektir, ancak diğer içerikleri de halüsinasyona uğratabilir.
(Resim: Bilişim için MPI)
(vza)
Haberin Sonu