amerikali
Yeni Üye
Yapay zeka araçlarını iki tıklamayla yükleyin | Pinokio’yu denedim
En yeni AI araçlarını yüklemek çoğu zaman tamamen önemsiz değildir. “AI tarayıcısı” Pinokio, işleri hızlı bir şekilde denemeyi çok daha kolay hale getiriyor. c 3003 bunu denemedi.
Reklamcılık
Videonun transkripti
(Not: Bu transkript yukarıdaki videoyu izleyemeyen veya izlemek istemeyen kişiler için hazırlanmıştır. Metin, görsel parçadaki bilgilerin tamamını yansıtmamaktadır.)
Buraya bir göz atın; bunlar, hepsini yerel olarak yükleyebileceğiniz en yeni AI araçlarından bazılarıdır. AudioCraft ile örneğin alışılmadık sesler üretebilirsiniz; burada Kurabiye Canavarı TV izlerken kurabiye yer. Veya Modelscope ile fotoğraflardan videolar oluşturun. Veya Facefusion ile videolardaki yüzleri değiştirin. Ya da burada RVC ile Freddy Mercury’nin Adele şarkıları söylemesini sağlayabilirsiniz — gerçekten eğlenceli şeyler, itiraf etmeliyim ki araştırma yaparken her şeyle saatlerce uğraştım. Üstelik eğlence de bitmiyor çünkü her gün yeni araçlar çıkıyor.
Ancak bu kadar ileri teknolojiye sahip yapay zeka araçlarını denediyseniz, bunun neredeyse her zaman komut satırına yazmak ve Python’un farklı sürümleriyle uğraşmak anlamına geldiğini ve bir şeylerin eksik olması veya bazı bağımlılıklar nedeniyle sürekli olarak şifreli hata mesajları aldığınızı bilirsiniz. karşılanmıyor veya başka bir şey kabul edilemez.
Evet, işte geliyor: Başlangıçta bahsettiğim tüm araçları yüklerken komut satırına hiçbir şey girmedim bile. Her şey en fazla iki fare tıklamasıyla kurulur. Linux’ta, Windows’ta veya macOS’ta olması önemli değil. Bu, yapay zeka tarayıcısı olarak adlandırılan Pinokio tarafından mümkün kılınıyor. Gerçekten iyi bir şey. Bizi izlemeye devam edin.
Sevgili bilgisayar korsanları, sevgili internet sörfçüleri, buraya hoş geldiniz…
Bu bir gerçek: Mevcut açık kaynaklı yapay zeka araçlarının neredeyse tamamı Python veya diğer komut dosyaları biçiminde mevcuttur ve bunlar genellikle çevrimiçi kod hizmeti GitHub’da yetersiz şekilde belgelenmiştir. Herhangi bir Python deneyiminiz yoksa, hızla bunaltıcı hale gelebilir – ancak Python becerileriniz olsa bile, kendinizi sıklıkla duvarlarla karşı karşıya bulursunuz çünkü xy aracı çok özel bir PyTorch veya başka bir sürüm gerektirir.
Ve şimdi buna karşı bir bitki büyüdü: Garip bir şekilde kendisine “Yapay Zeka Tarayıcısı” adını veren Pinokio. Ancak söz konusu olan bir tarayıcı değil, yapay zeka araçlarını otomatik olarak yükleyen bir araçtır; ve birbirinden düzgün bir şekilde ayrılmış olduğundan, bir aracın herhangi bir bileşenini güncellerseniz, başka bir aracın artık çalışmaması sorununu yaşamazsınız. Kısa ekleme: Elbette, sorunu manuel olarak çözebileceğiniz sanal Python ortamlarını da duydum – ancak anahtar kelime manueldir, Pinokio her şeyi otomatik olarak yapar.
İşe geçmeden önce, önemli bir sorumluluk reddi beyanı: Pinokio, Cocktail Peanut adlı bir kişi tarafından geliştirilen, aynı zamanda büyük dil modellerini yerel olarak çalıştırabileceğiniz ilk araçlardan biri olan Dalai’yi de yapan kişi tarafından geliştirilen tek kişilik bir projedir. Bununla ilgili zaten bir video yapmıştık; Bu arada, artık bu tür şeyler için Dalai’den çok daha iyi araçlar var, örneğin GPT4All.
Ama evet, Kokteyl Fıstığı anonimdir, Fıstık’a şunu yazdım: Tamamen sorun değil, eğer anonim kalmak istiyorsanız bunun için iyi nedenler var.
Ancak: Elbette bu, güvenilirliği değerlendirmeyi biraz zorlaştırıyor. Sizin için açık olmalı: Pinokio kodu bilgisayarınızda çalıştırır, Pinokio kodu bağımsız olarak yükler – ve evet, elbette kötü şeyler olabilir. Ancak: Pinokio açık kaynaktır ve AI araçlarının kurulum komut dosyaları da öyle, böylece GitHub’da olup bitenlere nispeten yakından bakabilirsiniz. Yine de: En azından seni uyardım.
Pinokio’nun kurulumu
Peki bu nasıl kurulur? Evet, çok kolay. Pinokio.computer’a gidin, ardından İndir’e tıklayın, ardından işletim sisteminizi seçin ve indirin. Evet, Windows altında bir kez paketinden çıkarın ve ardından pinokio-setup-exe dosyasını çalıştırın. Windows SmartScreen daha sonra bir kez şikayette bulunur, böylece cesurca “Daha fazla bilgi” ve ardından “Yine de çalıştır” seçeneğine tıklayabilirsiniz. Evet ve sonra kurulacak.
MacOS’unuz varsa M1/M2 veya Intel Mac’ler için İndirme bölümüne tıklayın. Daha sonra DMG’ye çift tıklayın, her zamanki gibi Uygulamalar’a sürükleyin, ancak daha sonra buraya tekrar sağ tıklayıp “Yama komutu”na tıklayıp “Aç”a tıklamanız gerekir. Sistem şifresini bir kez girin, tamam, tüm pencereleri kapatabilirsiniz.
LInux’unuz varsa Github’a yönlendirileceksiniz. Burada doğru Pinokio çeşidini seçmelisiniz. Örneğin “AppImage” sonuyla bu, Debian tatları için deb sonuyla birlikte Ubuntu varyantları (örneğin Mint) için tasarlanmıştır. O zaman üzerine çift tıklamanız yeterli. Zack, bitti.
Evet ve bundan sonra Pinokio tüm işletim sistemlerinde aynı şekilde çalışacak. İlk kez başlattığınızda, “Kurulum”a bir kez tıklamanız gerekir, ardından Pinokio temel şeyleri yükler. Bu birkaç dakika sürebilir, bu yüzden şaşırmayın. Evet, sonra oynamaya başlayabilirsiniz. Bu arada, sol üstteki yapboz parçasına benzeyen simgeye tıklarsan istediğin zaman geri dönebilirsin. Evet, bunlar yukarıdaki “öne çıkan” kurulum komut dosyalarıdır, aşağıda kronolojik olarak sıralanmıştır.
Bu arada bir kez daha açıklamak gerekirse: Pinokio’nun arkasındaki kişinin araçlarla hiçbir ilgisi yoktur, Cocktail Peanut yalnızca Pinokio’yu ve AI araçları için Pinokio kurulum komut dosyalarını oluşturur.
Bir bakışta en önemli yapay zeka araçları
Size en ilginç olduğunu düşündüğüm şeyleri kısaca tanıtabilirim:
Bu, Otomatik1111 olarak da bilinen Kararlı Difüzyon WebUI’sidir. Stable Diffusion, şüphesiz şu anda mevcut olan en iyi açık kaynaklı metin-görüntü oluşturucudur. Midjourney’den biraz daha kötü olduğunu söyleyebilirim – ancak Midjourney açık kaynak değil ve yerel olarak çalışmıyor. StableDiffusion kesinlikle Midjourney’den ÇOK daha esnektir, onunla gerçekten çılgın şeyler yapabilirsiniz, Controlnet’i daha önce bir videoda sunmuştum. Otomatik1111, Stable Diffusion’ın eski tarz kullanıcı arayüzüdür, ancak hiç de hoş değildir. Ve kullanımı da kolay değil. İşte bu yüzden Pinokio aracılığıyla diğer kullanıcı arayüzlerini de kurabilirsiniz, örneğin diğer uç nokta: Üç o’lu Fooocus, süper temiz ve zahmetli değil. Görmek istediğiniz şeyi yazmanız yeterli: Zack.
Ya da Node’a benzeyen ve şu sıralar oldukça popüler olan Pinokio üzerinden ComfyUI’yi de kurabilirsiniz.
Ve yepyeni: Gerçekten güzel optik yanılsamalar yaratabileceğiniz İllüzyon Difüzyonu – bu aynı zamanda diğer kullanıcı arayüzleri ve Controlnet ile de çalışır, ancak bu şekilde çok daha kolaydır. Burada c’t logosunu buraya yerleştirdim. Bunu görüyor musun? Gözlerinizi kısın veya biraz geriye çekilin. Güzel, değil mi? Bu arada, şık QR kodları yapmak istiyorsanız: Siz de yapabilirsiniz, sadece bir QR kod resmi yükleyin ve ardından görmek istediklerinizi, örneğin sevimli robotları buraya yazın. Burada illüzyon gücü kontrolü 2,0’ın altına ayarlanmamalıdır, bu durumda QR kodu artık testlerimizde çalışmaz. Ancak 2.0’dan itibaren sorunsuz çalışıyor.
Ve tabii ki sadece durağan görüntü değil, aynı zamanda video da var:
Facefusion ile bir video çekebilir ve içindeki yüzleri değiştirebilirsiniz. Bunun için yalnızca tek bir fotoğrafa ihtiyacınız var. Sonuçlar yarı iyi ama yine de eğlenceli. Canlı web kamerası görüntüsünde yüzün değiştirilebildiği bir web kamerası modu bile var.
ModelScope Image2Video ile tek bir görüntüyü videoya dönüştürebilirsiniz. Sonuçlar oldukça tuhaf ama burada da: yine de eğlenceli. Örneğin ModelScope Video2Video ile videoların görüntü kalitesi tahmin edilebilir.
Ve son olarak ses departmanında:
AudioCraft Plus yalnızca ses efektleri değil aynı zamanda müzik de üretir. Buranın Teknopolka olması gerekiyor. Tamam…. Bark Voice Cloning veya XTTS ile kısa bir konuşma örneği atarsınız ve ardından metinden konuşmaya yoluyla aynı sesle konuşmanın çıktısını alabilirsiniz. Yani, ElevenLabs’ta tam olarak aylık ücretli aboneliğe ihtiyacınız olan şey.
Pinokio’nun sunduğu tüm araçlar arasında favorim RVC. Ne yazık ki, yasallık açısından muhtemelen en sorunlu şey budur. Bununla ne yapabilirsiniz: Herhangi bir şarkıyı alırsınız, vokal ve enstrümantal parçaları ayırırsınız (bunu da buradaki sekmede RVC ile yapabilirsiniz!!!). Evet, daha sonra başka birinin vokal bandında vokalleri söylemesini sağlayabilirsiniz. İnternette aklınıza gelebilecek hemen her şarkıcının ses modelleri mevcut. Bunu yasal nedenlerden dolayı yapmıyorum, ancak örneğin YouTube’da birisinin Freddie Mercury’nin Adele’in “Someone like you” şarkısını söylemesine izin verdiği bir video var:
Bu gerçekten gerçekçi geliyor, değil mi? Evet katılıyorum. Bir grubunuz varsa ve şarkı söylemeyi seviyorsanız ama sesinizi pek beğenmiyorsanız: Evet, o zaman artık ne deneyebileceğinizi biliyorsunuz. Ama benden ipucunu almadın, değil mi?
Çözüm
Pinokio, en azından benim için sıklıkla hayal kırıklığına yol açan bir sorunu çözüyor. Herhangi bir Python bağımlılığıyla uğraşmanıza gerek kalmadan en son teknolojiye sahip yapay zeka araçlarını otomatik olarak yükler. Ve ayrıca gerçekten harika olan şey, “Keşfet” altındaki öğelerin gerçekten iyi seçilmiş olmasıdır. Yani, en azından Cocktail Peanut bu işi üstlendiği sürece, sürekli olarak kendiniz araştırmanıza gerek kalmadan size her zaman en havalı, en yeni yapay zeka araçları sunulacak. Yani: Bence gerçekten çok hoş.
Ancak önemli: Pinokio alfa bir yazılımdır, zaten 1.0 değil, beta sürümüne sahip olmaktan çok uzaktayız. Bununla birlikte, her şey sıcak iğnelerle örülüyor ve bazen işler yolunda gitmiyor. Pinokio’yu Linux, macOS ve Windows’ta çalıştırdım; ve her platformda çalışmayan ama diğer platformlarda işe yarayan bir şey buldum. Pinokio üzerinde oynanabilecek bir şeydir; son derece kararlı bir üretim yazılımı değildir. Bu nedenle, bir şeyler yolunda gitmezse üzülmeyin, sadece yeni sürümü bekleyin; Bu şu anda en geç üç gün sonra geliyor. Peki iyi eğlenceler! Hoşçakal!
c’t 3003, c’t’in YouTube kanalıdır. c’t 3003’teki videolar bağımsız içerik olup c’t dergisindeki yazılardan bağımsızdır. Editörler Jan-Keno Janssen ve Lukas Rumpler ile video yapımcıları Şahin Erengil ve Pascal Schewe her hafta bir video yayınlıyor.
(jkj)
Haberin Sonu