Yapay Zeka Güncellemesi Derinlemesine İnceleme: Yapay Zekalar Ne Okuyor?

amerikali

Yeni Üye
Popüler görüşe göre okumak eğitir. Ancak makineler milyonlarca web sitesini ve yüzbinlerce kitabı silip süpürdüğünde, mutlaka daha akıllı hale gelmiyorlar. c’t editörü Hartmut Gieselmann, 24/2023 sayısı için büyük dil modellerinin bulunduğu kitaplığa göz attı ve AI güncellemesinde orada ne bulduğunu bize anlattı.

Reklamcılık




OpenAI gibi üretken yapay zekanın ticari sağlayıcıları, kendilerinin incelenmesine izin vermek konusunda isteksizler. Ancak uzman, Hugging Face web sitesindeki açık kaynak dil modelleri için eğitim verileriyle birlikte 60.000’den fazla girişi tararsanız, hangi modellerin bunlarla eğitildiğini de görebileceğinizi açıklıyor. “Çeşitli eğitim verilerine daha yakından bakarsanız, üçüncü ağaçta yer almayan her şeyin bir şekilde internetten kazındığı açıkça görülüyor.”







Yapay zeka aslında ne kadar akıllı? Üretken yapay zekanın işimiz, boş zamanlarımız ve toplumumuz açısından ne gibi sonuçları var? Haberler’nin “Yapay Zeka Güncellemesi”nde The Decoder ile birlikte size hafta içi her gün en önemli yapay zeka gelişmelerine ilişkin güncellemeleri sunuyoruz. Cuma günleri uzmanlarla yapay zeka devriminin farklı yönlerini inceliyoruz.







Çok geniş bir AI metin koleksiyonu, Ortak Tarama olarak adlandırılır. Common Crawl, ABD’de her ay veya iki ayda bir yapay zeka eğitim veri seti olarak İnternet’in bir kopyasını yayınlayan, kar amacı gütmeyen bir kuruluştur. Geliştiriciler ayrıca çeviri modelleri olarak Avrupa Birliği’ndeki çevirileri kullanmayı da seviyorlar çünkü tüm konuşmalar veya yasa taslakları orada doğrudan tüm resmi dillerde yayınlanıyor. Gieselmann, “Hugging Face’e baktığınızda bunların çoğu Almanca metinler” diyor.

Ancak bu aynı zamanda birçok dil modelinin karşılaştığı ilk sorundur çünkü işlerinin çoğunu İngilizce olarak öğrenirler. Bu nedenle İngilizce yanıtlar genellikle daha doğrudur veya en azından daha zarif bir şekilde formüle edilmiştir. Ayrıca internetten alınan web siteleri çoğu zaman dil modellerine beslenen pek çok saçmalık içermektedir. Podcast’te c’t editörü, bu eğitim veritabanlarında buğdayın samandan ayrılabileceği çeşitli yolları açıklıyor: “ancak çok miktarda veri nedeniyle bu, bir kanalizasyon arıtma tesisindeki kaba bir tırmığa benziyor. Daha sonra suyu içmek istemezsiniz.”

Gieselmann, büyük dil modellerinin eğitim verilerinin kalitesi hakkında ne kadar çok şey bilirsek, yapay zekanın bizimle ne kadar güvenilir şekilde çalıştığını da o kadar değerlendirebileceğimizi belirtiyor. “Bu yapay zeka makineleriyle ne kadar çok deneyim kazanırsak, onları ne için kullanmamamız gerektiğini o kadar kesin olarak biliyoruz. Ve bu aslında bilgi açısından gerçekten iyi bir kazanç.”


(igr)



Haberin Sonu