Llama 3.3 yayınlandı: Meta'nın yeni yapay zekası nasıl performans gösteriyor?

amerikali · 8 Ara 2024

Llama 3.3 yayınlandı: Meta'nın yeni yapay zekası nasıl performans gösteriyor?

Meta Grup, Büyük Dil Modeli'nin (LLM) Lllama adlı yeni sürümünü yayınladı. Llama 3.3:70B'nin kullanımının daha kolay ve daha uygun maliyetli olması amaçlanıyor.

Reklamcılık

Meta'nın Üretken Yapay Zekadan Sorumlu Başkan Yardımcısı Ahmad Al-Dahle, Llama 3.3'ü duyurdu.

Önerilen editoryal içerik

Onayınız doğrultusunda harici içerik buraya yüklenecektir.

Harici içeriği şimdi yükle

405B modelimizin performansını sunan ancak çalıştırması daha kolay ve daha uygun maliyetli olan yeni bir 70B modeli olan Llama 3.3 ile tanışın. Çevrimiçi tercih optimizasyonu da dahil olmak üzere eğitim sonrası tekniklerdeki en son gelişmelerden yararlanan bu model, temel performansı artırır. pic.twitter.com/6oQ7b3Yuzc

— Ahmad Al-Dahle (@Ahmad_Al_Dahle) 6 Aralık 2024

Genel bakışa göre, karşılaştırma için belirli veri kümelerini tanımlayan çeşitli yerleşik yapay zeka kriterleri kullanıldı. Bunlar, bir yapay zeka modelinin belirli alanlardaki performansını test etmek için kullanılır. Her ne kadar Meta, Lama model ailesi hakkında pek çok bilgiyi açıklasa da, kesin eğitim verileri hâlâ gizli. Lama en iyi sıralamayı “Talimatları Takip Etme” yani talimatları tam olarak takip etme noktasında elde etti.

Bu amaçla Meta, doğrulanabilir görevlere sahip yaklaşık 500 bilgi istemi içeren IFEval kıyaslamasını kullandı; örneğin: “400'den fazla kelime yazın ve AI anahtar kelimesinden en az üç kez bahsedin” – ancak tüm IFEval istemleri gibi İngilizce. Lama 3.3, istemlerin yüzde 92,1'ini doğru yanıtladı. Bu, Meta'nın kendisi tarafından derlenen karşılaştırmada Amazon Nova Pro ile birlikte ön sırada yer alıyor.

Ayrıca okuyun

Daha fazlasını göster

Daha az göster

“Uzun bağlam” istemleri en iyi sonucu verir

Lama 3.3, “Uzun Bağlam” kategorisinde yüzde 97,5 ile en yüksek isabet oranına ulaştı. Yalnızca eski Lama modeli 3.1 yüzde 98,1 ile daha da iyi. Bu, amacın belirli bir karakter dizisini bulmak olduğu “NIH/Multi-needle” (NIH = Samanlıktaki iğne)'ye göre bir testtir.

Ancak Meta, kendi modeliyle ilgili bir Google araştırma makalesinde de yer alan Google Gemini Pro 1.5'ten bir karşılaştırma değeri kullanıyor. Llama 3.3 ayrıca Çok Dilli MGSM veri setinde de özellikle iyi sonuçlar elde etti – burada amaç on farklı dilde 250 okul düzeyindeki matematik problemini çözmektir – Llama 3.3 yüzde 91,1'e ulaştı, yalnızca Llama 3.1 yüzde 91,6 ile biraz daha fazlasını başardı. Bazı durumlarda yeni model, önceki modellerden biraz daha kötü performans gösteriyor; bu da muhtemelen Al-Dahle'nin öne sürdüğü operasyon ve maliyet verimliliği avantajlarının lehine.

Zuckerberg: Aylık 600 milyon kullanıcı

Llama 3.3 artık Hugging Face ve Meta web sitesinden indirilebilir. Meta'ya göre Llama AI modelleri şu ana kadar toplam 650 milyon kez indirildi. Meta CEO'su Marc Zuckerberg, Instagram'da paylaştığı bir videoda artık her ay 600 milyon kişinin Lama kullandığını söyledi. Lama AI'leri belirli koşullar altında araştırma ve ticari amaçlarla serbestçe kullanılabilir; yalnızca aylık 700 milyondan fazla aktif kullanıcısı olan platformlar Meta'dan özel bir lisans gerektirir.

Önerilen editoryal içerik

Onayınız doğrultusunda harici içerik buraya yüklenecektir.

Harici içeriği şimdi yükle

Kasım ayında Çin ordusunun Metas Llama yapay zekalarını kendi amaçları için kullandığı öğrenildi. Meta daha sonra ABD hükümetinin yapay zekasını ulusal güvenlik amacıyla kullanmasına da izin verdi. Geçtiğimiz günlerde Meta, AB yönetmeliklerine uymama korkusu nedeniyle Lama'nın bir versiyonunu AB'de piyasaya sürmemeye karar verdi.

Lama 4: Beklenen on kat daha fazla bilgi işlem gücü

Yaklaşan Lama Generation 4 ile Mark Zuckerberg, modelleri eğitmek için gereken bilgi işlem gücünün on kat artmasını bekliyor. Lama 4'ün 2025'te tamamlanması bekleniyor.

(HAYIR)

Llama 3.3 yayınlandı: Meta'nın yeni yapay zekası nasıl performans gösteriyor?

amerikali

Yeni Üye