Liquid AI’den 128 Bin Token Destekli Yeni Yapay Zeka Modeli LFM2.5-8B-A1B

Yapay zeka teknolojileri hızla gelişirken, Liquid AI ekibi önemli bir yeniliği duyurdu. LFM2.5-8B-A1B adlı yeni model, yüksek performanslı ancak ekonomik ve cihaz üzerinde çalışabilen Mixture-of-Experts (MoE) mimarisiyle dikkat çekiyor. Yaklaşık 8,3 milyar parametreye sahip olan model, her işlemde bu sayının sadece 1,5 milyarını aktif hale getirerek, konsumer donanımlarda bile yüksek verimlilik sunuyor. Bu sayede gelişmiş yapay zeka yetenekleri, güçlü bilgisayarlara veya bulut sistemlerine ihtiyaç duymadan kullanılabiliyor.

LFM2.5-8B-A1B, selefi LFM2-8B-A1B modelinin üzerine geliştirilen bir hibrid model ailesinin üyesi. Bu yeni versiyon, önceki modele kıyasla önemli yükseltmelere sahip. En dikkat çekeni ise bağlamsal pencere uzunluğunun 32 bin token seviyesinden 128 bine çıkarılması. Bu sayede model, çok daha uzun metinleri işleyip karmaşık ilişkiler kurabiliyor. Ayrıca eğitim süreci daha fazla veriyle ve daha kapsamlı biçimde tamamlandı. Model çok dilli desteğe sahip; Arapça, Çince ve Japonca gibi dokuz farklı dili anlayabiliyor.

Teknik açıdan LFM2.5-8B-A1B, parametrelerin ancak küçük bir kısmını aktif eden “seyrek” MoE yaklaşımını temel alıyor. Modelin 24 katmanı bulunuyor; bunların 18’i çift kapılı LIV konvolüsyon blokları, geri kalan 6’sı ise GQA adı verilen özelleştirilmiş katmanlardan oluşuyor. Bu birleşim sayesinde model, karmaşık hesaplama işlemlerini hafifleterek performansı yükseltiyor. Aynı zamanda model, “chain-of-thought” yani düşünce zinciri oluşturarak cevaplarını mantıksal adımlarla açıklıyor. Bu, yapay zekanın karar alma süreçlerini daha şeffaf ve anlaşılır hale getiriyor.

Liquid AI ekibi, modelin yeteneklerini geliştirirken yalnızca büyüklüğe değil, verimliliğe de odaklanmış. Geliştirme sürecinde öncelikle kelime dağarcığı iki katına çıkarıldı ve özellikle Latin olmayan dillerin daha efektif işlenmesi sağlandı. Eğitim aşamasında ise 12 trilyon token üzerinden gerçekleşen ön eğitimi 38 trilyon tokene yükseltti. Ayrıca, pek çok özellik yapay zekanın yanılgılarını minimuma indirmek üzere tasarlandı. Model, karmaşık düşünme süreçlerinde takılmaları engelleyen ve yanlış bilgi üretimini azaltan pek çok takviye öğrenme tekniğiyle destekleniyor.

Bu gelişmelerin önemi büyük. Artık güçlü yapay zeka modellerini yüksek donanım maliyetlerine ihtiyaç duymadan, akıllı telefonlardan dizüstü bilgisayarlara kadar birçok cihazda çalıştırmak mümkün. Bu, AI uygulamalarının erişilebilirliğini artırırken, veri gizliliği açısından da avantaj sağlıyor çünkü kullanıcıların verileri bulutta işlenmiyor. Ayrıca, uzun metinlerin anlamlandırılması ve çok dilli destek, eğitim, araştırma ve uluslararası iş alanlarında kullanımını artırabilir.

LFM2.5-8B-A1B’nin performansı da çeşitli benchmark testlerinde kendini gösterdi. Yanıltıcı bilgi üretme oranı öncekine göre neredeyse 10 kat azaldı. Matematik ve karmaşık akıl yürütme testlerinde de önceki modellere kıyasla ciddi gelişmeler sağladı. Modelin CPU ve GPU üzerinde hızlı çalışması, cihazlarda gerçek zamanlı uygulamalara olanak tanıyor. Örneğin, telefonlarda saniyede yaklaşık 30 kelimeyi anlamlı şekilde işleyebiliyor.

Geleceğe baktığımızda, bu tür verimli ve güçlü modellerin yapay zeka uygulamalarının yaygınlaşmasında kritik rol oynayacağı anlaşılıyor. Liquid AI’nin açık kaynaklı yaklaşımı ve farklı işlem ortamları için sağladığı destek, geliştiricilerin model üzerinde özgürce yenilik yapmasına imkan tanıyor. Ayrıca, modelin Python kodu çağrısı gibi fonksiyonları desteklemesi, otomasyon ve robotik gibi alanlarda yeni kapılar açabilir.

Sonuç olarak, LFM2.5-8B-A1B, hem performans hem de erişilebilirlik anlamında yapay zeka teknolojilerinde yeni bir dönemin habercisi. Yüksek bağlam işleme kapasitesi, çoklu dil desteği ve hesaplama verimliliği; onu mobil ve yerel yapay zeka çözümleri için ideal kılıyor. Bu yenilik, AI dünyasında dağıtık ve gizlilik odaklı uygulamaların artacağı günlerin sinyalini veriyor.

📎 Kaynak: marktechpost.com