Alibaba’nın yapay zekâ araştırma ekibi, Qwen3.6-35B-A3B adlı yeni nesil multimodal yapay zekâ modelini kamuoyuna sundu. Bu model, toplamda 35 milyar parametreye sahip olmasına rağmen, sadece 3 milyar parametreyi kullanarak etkileyici performans sergiliyor. Bu durum, yapay zekâ alanında parametre verimliliğinin ve hesaplama maliyetlerinin giderek önem kazanmasına güçlü bir örnek teşkil ediyor. Qwen3.6-35B-A3B, hem görsel hem de metinsel veriyi işleyebilen nadir modellerden biri olarak dikkat çekiyor.
Qwen3.6-35B-A3B’nin en önemli özelliği, spars (seyrek) Mixture of Experts (MoE) mimarisini kullanmasıdır. MoE, yapay zekâ modellerinde tüm parametrelerin her işlemde aktif olarak görev yapmadığı bir yaklaşımı ifade eder. Bu yöntemde, yalnızca belirli “uzman” alt ağlar (experts) aktif olurken, geri kalan parametreler pasif kalır. Bu sayede model çok büyük parametre sayısına ulaşırken, hesaplama maliyeti ve işlem süresi kontrol altında tutulabiliyor. Qwen3.6, bu yöntemi kullanarak toplam 35 milyar parametrenin yalnızca 3 milyarını her işlemde aktifleştirip maliyetleri önemli ölçüde düşürüyor.
Model mimarisi oldukça karmaşık ve yenilikçi bir yapıya sahip. 40 katmanlı bu sistem, lineer dikkat ve grup sorgu dikkat mekanizmaları kullanarak işlem verimliliğini artırıyor. İlgili teknik detaylarda, modelin kelime dizilerini çok uzun bağlamlarda işleyebildiği ve görüntü, video gibi multimodal verilerde yüksek başarı sağladığı belirtiliyor. Bu yeni yapıyla Qwen3.6-35B-A3B, önceki modellere kıyasla çok daha büyük veri setlerinde ve yüksek karmaşıklıkta görevlerde etkin şekilde çalışabiliyor.
Qwen3.6-35B-A3B, özellikle yazılım kodlamada üstün performans sunuyor. GitHub sorun çözme odaklı SWE-bench ve Terminal-Bench gibi testlerde rakiplerini geride bırakıyor. Ayrıca, ön uç web tasarımı ve oyun geliştirme gibi farklı kodlama alanlarında önemli sıçramalar kaydetti. STEM ve mantık temelli testlerde de büyük modellere meydan okuyan başarılı sonuçlar elde etti. Bu performanslar, Qwen3.6’nın sadece dil anlama değil, aynı zamanda karmaşık düşünme ve problem çözme kapasitesine sahip olduğunu gösteriyor.

Multimodal yetenekler modelin bir diğer dikkat çekici yönü. Qwen3.6-35B-A3B, sadece metin değil, aynı zamanda resim, video ve dokümanları da doğal biçimde analiz edebiliyor. Üniversite düzeyinde çok disiplinli görevler içeren MMMU ve RealWorldQA gibi testlerde performansı önceki modellere göre daha yüksek. Nesne tanıma ve video analizinde elde ettiği skorlar, görsel zekâ alanında yenilikçi bir gelişmeye işaret ediyor.
Model ayrıca düşünme süreçlerine dair önemli bir kontrol mekanizması sunuyor. Geliştiriciler, Qwen3.6’nın “düşünme modu”nu açıp kapatabiliyor. Bu özellik, yapay zekânın karmaşık mantık yürütme süreçlerini yönetirken daha esnek ve hız odaklı çalışmasına olanak sağlıyor. Ayrıca, model önceki konuşma adımlarındaki mantıksal çıkarsamaları hatırlayıp kullanabiliyor. Böylece, çok aşamalı görevlerde tekrar eden hesaplamalardan kaçınılırken, hem performans hem de kaynak kullanımı optimize ediliyor.
Qwen3.6-35B-A3B, Apache 2.0 lisansı altında tamamen açık kaynak olarak paylaşıldı ve ticari kullanıma uygun. Bu, yapay zekâ geliştirme alanında işbirliğini artırarak yeni uygulamalar için önemli fırsatlar yaratıyor. Model, CPU ve GPU kombinasyonlarını kullanabilen farklı açık kaynak altyapılarla uyumlu çalışıyor. Bu sayede, sınırlı donanım kaynaklarına sahip kullanıcılar için bile erişilebilir bir çözüm olarak öne çıkıyor.
Bu teknolojik gelişme, yapay zekâ modellerinde etkin parametre kullanımının ve multimodal yeteneklerin gelecekteki uygulamalarda ne kadar kritik olacağını ortaya koyuyor. Qwen3.6-35B-A3B’nin sunduğu esnek ve güçlü altyapı, yapay zekânın pek çok sektörde daha verimli ve akıllı çözümler üretmesinin kapılarını aralıyor. Yazılım geliştirmeden doğrudan tüketiciye yönelik görsel analizlere kadar pek çok alanda yeni uygulamaların önünü açması bekleniyor.
📎 Kaynak: marktechpost.com



