NVIDIA, yapay zeka alanında yeni bir döneme işaret eden Nemotron-Cascade 2 modelini tanıttı. 30 milyar parametreye sahip bu ileri düzey yapay zeka modeli, özellikle matematiksel akıl yürütme ve kodlama alanlarında şaşırtıcı başarılara imza atıyor. Model, sadece parametre büyüklüğüyle değil, “zeka yoğunluğu” kavramına odaklanarak sınıfının en iyileri arasında yer alıyor.
Nemotron-Cascade 2, karmaşık matematiksel problemleri çözme yeteneği ve kodlama becerileriyle dikkat çekiyor. NVIDIA araştırmacıları, bu modelde parametre sayısını azaltırken performansı artırmayı hedefledi. Geleneksel büyük yapay zeka modellerinin onlarca katı parametre sayısına sahip en ileri modellerin yakalayabildiği başarı seviyesini, çok daha küçük bir boyutta elde etmesi, yapay zeka geliştirmede yeni yaklaşımlara kapı aralıyor.

Model, Uluslararası Matematik Olimpiyatı (IMO), Uluslararası Bilişim Olimpiyatı (IOI) ve ICPC Dünya Finalleri gibi prestijli sınavlarda altın madalya seviyesinde performans göstererek iddiasını kanıtladı. Bu başarı, Nemotron-Cascade 2’nin özellikle matematiksel akıl yürütme, kodlama ve talimat izleme konularında ileri seviye yeteneklere sahip olduğunun somut işareti oldu.
Nemotron-Cascade 2’nin teknik altyapısı, “Karışık Uzmanlar” (Mixture-of-Experts) mimarisi üzerine kurulu. Bu yapı, modelin 3 milyar aktif parametre ile yüksek performans sunmasını sağlıyor. NVIDIA araştırmacıları, modelin eğitiminde ilginç bir yöntem izledi. Süpervizyonlu ince ayar (SFT) esnasında, milyonlarca Python kodlama örneği ve matematiksel kanıt içeren veri setleri kullanıldı. Ayrıca yazılım mühendisliği alanındaki özel veri karışımlarıyla modelin becerileri çeşitlendirildi.

Modelin eğitimi, “Cascade Reinforcement Learning” adı verilen ardışık ve alan bazlı pekiştirmeli öğrenme yöntemiyle desteklendi. Bu teknik, modelin birbirinden farklı alanlarda uzmanlaşmasını sağlarken önceki öğrenmelerin korunmasına yardımcı oluyor. Ayrıca “Multi-Domain On-Policy Distillation” (MOPD) denilen yeni bir teknikle, bilgi aktarımı daha verimli hale getirildi ve öğrenme süreci hızlandı.
Nemotron-Cascade 2’nin en çok dikkat çeken yanlarından biri, karmaşık matematik ve kodlama problemlerinde derin düşünebilme yeteneği. Model, bu görevler için özel bir “Thinking Mode” moduna sahip. Bu mod sayesinde, karmaşık soruları ve yazılım problemlerini adım adım çözebiliyor. Aynı zamanda daha hızlı yanıt vermek istediğinde ise “Non-Thinking Mode” ile etkin ve direkt cevaplar sunabiliyor.

Bu yapay zeka modeli, alanında öncü olan Qwen3.5-35B-A3B ve Nemotron-3-Super-120B-A12B gibi modellerle karşılaştırıldığında matematiksel problem çözme ve kodlama performansı açısından üstünlük sağladı. Örneğin, AIME 2025 yarışmasında Nemotron-Cascade 2 yüzde 92.4 başarı oranıyla rakiplerini geride bıraktı. Bu üstünlük, daha az parametre ile daha fazla zeka yoğunluğu sağlama stratejisinin başarısını gösteriyor.
Nemotron-Cascade 2, yapay zekada yeni bir vizyonun habercisi olarak kabul ediliyor. Geleneksel olarak büyük ve karmaşık modellere dayandırılan ileri seviye akıl yürütme yeteneklerinin, daha küçük ve optimize edilmiş modellerle elde edilebileceği fikrini güçlü şekilde destekliyor. Bu da hem yapay zekanın erişilebilirliğini artırıyor hem de enerji ve hesaplama maliyetlerini düşürüyor.
Gelecekte, Nemotron-Cascade 2 ve benzeri modellerin eğitim yöntemleri yapay zekanın farklı alanlarda daha etkin kullanılmasını sağlayacak. Matematik, kodlama ve mantıksal akıl yürütme gerektiren görevlerde, bu tür modellerin iş birliği ve yaratıcı çözümler geliştirme potansiyeli oldukça büyük. NVIDIA’nın bu yeni geliştirmesi, yapay zeka araştırmalarında daha verimli ve odaklı modellerin yolunu açıyor.
📎 Kaynak: marktechpost.com



