Emory Üniversitesi Fizikçileri Multimodal Yapay Zeka İçin Yeni Matematiksel Çerçeve Geliştirdi
Yapay zeka günümüzde metin, görüntü, ses ve video gibi farklı veri türlerini bir araya getirip yorumlamak için rutin olarak kullanılmaktadır. Ancak multimodal yapay zeka alanında geliştiricilerin karşılaştığı en büyük zorluklardan biri, her görev için en uygun algoritmanın hangisi olduğuna karar vermektir. Bu tercih süreci, hem karmaşık hem de zaman alıcıdır. Emory Üniversitesi’nden fizikçiler, bu soruna daha sistematik ve açık bir yaklaşım getiren yeni bir matematiksel çerçeve önerdi. The Journal of Machine Learning Research’te yayımlanan çalışmada, yapay zeka yöntemlerini organize eden ve algoritma tasarımını belirli problemlere göre yönlendiren bir yapı tanımlanıyor.
Emory Üniversitesi Fizik Profesörü ve çalışmanın kıdemli yazarı Ilya Nemenman, “Bugünün en başarılı yapay zeka yöntemlerinin çoğu, aslında çok basit bir fikir etrafında toplanıyor: Birden fazla veri türünü, ihtiyacınız olanları gerçekten tahmin eden kısımları tutmak için yeterince sıkıştırmak,” diyor. Bu yaklaşım, yapay zeka yöntemlerinin “periyodik tablosu” gibi bir yapı sunuyor. Farklı yöntemler, hangi bilgilerin korunup hangilerinin atıldığına göre farklı kategorilere ayrılıyor.
Burada kritik rol oynayan kavramlardan biri “loss function” yani kayıp fonksiyonudur. Kayıp fonksiyonu, bir yapay zeka modelinin tahminlerinin doğru sonuçlardan ne kadar saptığını ölçen matematiksel formüldür. Eğitim sürecinde yapay zeka sürekli olarak bu sapmayı minimize etmeye çalışır; sapma ne kadar düşükse modelin başarısı o kadar yüksek olur. Nemenman, multimodal yapay zeka sistemleri için yüzlerce farklı kayıp fonksiyonu geliştirildiğini söylüyor, ancak bunların bazıları bağlama göre diğerlerinden daha avantajlı olabiliyor. “Her seferinde sıfırdan başlamak zorunda kalmadan, daha basit ve sistematik bir çözüm yolu olabilir mi diye merak ettik,” diye ekliyor.
Araştırmacılar bu ihtiyacı karşılamak için “Variational Multivariate Information Bottleneck” (Varyasyonlu Çok Değişkenli Bilgi Sıkıştırma) adlı yeni bir matematiksel çerçeve geliştirdi. Bu yapı, hangi bilgilerin korunması gerektiği ve hangilerinin atılabileceği kararını kolaylaştıran bir denetim mekanizması işlevi görüyor. Projenin araştırma görevlisi Michael Martini, “Bu çerçeve aslında bir kontrol düğmesi gibi çalışıyor. Belirli bir problemi çözmek için hangi bilgilerin tutulması gerektiğini ayarlayabilirsiniz,” diyor. İlk yazar Eslam Abdelaleem ise bu yaklaşımı “genelleştirilmiş, prensiplerden hareket eden bir yöntem” olarak tanımlıyor ve amaçlarının sorunlara özel yapay zeka modelleri tasarlamada araştırmacılara rehberlik etmek olduğunu belirtiyor. Ayrıca, bu yöntem sayesinde modellerin neden ve nasıl çalıştığını anlamak da mümkün oluyor.
Önerilen çerçeve, yapay zeka geliştiricilerin yeni algoritmalar önermesine, hangi algoritmaların başarılı olacağını tahmin etmesine, ne kadar eğitim verisine ihtiyaç duyulacağına karar vermesine ve olası hata noktalarını önceden görmesine olanak tanıyor. Nemenman, “Bu çerçeve, daha doğru, verimli ve güvenilir yeni yapay zeka yöntemleri geliştirmemizi de sağlayabilir,” diyor.
Araştırmacılar bu çalışmaya fizik perspektifiyle yaklaşıyor. Abdelaleem, “Makine öğrenimi topluluğu genellikle sistemin nasıl çalıştığını sorgulamadan doğruluğu artırmaya odaklanıyor. Biz ise bir fizikçi olarak, neden ve nasıl işlediğini anlamaya çalışıyoruz,” ifadelerini kullanıyor. Ekip, karmaşık yapay zeka tekniklerinin altında yatan temel ve birleşik prensipleri bulmak için uzun süre elle hesaplamalar yaptı, beyaz tahtalar üzerinde tartıştı ve deneme-yanılma yoluyla yöntemlerini geliştirdi.
Çalışmanın kırılma noktası, veriyi sıkıştırma ile yeniden yapılandırma arasındaki dengeyi tanımlayan tekil bir prensip keşfetmek oldu. Martini, “Modelimizi iki test veri setinde denedik ve otomatik olarak ortak, önemli özellikleri ortaya çıkardığını gösterdik. Bu çok tatmin ediciydi,” diyor. İşlerin yoğunlaştığı bir gün, Abdelaleem kampüsten ayrılırken Samsung Galaxy akıllı saatinin hissettiği heyecanı yanlış yorumlayarak kendisini üç saat bisiklet sürüyormuş gibi kaydettiğini fark etti ve “Bu teknolojinin bilim üzerindeki etkisi gerçekten şaşırtıcı,” diye ekledi.
Çerçeveyi test etmek için araştırmacılar, mevcut birçok yapay zeka yöntemini bu yapıya uyguladılar. Nemenman, “Bilgisayar ortamında yaptığımız denemeler, framework’ümüzün standart test problemlerinde başarılı olduğunu gösterdi. Böylece daha az eğitim verisiyle daha etkin kayıp fonksiyonları türetmek mümkün hale geliyor,” diyor. Gereksiz özelliklerin elenmesi, yapay zeka sistemlerinin hesaplama yükünü azaltarak enerji tüketimini ve çevresel etkileri düşürüyor. Bu da hâlihazırda veri eksikliği nedeniyle çözülemeyen zorlu deneylerin kapısını aralayabilir.
Araştırmacılar, diğer bilim insanlarının bu çerçeveyi kullanarak kendi alanlarına özgü yapay zeka algoritmaları geliştirmesini umut ediyorlar. Kendi çalışmalarını da sürdürerek biyoloji gibi alanlarda, özellikle bilişsel işlevlerle ilişkili desenlerin belirlenmesi üzerine yoğunlaşmayı planlıyorlar. Abdelaleem, “Beynimizin aynı anda birçok bilgi kaynağını nasıl sıkıştırıp işlediğini anlamak istiyorum. Belki bir makine öğrenimi modeli ile insan beyninin nasıl benzerlikler taşıdığını gösteren bir yöntem geliştirebiliriz. Bu da her iki sistemi daha iyi anlamamızı sağlar,” diyerek araştırmanın gelecek vizyonunu özetliyor.
Kaynak: https://www.sciencedaily.com/releases/2026/03/260303145714.htm