Google’ın Gemini’si Pokémon Blue’yu Biraz Yardım Alarak Yendi

Google’ın en pahalı yapay zeka modeli, büyük bir dönüm noktasını aşmış gibi görünüyor: 29 yıllık bir video oyununu yenmek. Dün gece, Google CEO’su Sundar Pichai, X platformunda zaferle, “Ne muhteşem bir final! Gemini 2.5 Pro, Pokémon Blue’yu tamamladı!” diye yazdı. Açıkça belirtmek gerekirse, Gemini Plays Pokémon canlı yayını, kendi tabiriyle “Google ile bağlantısı olmayan 30 yaşındaki bir yazılım mühendisi” olan Joel Z tarafından oluşturuldu. Ancak Google yöneticileri bu çabayı coşkuyla destekledi.

Örneğin, Google AI Studio’nun ürün lideri Logan Kilpatrick, geçen ay Gemini’nin “Pokémon’u tamamlamada büyük ilerleme kaydettiği” ve “beşinci rozetini kazandığı” (diğer en iyi modelin farklı bir ajan sistemiyle sadece üç rozet aldığı) bir paylaşım yaptı. Bu, Pichai’nin “API üzerinde çalışıyoruz, Yapay Pokémon Zekası :)” diye şaka yapmasına yol açtı.

Neden Pokémon?

Şubat ayında, Anthropic, Claude yapay zeka modellerinin “Pokémon Red” oyununda kaydettiği ilerlemeyi vurgulayarak, Claude’un “uzatılmış düşünme ve ajan eğitimi”nin, klasik bir oyunu oynamak gibi “beklenmedik” görevlerde “büyük bir destek” sağladığını yazdı. (“Pokémon Red” ve “Blue”, 1996’da ilk kez piyasaya sürülen ve uzun süredir devam eden Pokémon serisiyle bağlantılı olan GameBoy oyunlarının farklı versiyonlarıdır.) Joel Z’nin ilham kaynağı olarak belirttiği bir Claude Plays Pokémon Twitch kanalı bile var. Ancak, Claude henüz “Pokémon Red”i tamamlamış gibi görünmüyor.

Pokémon Blue, karmaşık mekanikleri, stratejik savaşları ve açık dünya keşfiyle biliniyor; tüm bunlar yapay zeka sistemleri için zorlayıcı. Oyunu başarmak için bir yapay zekanın uzun vadeli planlama, hedef takibi ve görsel navigasyon becerilerine ihtiyacı var; bunlar genel yapay zekanın geliştirilmesinde temel beceriler. Joel Z, Google ile bağlantısı olmayan bir geliştirici olarak, Gemini 2.5 Pro Experimental’ı test etti ve birkaç yüz saatlik oyun sonrasında Gemini oyunu başarıyla tamamladı. Tüm oynanış, Twitch’te halka açık olarak mevcut.

Teknik Detaylar

Sistem, mGBA emülatörünü Gemini 2.5 Pro ile birleştiriyor. Emülatör, Gemini’ye ekran görüntüleri ve karakterin konumu, mevcut Pokémon ekibi ve haritanın düzeni gibi oyun verilerini sağlıyor. Gemini, tuş komutlarıyla yanıt veriyor ve navigasyon veya bulmacalar gibi belirli zorluklar için uzmanlaşmış ajanları devreye sokabiliyor. Gemini, bu ajanlardan birini ne zaman çağıracağına kendisi karar veriyor, bu da en azından rutin ve daha karmaşık oyun durumlarını ayırt edebildiğini gösteriyor.

Token sınırları içinde kalmak için sistem, her 100 eylemde bir önceki mesajları periyodik olarak özetliyor. Ancak, Gemini’nin performansı genel zekaya işaret etmiyor. Geliştirici, örneğin kaçış eşyalarının kullanımını sınırlamak veya hataları düzeltmek gibi durumlarda hala müdahale ediyor. Geliştiriciye göre, bilinen bir oyun hatası olan Rocket Grunt ile iki kez konuşarak Asansör Anahtarı’nı alma durumu dışında, doğrudan ipuçları veya rehberler verilmedi.

Joel Z, “Müdahalelerim, Gemini’nin genel karar verme ve akıl yürütme yeteneklerini geliştiriyor,” diyor. “Spesifik ipuçları vermiyorum — Mt. Moon gibi belirli zorluklar için rehber veya doğrudan talimat yok. Yakın olan tek şey, Gemini’ye Rocket Grunt ile iki kez konuşması gerektiğini bildirmek, ki bu Pokémon Yellow’da düzeltilen bir hata idi.”

Ayrıca, “Gemini Plays Pokémon hala aktif olarak geliştiriliyor ve çerçeve sürekli evrim geçiriyor,” dedi.

Tartışmalar ve Bağlam

Pokémon, yapay zeka kıyaslamaları için yarı ciddi bir test olarak kabul ediliyor; pek çok kişi bunun bir modelin yeteneklerini değerlendirmek için çok bilgilendirici bir test olduğunu iddia etmez. Daha önce, bir X paylaşımı viral olmuş ve Google’ın en son Gemini modelinin, Anthropic’in Claude modelini Pokémon video oyunu üçlemesinde geçtiğini iddia etmişti. Paylaşımda, Gemini’nin bir geliştiricinin Twitch yayınında Lavender Town’a ulaştığı, Claude’un ise Şubat sonu itibarıyla Mt. Moon’da takıldığı belirtiliyordu. Ancak paylaşım, Gemini’nin bir avantaja sahip olduğunu belirtmeyi ihmal etmişti: Geliştirici, oyundaki kesilebilir ağaçlar gibi “kareleri” tanımlamaya yardımcı olan özel bir mini harita oluşturmuştu. Bu, Gemini’nin oyun kararları vermeden önce ekran görüntülerini analiz etme ihtiyacını azaltıyordu.

Gemini’nin başarısı, Google’ın yapay zeka modellerinin yeteneklerini sergilemek için eğlenceli bir yol olsa da, Anthropic’in Claude’u gibi diğer modeller de benzer görevlerde ilerleme kaydediyor. Örneğin, Claude’un Pokémon Red’deki ilerlemesi, Anthropic’in “uzatılmış düşünme” ve “ajan eğitimi”nin karmaşık görevlerdeki potansiyelini gösterdi.

Sonuç

Gemini 2.5 Pro’nun Pokémon Blue’yu tamamlaması, yapay zekanın stratejik düşünme ve karmaşık görevleri yönetme yeteneklerini vurgulayan etkileyici bir başarı. Ancak, bu başarı, özel mini haritalar, periyodik insan müdahaleleri ve uzmanlaşmış ajanlar gibi önemli teknik desteklerle mümkün oldu. Joel Z’nin projesi, yapay zekanın oyun oynama potansiyelini gösteriyor, ancak aynı zamanda genel zeka yolunda hala sınırlamalar olduğunu hatırlatıyor. Gemini’nin bir sonraki meydan okuması ne olacak? Belki de daha zor bir oyun, örneğin Elden Ring?

Kaynak: TechCrunch .

Google’ın Gemini’si Pokémon Blue’yu Biraz Yardım Alarak Yendi

Neden Pokémon?

Teknik Detaylar

Tartışmalar ve Bağlam

Sonuç

İlgili

Arama

Akıllı Menü

Google’ın Gemini’si Pokémon Blue’yu Biraz Yardım Alarak Yendi

Neden Pokémon?

Teknik Detaylar

Tartışmalar ve Bağlam

Sonuç

Paylaş:

İlgili

Anthropic’ten Dev Hamle: Claude 4 Serisi Yapay Zekada Yeni Bir Dönem Başlatıyor

Paylaş:

Büyük Teknolojinin YZ Arayışı: Geleceğin İdeal Cihazı

Paylaş:

Arama

Akıllı Menü