Google'dan yapay zeka devrimi: Gemini 3 resmen tanıtıldı!

Google ve Alphabet CEO’su Sundar Pichai ile Google DeepMind liderleri Demis Hassabis ve Koray Kavukçuoğlu’nun detaylarını paylaştığı lansmanda, yeni dönemin sadece metin ve görsel işlemeyi değil, yapay zekanın bağlamı derinlemesine anlama ve karmaşık görevleri otonom olarak planlama yeteneklerini de kapsadığı vurgulandı.

AKIL YÜRÜTMEDE ZİRVE: GEMİNİ 3 PRO KIYASLAMARI ALT ÜST ETTİ

Yaklaşık iki yıldır devam eden Gemini sürecinin en parlak meyvesi olan Gemini 3, derinliği ve nüansları kavrayacak şekilde tasarlanmış gelişmiş bir akıl yürütme yapısına sahip. Model, yaratıcı bir fikrin ince ipuçlarını algılamaktan, zorlu bir sorunun iç içe geçmiş katmanlarını ayrıştırmaya kadar geniş bir yelpazede yüksek performans sergiliyor.

Google DeepMind CEO’su Demis Hassabis ve CTO Koray Kavukçuoğlu’nun aktardığı teknik detaylara göre, Gemini 3 Pro sürümü, tüm önemli yapay zeka kıyaslama testlerinde (benchmark) bir önceki sürüm 2.5 Pro'yu açık ara geride bıraktı. Model, LMArena liderlik tablosunun zirvesine 1501 Elo puanıyla yerleşirken, doktora düzeyinde akıl yürütme becerisini gözler önüne seren testlerde de iddialı skorlar elde etti:

Humanity’s Last Exam: %37,5 (Araçsız)
GPQA Diamond: %91,9
MathArena Apex: %23,4 (Matematik alanında yeni standart)
Çok Modlu Akıl Yürütme (MMMU-Pro/Video-MMMU): %81 / %87,6

DERİN DÜŞÜNME MODU: GEMİNİ 3 DEEP THİNK

Zeka sınırlarını daha da zorlayan Gemini 3 Deep Think modu da duyuruldu. Özellikle akıl yürütme ve çok modlu anlama özelliklerinde önemli bir değişim sunan bu mod, test sonuçlarında Pro sürümünü geride bıraktı. Humanity’s Last Exam'da %41,0 ve GPQA Diamond testinde %93,8 skorlarına ulaşan Deep Think, kod yürütme içeren ARC-AGI-2 testinde ise %45,1'lik rekor bir skorla daha önce karşılaşılmamış problemlerde üstün bir çözüm yeteneği sergiliyor. Bu mod, ilk aşamada güvenlik test uzmanlarının erişimine açılacak ve önümüzdeki haftalarda Ultra abonelerine sunulmaya başlanacak.

1 MİLYONLUK BAĞLAM PENCERESİ VE OTONOM YETENEĞİ

Gemini 3'ün en çarpıcı özelliklerinden biri de 1 milyon parçalık devasa bağlam penceresi. Bu sayede model, uzun akademik makalelerden ve video derslerden etkileşimli bilgi kartları oluşturabiliyor veya aile yadigarı el yazısı tarifleri farklı dillerden çevirerek dijital bir yemek kitabına dönüştürebiliyor.

Modelin temsilci (agent) yetenekleri ise günlük yaşamdan karmaşık iş akışlarına kadar pek çok alanda otonom çözümler vaat ediyor. Gemini 3, simüle edilmiş bir otomat işletmesini yöneterek uzun vadeli planlamayı test eden Vending-Bench 2’de liderliği elinde tutuyor. Bu yetenek, Gemini Agent ile birleşerek Gmail gelen kutusunu düzenleme veya yerel servislerden randevu oluşturma gibi çok adımlı görevlerin, kullanıcının kontrolü ve rehberliğinde baştan sona yürütülmesine olanak tanıyor.

GELİŞTİRİCİLERE ÖZEL YENİ PLATFORM: GOOGLE ANTİGRAVİTY

Yazılım geliştirme alanında da iddialı olan Gemini 3, WebDev Arena liderlik tablosunda 1487 Elo puanıyla zirveye yerleşen ve SWE-bench Verified testinde %76,2 başarı oranı yakalayan en iyi kodlama modeli olarak tanımlanıyor.

Google, bu yetenekleri geliştiri deneyimiyle buluşturmak için Google Antigravity adını verdiği yeni temsilci tabanlı geliştirme platformunu da duyurdu. Antigravity, yapay zeka yardımını bir araç olmaktan çıkarıp aktif bir iş ortağına dönüştürüyor. Platform, yapay zeka temsilcilerine editör, terminal ve tarayıcıya doğrudan erişim yetkisi vererek, temsilcilerin karmaşık yazılım görevlerini bağımsız olarak planlayıp yürütmesine olanak tanıyor.

ARAMA'YA DOĞRUDAN ENTEGRASYON VE GÜVENLİK VURGUSU

Google Arama, Gemini 3 entegrasyonundan doğrudan faydalanan bir diğer temel ürün oldu. Yapay Zeka Modu, ilk kez bir Gemini sürümünü lansman gününde doğrudan Arama’ya entegre ederek, sorguya özel sürükleyici görsel düzenler, etkileşimli araçlar ve simülasyonları anlık olarak oluşturuyor.

Güvenlik konusunda da iddialı olan şirket, Gemini 3'ün aşırı uyumluluk davranışında azalma gösterdiğini, istem enjeksiyonlarına karşı direncinin arttığını ve siber saldırılar yoluyla kötüye kullanıma karşı daha iyi koruma sağladığını belirtti. Model, bireysel kullanıcılar, geliştiriciler ve kurumsal müşteriler için farklı kanallardan erişime açılmış durumda.

Kaynak: Haber Merkezi

Reklam