
Google, Gemini 3.5 Flash modeline computer use özelliğini entegre etti — model artık masaüstü, mobil ve tarayıcıda ekranı görüp yorumlayarak gerçek görevleri kendi başına tamamlayabiliyor.
Google, Gemini 3.5 Flash modeline computer use yeteneğini ekledi. Model artık masaüstü, mobil ve tarayıcı ortamlarında ekranı görüp yorumlayarak fare tıklaması, klavye girişi gibi gerçek aksiyonlar alabiliyor — yani sadece cevap üretmiyor, işi kendisi yapıyor.
Ne değişti
Önceki Gemini sürümleri ekran görüntüsünü analiz edip öneri sunabiliyordu, ama aksiyonu hâlâ kullanıcı alıyordu. Yeni entegrasyonla model bu döngüyü kendi içine alıyor: görevi planlıyor, ekranda neyin nerede olduğunu tespit ediyor, tıklıyor, yazıyor, sonucu kontrol ediyor. Google bunu özellikle uzun süreli agenti
insan gözetimi olmadan çok adımlı görevleri yürüten yapay zeka sistemi görevleri için öne çıkarıyor: sürekli yazılım testi, tekrarlayan veri girişi, bilgi işi otomasyonu gibi.
Kurumsal tarafta ne anlama geliyor
Google, bu güncellemeyi enterprise otomasyon senaryolarına özellikle işaret ederek duyurdu. Uzun ufuklu görevlerde performans artışı vurgulanıyor — yani model bir görevi birkaç adımda değil, onlarca adımda da tutarlı şekilde sürdürebiliyor. Bu, tool usei
modelin harici uygulama, API veya arayüzlerle etkileşime girerek görev tamamlaması kapasitesiyle birleşince Gemini'yi ciddi bir ajan platformu adayı yapıyor.

Computer use yarışı üç büyük arasında resmen kızıştı — herkes ekranı görüp tıklayan bir ajan peşinde. Google'ın burada avantajı Android ve Chrome'daki doğal erişimi; rakiplerin sanal masaüstü kurması gerekirken Google zaten o ekosistemin içinde. Ama ekranı görüp tıklamak her zaman güvenilir şekilde tıklamak demek değil — bu tür ajanların hata oranı prodüksiyonda hâlâ kritik bir mesele, özellikle ödeme veya silme gibi geri dönüşü olmayan aksiyonlarda.