Atoms ile kod yazmadan uygulama kur — AI ekibin senin için planlasın, kodlasın, deploy etsindene →
Ana Sayfa/Rehberler/Bilgisayarını Kullanabilen AI Ajanlar: 2
Verimlilik

Bilgisayarını Kullanabilen AI Ajanlar: 2026'da Öne Çıkanlar ve Karşılaştırma

14 Haziran 2026
Bilgisayarını Kullanabilen AI Ajanlar: 2026'da Öne Çıkanlar ve Karşılaştırma

Computer-use AI ajanları nedir, hangisi işine yarar? Claude, ChatGPT Agent, Gemini, Manus ve açık kaynak UI-TARS — 2026 itibarıyla karşılaştırma ve güvenlik notları.

Bilgisayarını Kullanabilen AI Ajanlar: 2026'da Öne Çıkanlar ve Karşılaştırma

Bir AI'a "şu siteden uçak bileti bul, en ucuzunu sepete at" dediğinde artık sana link vermiyor — ekranını açıp fareyi kendi oynatıyor, butonlara basıyor, formu dolduruyor. Buna computer-useiAI'ın ekranı görüp fare-klavyeyle bilgisayarı insan gibi kullanması deniyor ve 2026'da AI dünyasının en hareketli alanı burası.

Mantık basit: model ekranın görüntüsünü alır, "şimdi ne yapmalıyım" diye karar verir, tıklar ya da yazar, sonra tekrar bakar. Buna vision-action loopigör–karar ver–uygula döngüsü diyorlar. Bu döngünün güzelliği şu: bir programın API'si olmasa bile, ajan onu tıpkı senin gibi ekrandan kullanıyor — sadece arayüzü olan her programı.

Burada bir ayrım var, karıştırılıyor: tarayıcı ajanları sadece web sitelerinde gezer (browser-use). Asıl computer-use ajanları ise tüm masaüstünü kullanır — VS Code'u açar, dosya gezginini karıştırır, native uygulamalara girer. Aşağıda iki türü de durumuna göre ayırıyorum.


Claude: Computer Use, Chrome ve Cowork

Anthropic bu işi başlatan taraf. Computer Use'u API üzerinden Ekim 2024'te açtılar — bir kum havuzunda ekran görüntüsü alıp fare/klavye komutu üreten bir beta toolihenüz deneysel, geliştiriciye yönelik özellik. Geliştirici işi; kullandıkça öde mantığında.

Günlük kullanıcı için asıl olay Claude in Chrome. Ağustos 2025'te research preview olarak çıktı, Aralık 2025'te tüm ücretli planlara açıldı. Tarayıcının yan panelinde duruyor, sen gezerken sayfayı okuyor, tıklıyor, gezdiriyor. Bir de Claude Cowork ve Claude Code var — bunlar senin kendi makinende dosyalarınla, terminalinle çalışıyor.

Türkiye'den bakınca Claude bu listenin en kolay erişilen, en oturmuş seçeneği. Eklenti kurulumu dakikalar sürüyor, sürpriz yok.

[mindi_yorum]
💰 Claude for Chrome tüm ücretli planlarda. Pro yaklaşık $17–20/ay (Chrome'da Haiku 4.5), Max $100+/ay (Sonnet ve Opus 4.5 de seçilebiliyor). Computer Use API tarafında kullandıkça öde. Fiyatlar sık değişiyor, güncelini kontrol et.
🟢 En kolay başlanan seçenek — yan panelde, sen izlerken çalışıyor, ne yaptığını görüyorsun.
🟡 Free planda yok. Ajan yanlış sayfada yanlış butona basabilir; onay isteyen modda tut, başıboş bırakma.
🔵 İlk denemede düşük riskli iş ver: "şu sekmedeki tabloyu özetle" gibi. "Bir şey satın al" demeden önce güvenini kazansın.


OpenAI: Operator'dan ChatGPT Agent ve Atlas'a

OpenAI'ın ilk computer-use ürünü Operator'dı — Chrome'u görüp tıklayan bir ajan. 2026'da bunu tek çatı altında topladılar: Operator + Deep Research + sohbet artık ChatGPT Agent olarak geliyor. Ayrı bir de Atlas adında kendi tarayıcıları var, içinde Agent Mode çalışıyor.

İşin acı tarafı fiyat. Tam ajan erişimi pratikte ChatGPT Pro ($200/ay) demek. Plus ($20/ay) planında agent mode var ama limitler ciddi iş için zorluyor. Nisan 2026'da araya $100/ay'lık bir orta Pro kademesi de girdi (Plus'ın 5 katı limit).

[mindi_yorum]
💰 Tam ajan erişimi pratikte Pro $200/ay. Plus $20/ay'da agent mode var ama limitli; Go $8/ay'da yok sayılır. 2026 fiyatları, değişebilir.
🟢 Arama, deep research ve bilgisayar kullanımı tek arayüzde birleşti — dağınıklık azaldı.
🟡 Operator bağımsız testlerde OSWorldigerçek bilgisayar görevleriyle ajanları ölçen akademik test üzerinde %32.6 aldı. Yani işlerin çoğunu tek seferde bitiremiyor. Pahalı ve hâlâ deneysel.
🔵 $200'ü vermeden önce ChatGPT Plus'ta birkaç gerçek görevle dene; işine gerçekten yarıyor mu gör.


Google Gemini Agent

Google'ın bu alandaki prototipi Project Mariner'dı (Aralık 2024). Tarayıcını görüp formları dolduran, uçuş arayan bir web ajanıydı. Ama Google onu 4 Mayıs 2026'da ayrı ürün olarak kapattı.

Teknolojiyi çöpe atmadılar — Gemini Agent'a ve Chrome'un "auto-browse" özelliklerine taşıdılar. Yani Google'ın mesajı net: tarayıcı kontrolü ayrı bir ürün değil, bir özellik. Şu an Gemini Agent, Gemini 3.1 Pro ile çalışıyor ve doğrudan Google ekosistemine gömülü geliyor.


Manus AI: Kendi Linux Kutusunda Çalışan Ajan

Manus AI farklı bir mimari deniyor. Çoğu ajan tek model + sabit araç şeması kullanırken, Manus izole bir Linux sandboxidış sistemden yalıtılmış güvenli çalışma alanı içinde birden fazla uzman ajan koşturuyor ve yürütücü ajan anlık Python yazıp istediği kütüphaneyi çağırabiliyor. Bu yüzden esnek.

Mart 2026'da çıkan masaüstü uygulamasındaki "My Computer" özelliğiyle terminal komutu çalıştırıyor, yerel dosyaları okuyor, kurulu geliştirici araçlarını kullanıyor (macOS ve Windows). Singapur merkezli, Çinli kurucuları olan bir şirket; Meta yaklaşık $2 milyarlık satın alma yaptı ama Çin düzenleyicisi 27 Nisan 2026'da anlaşmayı bloke etti.

Fiyat kredi bazlı: ücretsiz katmanda günde 300 kredi, sonra $20 (4.000 kredi), $40 (8.000) ve $200 (40.000) kademeleri.


Tarayıcı Ajanları: Comet ve Copilot

Eğer ihtiyacın sadece web'de gezen bir ajansa, daha hafif seçenekler var. Perplexity Comet Ekim 2025'te ücretsiz oldu, 2026'da iOS, Android, Mac ve Windows'ta yayıldı; otonom çoklu adım görevleri kendi tamamlıyor. Tek uyarı: otomatik alışveriş yeteneği yüzünden Amazon, Ocak 2026'da bu teknolojiye karşı ilk davayı açtı — yani hukuki zemin henüz oturmadı.

Microsoft tarafında Copilot Mode hem Edge'de hem Chrome'da çalışıyor. Mantığı opt-in: her ajan eylemi izin istiyor ve ne yaptığını açıkça gösteriyor. 1 Mayıs 2026'da arayüzü yenilendi.


Açık Kaynak: UI-TARS, Browser Use, Open Interpreter

Kendi makinende, kendi kontrolünde çalıştırmak istersen açık kaynak tarafı canlı.

ByteDance'in UI-TARS / Agent TARS projesi (Apache-2.0 lisans) Windows masaüstü otomasyonunda 2026'nın en güçlü açık kaynak seçeneği — özellikle yerel çalıştırmak için GPU'n varsa. Ekranı gören kendi vision-language modeliyle geliyor. Browser Use, sadece tarayıcı görevlerinde öne çıkıyor. Open Interpreter ise terminal tabanlı: kod çalıştırıp sistemini kullanıyor, GUI ve script işini karıştıran akışlarda iyi.

Avantajı: bedava ve veri senin makinende kalıyor. Bedeli: kurulum, bakım ve çoğu zaman bir GPU senin sırtında.


Hangisini Seçmeli?

Durumuna göre kısa yol:

Sadece web'de iş yaptıracaksan ve bütçe sıfırsa, Perplexity Comet ya da Microsoft Copilot Mode ile başla. Türkiye'den en pürüzsüz, en oturmuş deneyim için Claude in Chrome — küçük ücret, az sürpriz. Geliştiriciysen ve makinende dosya/terminal işi varsa Claude Cowork/Code veya Manus AI. Bütçe sınırsız ve OpenAI ekosistemindeysen ChatGPT Agent (ama $200 cebini yakar). Her şeyi kendi sunucunda, veri dışarı çıkmadan kontrol etmek istiyorsan açık kaynak UI-TARS.


Bu Ajanlara Ne Kadar Güvenmeli?

Dürüst olmak gerekirse: henüz tam güvenmemeli. OSWorld testinde insan başarısı ~%72 iken ajanlar bunun epey altında kalıyor. Yani bir ajan görevin yarısını parlak yapıp diğer yarısında duvara toslayabiliyor.

İki gerçek risk var. Birincisi prompt injectionibir web sayfasının içine gizlenmiş, ajanı kandırmaya çalışan komut — ajan kötü niyetli bir sayfadaki talimatı senin emrin sanabilir. İkincisi geri alınamaz eylemler: satın alma, mail gönderme, dosya silme. Amazon'un Comet'e açtığı dava da bu belirsizliğin habercisi.

Pratik kural: ajana her zaman onay isteyen modda çalıştır, finansal işlemleri ve silme eylemlerini kendin yap, ve "şunu satın al / şu maili gönder" gibi komutları gözün ekranın başındayken ver.


Nereden Başlamalı?

Bu alana ilk adımı atacaksan sırayla şunu yap:

İlk olarak elindeki ücretli AI aboneliğini kontrol et — Claude Pro veya ChatGPT Plus'ın varsa ajan özelliği zaten cebinde, ekstra ödeme yok. İkinci olarak Claude in Chrome ya da Comet'i kurup tek, düşük riskli bir görev ver: bir tabloyu özetlet, bir formu doldurt, ama parasal bir şey yaptırma. Üçüncü olarak ajanın her adımını izle; nerede takıldığını, nerede yanlış tıkladığını gör — bu sana neye güvenip neye güvenmeyeceğini öğretir. Güvenin oturduğunda görevleri büyüt.

Bu teknoloji daha bebeklik döneminde ama yönü net: yakında "bunu benim yerime hallet" demek standart hale gelecek.