Ana Sayfa/Rehberler/Bilgisayarını Kullanabilen AI Ajanlar: 2…

Verimlilik

Bilgisayarını Kullanabilen AI Ajanlar: 2026'da Öne Çıkanlar ve Karşılaştırma

14 Haziran 2026

İlgili Araçlar

Perplexity Comet

Perplexity'in AI destekli tarayıcısı. Her sayfada araştırma yap, görevleri otomatikleştir, sekmeler arası özetle.

Claude Cowork

Anthropic'in masaüstü AI ajanı. Dosyalarınıza erişerek görevleri baştan sona tamamlar — siz sadece sonucu kontrol edersiniz.

Claude in Chrome

Claude'u doğrudan Chrome tarayıcınıza getiren Anthropic'in resmi uzantısı. Form doldurma, takvim yönetimi ve çok adımlı görev otomasyonu.

Manus AI

Bağımsız olarak karmaşık görevleri yerine getiren genel amaçlı bir AI asistanı.

LM Studio Bionic

Açık modellerle çalışan yerel AI ajanı. Kod projelerinde inline diff'le düzenleme yapıyor, Work modunda belge, sunum ve tablo üretiyor.

Computer-use AI ajanları nedir, hangisi işine yarar? Claude, ChatGPT Agent, Gemini, Manus, Comet, Copilot, LM Studio Bionic, openclaw ve açık kaynak UI-TARS — 2026 karşılaştırması ve güvenlik notları.

Bilgisayarını Kullanabilen AI Ajanlar: 2026'da Öne Çıkanlar ve Karşılaştırma

Bir AI'a "şu siteden uçak bileti bul, en ucuzunu sepete at" dediğinde artık sana link vermiyor — ekranını açıp fareyi kendi oynatıyor, butonlara basıyor, formu dolduruyor. Buna computer-useⁱAI'ın ekranı görüp fare-klavyeyle bilgisayarı insan gibi kullanması deniyor ve 2026'da AI dünyasının en hareketli alanı burası.

Mantık basit: model ekranın görüntüsünü alır, "şimdi ne yapmalıyım" diye karar verir, tıklar ya da yazar, sonra tekrar bakar. Buna vision-action loopⁱgör–karar ver–uygula döngüsü diyorlar. Bu döngünün güzelliği şu: bir programın API'si olmasa bile, ajan onu tıpkı senin gibi ekrandan kullanıyor — sadece arayüzü olan her programı.

Burada bir ayrım var, karıştırılıyor: tarayıcı ajanları sadece web sitelerinde gezer (browser-use). Asıl computer-use ajanları ise tüm masaüstünü kullanır — VS Code'u açar, dosya gezginini karıştırır, native uygulamalara girer. Üçüncü bir tür de büyüyor: ekranını devralmayan ama senin dosyalarınla, kendi sandbox'ında iş yapan yerel ajanlar. Aşağıda üçünü de durumuna göre ayırıyorum.

1. Claude: Computer Use, Chrome ve Cowork

Anthropic bu işi başlatan taraf. Computer Use'u API üzerinden Ekim 2024'te açtılar — bir kum havuzunda ekran görüntüsü alıp fare/klavye komutu üreten bir beta toolⁱhenüz deneysel, geliştiriciye yönelik özellik. Geliştirici işi; kullandıkça öde mantığında.

Günlük kullanıcı için asıl olay Claude in Chrome. Ağustos 2025'te research preview olarak çıktı, Aralık 2025'te tüm ücretli planlara açıldı. Tarayıcının yan panelinde duruyor, sen gezerken sayfayı okuyor, tıklıyor, gezdiriyor. Bir de Claude Cowork ve Claude Code var — bunlar senin kendi makinende dosyalarınla, terminalinle çalışıyor. Cowork 7 Temmuz 2026'dan itibaren web ve mobile de taşındı (hâlâ beta, önce Max abonelerinde), ama gerçek zamanlı bilgisayar/tarayıcı kontrolü hâlâ sadece masaüstünde.

Türkiye'den bakınca Claude bu listenin en kolay erişilen, en oturmuş seçeneği. Eklenti kurulumu dakikalar sürüyor, sürpriz yok.

[mindi_yorum]
💰 Claude for Chrome tüm ücretli planlarda. Pro yaklaşık $17–20/ay (Chrome'da Haiku 4.5), Max $100+/ay (Sonnet ve Opus 4.5 de seçilebiliyor). Computer Use API tarafında kullandıkça öde. Fiyatlar sık değişiyor, güncelini kontrol et.
🟢 En kolay başlanan seçenek — yan panelde, sen izlerken çalışıyor, ne yaptığını görüyorsun.
🟡 Free planda yok. Ajan yanlış sayfada yanlış butona basabilir; onay isteyen modda tut, başıboş bırakma.
🔵 İlk denemede düşük riskli iş ver: "şu sekmedeki tabloyu özetle" gibi. "Bir şey satın al" demeden önce güvenini kazansın.

2. OpenAI: Operator'dan ChatGPT Agent'a — ve şimdi ChatGPT Work

Güncelleme (9 Temmuz 2026): OpenAI, GPT-5.6 ile birlikte ChatGPT'ye üçüncü bir mod daha ekledi: ChatGPT Work. Aşağıdaki Operator/Agent tarihçesi hâlâ geçerli ama artık computer-use + araştırma + iş çıktısı üretimi Work modunda toplanıyor — ayrıntılı rehberimize bakabilirsin.

OpenAI'ın ilk computer-use ürünü Operator'dı — Chrome'u görüp tıklayan bir ajan. 2026'da bunu tek çatı altında topladılar: Operator + Deep Research + sohbet artık ChatGPT Agent olarak geliyor. Ayrı bir de Atlas adında kendi tarayıcıları var, içinde Agent Mode çalışıyor.

İşin acı tarafı fiyat. Tam ajan erişimi pratikte ChatGPT Pro ($200/ay) demek. Plus ($20/ay) planında agent mode var ama limitler ciddi iş için zorluyor. Nisan 2026'da araya $100/ay'lık bir orta Pro kademesi de girdi (Plus'ın 5 katı limit).

[mindi_yorum]
💰 Tam ajan erişimi pratikte Pro $200/ay. Plus $20/ay'da agent mode var ama limitli; Go $8/ay'da yok sayılır. 2026 fiyatları, değişebilir.
🟢 Arama, deep research ve bilgisayar kullanımı tek arayüzde birleşti — dağınıklık azaldı.
🟡 Operator bağımsız testlerde OSWorldⁱgerçek bilgisayar görevleriyle ajanları ölçen akademik test üzerinde %32.6 aldı. Yani işlerin çoğunu tek seferde bitiremiyor. Pahalı ve hâlâ deneysel.
🔵 $200'ü vermeden önce ChatGPT Plus'ta birkaç gerçek görevle dene; işine gerçekten yarıyor mu gör.

3. Google Gemini Agent

Google'ın bu alandaki prototipi Project Mariner'dı (Aralık 2024). Tarayıcını görüp formları dolduran, uçuş arayan bir web ajanıydı. Ama Google onu 4 Mayıs 2026'da ayrı ürün olarak kapattı.

Teknolojiyi çöpe atmadılar — Gemini Agent'a ve Chrome'un "auto-browse" özelliklerine taşıdılar. Yani Google'ın mesajı net: tarayıcı kontrolü ayrı bir ürün değil, bir özellik. Şu an Gemini Agent, Gemini 3.1 Pro ile çalışıyor ve doğrudan Google ekosistemine gömülü geliyor.

Gemini Spark (19 Mayıs 2026, I/O): Google bu işi bir adım öteye taşıdı. Spark senin cihazında değil, bulutta 7/24 çalışan bir kişisel ajan — telefonunu kapatsan bile arka planda işini sürdürüyor. Kendine ait bir Gmail adresi var, yani ajana mail atarak görev veriyorsun; Chrome üzerinden web'de geziniyor, Gmail, Takvim, Drive, Docs ve Maps ile doğrudan konuşuyor. Antigravity platformu üstünde, Gemini 3.5 Flash ile koşuyor.

Türkiye'den bakan için önemli not: Spark şimdilik yalnızca ABD'deki Google AI Ultra abonelerine ve seçili kurumsal kullanıcılara açık. Yani listedeki en iddialı ajanlardan biri ama henüz erişemiyoruz.

4. Manus AI: Kendi Linux Kutusunda Çalışan Ajan

Manus AI farklı bir mimari deniyor. Çoğu ajan tek model + sabit araç şeması kullanırken, Manus izole bir Linux sandboxⁱdış sistemden yalıtılmış güvenli çalışma alanı içinde birden fazla uzman ajan koşturuyor ve yürütücü ajan anlık Python yazıp istediği kütüphaneyi çağırabiliyor. Bu yüzden esnek.

Mart 2026'da çıkan masaüstü uygulamasındaki "My Computer" özelliğiyle terminal komutu çalıştırıyor, yerel dosyaları okuyor, kurulu geliştirici araçlarını kullanıyor (macOS ve Windows). Singapur merkezli, Çinli kurucuları olan bir şirket; Meta yaklaşık $2 milyarlık satın alma yaptı ama Çin düzenleyicisi 27 Nisan 2026'da anlaşmayı bloke etti.

Fiyat kredi bazlı: ücretsiz katmanda günde 300 kredi, sonra $20 (4.000 kredi), $40 (8.000) ve $200 (40.000) kademeleri.

5. Perplexity Comet

Eğer ihtiyacın sadece web'de gezen bir ajansa, daha hafif seçenekler var. Perplexity Comet Ekim 2025'te ücretsiz oldu, 2026'da iOS, Android, Mac ve Windows'ta yayıldı; otonom çoklu adım görevleri kendi tamamlıyor. Tek uyarı: otomatik alışveriş yeteneği yüzünden Amazon, Ocak 2026'da bu teknolojiye karşı ilk davayı açtı — yani hukuki zemin henüz oturmadı.

6. Microsoft Copilot Mode

Microsoft tarafında Copilot Mode hem Edge'de hem Chrome'da çalışıyor. Mantığı opt-in: her ajan eylemi izin istiyor ve ne yaptığını açıkça gösteriyor. 1 Mayıs 2026'da arayüzü yenilendi.

7. LM Studio Bionic: Yerel Modelle Çalışan Ajan

Yeni (16 Temmuz 2026). LM Studio Bionic listedeki diğerlerinden bir noktada ayrılıyor: ekranını devralmıyor. Fare oynatmak yerine senin makinende çalışan açık modellerle iş yapıyor — Code projesinde repo klasörünü gösteriyorsun, inline diff'le kodu düzenliyor; Work projesinde PDF, sunum ve tabloyu sandbox içinde işliyor, her adımda checkpoint alıyor.

Modeli nerede çalıştıracağın sana kalmış: kendi GPU'nda, LM Link ile evdeki güçlü makinede ya da LM Studio Secure Cloud'da. Voxtral sesli klavyesi transkripsiyonu tamamen cihazında yapıyor. Ücretsiz katman gerçek: yerel modeller, sesli transkripsiyon ve 5 cihaza kadar LM Link; bulut modelleri kredi ile.

Karşılığında iki taviz var — uygulama kapalı kaynak ve şu an initial preview'da. Ayrıntısı LM Studio Bionic rehberimizde.

8. openclaw: Topluluğun Kendi Ajanı

Bu listedeki tek gerçekten açık kaynak, gerçekten viral olan isim. Avusturyalı geliştirici Peter Steinberger'in Kasım 2025'te başlattığı proje (önce Clawdbot, sonra Moltbot adıyla) Ocak 2026'da patladı ve GitHub'ın en çok yıldızlanan projelerinden biri oldu.

Mantığı diğerlerinden farklı: openclaw kendi makinende sürekli çalışan kişisel bir ajan. Ekran görüntüsü alıp piksel düzeyinde tıklıyor, shell komutu çalıştırıyor, dosyalarını yönetiyor, web'de geziniyor. Üstüne WhatsApp ya da Telegram'dan mesaj atarak konuşuyorsun — yani ajan cebinde, iş bilgisayarında dönüyor. Yüzden fazla hazır AgentSkillⁱajana belirli bir işi öğreten hazır yetenek paketi ile yeteneklerini genişletiyorsun.

Yazılım MIT lisanslı ve bedava; ödediğin tek şey arkasına bağladığın modelin API faturası.

Ama madalyonun diğer yüzü ağır. Ocak 2026'da tek tıkla uzaktan kod çalıştırmaya izin veren bir açık bulundu (CVE-2026-25253): openclaw'ın yerel sunucusu WebSocket origin başlığını doğrulamıyordu, yani ziyaret ettiğin herhangi bir site çalışan ajanına sessizce bağlanabiliyordu. Sonrasında komut enjeksiyonu, SSRF ve dosya okuma açıkları da raporlandı. Dahası, güvenlik firmaları internete açık şekilde duran on binlerce openclaw örneği saydı — çoğu kimlik doğrulaması olmadan.

Kısacası: en özgür seçenek, aynı zamanda en çok dikkat isteyen seçenek. Kurulumu bir hafta sonu projesi gibi görünüyor ama makinenin tamamını bir ajana teslim ediyorsun. Güncel sürümü kullan, ajanı internete açık bırakma, hassas hesaplarını bağlamadan önce iki kez düşün.

Açık Kaynak: UI-TARS, Browser Use, Open Interpreter

Kendi makinende, kendi kontrolünde çalıştırmak istersen açık kaynak tarafı canlı.

ByteDance'in UI-TARS / Agent TARS projesi (Apache-2.0 lisans) Windows masaüstü otomasyonunda 2026'nın en güçlü açık kaynak seçeneği — özellikle yerel çalıştırmak için GPU'n varsa. Ekranı gören kendi vision-language modeliyle geliyor. Browser Use, sadece tarayıcı görevlerinde öne çıkıyor. Open Interpreter ise terminal tabanlı: kod çalıştırıp sistemini kullanıyor, GUI ve script işini karıştıran akışlarda iyi.

Avantajı: bedava ve veri senin makinende kalıyor. Bedeli: kurulum, bakım ve çoğu zaman bir GPU senin sırtında.

Hangisini Seçmeli?

Durumuna göre kısa yol:

Sadece web'de iş yaptıracaksan ve bütçe sıfırsa, Perplexity Comet ya da Microsoft Copilot Mode ile başla. Türkiye'den en pürüzsüz, en oturmuş deneyim için Claude in Chrome — küçük ücret, az sürpriz. Geliştiriciysen ve makinende dosya/terminal işi varsa Claude Cowork/Code veya Manus AI. Verini dışarı çıkarmadan, aboneliksiz çalışmak istiyorsan LM Studio Bionic — ekranını kullanmıyor ama dosya ve kod işini yerelde bitiriyor. Bütçe sınırsız ve OpenAI ekosistemindeysen ChatGPT Agent (ama $200 cebini yakar). Her şeyi kendi sunucunda, veri dışarı çıkmadan kontrol etmek istiyorsan açık kaynak UI-TARS. Kurcalamayı seviyor, güvenlik ayarlarını kendin yapacak kadar teknikse openclaw en özgür seçenek — ama sorumluluğu da sende.

Bu Ajanlara Ne Kadar Güvenmeli?

Dürüst olmak gerekirse: henüz tam güvenmemeli. OSWorld testinde insan başarısı ~%72 iken ajanlar bunun epey altında kalıyor. Yani bir ajan görevin yarısını parlak yapıp diğer yarısında duvara toslayabiliyor.

İki gerçek risk var. Birincisi prompt injectionibir web sayfasının içine gizlenmiş, ajanı kandırmaya çalışan komut — ajan kötü niyetli bir sayfadaki talimatı senin emrin sanabilir. İkincisi geri alınamaz eylemler: satın alma, mail gönderme, dosya silme. Amazon'un Comet'e açtığı dava da bu belirsizliğin habercisi. openclaw'da Ocak 2026'da bulunan tek tıkla kod çalıştırma açığı ve internete açık kalan on binlerce kurulum da bunun teorik bir korku olmadığını gösterdi.

Pratik kural: ajana her zaman onay isteyen modda çalıştır, finansal işlemleri ve silme eylemlerini kendin yap, ve "şunu satın al / şu maili gönder" gibi komutları gözün ekranın başındayken ver.

Nereden Başlamalı?

Bu alana ilk adımı atacaksan sırayla şunu yap:

İlk olarak elindeki ücretli AI aboneliğini kontrol et — Claude Pro veya ChatGPT Plus'ın varsa ajan özelliği zaten cebinde, ekstra ödeme yok. İkinci olarak Claude in Chrome ya da Comet'i kurup tek, düşük riskli bir görev ver: bir tabloyu özetlet, bir formu doldurt, ama parasal bir şey yaptırma. Üçüncü olarak ajanın her adımını izle; nerede takıldığını, nerede yanlış tıkladığını gör — bu sana neye güvenip neye güvenmeyeceğini öğretir. Güvenin oturduğunda görevleri büyüt.

Bu teknoloji daha bebeklik döneminde ama yönü net: yakında "bunu benim yerime hallet" demek standart hale gelecek.