
Google yeni bir ses modeli çıkardı: Gemini 3.5 Live Translate, 70'ten fazla dili otomatik algılayıp konuşmacının ton ve vurgusunu koruyarak neredeyse gerçek zamanlı çeviri yapıyor.
Google, canlı konuşma çevirisi için özel eğitilmiş yeni bir ses modelini duyurdu: Gemini 3.5 Live Translate. Model 70'in üzerinde dili otomatik tespit ediyor, konuşmacının doğal tonlamasını koruyor ve klasik çeviri araçlarındaki o garip bekleme ve duraklama hissini büyük ölçüde ortadan kaldırıyor.
Nasıl çalışıyor
Live Translate, konuşmayı metne çevirip sonra tekrar sese dönüştüren klasik speech-to-texti
ses kaydını yazılı metne dönüştüren işlem → çeviri → text-to-speechi
yazılı metni doğal sese dönüştüren işlem zincirini tek bir modelde birleştiriyor. Bu da gecikmeyi düşürüyor ve konuşmanın akışını koruyor — çok dilli toplantılarda, seyahatte ya da telefon görüşmelerinde ardışık çeviri yerine neredeyse eşzamanlı bir deneyim vaat ediyor.
Nerede kullanılabiliyor
Model şimdilik Gemini Live API, Google AI Studio ve Google Translate uygulamasına dağıtılıyor. Google, özellikle çok dilli iş toplantıları ve seyahat senaryolarını örnek gösteriyor.

Simültane çeviri motorları uzun süredir neredeyse gerçek zamanlı diyor ama gerçek konuşma temposunu — kesme, tekrar, yarım kalan cümle — yakalamak zor bir problem. 70'in üzerinde dil iddiası etkileyici ama asıl soru düşük kaynaklı dillerde kalitenin ne durumda olduğu; İngilizce-İspanyolca demoları her zaman parlak görünür. Türkçe'de nasıl performans gösterdiğini görmeden heyecanlanmak erken.