Gemini 3.5 Live Translate 跟一般語音翻譯差在哪？

傳統系統採「輪流式」，得等講者說完整句才翻譯，中間有明顯停頓。Gemini 3.5 Live Translate 用連續語音生成技術，只落後說話者數秒就即時輸出，且保留原本的語調、節奏與音調，讓對話雙方的溝通體感接近自然對談，而非機器口譯。

開發者現在可以在哪裡試用 Gemini 3.5 Live Translate？

即日起可透過 Gemini Live API 與 Google AI Studio 的公開預覽版取得使用權限。企業用戶則需等待本月起的 Google Meet 私人預覽導入。消費端使用者可直接在 Android 與 iOS 版 Google Translate App 內體驗，無需額外申請。

支援多少語言？需要手動切換嗎？

支援 70 種以上語言，覆蓋逾 2,000 種語言組合。模型會自動辨識輸入語言，無需手動切換設定，這對雙方講不同語言、來回交錯的真實對話特別關鍵。相較 Google Meet 原本僅支援 5 種語言，這次擴展幅度相當大。

吵雜環境或訊號不穩時翻譯品質會掉嗎？

官方強調內建抗噪能力，可應對現實中吵雜或連線不穩的場景。東南亞叫車平台 Grab 正在測試此模型處理司機與乘客的多語溝通，其平台每月逾 1,000 萬通語音通話，車內背景噪音就是實測環境。實際導入前建議用目標場景的錄音樣本自行驗證。

整合 Gemini Live API 需要自己處理語音串流基礎設施嗎？

不用。Agora、LiveKit、Pipecat 這幾個開發者平台已整合 Gemini Live API，開發者可直接在其 SDK 上疊應用層，串流連線、封包處理、雙向音訊同步等底層邏輯由平台代管，能大幅縮短從原型到上線的時間。

適合哪些產品情境導入？哪些情境還不建議？

適合跨語言客服、跨境叫車、國際會議、多語直播翻譯等即時對話場景。若需要高精度筆譯、法律或醫療文件翻譯，仍建議走文字模型與人工複核流程。語音模型的優勢在流暢度與延遲，不在絕對字詞精準度。

評估要不要導入時，該優先測試什麼？

建議到 Google AI Studio 申請預覽版後，優先測兩件事：一是目標語言在你實際使用環境（如車內、店面、戶外）的抗噪表現；二是講者語調與情緒是否被保留，這直接影響客服或銷售場景的信任感。再依測試結果決定整合與否。

Gemini 3.5 即時語音翻譯功能上線，對話流暢自然不卡頓

📰 重點摘要

Google DeepMind 發布 Gemini 3.5 Live Translate，這是一款專為即時語音對語音翻譯設計的音訊模型。相較於傳統「等說完才翻」的輪流式系統，3.5 Live Translate 採用連續語音生成技術，在保留說話者語調、節奏與音調的同時，始終僅落後說話者數秒，讓對話流暢不中斷。模型能自動辨識 70 種以上語言，無需手動切換設定，並具備抗噪能力，可應對吵雜或不穩定的現實環境。

在部署範圍上，今日起開發者可透過 Gemini Live API 與 Google AI Studio 公開預覽版取得使用權限；企業用戶則從本月起以私人預覽形式導入 Google Meet，語言支援數從原本的 5 種大幅擴展至 70 種以上，同時覆蓋逾 2,000 種語言組合。消費端則同步在 Android 與 iOS 版 Google Translate 上線。

合作夥伴方面，東南亞叫車平台 Grab 正測試此模型，用於司機與乘客之間的多語即時溝通，其平台每月有超過 1,000 萬通語音通話需求。Agora、LiveKit、Pipecat 等開發者平台也已整合 Gemini Live API，協助開發者在不自行處理複雜串流基礎設施的前提下，快速打造語音翻譯應用。

💬 JudyAI Lab 觀點

Google DeepMind發布Gemini 3.5 Live Translate，採用連續語音生成技術，將翻譯延遲壓縮到僅落後說話者數秒，打破了過去「等說完才翻」的輪流式瓶頸，是語音AI從實驗場景走向日常對話的一個明顯轉折。

從這個案例，我們可以觀察到兩件事：第一，準確率已不再是語音翻譯的唯一指標，語調、節奏與音調的保留程度直接影響對話雙方的溝通體感，是過去多語產品常被忽略的設計細節。第二，底層串流基礎設施被封裝進API後，Agora、LiveKit、Pipecat這類平臺可以直接在上面疊應用，不用自己處理複雜串流邏輯；Grab每月逾1,000萬通語音通話的場景，也說明真實嘈雜環境的抗噪能力才是部署門檻的真正所在。70種語言、逾2,000種語言組合的覆蓋，讓多語切換不再是需要手動設定的邊緣需求。

如果你正在評估語音相關產品，現在可以到Google AI Studio申請Gemini Live API預覽版，重點測試抗噪能力與語調保留是否符合目標使用情境，再決定是否整合。

📅 原文資訊

發布時間：2026-06-09T15:16
來源原文：https://deepmind.google/blog/fluid-natural-voice-translation-with-gemini-35-live-translate/

Gemini 3.5 即時語音翻譯功能上線，對話流暢自然不卡頓

📰 重點摘要

💬 JudyAI Lab 觀點

📅 原文資訊

🔗 延伸閱讀

參考來源

📰 重點摘要#

💬 JudyAI Lab 觀點#

📅 原文資訊#

🔗 延伸閱讀#

參考來源#

訂閱 AI 週報，每週精選新知：

📰 重點摘要

💬 JudyAI Lab 觀點

📅 原文資訊

🔗 延伸閱讀

參考來源