Google 翻譯整合 Gemini 後,強化俚語與成語翻譯能力,並支援即時耳機口譯功能,提升語境理解與語意細節保留,讓跨語言溝通更自然流暢。
Google稍早宣布針對旗下搜尋與Google翻譯App推出基於Gemini AI模型的重大更新,讓翻譯結果可以更具「人味」,不僅能精準解讀帶有弦外之音的俚語 (Slang) 與成語,還針對耳機使用者推出了能保留說話者語氣的即時翻譯功能。
拒絕「機翻」感,Gemini幫你懂在地俚語
Google表示,透過導入Gemini模型,新的文字翻譯功能現在能處理更具「細微差別」 (nuanced meanings)的語句。過去翻譯App遇到口語化的俚語或習慣用語時,往往會給出令人啼笑皆非的直譯結果。而此次更新後,系統會將這些非正式用語納入考量,提供更自然、更符合當地情境的翻譯。
這項功能首波將在美國與印度推出,支援英文與其他約20種語言 (包含中文、德文、西班牙文與阿拉伯文等)之間的互譯,並且同步開放iOS、Android App與網頁版本更新。
耳機即時口譯:聽得懂口語中的「抑揚頓挫」
除了文字,語音翻譯也有更新。Google升級其語音對語音 (speech-to-speech)翻譯功能,讓使用者透過耳機就能聽到即時翻譯。
這項功能目前以Beta測試版形式先在美國地區的Android版翻譯App提供 (iOS版本預計明年推出),最大特色在於透過AI保留說話者的語氣、強調重點與抑揚頓挫 (cadence),讓使用者即使不用看畫面也能聽出對方是在生氣,或是在開玩笑,更清楚對話的流向。
而這項功能支援任何耳機 (不侷限Pixel Buds),並且支援超過70種語言。這似乎是有意與蘋果AirPods Pro 3的類似功能互別苗頭。
越來越像Duolingo?學語言功能再強化
Google似乎也想搶食語言學習市場的大餅。繼今年8月開始在翻譯App中加入AI輔助學習工具後,這次更新加入了類似Duolingo的「連續打卡」功能,系統會記錄使用者連續幾天進行語言練習,激勵使用者持之以恆 (但不知道是否會像Duolingo以情勒鳥形式持續「死纏爛打」。
此外,發音回饋功能也獲得改善,能提供更實用的發音建議。這套教育工具將擴大開放至德國、印度、瑞典等20個國家地區使用。
分析觀點:AI讓翻譯從「看懂」進化到「聽懂」
筆者觀察,Google近期對翻譯的關注度明顯提升,雖然很早就開始以AI技術提升翻譯功能,但近年藉由生成式AI技術,則是讓Google翻譯功能從過往機器翻譯表現,顯得更有「人味」,同時翻譯準確率也變得更高 (雖然還是有不少語言文化上的落差)。
而此次針對俚語與語氣翻譯的提升,可以看出Google正利用Gemini的優勢,試圖解決機器翻譯長久以來缺乏「語境」與「情緒」的痛點。當AI開始能聽懂你的弦外之音與語氣起伏,跨語言溝通的最後一道高牆或許真的快被推倒了。


