1.機器口譯的基本概念
相對于機器翻譯,機器口譯是一個相對陌生的概念。機器口譯(MI),又稱“口語翻譯”(Spoken Language Translation,SLT)、“語音機器翻譯”(Speech-to-Speech MT)或“自動口譯”(AutomatedInterpretation),是指讓計算機實現從一種語言的語音到另一種語言的語音自動翻譯的過程(瑞諾爾, 2010)。其理想目標是讓計算機像人一樣在持不同語言的說話人之間充當口譯員的角色。會議演講、交談(通過電話、網絡或面對面交流)、廣播等場景下的話語翻譯都是機器口譯應用的重要領域。
機器口譯可分解為三個步驟:一是語音識別,即機器通過軟件接收說話人的語音,然后將其識別轉化為文字;二是語言轉換,即機器翻譯程序對文本進行加工轉譯;三是語音合成,即機器將譯文自動形成目的語語音輸出。因此,機器口譯包含三項核心技術:語音識別、機器翻譯和語音合成。
與機器翻譯一樣,人們常把機器口譯與計算機輔助口譯(CAI)或“機助口譯”混為一談。機器口譯是全自動口譯,無需人工輔助,例如各種在線語音翻譯系統、口語翻譯機、口譯機器人、自動口譯電話等。計算機輔助口譯則指譯員在計算機的輔助之下完成口譯任務。計算機輔助口譯的原理是:計算機快速識別源語語音,然后將識別的內容進行機器翻譯,最后將譯文呈現在屏幕上,供譯員參考。不難看出,最后的譯文是顯示在屏幕上供譯員參考還是轉換成語音由機器播出,這是機器口譯與計算機輔助口譯的根本區別之所在。
2. 機器口譯的優缺點
機器口譯有著人工口譯難以企及的一系列優點:
一是成本低。人工口譯培養周期長、難度大、費用高,特別是同傳,國際會議上每個語種往往需要安排兩名譯員,人力和開支要求均比較高;機器口譯使用成本低,有的甚至完全免費。
二是效率高。人工口譯費時、費事、效率低下,還時常出現翻譯盲點,且譯員受體力、腦力和能力的限制,難以長時間、不間斷、高強度地工作,特別是同傳;機器口譯速度快、效率高,不會疲勞,且受海量數據支持,學習快,無翻譯盲點,可以大大提高翻譯效率和同傳準確性。
三是使用方便。人工口譯難找,特別是非通用語種;機器口譯不受語種和時空的限制,一個系統可同時安裝幾種、幾十種甚至幾百種語言互譯,因而方便、快捷、省事,尤其是準確性要求不高的口譯。此外,國際會議上同傳設備使用麻煩,同傳接收機經常不夠用,且容易丟失,引發糾紛;機器口譯相對簡便,只需在智能手機或平板電腦上安裝一個應用軟件即可收聽同傳或者進行交談。
當然,機器口譯也存在著一系列缺點,主要瓶頸有兩個:
一是語音識別軟件尚不完美。語音識別的準確性與說話人的口語質量和周圍環境密切相關。目前,多數語音翻譯系統和應用軟件只能識別語速不快、發音規范、前后連貫的語句。假如說話人語速很快,講話不連貫,或者講方言、帶口音、吐字不清、發音錯誤、使用同音字,語音識別系統就會出錯。同時,環境噪聲(背景噪聲、背景語音、混響、回聲、多人講話)、信道噪聲(麥克風調整、電話調整、電話蜂音)、網絡連接不暢、說話人距離遠,都會嚴重降低語音識別的準確率。
二是機器翻譯不夠準確。機器算法無法理解和翻譯語言文學性,包括文化、語境、語法和情感。人類語言非常復雜,許多詞語是多義的,具體意思取決于特定的語境。機器翻譯常常忽略上下文來翻譯詞句,也不遵守語法,因而譯文生硬,常常伴有語法和語序錯誤,準確性和流暢性較差。目前,機器翻譯還基本停留在表層結構的句法分析之上,無法像人腦一樣理解意義、區分情感色彩和文化差異,因而無法識別和傳達語言的深層含義、言外之意和文化元素(包括幽默和隱喻)。