——2018機(jī)器翻譯(成都)論壇側(cè)記
2018年5月26-27日,2018年機(jī)器翻譯論壇首次線下活動(成都論壇)在成都召開,來自2018機(jī)器翻譯論壇在中國成都召開,5月26-27日為期兩天的線下交流活動吸引了來自國內(nèi)翻譯語言行業(yè)的頂尖大學(xué)學(xué)者與公司代表們參與。
東北大學(xué)、澳門大學(xué)、大連理工大學(xué)、蘇州大學(xué)、廣外、廈門大學(xué)、香港城市大學(xué)、西湖大學(xué)、阿里達(dá)摩院、科大訊飛、奇虎360、搜狗、騰訊、網(wǎng)易、云譯科技等機(jī)器翻譯技術(shù)研發(fā)機(jī)構(gòu)以及四川語言橋、廈門精藝達(dá)等十余家國內(nèi)著名的語言服務(wù)企業(yè)共計(jì)50多名代表出席,一起熱議機(jī)器翻譯的技術(shù)發(fā)展方向及應(yīng)用落地場景。
“機(jī)器翻譯論壇”由小牛翻譯團(tuán)隊(duì)于2016年發(fā)起,旨在聚集國內(nèi)機(jī)器翻譯研究學(xué)者、機(jī)器翻譯技術(shù)開發(fā)者、機(jī)器翻譯需求方等多個(gè)領(lǐng)域的代表,對機(jī)器翻譯技術(shù)發(fā)展與應(yīng)用場景進(jìn)行深入研討,迄今已經(jīng)分別成功舉辦了2016年沈陽、2017年大連兩屆年度論壇,已發(fā)展成為國內(nèi)最大的機(jī)器翻譯產(chǎn)學(xué)研交流平臺。
此次機(jī)器翻譯(成都)論壇由小牛翻譯和語言橋聯(lián)合主辦,云譯科技提供了贊助支持,共有35家單位的42名代表出席,分為“技術(shù)與應(yīng)用報(bào)告”與“自由研討”兩個(gè)部分,機(jī)器翻譯報(bào)告部分由大連理工大學(xué)黃德根教授主持,廣東外語外貿(mào)大學(xué)宋柔教授、阿里達(dá)摩院陳博興博士、新加坡技術(shù)與設(shè)計(jì)大學(xué)/西湖大學(xué)張?jiān)啦┦俊⒖拼笥嶏w劉俊華博士、廈門大學(xué)蘇勁松博士、網(wǎng)易見外劉鵬博士、搜狗翟飛飛博士、廈門精藝達(dá)韋忠和董事長分別作了精彩的報(bào)告,為大家勾勒出如下有關(guān)機(jī)器翻譯技術(shù)發(fā)展方向與應(yīng)用落地場景的新“畫像”:
機(jī)器翻譯技術(shù)發(fā)展越來越快
自神經(jīng)機(jī)器翻譯技術(shù)在2013年被提出以來,機(jī)器翻譯已經(jīng)從統(tǒng)計(jì)機(jī)器翻譯時(shí)代全面轉(zhuǎn)向神經(jīng)機(jī)器翻譯時(shí)代,2016年起神經(jīng)機(jī)器翻譯在產(chǎn)業(yè)界的應(yīng)用開始爆發(fā),神經(jīng)機(jī)器翻譯模型結(jié)構(gòu)進(jìn)化、異步雙向解碼技術(shù)、數(shù)據(jù)增強(qiáng)技術(shù)、譯文后處理和外部知識干預(yù)等技術(shù),以及基于graph的自然語言處理技術(shù),讓機(jī)器譯文質(zhì)量不斷提高,可用性越來越強(qiáng)。
機(jī)器翻譯應(yīng)用場景越來越豐富
隨著跨語言海量信息快速交互需求的不斷增加,機(jī)器翻譯技術(shù)成為大數(shù)據(jù)翻譯唯一可行解決方案,各種機(jī)器翻譯應(yīng)用層出不窮,目前全球每天機(jī)器翻譯服務(wù)提供的在線翻譯量已經(jīng)達(dá)到了1萬億詞的規(guī)模。機(jī)器翻譯+行業(yè)、機(jī)器翻譯技術(shù)+圖像技術(shù)/語音技術(shù),推動了語音同傳翻譯、視頻翻譯等產(chǎn)品一波又一波的發(fā)展,從亞馬遜到阿里等跨境電商,從Facebook到微信等在線社交平臺,從訊飛的語音翻譯機(jī)、搜狗的多語搜索、網(wǎng)易的視頻翻譯,甚至在語言服務(wù)業(yè),也已經(jīng)有超過50%的翻譯公司和個(gè)人在使用機(jī)器翻譯。
人機(jī)結(jié)合,優(yōu)勢互補(bǔ)
雖然機(jī)器翻譯目前可以很好地滿足網(wǎng)頁瀏覽等“可讀性”翻譯需求,但離“優(yōu)質(zhì)”翻譯需求的距離還很遠(yuǎn)。廣外的宋柔教授指出,從語法角度看,由于機(jī)器還無法識別復(fù)雜中文句子的內(nèi)部邏輯關(guān)系,對于存在多個(gè)“小句復(fù)合體”的中文句子,機(jī)器明顯“心有余力不足”。為了得到高質(zhì)量機(jī)器譯文,還需要做更多“譯前編輯”“譯后編輯”等工作。“2017年全球語言服務(wù)市場規(guī)模達(dá)到430億美元,近幾年一直以10%的速度在穩(wěn)步增長”這一事實(shí)也說明,雖然采用機(jī)器翻譯提高效率、降低成本已經(jīng)是大勢所趨,但是人機(jī)結(jié)合、優(yōu)勢互補(bǔ),仍將會是一個(gè)長期存在。
報(bào)告結(jié)束之后的“自由研討”由小牛翻譯創(chuàng)始人朱靖波教授主持,討論中技術(shù)專家與技術(shù)愛好者唇槍舌劍,交流的主要話題涉及到:在機(jī)器翻譯引擎開發(fā)方面,機(jī)器翻譯開發(fā)者與用戶需要如何合作,實(shí)現(xiàn)通過用戶反饋來幫助改進(jìn)機(jī)器譯文質(zhì)量及友好功能;在機(jī)器譯文質(zhì)量評價(jià)方面,傳統(tǒng)的BLEU/NIST等自動評價(jià)指標(biāo)不足以滿足評價(jià)需求、人工評價(jià)存在著代價(jià)高、容易產(chǎn)生不一致評價(jià)結(jié)果的情況下,應(yīng)該采用哪些方法?比如可以采用眾包評價(jià)的方式,而在電商機(jī)器翻譯評價(jià)上,可以采用用戶訪問率、用戶下單率是否提高等方式來做評價(jià);在高質(zhì)量訓(xùn)練語料構(gòu)建方面,除了基于正則表達(dá)式進(jìn)行數(shù)據(jù)清洗之外,是否可以用神經(jīng)網(wǎng)絡(luò)來自動生成清洗規(guī)則;在語言資源與技術(shù)共享方面,如何建立語言服務(wù)公司與機(jī)器翻譯公司互利共贏的行業(yè)生態(tài)。
此外,大家還討論了在機(jī)器翻譯引擎構(gòu)建方面,如何采用遷移學(xué)習(xí)技術(shù)、無監(jiān)督及半監(jiān)督的機(jī)器學(xué)習(xí)技術(shù),進(jìn)行資源稀缺性語言/垂直領(lǐng)域的機(jī)器翻譯引擎研發(fā);在機(jī)器翻譯與高校翻譯教育方面,如何破解“機(jī)器翻譯與人工翻譯”的迷局?人工譯員真的需要擔(dān)心失業(yè)么?
對于上述最后一個(gè)問題,阿里達(dá)摩院陳博興博士表示,“機(jī)器翻譯的量過去5年至少翻了兩翻,但人工翻譯的市場每年也保持了10%的增長速度。在不可逆轉(zhuǎn)的全球化進(jìn)程中,機(jī)器翻譯和人工翻譯都有大量的機(jī)會。對于譯員而言,要不斷提高自身翻譯水平,也要學(xué)會利用機(jī)器翻譯提高工作效率,否則,淘汰你的不是機(jī)器,而是那些會利用機(jī)器的同行。”
2018機(jī)器翻譯論壇在成都圓滿落幕,來自國內(nèi)行業(yè)內(nèi)的專家學(xué)者針對機(jī)器翻譯相關(guān)的多個(gè)問題進(jìn)行總結(jié)匯報(bào),取得了豐碩的成就。對機(jī)器翻譯如何與多產(chǎn)業(yè)結(jié)合,如何更好的落地服務(wù)有了更加直觀的答案,此次論壇也將對我國機(jī)器翻譯產(chǎn)業(yè)起到積極地推動作用。