前陣子,一位同傳翻譯員聲討科大訊飛“AI同傳造假”,在網上引起了軒然大波。人工智能和同傳翻譯由此成為大家熱議的話題。今天,我們來談一談“人工智能翻譯是否真的可以取代同傳翻譯員”?
同聲傳譯有多難?
同聲傳譯***早出現在一戰后的巴黎和會上,英法兩國代表借助同聲傳譯人員的幫助,完成了緊張的談判。
如今,該技術依然在國際會議上扮演著極其重要的角色。據統計,95%的國際會議都有***同聲傳譯人員助力。
同傳翻譯員在臺上能夠將同傳能力運用自如,需要平時大量的艱苦練習,即使是雙語運用自如的***人員,在實戰之前,也要進行數年的鍛煉。他們不僅需要事先學習、熟悉會議資料,還需要隨機應變的能力。同聲傳譯的工作方式也比較特殊,因為壓力巨大,一般多人協同,在一場數小時的過程中,每人輪流翻譯幾十分鐘。
相較之下,普通的口譯工作則要簡單不少。機器翻譯如能代替同聲傳譯無疑具有巨大的價值。
人工智能翻譯的水平如何?
那么,人工智能同傳翻譯的能力究竟怎樣?會不會搶走同傳翻譯員的飯碗呢?
今年上半年的博鰲亞洲論壇上,***出現了AI同傳。然而,現場配備的系統卻掉了鏈子,鬧出詞匯翻譯不準確、重復等低級錯誤。
客觀來講,人工智能或機器翻譯技術在自然語言處理上,的確有許多突破。這些突破給人希望,讓人暢想未來,但是,短期內的價值,更多體現在輔助翻譯等領域。
當然,目前機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離人工同傳以及高水平翻譯所講究的“信、達、雅”,還存在很大的差距。
目前的差距是由現有技術水平的***決定的,機器翻譯,又稱為自動翻譯,是利用計算機將一種語言轉換為另一種語言,機器翻譯技術的發展與計算機技術、信息論、語言學等學科的發展緊密相關。從早期的詞典匹配,到結合語言學專家梳理的知識規則,再到基于語料庫的統計學方法,隨著計算能力的提升和多語言信息的積累,機器翻譯技術開始在一些場景中提供便捷的翻譯服務。
新世紀以來,隨著互聯網的普及,互聯網公司紛紛成立機器翻譯研究組,研發了基于互聯網大數據的機器翻譯系統,從而使機器翻譯真正走向實用,市場上開始出現比較成熟的自動翻譯產品。近年來,隨著深度學習的進展,機器翻譯技術得到了進一步的發展,促進了翻譯質量的提升,使得翻譯更加地道、流暢。
機器翻譯的難點在哪里?
這里,簡單介紹一下機器翻譯的難點。整個機器翻譯的過程,可以分為語音識別轉換、自然語言分析、譯文轉換和譯文生成等階段。在此,以比較典型的、基于規則的機器同傳翻譯為例(參見下圖),模塊包含了:語音識別(語音轉換為文本)、自然語言處理(語法分析、語義分析)、譯文轉換、譯文生成和語音生成等模塊。其中的技術難點主要是:語音識別、自然語言處理和譯文轉換等步驟。