- 說明
-
分類:資訊
-
-
點擊數(shù):2723
出國旅游語言不通怎么辦?來個XX翻譯機讓你從此暢通無阻。相信很多人都看過類似的智能翻譯機廣告,仿佛小時候看哆啦A夢里的?翻譯蒟蒻道具已成為現(xiàn)實,但在筆者看來,受制于語音識別精度及機器翻譯能力的不足,目前這些所謂的智能翻譯機全是扯淡。
6年前筆者研究生畢業(yè)時,曾邀請母上大人來美國參加畢業(yè)典禮順帶玩了一圈,回來之后母上大人就開始時不時看看旅游常用短句之類的書計劃未來跟朋友一起來個海外自由行。但無奈歲數(shù)大了,記憶力下降嚴重,這么多年過去母上大人的英文并沒有太大長進,所以作為兒子,筆者一直很希望智能翻譯技術能有所突破,好幫助母上大人實現(xiàn)環(huán)游世界的夢想。
這兩年人工智能概念火熱,而翻譯作為一個重要的剛需自然得到大量公司的青睞,從翻譯軟件到翻譯網(wǎng)站再到翻譯手機、翻譯機的產品層出不窮,價格從一兩百到幾千不等。各家都將“人工智能”四個大字當做金字招牌來用于自家產品的宣傳,而各路媒體也在旁煽風點火,大有人工智能技術將一統(tǒng)江山,翻譯人員全要下崗的態(tài)勢。
如果對智能翻譯技術不太了解的小白很容易就被這樣的宣傳所蠱惑,但實際上,如果對行業(yè)稍微有點了解就能知道這些產品目前還遠達不到用戶所期待的交流無礙這個標準。
從實現(xiàn)方案來說,分為離線和在線兩種。離線顧名思義有點類似小時候用的那種電子詞典,缺點是詞匯量和參考翻譯都有局限性。在線的則是借助云計算和搜索引擎,缺點是沒了網(wǎng)基本就快廢了。
從功能分工來看,智能翻譯分為兩方面:一個是語音識別 ,一個是智能翻譯。所以對于所有智能翻譯機的第一道門檻就是語音識別的精確度,事實就是來說,在這方面,人工智能算法的引入及發(fā)展確實讓精確度得到了一個質的飛躍。
?根據(jù)公開資料顯示,借助訓練過得神經(jīng)網(wǎng)絡系統(tǒng),谷歌的單次錯誤識別率開始大幅下降,2013年時還高達23%,而2017年時已降到4.9%,而谷歌的兩大對手IBM和微軟在2017年的表現(xiàn)分別是5.5%和5.1%,這個成績同人類相比如何呢?根據(jù)報告可知,用英語做日常用語的人類語音識別錯誤率在5%左右,所以谷歌、微軟和IBM的成績在英語國家已堪比人類。在中文方面,科大訊飛今年公布信息宣布語音識別準確率已達到98%,搜狗和百度則是97%(今年兩者信息沒有更新)。
從數(shù)據(jù)來看,語音識別精確度的問題已不嚴重,但從實際應用來說,依然不盡如人意,一方面是遠場語音識別非常容易受到噪音干擾影響準確率(你總不能舉著翻譯機湊到對方嘴邊吧?),另一方面則是一音多字或者多詞的問題難以解決。
眾所周知,中文的一音多字情況非常普遍,而智能翻譯的原理是先將語音識別為正確的文字,然后再從文字轉換到希望翻譯的語言,當出現(xiàn)一些專有名詞或者句子過于簡短的時候,中文的識別錯誤率都會大幅攀升,就比如姓名。?別說機器,就算是我們自己如果脫離語境單純聽都能聽錯,否則相聲里的包袱怎么來的?
?當然,語音識別精確度并不是最大的攔路虎,真正的挑戰(zhàn)還在于智能翻譯。每當討論到這個話題時,筆者的回答永遠是:什么時候在線翻譯軟件能把文檔翻譯利索了,什么時候智能語音翻譯就能實現(xiàn)。如果100%精確度的文檔都沒翻譯對,還談什么語音翻譯?
客觀來說,中文由于過于博大精深,因此我們不能苛求翻譯機實現(xiàn)100%的準確率,但在筆者看來,在技術不成熟的情況下進行夸張的宣傳短期內確實可以促進銷量,可從長期來看,這很有可能讓消費者未來對此類產品的不信任感不斷加深,而這顯然不是行業(yè)參與者們所愿意看到的。所以筆者還是那句話,適當夸張宣傳可以,但別過度忽悠消費者,否則最終砸的還是自己的飯碗。
?