google神經機械翻譯(gnmt)將中文句子翻譯成英文句子的過程,透過編碼器 (encoder),起首,gnmt將中文句子的每一個單詞進行向量(vector)編碼,而每一個向量將顯示出今朝為止單詞被讀取到的所成心義。
留意 (attention)功能是為了每一步都產出准確的詞,解碼器將針對編碼中文向量裡最相關的英文單詞權重分布(weighted distribution)進行解碼。
其實不只簡體中文、繁體中文的語法溝通,他透露,日文、韓文在機器翻譯上也可算是語法相同,用統一套系統翻譯
他認為,雖然簡體中文、繁體中文有些溝通的字詞有著分歧的意義,或不異的字已衍生出新的意義,但因簡體、繁體中文語法不異,在機械翻譯上仍採用一套系統,可視為專著名詞,透過進修豎立資料庫來校正。
聯合報系資料照片">
結合報系資料照片" title="google。
簡立峰诠釋,google翻譯有進修及資料庫的功能,不斷累積經驗,毛病也是一種經驗,除非幾乎所的人都在「修改建議」欄寫下一模一樣的錯誤,才會積非成是,但事實上這類情況其實不可能産生。
google翻譯的發展進程快速,10年前,google推出翻譯辦事,並以片語式機器翻譯(phrase-basedmachine translation)作為主要運算體例。從曩昔僅支援幾種說話,到此刻可支援103種說話,且天天翻譯超過1400億個單詞,google翻譯的品質有了很大的進展。
在讀取完全句子後,解碼器(decoder)就會入手下手運作,一次產生一個英語句子中的一個詞翻譯
剛開始推出神經機器翻譯時,這兩種翻譯方式的精準度不相上下。相較於曩昔的片語機器學習(pbmt),神經機械翻譯(nmt)僅需要較少的系統架構設計。
曩昔,為翻譯肆意兩種說話,google需要建構多個分歧的翻譯系統,運算本錢相當可觀。
文章出自: https://udn.com/news/story/6811/2440774有關翻譯的問題歡迎諮詢天成翻譯社
留言列表