(文章來源:教育新聞網)
通信技術的進步對各種行業都產生了重大影響,但也許沒有比教育更大的影響了。現在,來自世界各地的任何人都可以現場收聽諾貝爾獎獲得者的演講,也可以通過互聯網訪問最知名的大學而獲得學分。但是,如果聽眾聽不懂講師的語言,將從在線觀看和收聽中獲得的可能的信息丟失。為了解決這個問題,日本奈良科學技術學院(NAIST)的科學家在日本信息處理學會(IPSJ SIG-)的自然語言處理特別興趣小組第240次會議上提出了一種新的機器學習解決方案。 NL)。
機器翻譯系統使某人以以前從未聽說過的語言向酒店詢問路線變得非常簡單。有時,系統可能會犯出有趣和無辜的錯誤,但總體上實現了連貫的交流,至少對于短時間的交流(通常只有一兩個句子)。如果演示文稿可能持續一個小時以上,例如學術講座,那么它們的魯棒性就差很多。
主持這項研究的NAIST教授中村聰解釋說:“ NAIST有20%的外國學生,盡管英語課程的數量在增加,但這些學生的選擇受到他們日語能力的限制。”Nakamura的研究小組從NAIST獲得了46.5個小時的存檔演講視頻及其轉錄和英語翻譯,并開發了基于深度學習的系統來轉錄日語演講語音并將其翻譯成英語。在觀看視頻時,用戶會看到與講師的口語相匹配的日語和英語字幕。
有人可能希望理想的輸出是可以通過現場演示進行的同步翻譯。但是,實時翻譯會限制處理時間,從而限制準確性。
他說:“由于我們將帶字幕的視頻保存在檔案中,因此,通過創建處理時間更長的字幕,我們發現了更好的翻譯。”用于評估的存檔素材包括機器人技術,語音處理和軟件工程的演講。有趣的是,語音識別中的單詞錯誤率與講師語音中的不愉快程度相關。錯誤率不同的另一個因素是不停頓說話的時間長度。用于訓練的語料仍然不足,應進一步發展以進一步改進。
他繼續說:“日本希望增加其國際學生,而NAIST則有很大的機會成為這項工作的領導者。我們的項目不僅將改善機器翻譯,還將為日本帶來光明的頭腦。”
(責任編輯:fqj)
-
通信技術
+關注
關注
20文章
1118瀏覽量
92205 -
翻譯
+關注
關注
0文章
47瀏覽量
10753
發布評論請先 登錄
相關推薦
評論