大語言模型LLM是這幾個月熱度最高的全球明星。目前看來,AI逐漸走向復(fù)雜專業(yè)的白領(lǐng)型崗位,已經(jīng)是必然的趨勢。
OpenAI剛剛發(fā)布的35頁論文中,提到了最容易受到LLM影響的職業(yè)中譯員和筆譯員排名第二。
以前機器翻譯就是出國旅游時拍拍路標(biāo)、看看菜譜,現(xiàn)在GPT-4連學(xué)術(shù)論文里的復(fù)雜長難句、專業(yè)術(shù)語都能理解,“人肉翻譯”越來越?jīng)]優(yōu)勢。
生成式AI能直接模擬已故的翻譯家,輸出大師風(fēng)格的譯文,一般人做翻譯還有什么前途?
調(diào)用ChatGPT翻譯一本中等部頭的英文書,只需要花大概十個小時、四美元,人工翻譯卷到天際也達不到這樣的性價比……
這段時間,外語專業(yè)學(xué)生和翻譯從業(yè)者們有類似心情的人不在少數(shù)。
根據(jù)中國翻譯協(xié)會的調(diào)查,中國的翻譯人才的規(guī)模是538萬人,其中本科以上的中青年為主,這些年輕、專業(yè)、高素質(zhì)的人才如果離開了翻譯行業(yè),豈不可惜?
所以,我們應(yīng)該盡快回答這些問題:AI時代,我們?yōu)槭裁催€需要人工翻譯?翻譯人才要怎么跨入AI的大門?譯者+機器的人機協(xié)作,有哪些必要條件?
幸好,翻譯行業(yè)的反應(yīng)速度遠(yuǎn)比我們想象得快。4月3日至4日,2023中國翻譯協(xié)會年會舉辦,百度翻譯聯(lián)合中國外文局翻譯院、中國翻譯協(xié)會翻譯技術(shù)委員會,共同發(fā)布了《2023機器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍皮書》。
《藍皮書》系統(tǒng)闡述了機器翻譯的發(fā)展歷程和方向,介紹了產(chǎn)業(yè)級機器翻譯系統(tǒng)和產(chǎn)品形式,并通過實際案例展示了機器翻譯產(chǎn)業(yè)應(yīng)用現(xiàn)狀,對機器翻譯未來發(fā)展提出建議。為推動機器翻譯技術(shù)與各行業(yè)的深度融合提供有益借鑒,為機器翻譯技術(shù)的產(chǎn)業(yè)應(yīng)用提供有力支持,其客觀、全面、權(quán)威的信息,也成為翻譯人才把握當(dāng)下趨勢的權(quán)威參考。
同時,在譯協(xié)年會上,由百度翻譯提供技術(shù)和平臺支持的“首屆全國翻譯技術(shù)大賽”正式啟動,預(yù)計賽制持續(xù)到8月,也為中國翻譯人才擁抱技術(shù)提供了競技舞臺和窗口期。
沒有人會懷疑,我們正處在一個非常重要的歷史轉(zhuǎn)折點。面對大語言模型等最新AI技術(shù)帶來的無數(shù)可能性,中國翻譯人才可以不焦慮、不盲目、有底氣的進入人機共譯新階段。
不焦慮:“見識過‘珍妮紡紗機’,我還是選擇當(dāng)翻譯”
在翻譯行業(yè)工作多年的小A表示:太陽底下無新事,翻譯人見過的“AI威脅論”并不少。
2016年,翻譯領(lǐng)域就曾出現(xiàn)過類似的“珍妮紡紗機時刻”。當(dāng)時,一篇名為《翻譯界的重大突破!作為一個翻譯,此刻我理解了18世紀(jì)紡織工人看到蒸汽機時的憂慮和恐懼!》的文章,傳遍了翻譯人的朋友圈。
不少譯員和外語系學(xué)生就像在手工棉紡織時代,看到了由蒸汽機帶動的珍妮紡紗機,能同時紡8卷線一樣,感到非常擔(dān)憂。
原來,百度于2015年發(fā)布了全球首個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)。隨后,谷歌、微軟相繼部署了以神經(jīng)網(wǎng)絡(luò)作為基礎(chǔ)的機器翻譯系統(tǒng)。這種機器翻譯技術(shù),通過建立深度神經(jīng)網(wǎng)絡(luò)模擬人類的翻譯過程,在語言表示、語義理解、譯文生成等方面有顯著進步,讓機器翻譯的質(zhì)量大幅提升。結(jié)果呢?今天人類翻譯依然存在,而大眾使用翻譯服務(wù)的門檻則大大降低了。
更早一點,上世紀(jì)末的翻譯人,也曾遇到過“珍妮紡紗機”。九十年代,統(tǒng)計機器翻譯方法的出現(xiàn),可以基于大規(guī)模語料自動訓(xùn)練模型參數(shù),這種方式不需要人工專家來構(gòu)建翻譯規(guī)則,比基于規(guī)則的機器翻譯效率更高、效果更好,彌補了當(dāng)時國內(nèi)高水平的專業(yè)翻譯人才匱乏、不能滿足實際需求的問題,讓更多高質(zhì)量的譯著走出了國門,走進大眾視野。
作為一種更古早的機器翻譯技術(shù),基于規(guī)則的機器翻譯,其實也曾是人類眼中的“珍妮紡紗機”。上世紀(jì)五十年代,哪怕窮盡全球翻譯家們一生的力量,也只能掌握幾十種語言,譯著只占人類作品總量的冰山一角,通過計算機自動完成翻譯,解決全球溝通和交流的問題,也帶來了翻譯業(yè)態(tài)的快速發(fā)展。
把時間拉回到當(dāng)下,以 ChatGPT、文心一言為代表的新一代預(yù)訓(xùn)練模型技術(shù),通過超大規(guī)模的數(shù)據(jù)和充分訓(xùn)練實現(xiàn)了智能涌現(xiàn)效應(yīng),大幅提升了機器翻譯的魯棒性和容錯能力。
所以說,機器翻譯從來沒有真正消滅人工翻譯,這是歷史上被多次證明的,反而機器翻譯讓高質(zhì)量翻譯人才的需求更加旺盛。
面對新的機器翻譯技術(shù),翻譯人才對于“珍妮紡紗機”的恐懼,更多是源于對于自身發(fā)展的不確定。幸好,這種“不確定”正在被“國家隊”所改變。
在剛剛發(fā)布的《2023機器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍皮書》中,中國翻譯協(xié)會的調(diào)研數(shù)據(jù)顯示,有超過 85% 的受訪者認(rèn)為“機器翻譯 + 譯后編輯”的工作模式會在更大范圍內(nèi)應(yīng)用。
《藍皮書》認(rèn)為,機器翻譯成為人類譯員的得力助手和有效補充,促使翻譯行業(yè)催生出更多如譯后編輯、機翻質(zhì)量控制等新職業(yè),正在多種場景中被應(yīng)用。
簡單舉幾例:
1.加速短視頻、網(wǎng)絡(luò)文學(xué)等中國優(yōu)質(zhì)內(nèi)容出海。人人譯視界助力 B 站的海外達人項目,完成三百多個頻道的譯制工作;晉江文學(xué)城、米讀小說 APP使用針對網(wǎng)絡(luò)文學(xué)垂直領(lǐng)域定制優(yōu)化的機器翻譯系統(tǒng),將大量本土網(wǎng)絡(luò)文學(xué)作品翻譯成英語、西班牙語、葡萄牙語等語種,獲得海外用戶的青睞。
2.助力企業(yè)海外市場經(jīng)營。中石化的企業(yè)智能翻譯平臺,支撐境外財務(wù)票據(jù)核銷、重大項目審計、合規(guī)備案等翻譯工作;新華社的“新華絲路”, 引入智能翻譯平臺,輔助人工譯員提高翻譯效率。
3.支撐各行各業(yè)數(shù)字化建設(shè)。譯馬網(wǎng)引入“AI+人工” 的譯后編輯模式,日均翻譯字?jǐn)?shù)可提升近 4倍,翻譯成本降低 34%;邁迪培爾開發(fā)的醫(yī)藥等垂直領(lǐng)域機器翻譯,為科研人員的研究工作提供了極大便利。
總之,翻譯領(lǐng)域的新機會還有很多,更詳細(xì)的信息,大家可以在《藍皮書》中閱覽。
機器翻譯大有用武之地,高端翻譯人才也是時代所需。二者相輔相成,可以滿足不同層次的翻譯需求,在獲取全球信息、對外交流等方面將發(fā)揮越來越重要的作用。
作為普通人,要做的是學(xué)習(xí)駕馭最新的“珍妮紡紗機”,把機器翻譯用好,不是留戀做一個“手工紡紗人”。
不盲目:從朦朧到清晰的人機協(xié)作之路
那么,“AI+人工” 的譯后編輯工作模式下,究竟怎樣才算用好AI技術(shù)?人機共譯,需要具備哪些技能?
《藍皮書》提供了方法論,呼吁培養(yǎng) “翻譯 + 技術(shù) +N”的精翻譯、懂技術(shù)、能力強的新時代高端翻譯人才。首屆全國翻譯技術(shù)大賽,則提供了具體的實現(xiàn)路徑。
要將AI技術(shù)和機器翻譯作為得力助手,人類譯員想要提高技能,也不能盲目。
“首屆全國翻譯技術(shù)大賽”,由中國外文局、全國翻譯專業(yè)學(xué)位研究生教育指導(dǎo)委員會指導(dǎo),中國翻譯協(xié)會、中國外文局翻譯院、大連外國語大學(xué)主辦。百度翻譯作為承辦單位之一,提供翻譯技術(shù)與比賽平臺支持。
從陣容中不難看到,賽事為推動行業(yè)各方對機器翻譯技術(shù)的了解和應(yīng)用,提供了清晰的方向和路徑:
1.清晰的培養(yǎng)方向。
舉辦方是百度翻譯,和翻譯行業(yè)的“國家隊”,保證了比賽涉及內(nèi)容的前沿性和權(quán)威性,同時,賽事向各類翻譯愛好者開放,高校學(xué)生、翻譯機構(gòu)、企業(yè)單位等都可以參與,人才覆蓋面廣。
由此證明,復(fù)合型翻譯人才的培養(yǎng),AI+翻譯融合學(xué)科的建設(shè),離不開政產(chǎn)學(xué)研用多方形成合力,提供更充沛的實踐機會和更明確的方向引導(dǎo)。
2.清晰的技能標(biāo)準(zhǔn)。
中國的翻譯人才要開啟“人機共譯”工作新范式,需要具備哪些核心能力?比賽考核點的設(shè)計,也給出了清晰的答案,讓人才能夠不再迷茫,提早培養(yǎng)自身的競爭力。
比如以往的翻譯比賽,主要考察人類譯文的準(zhǔn)確性、優(yōu)美性,而此次比賽,還將對機器翻譯的掌握,納入了考核,包括對機器翻譯軟件內(nèi)置功能是否熟悉,操作熟練度如何,是否充分運用了技術(shù),做到真正以賽促學(xué),幫助大家掌握先進的機器翻譯工具。
(譯后編輯能力考察:術(shù)語替換題)
3.清晰的產(chǎn)業(yè)基石。
大賽由百度翻譯提供技術(shù)和平臺支持,背后也有著深度的考量:中國翻譯綜合能力的提高,要建立在怎樣的機器翻譯底座上?
選擇百度翻譯,一是技術(shù)領(lǐng)先,百度于2015年自主研發(fā)的全球首個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng),能夠快速提高翻譯產(chǎn)能,是較為先進的機器翻譯工具。
二是平臺能力,百度智能文檔翻譯平臺的創(chuàng)新人機共譯模式,將機器翻譯(Machine Translation)+ 譯后編輯(post-editing)+ 模型自學(xué)習(xí)相結(jié)合,讓機器翻譯結(jié)果越用越準(zhǔn),效率不斷提升。
三是應(yīng)用豐富。百度智能文檔翻譯平臺,提供術(shù)語參考、翻譯記憶、智能糾錯等功能,內(nèi)置權(quán)威術(shù)語,查證更省力,在工作中真正為人類譯員減負(fù)。
從底層技術(shù)到上層應(yīng)用的優(yōu)勢,是百度智能文檔翻譯平臺“被選擇”的原因,也為翻譯行業(yè)和翻譯人才接下來的發(fā)展提供牢靠的支持。
翻譯人才如何跨入AI的大門,從首屆全國翻譯技術(shù)大賽開始,路徑正從朦朧走向清晰。
(產(chǎn)業(yè)級機器翻譯系統(tǒng)流程圖)
有底氣:從一群人的比賽,到全民的新可能
你可能會問:我又不當(dāng)譯員,機器翻譯的發(fā)展跟我又有什么關(guān)系呢?
當(dāng)然有。
從基于規(guī)則的機器翻譯,到大語言模型驅(qū)動的機器翻譯,機器翻譯技術(shù)的每一次更迭,都會讓全社會、全世界廣泛受益。
你讀到的一部譯本,與海外朋友的一次對話,境外旅游時的無礙溝通,前沿論文的快速傳播……翻譯成本不斷降低,以前需要請一個翻譯,現(xiàn)在手機app/翻譯筆就能搞定;體驗越來越絲滑,原本要分段復(fù)制粘貼的學(xué)術(shù)論文,現(xiàn)在整個丟進百度智能文檔翻譯,就能直出全部譯文,還帶還原版式,閱讀效率也高多了。
對于個人來說,跨語言溝通、學(xué)習(xí)和交流,是成長和進步的基礎(chǔ),通過百度翻譯這樣的智能產(chǎn)品獲得更高質(zhì)量、更低成本的翻譯服務(wù),減少了很多不必要的時間和操作,某種程度上來說,是一種人生的提速。
對于企業(yè)來說,產(chǎn)品出海或跨境貿(mào)易,需要在翻譯上投入高成本,有時還不能快速到位,一些翻譯相關(guān)業(yè)務(wù)場景需要定制化開發(fā),缺乏相應(yīng)的人才。
《藍皮書》中提到國內(nèi)某世界500強企業(yè),需要通過海外媒體報道和電商渠道的消費者評論等信息,進行海外市場經(jīng)營決策,涵蓋近百種語言,每月翻譯需求超百億詞,涵蓋文本、文檔、圖片等多種形態(tài),海量而冗雜的翻譯任務(wù),全靠人工根本沒辦法及時跟進最新市場動向。
中國企業(yè)要“走出去”,AI+機器翻譯,是必不可少的輔助。
百度翻譯從模型到應(yīng)用的豐富能力,背靠百度生態(tài),可與計算機視覺、語音處理等人工智能技術(shù)深度融合,全面、及時、深入響應(yīng)不同行業(yè)不同場景的業(yè)務(wù)需求。
對國家來說,翻譯能力是國家軟實力的一部分。
中國外文局局長、中國翻譯協(xié)會會長杜占元指出,國家翻譯能力,是通過翻譯行為建構(gòu)對外話語、開展文化傳播、塑造國家形象的綜合能力,是文化軟實力和國際傳播能力的重要組成部分,也是發(fā)揮大國作用、提升國際話語權(quán)的重要保障。
從這個角度看,加強國家翻譯能力建設(shè),除了傳統(tǒng)手段之外,機器翻譯的技術(shù)領(lǐng)先性、安全性、可用性愈發(fā)重要。
百度在大模型技術(shù)、大語言模型(LLM)、自然語言處理(NLP)方面深耕多年的技術(shù)儲備和領(lǐng)先實力,從芯片、深度學(xué)習(xí)框架到翻譯模型的核心模塊自研能力,讓百度翻譯有望成為首屈一指的產(chǎn)業(yè)級機器翻譯系統(tǒng),在翻譯行業(yè)智能化、數(shù)字經(jīng)濟交流中發(fā)揮作用。
這些力量融合起來,才推動中國翻譯來到新的轉(zhuǎn)折點。而一個溝通無礙、高效的新世界,會讓一個人、一個企業(yè)、乃至一個國家,都獲得新的機會與可能。
1999年,萬維網(wǎng)的發(fā)明者、互聯(lián)網(wǎng)之父Tim Berners-Lee,就曾提出過一個概念:social machine(社會機器),即人與機器的協(xié)作體。人負(fù)責(zé)創(chuàng)造,而機器負(fù)責(zé)執(zhí)行。當(dāng)時,最熱的機器是家用電腦,全國都興起一股“電腦熱”,各種電腦培訓(xùn)班、電腦操作書籍紛紛問世,和今天的“AI熱”差不多。
如果你不會恐懼電腦、抗拒電腦,那當(dāng)然也不應(yīng)該恐懼AI。AI時代,我們?nèi)匀恍枰祟愖g者,語言的通天塔一天沒有越過,翻譯的火種便會生生不息。
個人對機器翻譯的不同態(tài)度和選擇,將迎來不同的命運,但愿你的選擇,映射的是你的希望,而非恐懼。
-
AI
+關(guān)注
關(guān)注
87文章
30146瀏覽量
268421 -
OpenAI
+關(guān)注
關(guān)注
9文章
1043瀏覽量
6408 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1548瀏覽量
7495
發(fā)布評論請先 登錄
相關(guān)推薦
評論