一、現狀問題
國際系統當前的多語言是國際業務的普遍特點,僅僅倉儲管理系統,當前系統語言種類已經達到了九種,并且隨著業務的開展還在不斷的擴展,現有的國際系統支持的語言有中文、英語、日語、韓語、葡萄牙語、西班牙語、法語、德語、越南語。其中每個語言包的詞條都有上萬條,且隨著新需求的開發迭代也在不斷的新增,語言包的不斷擴展和詞條的不斷增加,詞條翻譯的簡潔性、專業性和時效性就直接影響了業務的開展和需求的交付速度,迭代的完成效率。更多完整的系統多語言解決方案參見: 系統國際化之多語言解決方案
??
國際的系統不僅僅是語言多、詞條多,而且基本涵蓋了供應鏈體系的所有核心系統,在這些系統的詞條翻譯也缺少統一的國際專業術語,相同的業務釋義在不同的業務條線就存在各種名字,內部溝通不僅費時費力,在客戶使用京東系統時也會造成一些困惑。
二、分析原因
在新語言的不斷新增過程中,每次新增一種語言,一般的流程是研發提供全套的待翻譯詞條,業務找到對口的翻譯公司按照詞條和我們提供的語境、場景翻譯成對應的語言,研發根據翻譯公司提供的詞條生成新的語言包添加到系統中。但是標準和專業的工作流程往往實現起來存在困難,從“成本、效率、體驗”的角度出發,總不能研發每次做一個需求都要找一遍翻譯公司吧?隨著語言包的不斷新增和各種需求的不斷迭代,所有的翻譯都需要專業翻譯公司介入基本是不太現實的,這種工作流程方式既增加了成本,又影響了交付效率。在以前沒有大模型的時候,一些簡單的翻譯基本都是借助各類翻譯平臺實現詞語的直譯。隨著GPT的出現,我們開始使用GPT替換了人工翻譯和翻譯平臺的直譯,翻譯的準確性對比其他翻譯工具更加準確,對比人工翻譯成本降低了,效率提高了,且準確性也能得到一定的保障。
不論是人工翻譯還是GPT的AI智能翻譯,都不能達到國外專業業務系統的簡潔和準確,但是想要做的特別專業就需要請專業的外部翻譯公司,無疑又增加了成本的支出,有沒有一種既能讓系統逐步迭代的越來越完美又能降低成本的辦法呢?
其實,在多語言方面,“用戶”就是最專業的專家。他們對系統熟悉以后,在特定的場景和語境下,是最專業的人。如果他們能夠在線修訂系統中的各種詞匯,是不是就可以解決這個問題?
三、計劃目標
1.實時多語言支持:
?利用大模型的翻譯能力,實現對新增語言的快速響應和實時翻譯,從而加速國際系統對新語言的支持。
2.提升翻譯質量:
?通過大模型對歷史翻譯數據的學習,提高翻譯的專業性和準確性,減少人工干預,提升整體翻譯質量。
3.提高詞條更新效率:
?通過“詞條管家”功能,允許用戶在線即時修改詞條,利用大模型提供智能建議和自動更正,大幅提升詞條更新的速度。
4.優化用戶參與流程:
?鼓勵用戶參與詞條的修訂,利用大模型分析用戶反饋,快速響應用戶需求,提升用戶參與度和滿意度。
5.降低成本:
?減少對專業翻譯公司的依賴,通過大模型輔助的自動化翻譯和用戶社區的參與,有效降低翻譯和更新的成本。
6.增強系統的智能化:
?利用大模型對用戶行為和詞條使用模式的分析,實現智能化的詞條推薦和預測性更新,進一步提升系統的智能化水平。
7.持續學習和優化:
?大模型將持續從用戶修訂、審批流程和系統反饋中學習,不斷優化翻譯和更新流程,實現持續的性能提升
充分利用大模型的強大計算和學習能力,實現多語言支持的自動化、智能化,從而顯著提升整個系統的效率和性能。
四、實現步驟
4.1 建設國際物流術語詞條庫
建設國際系統統一使用的國際專業術語詞條庫,這個詞條庫將現有各個系統已有詞匯匯集整理以后形成一套大家都在使用的標準國際專業術語詞條,后續新增的需求將優先從詞條庫中選擇現有詞條,沒有的詞條需要產品新增,產品新增完成以后前端研發就會引用該詞條到各自的系統中。
??
使用技術手段,讓用戶能夠在線修訂系統中的各種詞條和提示語,經過審批流程以后,詞條、提示語就能夠生效并最終應用于系統中。
4.2 哪里不對改哪里,詞條管家秒更新
在系統中集成了自動劃詞修改功能,該功能允許用戶在瀏覽前端頁面時,對識別出的不恰當或過時的詞條進行即時修改。
1.劃詞選中:用戶在前端頁面中發現需要修訂的詞條后,可以通過劃詞操作快速選中該詞條。
2.彈出更正窗口:選中詞條后,系統會自動彈出一個更正窗口,引導用戶輸入修訂后的詞條內容。
3.審批流程:用戶輸入新詞條并提交后,系統將啟動審批流程。這一流程確保了詞條修改的專業性和準確性。
4.自動生效:一旦新詞條通過審批,修改將被自動應用并即時生效,從而保證了詞條庫的時效性和可靠性。
通過這一流程,我們不僅提高了詞條更新的效率,還通過審批機制確保了詞條內容的質量和權威性。
??
4.3 架構實現
整體架構設計
??
4.3.1 大模型翻譯
使用集團提供的大模型平臺GPT、言犀等,對需要翻譯的語言包或者新增詞條部分進行定制化翻譯,方便系統很快速的擴展新的語言包。對國際術語詞條庫的內容進行實時在線翻譯,新增詞條時自動根據母語(中文)翻譯出其他語言的結果供產品參考。
內容沉淀:在翻譯過程中內置了多種專業詞條庫,包括敏感詞、商品名稱、報關地址、各個國家的地址信息等,在翻譯的同時還會沉淀下來,形成專業的術語庫,為后續其他業務提供模塊化的支撐。
規則約束:在翻譯時,會在系統中內置一系列的邏輯,確保翻譯出來的結果符合各個語境下的習慣,例如英語的詞匯翻譯結果一般都是首字母大寫,在進行英語簡拼時,一般后面都會帶個英文的“.”來標識。日本的地址信息一般是按照都道府縣、市、區一級級,類似于中國的省市縣,在翻譯日本地址信息也會嚴格遵照日本的地址規范,這些都是系統內置的能力。
話術集成:對不同的翻譯場景,在使用時會使用已經培訓好的話術,根據需要的不同場景自動翻譯提煉。
結果糾錯:大語言模型對于翻譯的結果不是穩定可靠的,經常會因為需要翻譯的話術存在歧義導致整體翻譯的結果不對,或者翻譯出來的內容不是純粹的翻譯結果而失敗,在進行翻譯時,根據多種規則判斷翻譯的結果是否是正常的翻譯內容,包括翻譯結果的長度是否和預期差異較大,包括翻譯的結果是否是純粹的結果而不是帶了一些其他的干擾詞匯等等最終實現翻譯結果與預期一致。
?
??
大模型自動化輔助翻譯:在新增加詞條時,用戶選擇語言后,利用大模型得到相對應的翻譯輔助用戶,可直接使用或在此基礎上進行調整,大大降低翻譯成本。
??
4.3.2 多語言線上化
將多語言包上傳至云存儲,在每次更新翻譯內容并審批通過時自動更新云存儲的文件。
??
4.3.3 自動版本更新
審批通過以后自動生成新的版本,在前端拉取語言版本時自動拉取的就是最新版本的語言包。系統底層存儲了各個語言的版本號,和云存儲的文件對應在一起。
??
4.3.4 自動化詞條更新技術
自動化詞條更新技術,旨在提升詞條更新的效率和專業性。
效率:具體而言,當用戶在前端界面啟用錨點編輯功能并選中特定詞條時,系統將自動觸發并展示更新界面。該界面引導用戶輸入新的詞條內容,隨后前端將這些更改實時轉化為一個待審批的詞條替換任務。
專業性:此任務隨后被送至管理員端,由具備相應權限的管理員進行審核。審批流程不僅確保了詞條更新的合法性和準確性,同時也維護了內容的質量和一致性。
一旦管理員批準了該詞條替換任務,所提議的詞條更改將被自動應用并立即生效,從而實現了對語言庫的快速而審慎的更新。
4.3.5 異常兼容降級
在用戶訪問應用時,優先拉取最新的語言包,同時存儲該版本到本地,下次進入獲取各語言包版本,和本地緩存的對應語言包版本進行對比,如果對應語言的版本有更新,則獲取新資源同時對本地資源更新。
同時在每次構建時自動拉取最新的語言包并更新,同時該版本作為base(基礎)版本,當自動更新詞條服務不可用時進行降級處理,繼續引用編譯構建時的語言包,不影響系統的正常使用。
??
本地緩存的語言包:
??
通過這種降級方案,我們可以實現:
1.無縫更新:用戶可以自動獲取最新的語言包,無需手動干預,提升了用戶體驗。
2.離線支持:即使遠程服務不可用,應用也能通過本地緩存的語言包繼續運行,保證了應用的可用性。
3.版本兼容性:通過版本檢查確保用戶總是使用與應用兼容的語言包,避免因版本不匹配導致的潛在問題。
4.構建時更新:在構建應用時自動更新語言包,確保部署的應用總是使用最新的語言資源。
5.資源效率:通過本地緩存減少了重復從遠程服務器拉取相同資源的次數,節省了網絡帶寬和服務器負載。
6.容錯性:即使在更新過程中出現問題,系統也可以回退到穩定的base版本,保持系統的穩定性。
7.易于維護:清晰的版本管理和更新邏輯簡化了維護工作,便于開發者管理和部署語言資源。
五、實現效果
5.1 人效提升
每個迭代周期按照經驗更正20個不規范詞條左右,并且每個迭代周期上線1.5次,那么每個月可以節省大約2人日的工作量。這種效率的提升,不僅提高了國際化產品的專業力,還提高了團隊的整體生產力。
5.1.1 系統國際化快速復用
在傳統的國際化流程中,每當系統需要支持新的語言,通常需要進行繁瑣的翻譯和本地化工作。然而,通過引入大型模型的翻譯能力,我們能夠實現快速的語言版本定制和更新。例如,當系統需要支持一種新的語言時,可以利用大模型快速翻譯系統代碼中的詞條,然后通過自動化工具將這些詞條集成到系統中,無需進行復雜的手動操作。
此外,通過建立國際物流術語詞條庫,我們可以確保不同系統之間的術語統一,避免了重復翻譯和不一致的問題。這種方法不僅提高了翻譯的準確性,還大大減少了研發在多語言支持上的工作量,使得國際化過程更加高效。
??
5.1.2 詞條校準快速高效
在每個迭代的需求開發時,不再因為詞條的更新需要研發不斷的發版,每次發版發布多套環境,而是系統自動更新自動生效。只需要在詞條管家中修改以后等待審批人審批以后即可生效,極大的縮短詞條的生效時間,助力敏捷提效。快速更正不合適的詞條,省去各個中間環節。
原有流程完成一次術語修改需要經過10個流程節點才能完成一次術語的修改和生效,每次修改需要2個多小時,主要花費在部署多套環境上。增加了術語庫的能力以后,每次修改術語需要4個流程節點,生效時間只需要15分鐘左右,真正實現了即改即生效,生效即可見的效果。
??
5.2 質量提升
5.2.1 物流術語專業統一
為了解決翻譯本土化的難題,我們嘗試了多種方案。最直接的方法是依賴第三方翻譯服務商,但這種做法存在多個問題。首先,成本較高;其次,翻譯的準確性無法保證。主要問題是,我們的每個系統都具有專業性,日常使用中看似簡單的詞匯,翻譯公司可能無法準確理解其含義,從而導致翻譯結果無法準確表達原意。因此,這種方法產生的結果并不理想。隨著越來越多的系統在做國際化,我們發現同行業系統之間有很多詞匯是相同的,但是不同系統的翻譯結果可能有差異,無法做到術語統一,這會給用戶帶來困擾,對外體驗不好,因此我們孕育出想做一個行業詞條庫的想法。
通過國際供應鏈各個系統詞條匯總,統計出高頻詞條,通過GPT智能翻譯加人工校對,確保詞條翻譯的準確性和本土化,有了公共詞庫作為基礎,所有系統多語言翻譯優先查詢公共詞庫,確保不同系統術語統一,其次才是復雜文本GPT智能翻譯。
國際公共詞庫成型示意圖:
??
通過現有國際物流系統的詞條,我們通過使用頻率篩選出高頻詞條,通過GPT翻譯加人工校驗的方式進行詞條沉淀,考慮到不同位置展示的詞條書寫格式的差異,詞條類型根據不同的用途進行分類管理。比如考慮到菜單類詞條可能很多英語寫法喜歡縮寫,會將頁面菜單詞條和異常提示詞條分類存放,使用的時候同樣的詞匯會根據具體的類型進行翻譯。
??
?
通過公共詞庫的實踐,我們避免了很多詞匯的二次翻譯,同時翻譯結果的準確性和本土化程度大幅提高,隨著詞條沉淀的增多,發揮的作用將會越大,所以,如果你的系統正在做國際化,強烈推薦沉淀一份公共詞庫,可以讓系統翻譯更加統一,更加精確。
六、總結規劃
當前國際物流術語詞條庫已經開始建設,但是不同語言在系統層面如何精簡的體現且能被用戶清晰的知曉還需要不斷的摸索和提煉,也希望大家獻言獻策,不斷完善。
國際在多語言的開發過程中不斷總結歸納,創新性的將國際的多語言整理成了國際術語詞條庫,為國際的專業術語統一打下了良好的基礎。利用技術優勢,將語言包放置到了線上,在打包時自動更新拉取,同時提供線上所見即所得的詞條修改能力,不斷提高多語言的專業性。
附錄:系統國際化技術解決方案系列—— 系統國際化之多語言解決方案
審核編輯 黃宇
-
GPT
+關注
關注
0文章
342瀏覽量
15151 -
大模型
+關注
關注
2文章
2053瀏覽量
1777
發布評論請先 登錄
相關推薦
評論