精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型助力國際術語專業化,前后聯動實現所見即所得

京東云 ? 來源:jf_75140285 ? 作者:jf_75140285 ? 2024-06-21 17:37 ? 次閱讀

一、現狀問題

國際系統當前的多語言是國際業務的普遍特點,僅僅倉儲管理系統,當前系統語言種類已經達到了九種,并且隨著業務的開展還在不斷的擴展,現有的國際系統支持的語言有中文、英語、日語、韓語、葡萄牙語、西班牙語、法語、德語、越南語。其中每個語言包的詞條都有上萬條,且隨著新需求的開發迭代也在不斷的新增,語言包的不斷擴展和詞條的不斷增加,詞條翻譯的簡潔性、專業性和時效性就直接影響了業務的開展和需求的交付速度,迭代的完成效率。更多完整的系統多語言解決方案參見: 系統國際化之多語言解決方案

wKgaomZ1SbmAF8tgAACQo7ymAZE931.png

??

國際的系統不僅僅是語言多、詞條多,而且基本涵蓋了供應鏈體系的所有核心系統,在這些系統的詞條翻譯也缺少統一的國際專業術語,相同的業務釋義在不同的業務條線就存在各種名字,內部溝通不僅費時費力,在客戶使用京東系統時也會造成一些困惑。

二、分析原因

在新語言的不斷新增過程中,每次新增一種語言,一般的流程是研發提供全套的待翻譯詞條,業務找到對口的翻譯公司按照詞條和我們提供的語境、場景翻譯成對應的語言,研發根據翻譯公司提供的詞條生成新的語言包添加到系統中。但是標準和專業的工作流程往往實現起來存在困難,從“成本、效率、體驗”的角度出發,總不能研發每次做一個需求都要找一遍翻譯公司吧?隨著語言包的不斷新增和各種需求的不斷迭代,所有的翻譯都需要專業翻譯公司介入基本是不太現實的,這種工作流程方式既增加了成本,又影響了交付效率。在以前沒有大模型的時候,一些簡單的翻譯基本都是借助各類翻譯平臺實現詞語的直譯。隨著GPT的出現,我們開始使用GPT替換了人工翻譯和翻譯平臺的直譯,翻譯的準確性對比其他翻譯工具更加準確,對比人工翻譯成本降低了,效率提高了,且準確性也能得到一定的保障。

不論是人工翻譯還是GPT的AI智能翻譯,都不能達到國外專業業務系統的簡潔和準確,但是想要做的特別專業就需要請專業的外部翻譯公司,無疑又增加了成本的支出,有沒有一種既能讓系統逐步迭代的越來越完美又能降低成本的辦法呢?

其實,在多語言方面,“用戶”就是最專業的專家。他們對系統熟悉以后,在特定的場景和語境下,是最專業的人。如果他們能夠在線修訂系統中的各種詞匯,是不是就可以解決這個問題?

三、計劃目標

1.實時多語言支持

?利用大模型的翻譯能力,實現對新增語言的快速響應和實時翻譯,從而加速國際系統對新語言的支持。

2.提升翻譯質量

?通過大模型對歷史翻譯數據的學習,提高翻譯的專業性和準確性,減少人工干預,提升整體翻譯質量。

3.提高詞條更新效率

?通過“詞條管家”功能,允許用戶在線即時修改詞條,利用大模型提供智能建議和自動更正,大幅提升詞條更新的速度。

4.優化用戶參與流程

?鼓勵用戶參與詞條的修訂,利用大模型分析用戶反饋,快速響應用戶需求,提升用戶參與度和滿意度。

5.降低成本

?減少對專業翻譯公司的依賴,通過大模型輔助的自動化翻譯和用戶社區的參與,有效降低翻譯和更新的成本。

6.增強系統的智能化

?利用大模型對用戶行為和詞條使用模式的分析,實現智能化的詞條推薦和預測性更新,進一步提升系統的智能化水平。

7.持續學習和優化

?大模型將持續從用戶修訂、審批流程和系統反饋中學習,不斷優化翻譯和更新流程,實現持續的性能提升

充分利用大模型的強大計算和學習能力,實現多語言支持的自動化、智能化,從而顯著提升整個系統的效率和性能。

四、實現步驟

4.1 建設國際物流術語詞條庫

建設國際系統統一使用的國際專業術語詞條庫,這個詞條庫將現有各個系統已有詞匯匯集整理以后形成一套大家都在使用的標準國際專業術語詞條,后續新增的需求將優先從詞條庫中選擇現有詞條,沒有的詞條需要產品新增,產品新增完成以后前端研發就會引用該詞條到各自的系統中。

wKgZomZ1SbuAANpgAAJzY6YDWls861.png

??

使用技術手段,讓用戶能夠在線修訂系統中的各種詞條和提示語,經過審批流程以后,詞條、提示語就能夠生效并最終應用于系統中。

4.2 哪里不對改哪里,詞條管家秒更新

在系統中集成了自動劃詞修改功能,該功能允許用戶在瀏覽前端頁面時,對識別出的不恰當或過時的詞條進行即時修改。

1.劃詞選中:用戶在前端頁面中發現需要修訂的詞條后,可以通過劃詞操作快速選中該詞條。

2.彈出更正窗口:選中詞條后,系統會自動彈出一個更正窗口,引導用戶輸入修訂后的詞條內容。

3.審批流程:用戶輸入新詞條并提交后,系統將啟動審批流程。這一流程確保了詞條修改的專業性和準確性。

4.自動生效:一旦新詞條通過審批,修改將被自動應用并即時生效,從而保證了詞條庫的時效性和可靠性。

通過這一流程,我們不僅提高了詞條更新的效率,還通過審批機制確保了詞條內容的質量和權威性。

wKgZomZ1SbyAaDqXAAhX3gBsMNE834.png

??

4.3 架構實現

整體架構設計

wKgaomZ1Sb2AV_3KAAOwZrl2ksM037.png

??

4.3.1 大模型翻譯

使用集團提供的大模型平臺GPT、言犀等,對需要翻譯的語言包或者新增詞條部分進行定制化翻譯,方便系統很快速的擴展新的語言包。對國際術語詞條庫的內容進行實時在線翻譯,新增詞條時自動根據母語(中文)翻譯出其他語言的結果供產品參考。

內容沉淀:在翻譯過程中內置了多種專業詞條庫,包括敏感詞、商品名稱、報關地址、各個國家的地址信息等,在翻譯的同時還會沉淀下來,形成專業的術語庫,為后續其他業務提供模塊化的支撐。

規則約束:在翻譯時,會在系統中內置一系列的邏輯,確保翻譯出來的結果符合各個語境下的習慣,例如英語的詞匯翻譯結果一般都是首字母大寫,在進行英語簡拼時,一般后面都會帶個英文的“.”來標識。日本的地址信息一般是按照都道府縣、市、區一級級,類似于中國的省市縣,在翻譯日本地址信息也會嚴格遵照日本的地址規范,這些都是系統內置的能力。

話術集成:對不同的翻譯場景,在使用時會使用已經培訓好的話術,根據需要的不同場景自動翻譯提煉。

結果糾錯:大語言模型對于翻譯的結果不是穩定可靠的,經常會因為需要翻譯的話術存在歧義導致整體翻譯的結果不對,或者翻譯出來的內容不是純粹的翻譯結果而失敗,在進行翻譯時,根據多種規則判斷翻譯的結果是否是正常的翻譯內容,包括翻譯結果的長度是否和預期差異較大,包括翻譯的結果是否是純粹的結果而不是帶了一些其他的干擾詞匯等等最終實現翻譯結果與預期一致。

?

wKgZomZ1Sb6AL_C1AACNoaVt7tM373.png

??

大模型自動化輔助翻譯:在新增加詞條時,用戶選擇語言后,利用大模型得到相對應的翻譯輔助用戶,可直接使用或在此基礎上進行調整,大大降低翻譯成本。

chaijie_default.png

??

4.3.2 多語言線上化

將多語言包上傳至云存儲,在每次更新翻譯內容并審批通過時自動更新云存儲的文件。

wKgaomZ1ScuAbcN1AADHQ4Kw7w0097.png

??

4.3.3 自動版本更新

審批通過以后自動生成新的版本,在前端拉取語言版本時自動拉取的就是最新版本的語言包。系統底層存儲了各個語言的版本號,和云存儲的文件對應在一起。

wKgZomZ1ScuAIEyzAAGgLGcB590751.png

??

4.3.4 自動化詞條更新技術

自動化詞條更新技術,旨在提升詞條更新的效率和專業性。

效率:具體而言,當用戶在前端界面啟用錨點編輯功能并選中特定詞條時,系統將自動觸發并展示更新界面。該界面引導用戶輸入新的詞條內容,隨后前端將這些更改實時轉化為一個待審批的詞條替換任務。

專業性:此任務隨后被送至管理員端,由具備相應權限的管理員進行審核。審批流程不僅確保了詞條更新的合法性和準確性,同時也維護了內容的質量和一致性。

一旦管理員批準了該詞條替換任務,所提議的詞條更改將被自動應用并立即生效,從而實現了對語言庫的快速而審慎的更新。

4.3.5 異常兼容降級

在用戶訪問應用時,優先拉取最新的語言包,同時存儲該版本到本地,下次進入獲取各語言包版本,和本地緩存的對應語言包版本進行對比,如果對應語言的版本有更新,則獲取新資源同時對本地資源更新。

同時在每次構建時自動拉取最新的語言包并更新,同時該版本作為base(基礎)版本,當自動更新詞條服務不可用時進行降級處理,繼續引用編譯構建時的語言包,不影響系統的正常使用。

wKgaomZ1ScyAGTMaAACovgIQDfY088.jpg

??

本地緩存的語言包:

wKgZomZ1Sc6AMbK6AAXnm7186pE446.jpg

??

通過這種降級方案,我們可以實現:

1.無縫更新:用戶可以自動獲取最新的語言包,無需手動干預,提升了用戶體驗。

2.離線支持:即使遠程服務不可用,應用也能通過本地緩存的語言包繼續運行,保證了應用的可用性。

3.版本兼容性:通過版本檢查確保用戶總是使用與應用兼容的語言包,避免因版本不匹配導致的潛在問題。

4.構建時更新:在構建應用時自動更新語言包,確保部署的應用總是使用最新的語言資源。

5.資源效率:通過本地緩存減少了重復從遠程服務器拉取相同資源的次數,節省了網絡帶寬和服務器負載。

6.容錯性:即使在更新過程中出現問題,系統也可以回退到穩定的base版本,保持系統的穩定性。

7.易于維護:清晰的版本管理和更新邏輯簡化了維護工作,便于開發者管理和部署語言資源。

五、實現效果

5.1 人效提升

每個迭代周期按照經驗更正20個不規范詞條左右,并且每個迭代周期上線1.5次,那么每個月可以節省大約2人日的工作量。這種效率的提升,不僅提高了國際化產品的專業力,還提高了團隊的整體生產力。

5.1.1 系統國際化快速復用

在傳統的國際化流程中,每當系統需要支持新的語言,通常需要進行繁瑣的翻譯和本地化工作。然而,通過引入大型模型的翻譯能力,我們能夠實現快速的語言版本定制和更新。例如,當系統需要支持一種新的語言時,可以利用大模型快速翻譯系統代碼中的詞條,然后通過自動化工具將這些詞條集成到系統中,無需進行復雜的手動操作。

此外,通過建立國際物流術語詞條庫,我們可以確保不同系統之間的術語統一,避免了重復翻譯和不一致的問題。這種方法不僅提高了翻譯的準確性,還大大減少了研發在多語言支持上的工作量,使得國際化過程更加高效。

wKgaomZ1Sc6AJAO-AACHsNIZ_eQ437.png

??

5.1.2 詞條校準快速高效

在每個迭代的需求開發時,不再因為詞條的更新需要研發不斷的發版,每次發版發布多套環境,而是系統自動更新自動生效。只需要在詞條管家中修改以后等待審批人審批以后即可生效,極大的縮短詞條的生效時間,助力敏捷提效。快速更正不合適的詞條,省去各個中間環節。

原有流程完成一次術語修改需要經過10個流程節點才能完成一次術語的修改和生效,每次修改需要2個多小時,主要花費在部署多套環境上。增加了術語庫的能力以后,每次修改術語需要4個流程節點,生效時間只需要15分鐘左右,真正實現了即改即生效,生效即可見的效果。

wKgZomZ1Sc-AfJBOAAHQsRcBq_s605.png

??

5.2 質量提升

5.2.1 物流術語專業統一

為了解決翻譯本土化的難題,我們嘗試了多種方案。最直接的方法是依賴第三方翻譯服務商,但這種做法存在多個問題。首先,成本較高;其次,翻譯的準確性無法保證。主要問題是,我們的每個系統都具有專業性,日常使用中看似簡單的詞匯,翻譯公司可能無法準確理解其含義,從而導致翻譯結果無法準確表達原意。因此,這種方法產生的結果并不理想。隨著越來越多的系統在做國際化,我們發現同行業系統之間有很多詞匯是相同的,但是不同系統的翻譯結果可能有差異,無法做到術語統一,這會給用戶帶來困擾,對外體驗不好,因此我們孕育出想做一個行業詞條庫的想法。

通過國際供應鏈各個系統詞條匯總,統計出高頻詞條,通過GPT智能翻譯加人工校對,確保詞條翻譯的準確性和本土化,有了公共詞庫作為基礎,所有系統多語言翻譯優先查詢公共詞庫,確保不同系統術語統一,其次才是復雜文本GPT智能翻譯。

國際公共詞庫成型示意圖:

wKgaomZ1SdCAQXJRAABpYyax2M0946.png

??

通過現有國際物流系統的詞條,我們通過使用頻率篩選出高頻詞條,通過GPT翻譯加人工校驗的方式進行詞條沉淀,考慮到不同位置展示的詞條書寫格式的差異,詞條類型根據不同的用途進行分類管理。比如考慮到菜單類詞條可能很多英語寫法喜歡縮寫,會將頁面菜單詞條和異常提示詞條分類存放,使用的時候同樣的詞匯會根據具體的類型進行翻譯。

wKgZomZ1SdGAK0qXAADzdutaSXM199.png

??

?

通過公共詞庫的實踐,我們避免了很多詞匯的二次翻譯,同時翻譯結果的準確性和本土化程度大幅提高,隨著詞條沉淀的增多,發揮的作用將會越大,所以,如果你的系統正在做國際化,強烈推薦沉淀一份公共詞庫,可以讓系統翻譯更加統一,更加精確。

六、總結規劃

當前國際物流術語詞條庫已經開始建設,但是不同語言在系統層面如何精簡的體現且能被用戶清晰的知曉還需要不斷的摸索和提煉,也希望大家獻言獻策,不斷完善。

國際在多語言的開發過程中不斷總結歸納,創新性的將國際的多語言整理成了國際術語詞條庫,為國際的專業術語統一打下了良好的基礎。利用技術優勢,將語言包放置到了線上,在打包時自動更新拉取,同時提供線上所見即所得的詞條修改能力,不斷提高多語言的專業性。

附錄:系統國際化技術解決方案系列—— 系統國際化之多語言解決方案

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GPT
    GPT
    +關注

    關注

    0

    文章

    342

    瀏覽量

    15151
  • 大模型
    +關注

    關注

    2

    文章

    2053

    瀏覽量

    1777
收藏 人收藏

    評論

    相關推薦

    基于AX650N芯片部署MiniCPM-V 2.0高效端側多模態大模型

    2.8B參數。MiniCPM-V 2.0具有領先的光學字符識別(OCR)和多模態理解能力。該模型在綜合性OCR能力評測基準OCRBench上達到開源社區的最佳水平,甚至在場景文字理解方面實現接近Gemini Pro的性能。簡單來說,就是能夠
    的頭像 發表于 07-15 09:34 ?401次閱讀
    基于AX650N芯片部署MiniCPM-V 2.0高效端側多模態大<b class='flag-5'>模型</b>

    商湯“日日新”大模型全面賦能2024 WAIC

    7月6日,WAIC 2024迎來第三天。 商湯科技全新升級的「日日新SenseNova 5.5」備受熱議,作為國內首個具備流式原生多模態交互能力的大模型,交互效果和多項核心指標實現對標GPT-4o。“所見即所得”的
    的頭像 發表于 07-08 15:54 ?482次閱讀

    如何實現園區大屏可視

    如何實現園區大屏可視? 1.建立孿生模型:首先需要建立園區的孿生模型一個數字的虛擬
    的頭像 發表于 06-19 15:39 ?210次閱讀
    如何<b class='flag-5'>實現</b>園區大屏可視<b class='flag-5'>化</b>?

    光通信行業專業術語解析大全

    近期公司內部開展了一期學習交流會,各位同事收獲頗多,特別是關于一些專業術語的簡稱,大家都覺得非常有意思!小編馬不停蹄的整理出來分享給大家,希望可以給學習光通信知識的萌新們小小助力
    的頭像 發表于 05-11 17:22 ?488次閱讀

    李未可科技正式推出WAKE-AI多模態AI大模型

    文本生成、語言理解、圖像識別及視頻生成等多模態交互能力。 ? 該大模型圍繞 GPS 軌跡+視覺+語音打造新一代 LLM-Based的自然交互,同時多模態問答技術的加持,能實現所見即所問、所問
    發表于 04-18 17:01 ?448次閱讀
    李未可科技正式推出WAKE-AI多模態AI大<b class='flag-5'>模型</b>

    ADS應用技巧(16)—Layout連接性模式選項

    ADS通過物理連接性引擎(PCE)來管理Layout網絡,Layout網絡更新有兩種模式:所見即所得(WYSIWYG)、基于網絡(Net-Based)。
    的頭像 發表于 03-05 09:41 ?1487次閱讀
    ADS應用技巧(16)—Layout連接性模式選項

    SMT貼片加工常見的專業術語分享

    一站式PCBA智造廠家今天為大家講講SMT貼片加工有哪些常用的專業術語?SMT貼片加工常見的專業術語。SMT是表面組裝技術(表面貼裝技術),是目前電子組裝行業里流行的一種技術和工藝,具有組裝密度高
    的頭像 發表于 01-09 09:08 ?567次閱讀

    【采購必看】元器件采購常用的英文專業術語,都在這了!

    在全球的背景下,跨國企業和國際采購日益普遍,電子元器件行業亦如此。 電子采購員時常接觸到許多專業英文術語,如BOM(物料清單)、RFQ(詢價單)等。 了解這些英文
    的頭像 發表于 12-27 08:15 ?873次閱讀
    【采購必看】元器件采購常用的英文<b class='flag-5'>專業術語</b>,都在這了!

    SSD入門必看|這些專業術語你知道多少?

    SSD領域涉及到較多的專業術語,為了更深入地了解SSD技術,本文對常用SSD術語進行簡要的說明和介紹。Namespace命名空間,是NVMe協議中一個基本的邏輯空間的概念。簡單地說,命名空間將
    的頭像 發表于 12-16 08:34 ?579次閱讀
    SSD入門必看|這些<b class='flag-5'>專業術語</b>你知道多少?

    AI技術如何助力實現智慧交通

    人工智能的常見優勢在于能夠實時、高效地分析處理大量的數據,并結合算法模型提供個性專業化的服務。在智慧交通方面,人工智能同樣可以發揮專長,助力打造智能高效的交通運輸網絡,本篇就為大家
    的頭像 發表于 11-28 17:43 ?836次閱讀
    AI技術如何<b class='flag-5'>助力</b><b class='flag-5'>實現</b>智慧交通

    如何看待處理器中的專業化與通用

    專業化和通用之間有一個權衡。“在X軸上(見圖2),您可以看到與通用處理器相比,專業化帶來的速度提升。Y軸代表生產量。它顯示了為了從專業化中獲益你必須生產的芯片數量。淺藍色區域是我們大
    發表于 11-22 10:06 ?119次閱讀
    如何看待處理器中的<b class='flag-5'>專業化</b>與通用<b class='flag-5'>化</b>

    計算光學成像如何突破傳統光學成像極限

    傳統光學成像建立在幾何光學基礎上,借鑒人眼視覺“所見即所得”的原理,而忽略了諸多光學高維信息。當前傳統光學成像在硬件功能、成像性能方面接近物理極限,在眾多領域已無法滿足應用需求。
    發表于 11-17 17:08 ?689次閱讀
    計算光學成像如何突破傳統光學成像極限

    STM32F10x中一些專業術語解釋

    STM32F10x中一些專業術語解釋
    的頭像 發表于 11-01 16:59 ?386次閱讀

    電工行業的專業術語總結

    做電工的師傅都知道,電工的理論知識非常重要,理論知識可以在一定程度上指導實踐經驗,是電工發展的基礎。當然了,做電工掌握一些電工行業的專業術語也是非常重要的!要不然和專業人員交流的時候不免會很尷尬!下面我們就來看看有哪些必須知道的詞。
    的頭像 發表于 09-11 11:11 ?835次閱讀

    洲明進一步提高Micro LED自動化生產技術的可控能力

    沉浸式觀展氛圍 還可現場“游歷”XR虛擬拍攝場景體驗所見即所得的虛實空間 ? ?01Micro Space專為高精度顯示需求場景研發? ? ? ? ? 現場展出的UMini III 0.9 Pro系列
    的頭像 發表于 09-08 09:50 ?617次閱讀