“最近我被問到最多的一個問題,是 IBM 現在還在做 AI 嗎?我想告訴大家的是,IBM 是一家混合云與 AI 公司,我們一直在做 AI,并且專門做企業級 AI。”IBM 大中華區首席技術官、研發中心總經理謝東在日前接受媒體采訪時強調。
面對今年以來熱度一路狂飆的生成式 AI,作為 AI 發展史上的重要參與者,IBM 并沒有“閑著”。今年 5 月,IBM 發布了企業級 AI 和數據平臺 watsonx;自 7 月份以來,各個模塊陸續上市;預計在今年年底到明年初,全部功能模塊將會上市。其中,watsonx.data 的 premise 版本現在已經可以提供給中國客戶。
如謝東強調,IBM 在其中錨定的依舊是“企業級”市場,延續長期以來的產品和生態定位。
然而,企業級 AI 應用與個人 AI 應用需求之間存在巨大差異,對技術本身的要求也不在一個量級。僅拿當下生成式 AI 應用最讓人詬病的“AI 幻覺”問題來說,放在企業級生產環境,對此幾乎是“零容忍”。
根據 IBM 商業價值研究院最近發布的面向全球超過 30 個國家和地區、超過 3000 名 CEO 的調研報告顯示,61% 的受訪 CEO 表達了對生成式 AI 中所使用的數據來源的擔憂。
“這一擔憂側面反映了企業 AI 應用之路面臨著重重挑戰:首先是技術挑戰,尤其是數據的準備、應用和治理;第二是人才挑戰,企業需要快速實現人員技能的轉型和提升,來擁抱 AI 浪潮;第三是文化挑戰,技能的轉型往往伴隨組織文化的更新,如何讓二者互相成就、帶來生產力的提高,這需要優秀的管理智慧。”IBM 大中華區董事長、總經理陳旭東指出。
據此,在 IBM 看來,在企業落地 AI 應用有三個關鍵點:聚焦自身的業務需求、使用企業自己的數據、量身定制生成式 AI 解決方案和模型。那么,IBM watsonx 究竟是什么?又如何滿足企業級 AI 應用的如上需求?本文將為大家揭曉。
企業使用 AI,關注的是它“不能做什么”和“不允許做什么”
從“AI 幻覺”問題說起。
企業使用 AI,不只是關心它“能做什么”,更要關注的是它“不能做什么”,以及“不允許它做什么”。AI 的可信性、可解釋性非常關鍵。因為企業決策與經營直接相關,企業使用 AI,要避免給業務帶來技術風險,因此對智能分析的準確率要求高,容錯率低。
在謝東看來,消滅“幻覺”歸根結底要從最初的數據抓起。“想讓 AI 的回答是正確的,至少要保證訓練的數據是干凈合規的,數據本身的完整性、信息量要合乎要求。”他告訴 InfoQ。
IBM watsonx 正在試圖解決這些問題。根據官方釋義,它提供一個包括 AI 開發平臺 watsonx.ai、數據存儲平臺 watsonx.data 和 AI 治理平臺 watsonx.governance。
其中,watsonx.data 針對企業中海量且復雜的數據,可以通過集中治理和本地自動化策略實施來確保數據的安全性和合規性;此外,watsonx.governance 還采用了軟件自動化來幫助企業增強能力以降低風險、滿足監管要求和應對 AI 倫理問題,使得企業能夠自動化和整合多個工具、應用程序和平臺,同時可以記錄數據集、模型、相關元數據和管道的來源。
“另一方面,幻覺的產生是因為在大模型中缺失了相應的信息,克服的方法是使用企業自己的數據,把企業的數據輸入給它,這樣至少可以在特定業務領域減少幻覺的產生。”謝東補充說。
據了解,除了原始數據和專有數據,企業還可以帶入自己的數據來豐富和改進他們的目標模型,所有數據都存儲在 watsonx.data 中,其中包含有關每個文件或文檔的詳細元數據,以提供可追溯的治理。在數據的過濾和處理過程中,平臺首先會識別數據的來源和 ID,然后對數據進行分類和過濾,對重復數據和不合規數據進行分析和清除。并且,對數據進行版本控制和標記。在過濾和預處理后,每個數據集都會獲得一個數據名片。數據名片包含數據堆的名稱和版本,以及其內容和已應用的過濾器等其他相關內容。
“換句話說,IBM 非常清楚自己用于訓練模型所有的數據及其版本,也會告訴用戶我們的模型是由哪些數據訓練而來,并且后期還有很多調優的工作,以此增強用戶對模型的信心。”謝東進一步解釋。
事實上,從現階段來看,幾乎所有生成式模型都可能產生幻覺,都會給出一些不相關或不準確的答案。尤其典型的是,當提示模型去處理一個它沒有接受過訓練的題目或者用的訓練集數據不足時,AI 幻覺很難不發生。
對此,據 IBM 透露,其內部還在研究一種降低 AI 幻覺風險的方法,名為“檢索增強生成”,意在使模型能夠在生成答案之前從知識庫中檢索相關數據。
IBM 大中華科技事業部數據人工智能、自動化中國華南與華東大區總經理許偉杰表示,IBM 正在通過模型融合進一步解決這一問題。“大語言模型所做的最重要的一件事是語義理解,目前我們正在通過語義識別,基于 IBM watsonx 能力做精準答案確定。也就是說,利用通用語言大模型的方式了解語義,幫助既有的模型實現既有答案的匹配,再回溯給語義大模型。”
基礎模型帶來拐點,數據無需再打標簽
值得一提的是,IBM watsonx 平臺聚焦于特定業務領域的基礎模型。基礎模型基于特定類型的 Transformer 神經網絡架構而構建,為生成相關數據元素的序列(例如句子)而設。非常重要的一點在于,Transformer 架構能夠幫助基礎模型理解未標記數據,并將輸入轉換為輸出,從而生成新的內容(ChatGPT 就是基于 Transformer 架構開發)。
“以前基于深度學習、機器學習的算法,通常要對海量數據打標簽,再交給機器進行學習。并且,經過學習和部署,這個模型也只能做一個特定的事情,比如用于人臉識別或者下棋。”謝東解釋道。
換言之,深度學習和機器學習的痛點在于,前期工作巨大,但最終輸出的算法模型能應用的范圍非常局限,“性價比”不高。
有別于此,基礎模型允許在大量未標記的數據上進行訓練,可以適應新的場景和用例。盡管基礎模型也需要前期大量投資,但每次使用時,它都會攤銷 AI 模型構建的初始工作,因為微調基于基礎模型構建的其他模型的數據要求要比從頭開始構建低得多。這既可以大幅提高投資回報率(ROI),又可以大大縮短上市時間。
因此,在 IBM 看來,基礎模型把 AI 技術發展帶到一個拐點——使企業級 AI 的加速和擴展成為可能。
“我們認為,相較于通用大語言模型,企業應該更加關注基礎模型。”謝東解釋道,“在企業應用 AI 的時候,除了大語言模型,還會有不同的應用場景,包括 IT 自動化模型、數字勞動力的模型、網絡安全模型等等,這些不同的專業模型支撐了這些企業級應用。”
據了解,IBM 目前正在構建一系列針對多種類型的業務數據進行訓練的特定領域的基礎模型,包括代碼、時間序列數據、表格數據、地理空間數據、半結構化數據和混合模態數據(如文本與圖像的組合)。IBM 認為,這些基礎模型的靈活性和可擴展性將顯著加速企業對 AI 的采用。
在今年 7 月舉辦的 2023 溫網錦標賽上,IBM 已經利用 watsonx 為大賽所有視頻集錦提供生成式 AI 解說,并且,基于 IBM AI Draw Analysis 提供的一套全新的統計數據,還可以使用 AI 來預測單打抽簽中每個球員進入決賽的可能性。
大模型不一定越“大”越好
有了基礎模型,下一個解決的問題是,企業如何根據自身的業務需求,選擇適用的模型。謝東強調,所謂“適用”,意味著模型不一定越“大”越好。因為,企業在任何技術領域的投入都是以驅動經營為目的,更在乎其中的投入產出比。
一方面,雖然模型越“大”,其知識和能力也越強,但是成本投入也是巨大的。對于企業而言,很多應用場景的落地并不在于模型本身大小,而在于多大程度符合企業特定要求,能不能很好地完成任務,匹配業務目標;
另一方面,支持一個大模型的訓練和運行非常消耗算力,模型上線之后,企業業務本身仍然在不斷變化,這要求模型具備適應性和可擴展性,系統能力也要不斷學習和進化。而出于運維成本的考慮,“小”模型反而比“大”模型更加節約且靈活。
“在這個過程中,基礎模型要演化出各種不同應用,還需要有新的自動化工具和項目管理方法,實現持續的訓練、調試、部署等工作。”謝東舉例,IBM watsonx 就是這樣一個平臺工具,IBM 希望借此減輕企業的 AI 負擔,讓企業可以更輕松地實現大規模開發、調整和部署企業級 AI。
舉例來說,基于 watsonx.ai,AI 開發者就可以利用 IBM 自有的模型和 Hugging Face 的模型來完成一系列 AI 開發任務。這些模型經過預訓練,可以支持一系列自然語言處理 (NLP) 類型的任務,包括問答、內容生成和摘要、文本分類和提取。據了解,未來的版本還將提供更多由 IBM 訓練的針對提升相關領域效率和任務專業化的專有基礎模型的訪問。
事實上,多年來,IBM 一直在幫助企業把 AI 部署到核心應用中,從而增強企業生產力。據菜鳥科技首席科學家、菜鳥物流科技部算法總監王子豪介紹,菜鳥與 IBM 在 AI 開放和賦能方面有很多共性,菜鳥物流最早在快遞行業提出了神經網絡驅動的大規模地址分單技術,并且陸續在倉儲、客服、供應鏈等環節實現了廣泛的智能化升級,包括在倉儲場景應用機器視覺、推出物流智能客服和快遞末端地理大模型、基于決策智能技術構建菜鳥全球供應鏈網絡等等。并且,菜鳥還在無錫構建了亞洲最大規模的智能調度現場,最高峰期可以調度同時 1000 臺飛機。
但是,隨著基礎模型的演進,以及生成式 AI 的興起,的的確確給各行業 AI 的規模化廣泛應用帶來了新的變化。
謝東強調:“我們需要從以前數據為先的‘+AI’時代邁入 AI 為先的‘AI+’時代。這個說法不光是一個加號在前在后,當我們說 +AI 的時候,注重的是以數據為中心,企業是在數據應用的層面上附加一些 AI 的能力。而當我們走到 AI+ 的階段,意味著企業需要建立起 AI 的基礎能力,在這基礎上,我們需要進一步結合企業自身的數據和不同的業務目標,構建新的核心應用。”
寫在最后
對于企業而言,IBM watsonx 是一個全新的 AI 和數據平臺工具,那么,如何才能讓這個工具“物盡其用”?
除了搞定數據質量、數據共享的問題之外,IBM Consulting 大中華區總裁陳科典表示,企業中還必須具備相應的文化、人才和制度。“企業需要去提升內部人才的能力,培養新的文化,如此以來,才能讓內部對生成式 AI 的信心越來越充足,那么,更多的場景才會被創造出來。”
具體而言,IBM 認為在生成式 AI 的技術背景下,相關技術人員需要至少具備兩類能力:一是理解業務場景,能夠針對業務目標,對模型進行訓練和調整;二是理解企業自己的數據,知道數據分布在哪里,使用過程中的標準和規則等等。
IBM 大中華區客戶成功管理部總經理朱輝強調,“生成式 AI 的應用現在基本還處于‘打開腦洞’的階段,所以我們特別強調共創。因為有構建大模型能力的人,不一定擁有業務場景的支持,而擁有業務場景的企業,也不一定具有建設大模型的能力。這也是 IBM 一直以來的戰略定位,熱衷于提供基礎能力,與合作伙伴和客戶共創解決方案,從而解決客戶的問題。而不是拿出一個現成方案,告訴別人這就是你應該要的東西。
-
IBM
+關注
關注
3文章
1749瀏覽量
74626 -
AI
+關注
關注
87文章
30122瀏覽量
268407 -
大模型
+關注
關注
2文章
2324瀏覽量
2480
原文標題:企業級生成式 AI 應用,如何克服“幻覺”問題
文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論