在人工智能幾經起落的發展史里,人工智能進化的里程碑式的演進中,我們總會看見百年企業 IBM 的身影。除了大家所熟知的 1997 年 IBM 的深藍計算機在國際象棋比賽(和復賽)中擊敗國際象棋世界冠軍 Garry Kasparov,還有上世紀的跳棋人機大戰等諸多事件。而今天,在大模型的時代,IBM 帶來了針對基礎模型 watsonx 和生成式 AI 的全新平臺 —— watsonx。
IBM 大中華區董事長、總經理陳旭東這樣說道:“ChatGPT 的橫空出世,證明了大語言模型是一條走得通、通往未來 AI 的道路,也意味著 AI 的發展經過幾十年的算法、算力、數據方面的量變積累,‘質變時刻’已經到來。”
2011 年,IBM(國際商業機器公司)正式踏入了百年企業的行列,它是世界上最具影響力的科技公司之一,具有豐富的歷史和卓越的技術傳統。IBM 當時舉辦了一場紀念百年輝煌歷程的盛大慶典,用一部短片將 IBM 的百年歷史濃縮成了令人陶醉的幾分鐘,并全球各個角落提供了為時一整年的志愿者活動。
直到現在,我們仍然可以通過 IBM 100 網頁穿越時空,回顧從機械制表機起,逐一瀏覽原子重排技術、Fortran、RISC、大型機、個人電腦、小型機、深藍、Watson 的每一個創舉。
2023 年,IBM 百年慶典后的第十二年,這是屬于 AI 的一年。各行各業的公司紛紛加入這股智能潮流,研發各形各色的大模型,推出可以為我們規劃假期的生成式聊天機器人、組織企業數據的 AI 智能助手以及可以創建圖像和視頻的 AI 服務。今年 8 月,IBM 也緊跟著這道熱潮,宣布啟動新一代 AI 與數據平臺 IBM watsonx,為企業級基礎模型和生成式 AI 提供動力。
這是繼紅帽 OpenShift 開放式混合云技術平臺之后,IBM 落地大中華區市場的又一個具有里程碑意義的開放式 AI 技術平臺。
“Watson ”是 IBM 創始人老沃森的名字,也是 IBM 文化奠基人托馬斯·J·沃森(Thomas J. Watson Sr.)的名字。隨著時間的推移,這個名字變得更加具有象征性,代表了 IBM 在人工智能領域的雄心壯志和創新。若要回溯這些歷史,還得先從那些不起眼的象棋棋子開始。
始于棋局的 AI
自 20 世紀 40 年代末人工智能和第一臺計算機出現以來,計算機象棋就與人工智能領域聯系在一起。
這兩個領域交織了許多知名人士,例如艾倫·圖靈(Alan Turing),現代計算機科學的奠基人;約翰·麥卡錫 (John McCarthy) ,“人工智能”一詞的創造者;布爾邏輯先驅克勞德·香農(Claude Shannon),他率先支持使用國際象棋作為智力發展的適當起點。
其中,圖靈并沒有被當時技術的缺乏和先例的確立所嚇倒,而是尋求支持他的理論,并為世界上第一個國際象棋程序編寫了算法。不幸的是,這個由圖靈本人寫在紙上并實施的程序,很快就被一名同事輕松地擊敗了。
從那以后,大量的程序員投入時間和精力來研究國際象棋,他們堅信這個游戲將會使人工智能領域取得突破性進展。這些研究人員在國際象棋的結構中看到了一個大規模問題解決的簡化模型。而從人類比較的角度來看,世界各地已經存在的國際象棋選手的等級體系則為工程師提供了一個用來輕松而準確地衡量機器實力的標尺。
幾十年的研究幾乎沒有取得進展,許多計算機都曾與眾多國際象棋大師對弈,無一得勝。直到 1985 年,卡內基梅隆大學的研究生許峰雄(Feng-hsiung Hsu)開始著手他的論文項目:ChipTest,一臺國際象棋機器。許峰雄的同學 Murray Campbell 也參與其中,并在 1989 年被聘為 IBM Research 的工作人員。他們加入了 IBM 的團隊,并將該項目命名為“深藍”(Deep Blue)。
憑借強大的硬件系統和創新的評測功能,深藍一號在 1996 年以六局的賽制(six-game chess matches)發起了比賽,與當時的國際象棋世界冠軍卡斯帕羅夫對決。令許多人驚訝的是,深藍直接拿下了第一局,這也是機器首次戰勝國際象棋世界冠軍。然而,卡斯帕羅夫并沒被早期失利嚇倒,而是最終以四比二的比分贏得了整個比賽。
經過多次更新和提高其國際象棋知識以對抗上一場比賽中使用的策略,重建的深藍在 1997 年的復賽中戰勝了卡斯帕羅夫。
在比賽中,卡斯帕羅夫擅長的非傳統開局、心理威嚇和超時戰術對機器沒有任何影響,因為深藍只會冷靜地識別和分析棋局上的情況:人類玩家在棋盤上表現出的威脅和情感在機器對局勢的評估中沒有太大影響。
深藍使用的架構并未局限于賽場,而是很快應用到金融建模、數據挖掘和分子動力學等方面。最終,深藍被退役并存放在華盛頓特區的史密森尼博物館,結束了風光的一生。在 AI 領域,IBM 也沒有因此懈怠,而是投入到另一項重大挑戰:打造一臺能夠在更復雜的游戲中擊敗人類冠軍的計算機。
AI 能思考嗎?
2011 年,IBM 的 Watson 計算機參加了電視智力競賽節目《危險邊緣》(Jeopardy!)的比賽,對抗該節目有史以來最杰出的兩位冠軍選手。Watson 計算機由 IBM 研究部門開發,可以運行一個名為 Deep QA 的軟件。雖然這個項目的主要挑戰是在《危險邊緣》中獲勝,但 Watson 的真實目標是創建一代新的技術,試圖戰勝標準搜索技術,更有效地從非結構化數據中找到答案。
耳熟嗎?是否很像那個爆紅的對話式人工智能——ChatGPT。對于 IBM 的科學家而言,這不是什么很難想到的創意,但它涌現出的奇跡卻未能在 2011 年提前現世,而是需要沉淀 12 年的數據。
節目中,Watson 在理解復雜問題和找到最佳答案方面表現出色。IBM 的科學家也做出了解釋,指出 Watson 實際上不會思考。
“我們的目標是構建一臺計算機,能夠更有效地理解和運用自然語言,但并不一定需要以與人類相同的方式思考,而不是模仿人腦,”曾在 IBM 研究部門工作了 15 年,專注于自然語言問題和在非結構化信息中找到答案的 David Ferrucci 說道。
《危險邊緣》的問題充滿了微妙之處、雙關語和文字游戲,這些典型的腦筋急轉彎問題充斥著計算機難以應對的元素。計算機從來都不擅長尋找答案。搜索引擎不會回答問題,它們只會提供與關鍵詞匹配的成千上萬個搜索結果。
長期以來,大學研究人員和公司工程師一直致力于創造一個完美的問答軟件,但最優秀的軟件也只能理解和回答簡單直接的問題——哪怕是 2023 年的今天,問答大模型也經常會“胡謅”出一堆子虛烏有的事實來敷衍我們。 Watson 運行在一組 Power 750 計算機上,包括十個機架,90 個服務器,共計 2880 個處理器核心。它可以容納大約相當于一百萬本書的信息。IBM 耗費多年時間讓 Watson 吸收了大量信息,包括商業來源的文本以及允許公開復制其內容的來源(如維基百科)。
主持人向 Watson 提出問題時,超過 100 個算法將以不同的方式分析問題,并同時找到許多不同的合理答案。另一組算法則會對答案進行排名并給出分數。對于每個可能的答案,Watson 會找到可能支持或反駁該答案的證據。然而,在《危險邊緣》的比賽中,如果最高排名的可能答案評級不高到足以給 Watson 足夠的信心,那么 Watson 會決定不按鍵,以避免答錯而損失分數。
2010 年末,Watson 進行過一輪測試,在與前《危險邊緣》冠軍選手對戰的比賽中贏得約 70%的比賽。然后,2011 年 2 月,迭代到最新版本的 Watson 戰勝了《危險邊緣》的人類巨星肯·詹寧斯(Ken Jennings)和布拉德·拉特(Brad Rutter)。
“Watson 之父”約翰·凱利表示:“我想創建一些可以引入到每個其他零售行業、交通運輸行業等領域的東西,因為無論在哪里,時間都至關重要,需要將尖端信息提供給前線決策者。計算機需要從后勤變成提高人類決策智慧的工具?!?/p>
深藍和 Watson 分別代表了 IBM 在 AI 領域的兩個巔峰時刻。深藍的勝利證明了機器在高度專業領域的潛力,而 Watson 則將 AI 引入了自然語言處理和商業應用的新領域。這兩個里程碑都為 IBM 在 AI 領域的未來探索奠定了堅實基礎。
擁抱基礎模型與生成式 AI
上世紀 80 年代,IBM 猶如硅谷之巔的一尊巨獸,等待著挑戰。微軟和蘋果虎視眈眈,而無數初創企業也躍躍欲試。幾十年來,IBM 一直走在突破性人工智能科技的前沿。從深藍到 Watson,再到云原生時代,在云計算的基礎上構建了 AI 超級計算機。然而,AI 寒冬太過漫長,許多公司放棄了在人工智能領域的探索,投入資源更多地用于其他領域。
隨著 ChatGPT 點燃了這場寒冬,企業對生成式 AI 和大語言模型的關注度激增,迫切希望應用 AI 領域的新技術來提升競爭力。今年 8 月的發布會上,IBM 將多年以來在企業級 AI 領域積累的技術和經驗,結合最近五年在基礎模型研究方面取得的進展,推出了新一代數據與 AI 平臺 IBM watsonx。
watsonx 是 IBM 為解決企業在人工智能應用中的數據管理、模型開發、驗證、部署和治理等方面的挑戰而推出的綜合平臺。該平臺包括 watsonx.ai、watsonx.data 和 watsonx.governance 三個關鍵組件,共同構成了一個完整的AI生命周期解決方案。
watsonx.ai 是平臺的核心,專注于AI模型的訓練、驗證、微調和部署。它為企業提供了強大的計算資源,以處理大規模的模型訓練任務。有了 watsonx.ai,AI 構建者就可以利用 IBM 的模型和 Hugging Face 的模型來完成一系列 AI 開發任務。
這些模型經過預訓練,可支持一系列自然語言處理(NLP)類型的任務,包括問答、內容生成和摘要、文本分類和提取。watsonx.ai 允許企業選擇適合其需求的模型架構,并根據模型性能的基準測試結果來評估和選擇最佳模型。
在發布會的演講中,IBM 大中華區首席技術官、研發中心總經理謝東也對 IBM 近期的 AI 研究作出了詳細的介紹:「最近,很多人都問我一個問題:IBM 是否還在持續發展人工智能?我想告訴大家,IBM 一直都是混合云與 AI 領域的領導者。
IBM 多年來一直是多個重大體育賽事的技術贊助商,包括美國高爾夫球大師賽、英國溫布爾登網球錦標賽和美國網球公開賽。
我之所以提到這些體育賽事,不僅因為我熱愛體育,更重要的是要說明,用于這些大賽的基于 watsonx 的生成式人工智能的技術,也是我們用于賦能各行各業應用的 AI 技術——基于特定專業領域的數據(如網球、高爾夫球)和知識,提供更為準確的預測(如球員比賽的贏率)。
但有人可能會問,人工智能如此強大和有趣,是否很容易應用到各個領域呢?我要告訴大家,實際情況并非如此。雖然很多人熟悉 ChatGPT 等大語言模型,但實際應用 AI 需要考慮多個因素,包括模型的選擇、數據的利用、開發環境和算力等等。
這就是許多企業目前面臨的挑戰。隨著大語言模型的不斷涌現,企業需要仔細思考選擇哪個模型、如何充分利用自身數據、如何開發應用和部署等問題。而 IBM 正致力于解決這些問題,為企業提供完整的人工智能解決方案?!?/p>
watsonx.data 是數據管理的關鍵部分,它幫助企業高效地準備、過濾和清洗數據以用于訓練模型。數據的分類和詞符化是數據準備過程中的重要步驟。watsonx.data 還允許企業使用自有數據或 IBM 數據堆來滿足模型訓練的需求,并提供了數據名片和版本控制,以便進行數據的可追溯治理。
數據——這個詞匯一直縈繞在無數技術人的心中,更是 IBM 歷史上重要的一頁。IBM 在上世紀 70 年代對數據庫領域產生了深遠影響。1970 年,IBM 的科學家埃德加·科德(Edgar F. Codd)提出了關系型數據庫的理論,這一理論后來演化成了 SQL(結構化查詢語言),為關系型數據庫管理系統(RDBMS)的發展奠定了基礎。
到了上文提到的 IBM Watson 時代,Watson 利用大規模的數據庫來構建知識圖譜,幫助用戶獲取復雜問題的答案。Watson 還被用于醫療領域,可以通過分析數百萬篇醫學文獻和病例數據庫來輔助醫生制定診斷和治療方案。
如今,watson 之名還在延續。今年晚些時候,watsonx.data 將利用 watsonx.ai 的基礎模型,來幫助簡化和加速用戶與數據的交互方式,使他們能夠使用自然語言以對話式的用戶體驗來發現、增強、優化和可視化其數據與元數據。
watsonx.governance 關注企業級 AI 的合規性和治理。正如這場發布會的名稱——“企業級 AI 的未來”。它確保模型和數據遵守法律法規和道德標準,特別是在處理敏感信息和隱私數據時。在演講中,強調了治理的重要性,以確保企業可以信任其 AI 系統。watsonx.governance 還提供了事實表,用于記錄模型和數據的詳細信息,以便進行監控和更新。
跨世紀的 AI 探索者
深藍和 Watson 都是早期的 AI 項目,筆者看過無數論壇網友和名人學者對它們的抨擊,這些機器被批評“沒有真正的智能”。
盡管深藍在計算棋局和搜索可能著法方面非常強大,但它被批評為一種“硬編碼”方法,即它不具備真正的智能或推理能力。深藍的勝利主要依賴于其出色的計算速度和搜索算法,而不是對棋局的理解。
Watson 的批評主要涉及到它在回答問題時的不確定性管理和推理能力。盡管 Watson 可以處理大量的信息和文本數據,但它有時會給出不準確的答案,因為它不能真正理解問題的上下文,只是根據統計概率進行答案選擇。
現在,大模型也正在受到一樣的抨擊。
它依舊不會推理、不會思考、不具備情感,但卻和 IBM 的幾次嘗試一樣有用,為全行業注入了新的活力。就像深藍和 Watson 在投入使用后為 IBM 的專業領域帶來了重大的貢獻一樣,大模型也滋潤著各行各業。
人工智能領域仍在不斷發展,無數企業和科學家們不懈努力,追求更優化的方法來處理認知任務和推理問題,以實現更高級別的智能。盡管面臨挑戰,AI 領域的前景仍然充滿希望。
-
算法
+關注
關注
23文章
4600瀏覽量
92646 -
人工智能
+關注
關注
1791文章
46866瀏覽量
237589 -
大模型
+關注
關注
2文章
2332瀏覽量
2489
原文標題:大模型意味著人工智能的質變時刻已經到來!
文章出處:【微信號:AI科技大本營,微信公眾號:AI科技大本營】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論