在2019年的re:Invent大會上,當亞馬遜AWS首席執行官Andy Jassy進行主旨演講時,他意識到有關機器學習的內容簡直太多了,僅僅這一部分就花了差不多75分鐘。
時間寶貴,但內容更加重要,這促使AWS在一年后做出調整,在長達三周的re:Invent 2020上,機器學習單獨拿出來成為內容擔當。AWS機器學習副總裁Swami Sivasupamanian親自登臺講解,美國IT媒體 SiliconANGLE評價,AWS發布的信息和一系列發布,“加強了其在機器學習領域的莊重承諾。”
機器學習不再“空中樓閣”
用Swami Sivasupamanian本人的話來評價機器學習,它就是“我們這一代人將遇到的最具破壞性的技術之一。”這句話,在整個2020年都已經被證實。
例如,疫情之下,零售商家試圖通過線上各個渠道拓展銷量,快速成為制勝法則。達美樂披薩使用機器學習進行訂單管理,在客戶下單僅10分鐘左右之后,就能夠提供新鮮的披薩。
而在醫療領域,機器學習運用的一個典型的應用場景是,醫生用其來幫助判別病患腦部供血的狀況或是癌癥發展的狀況,這種行話被稱為“讀片”的操作,正極大地改善和輔助醫院的工作流程。
按照AWS公布的數據,接入并使用AWS機器學習服務的客戶已經超過10萬家,其中包括起亞、雅馬哈、美國宇航局、普華永道等,不同行業不同機構的用戶,正在把自己的數據交給機器學習來分析。
“機器學習就是工具,越來越多的行業用戶開始使用工具,去更多地幫到他們的業務。” 在面向媒體和分析師的溝通會上,AWS大中華區云服務產品管理總經理顧凡如此解釋,機器學習迅速滲透,是因為企業發現新工具有用且好用。
具體到AWS層面,不斷夯實技術,簡化機器學習難度就是一直以來的主題,其中必須遵循的理念是:將機器學習交到更多應用程序開發者和終端用戶手中,而他們無需機器學習經驗;讓更多開發者應用機器學習,創造更好的終端用戶體驗。
技術領先,產品以用戶為本,使用者自然紛至沓來。AWS公布的數據顯示,目前92%的基于Tensorflow框架的機器學習工作負載,91%的基于PyTorch框架的工作負載都跑在AWS云上。在一系列云服務商中,AWS體現了絕對優勢。
總結AWS在機器學習上一直以來的努力,顧凡認為,工具庫上的深度和廣度、開放心態以及一些必要的服務原則,是AWS被越來越多開發者和客戶信任的原因。
首先,機器學習是一個“Right tools for the right job”的事情,顧凡稱 “你希望運行什么樣的工作,在什么樣的場景下,應該選擇工具箱中什么樣的工具最適合。” 也就是一把鑰匙開一把鎖,合適的工具做合適的事兒。而AWS在機器學習服務上深度和寬度,能滿足用戶的不同需求。
其次,AWS力求采取開放包容的工具選擇策略,讓云端可以和客戶的整個環境做到良好的集成。不僅是機器學習框架和接口標準,在AI芯片選型、計算實例上,也可以讓用戶根據應用的不同場景,自由選擇。簡單來說,讓開發者自行選擇最具成本效益的云基礎架構。
不過,機器學習的一個關鍵是“Know-How”(專業知識),同時要實現解決方案的產品化。但這并不容易,因為人才奇缺,有時候,懂技術的人往往不懂業務,懂業務的人往往不懂技術。對此,AWS有必要向客戶“授人以漁”,為客戶賦能。
“當客戶真正在工程方面有差距的時候,在產品原型實現方面需要幫忙的時候,我們會把客戶扶上馬再送一程,真正幫他/她快速地把一些業務難題,先用產品原型的方式把它實現出來。”顧凡說。
最終,在用戶不斷的機器學習實踐中,復雜的“數據分析”及“AI計算”需求將持續爆發,專業的云計算服務商和數字化技術服務商價值將被快速釋放。
自下而上
AWS在這次re:Invent陸續發布了基于英特爾Habana AI加速芯片的實例、Amazon Kendra企業搜索、Amazon CodeGuru自動代碼審核、Amazon Fraud Detector自動欺詐檢測等功能和服務,也借此更進一步打牢基礎設施,拓展企業商用市場,從云端到邊緣,實現對企業日常任務的重塑和改進。
長期觀察AI技術的IT專家們不難發現,在洞悉機器學習的核心驅動力后,這些功能發布背后的邏輯就已經自然顯現了。它是自下而上的。
首先是基礎設施。
一個現象是,云計算廠商們在技術研發上的投入已經不局限于基本的云技術本身,還投向了芯片、開發框架、邊緣計算、數據庫核心軟件等等。對于任何全棧云計算廠商而言,這些投入已經不可或缺。但從機器學習的角度來看,用AWS的話來總結,它們是打牢平臺能力的堅實基矗
例如,AWS在這次re:Invent上推出機器學習訓練芯片AWS Trainium,與標準的GPU實例相比,可帶來30%的數據吞吐量提升,并降低45%的單次引用成本。此外,AWS Trainium和AWS的機器學習推理芯片AWS Inferentia在SDK上保持一致。
值得一提的是,當Habana芯片進入AWS云服務的時候,被英特爾視為一次在云計算市場上對英偉達的重要勝利。實際上,真正的勝利者屬于AWS的用戶們,根據AWS測試顯示,Habana對機器學習任務這類云服務的性價比,能比目前基于GPU的云服務高40%。
無論英偉達GPU或英特爾Habana芯片,還是AWS自研機器學習芯片,在AWS上都永遠是可選項。一方面,客戶選擇無比豐富,遠遠超過AWS的所有競爭對手。另一方面,當AWS選擇追求極致時,大幅降低機器學習成本的暢想又讓客戶無法拒絕。
“如果只是依賴合作伙伴,很難把(機器學習)性價比做到極致,這也是我們一再強調AWS Trainium和AWS Inferentia兩款芯片的原因,一個是機器學習訓練里面的性價比的極致,一個是推理里面的性價比極致。” 顧凡說,AWS手握市面上絕大多數芯片,可任企業自由選擇。“但回到合作伙伴的關系上,無論是英特爾還是英偉達,一定有不一樣的場景對客戶選擇是合適的,其中我們不會干預客戶的選擇。”
對于大多數機器學習用戶來說,AWS的 Amazon SageMaker是目前機器學習配置效率和性價比最高的選擇。
Amazon SageMaker是面向機器學習開發者的集成開發環境和完全托管服務。它依托多項工具,化繁為簡,使開發人員和數據科學家能夠從根本上更輕松、更快速地構建、訓練和部署機器學習模型,并降低成本。自2017年發布了SageMaker以來,SageMaker在機器學習開發者之間極受歡迎,成為AWS手中的機器學習大殺器。
反饋到業務上,一些客戶發現,SageMaker“指導”下機器學習帶來的業務增長,就有點像是魔法了。
比如拉丁美洲在線食品配送公司iFood,每月訂單達 3060 萬份,在超過 1000 個城市中注冊了約 160000 家餐廳。iFood首席數據科學家Sandor Caetano表示,通過Amazon SageMaker,一方面,使用機器學習來改善顧客和餐廳的體驗,讓商家和商品的推薦更加智能和個性化。另一方面,體現在物流上的成績則是,由于路線優化,配送人員的行程縮短了 12%。
而美國職業橄欖球大聯盟 (NFL) 則是體育運動中使用機器學習技術的先鋒,一方面,體育賽場天然是數據產生的高發地,選手和教練需要數據來指導賽場決策,這是賽事需要;另一方面,將掌握的數據運用到實況轉播中,提升觀賽的沉浸感,這是商業需求。為此,NFL創建了名為Next Gen Stats (NGS) 的程序來采集數據。
關鍵在于,如何運用這些寶貴的數據?美式橄欖球數據公司Pro Football Focus CEO、NBC體育解說員Cris Collinsworth就曾告訴界面新聞,“我們過去總讓老派、學界的人來為體育賽事出主意,而教練則通過比賽錄像來分析和指導運動員。”但效率之低下顯而易見。
最終NFL選擇與AWS合作,因為機器學習進入體育,意味著“思維方式的變化”,在效率和成本上均更優。借助SageMaker,可以更快速有效地給出數據分析結果。一個例子是,當NFL構建、訓練和運行這些預測模型時,時間從 12 小時縮短到 30 分鐘。
甚至比賽觀賞性也提高到一種從未達到過的程度。借助Amazon QuickSight商業智能工具,NFL 能夠在內部獲得更深入的見解,同時還為球迷提供了與數據互動的機會。俱樂部、廣播公司的人可以針對比賽,在面板上提問查詢,并極快地獲得回答。
來自客戶驚喜的反饋并不讓Swami Sivasupamanian意外,“SageMaker可以說是在AWS歷史上發展最快的一個云服務。”他提到,在過去一年中AWS已經發布了超過50個SageMaker功能,目的就是讓客戶使用機器學習的過程更為容易。
回顧AWS在本次大會上SageMaker的功能發布,無論是數據特征提取器Data Wrangler,數據特征存儲庫Feature Store,還是自動化工作流Pipelines,都和Swami Sivasupamanian提出的降低機器學習難度的宗旨毫無偏離,甚至多數時候,還會讓客戶感到驚喜。
比如Data Wrangler,其內置了300多個數據轉換器,讓客戶無需編寫任何代碼,就可以將機器學習用到的特征進行規范化、轉換和組合,被稱為“準備機器學習數據的最快、最簡單的方法”。Pipelines是第一個專為機器學習構建的、方便易用的持續集成和持續交付服務。另外,大型復雜深度學習模型的分布式訓練,可以將訓練速度提升兩倍。
不難發現,在AWS的努力下,SageMaker正在朝兩個方向的迭代:一方面,機器學習每一個步驟做得越來越細、做得越來越易用;然后,將復雜機器學習的工作流給串聯起來。比如,Data Wrangler的數據準備工作流程就可以與 Amazon SageMaker Pipelines 無縫集成,以便用戶自動執行模型部署和管理。
這種串聯和無縫集成一定程度上令人著迷,也為開發者打開了“新世界”。“實際上機器學習的工作流是可以被組織的,因為機器學習的流程中,要么有些步驟是串行的,一步一步走,要么有些步驟在某個環境下是可以并行的,但是它都可以被組織、被編排的。”顧凡說。
豐富且友好的機器學習工具在一定程度上加強了AWS上的用戶粘性。相比于其他平臺,AWS的機器學習工具鏈更加完善可靠,這意味著當用戶考慮使用機器學習時,AWS總會在各種云服務可選項中脫穎而出。
責任編輯:YYX
-
機器學習
+關注
關注
66文章
8378瀏覽量
132415 -
AWS
+關注
關注
0文章
427瀏覽量
24315
發布評論請先 登錄
相關推薦
評論