當所有人都沉浸在與ChatGPT對話的樂趣中,一場靜水流深的變革已然啟動。
2023年11月,比爾·蓋茨發表了一篇文章,他表示,AI Agent將是大模型之后的下一個平臺,不僅改變每個人與計算機互動的方式,還將在五年內徹底改變我們的生活。
如果說大模型是未來水電煤一般的基礎設施,那么Agent則是未來用戶接觸、使用AI的方式。
AI Agent不再滿足于僅僅作為“聊天對象”的角色,而是渴望成為能在真實世界里揮灑自如的“智能執行者”。
數據顯示,過去兩年間,針對AI Agent的研究投入增長幅度高達300%。大模型市場的玩家們,似乎正齊刷刷地轉向AI Agent。
在國內,截止去年11月中旬,AI Agent賽道發生融資事件13起,總融資金額約735億人民幣,公司融資均值為56.54億人民幣。
在國外,據外媒MattSchlicht數據顯示,至少有100個項目正致力于將AI代理商業化,近10萬名開發人員正在構建自主Agent。
毫無疑問,AI Agent正在成為大模型之后下一個爆發點。
值得探討的是,作為一種巨大的技術變革,AI Agent將如何改變我們的生活?國內外AI Agent的發展現狀如何?AI Agent落地的關鍵點是什么?
AI Agent:自主執行任務的“小助手”
去年4月份,斯坦福和谷歌的研究者共同創建了一個“西部世界小鎮(Westworldsimulation)”。在這個小鎮里,25個AI Agent每天都在樂此不疲地散步、約會、聊天、用餐以及分享當天的新聞。
在這個實驗中,AI Agent(智能體)在執行任務和互動上表現出了令人驚艷的自主性和智能性,由此引發了業界的高度關注。
事實上,這并不是AI Agent第一次出圈,其概念從出現到爆發,已經邁過多個階段。
在單一Agent階段,主要是針對不同領域和場景的特定任務,開發和部署專門的智能體。以GPTengineer為例,給它一個需求,其就可以把代碼寫個大概。
在多Agent合作階段,是由不同角色的Agent自動合作完成復雜的任務。
例如在MetaGPT上,如果讓其做一個股票分析的工具,它會把這個任務分別翻譯給產品經理、架構師、項目經理等5個角色,模擬整個的軟件開發中所有決策工作流。
不過,隨著微軟全新工具AutoGen的發布,AI Agent很快翻開了新的篇章。
AutoGen允許多個LLM智能體通過聊天來解決任務。LLM智能體可以扮演各種角色,如程序員、設計師,或者是各種角色的組合,對話過程就把任務解決了。
與MetaGPT不同的是,MetaGPT的角色模型是被定義好的,而AutoGen可以讓開發者自己定義Agent,還可以讓他們相互對話。
這是一個新的且富有創造性的Agent框架。在AutoGen發布的兩個星期內,星標量從390狂增到10K,并在Discord上吸引了5000多名成員。
如果說AutoGPT拉開了自主智能體(Autonomous Agent)的帷幕,那么前文提到的“西部世界小鎮”則開啟了生成智能體(Generative Agent)之路。
生成智能體就像美劇《西部世界》中的人形機器人或《失控玩家》中的智能NPC,它們在同一環境中生活,擁有自己的記憶和目標,不僅與人類交往,還會與其他機器人互動。
總的來說,AI Agent是一個能夠自主行動、執行任務的“小助手”,能夠針對目標獨立思考并做出行動,會根據給定任務詳細拆解出每一步的計劃步驟,依靠來自外界的反饋和自主思考,為自己創建prompt以實現目標。
比如,讓AI Agent買一杯咖啡,它會首先拆解如何才能為你購買一杯咖啡并擬定代用某APP下單以及支付等若干步驟,然后按照這些步驟調用APP選擇外賣,再調用支付程序下單支付,過程無需人類去指定每一步操作。
而目前基于LLM的ChatGPT給出的反饋,只能止于“無法購買咖啡,它只是一個文字AI助手”之類的回答。
這也就不難理解,為什么AI Agent會是大模型的下一個高地——大模型聚焦于處理語言相關的任務,它并不直接與現實世界互動,而AI Agent強調解決實際問題的能力和與環境交互的全面性。
AI Agent加速落地
事實上,大模型還沒有出現之前,一些企業就已在研究傳統AI與Agent的結合應用。因此,AI Agent在各領域的落地比大家預想得要快很多。
目前,海外已經在零售、房地產、旅游、客戶服務、人力資源、金融、制造業等多個領域出現AI Agent架構與產品,例如:
在醫療領域,Agent可以幫助診斷、治療和監測患者。IBM Watson Health 是一個AI智能體,可以分析醫療數據,以識別潛在的健康問題并推薦治療方案。
在金融領域,Agent可以分析財務數據、檢測欺詐行為并提出投資建議。嘉信理財(Charles Schwab)使用名為Intelligent Portfolio的人工智能智能體,根據客戶的投資目標創建和管理投資組合。
在零售業務場景中,Agent可以提供個性化推薦,改善供應鏈管理,增強客戶體驗。亞馬遜的Alexa是一個AI智能體,可以推薦產品、下訂單和跟蹤發貨。
在制造業,Agent可以優化生產流程,預測維護需求,提高產品質量。通用電氣使用名為Predix的AI智能體實時監控機器,以預測和防止設備故障。
在運輸領域,自主AI Agent可以協助路線規劃、交通管理和車輛安全。特斯拉的Autopilot有助于自動駕駛車輛,并幫助駕駛員停車、變道和安全駕駛。
不僅如此,在底層技術方面,AI Agent也打下了不錯的基礎。
例如,OpenAI開發的GPTs,以及推出的GPT-4Turbo和可定制AI Agent,提供了基礎Agent的構建能力,如工具調用、基于知識庫文件記憶能力等,使得AI Agent進入了另外一個新階段,即人人都可以打造自己的Agent。
但總的來說,AI Agent技術還處于比較早期的階段,主要在兩個類型的場景中更容易落地:
一類是具有交互性質的場景。
例如,智能機器人和問答式交互,這與AI Agent的迭代性質天生匹配。在這種情境下,對于一些簡單的任務,比如購買火車票或解決企業內部IT服務的問題,任務型機器人的應用效果較好,并且相對容易維護。
另一類是線性執行任務的場景。
例如,一家支付公司要求用戶在開戶時提交身份證明,在這種場景下,前臺是單向的,但后臺可以利用AI Agent執行,相較于原有的流水線,AI Agnet更為高效。
AI Agent落地挑戰
盡量理想很美好,但當前市場上的大多數AI Agent,其實只是構建了一個基于特定知識庫或專業數據的Chatbot。這些智能體主要用于進行問答交互,如獲取行業資訊、報告等,在程序聯動和操作方面還有很大的提升空間。
在一些更復雜的場景中,現有的AI Agent技術只能做到輔助,無法完全實現自動執行。
這背后的原因有很多,包括技術能力、商業化路徑、應用場景等,都會影響Agent的能力體現。
首當其沖的,依然是技術問題。
LLM作為AI Agent的認知核心,其智能性在很大程度上決定了AI Agent感知環境、做出決策并執行適當行動的能力。但就目前而言,包括GPT-4在內的所有大模型,能力仍需提升。
同時,AI Agent繼承了LLM的一些問題,比如“幻覺”、“可解釋性”等問題。此外,對于底層基礎模塊的質量和性能,包括調用圖像識別等模型,也會直接影響到上層建筑的性能。
此外,Agnet各個模塊之間的交互和運行可能會產生許多中間結果和狀態,這也帶來了一些技術挑戰。例如,處理中間結果的魯棒性是一個問題,下層模塊的性能和質量會直接影響上層模塊的執行。
其次,AI Agent的落地效果也受限于應用場景。
例如,在出行預訂中,得益于豐富的API等問題,AI Agent表現出色。而在如法律助手場景中,由于新知識的頻繁出現和API的不完善,實際應用面臨更多挑戰。
這一點,從國內AI Agent紛紛生長于協同辦公平臺就可見一斑。
由于協同辦公平臺本身具備良好的API接口和插件體系,這使得將大模型集成到現有工具中變得更加容易。
同時,許多企業都在使用協同辦公軟件,這意味著廣泛的用戶基礎可以加速大模型的迭代和優化過程,使其更好地滿足用戶需求。
最后,找到切入點以及好的商業模式至關重要。
AI Agent爆發的一段時間,人們普遍認為補齊了大模型短板的AI Agent更具備實用性,將是大模型重要落地方向。
但就目前而言,這一路徑的商業化存在諸多問題。拿游戲場景而言,目前收費主要來源于出售游戲裝備、皮膚等方式,而AI Agent的價值無法體現在這些固有的變現途徑上。
由于AI Agent落地效果未出現顛覆性的能力,C端用戶是否會為其買單無法得知,能否成為AI大模型從C端商業化爆發一個最核心應用方向,還需時間驗證。
相對來說,B端可能更適合AI Agent的落地。在Agent構建平臺上,企業或將可以自己構建自己RPA、CRM、辦公OA等一系列管理軟件;軟件廠商也可以基于此平臺構建軟件為企業提供服務。
但這仍需要成本控制、投入預算、實現效率、安全管控等多方面嚴格及縝密的評估。
結語
無論存在多少質疑,時至今日,AI Agent依然帶來了諸多想象力。技術發展之路本就充滿質疑與批判,科技變革對于任何一個企業與個體都是一場機遇,關鍵在于如何把握它。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30146瀏覽量
268416 -
ChatGPT
+關注
關注
29文章
1548瀏覽量
7495 -
大模型
+關注
關注
2文章
2328瀏覽量
2483
發布評論請先 登錄
相關推薦
評論