近日,最新一期的《自然-人類行為》雜志發表了一項AI研究成果。該研究顯示,在一組實驗中,兩款AI大語言模型在某些情境下展現出與人類相似甚至勝過人類的心理狀態感知能力。
心理狀態感知能力,又稱心智理論,對于人類社交至關重要。來自德國漢堡-埃彭多夫大學醫學中心的James W. A. Strachan及其團隊設計了一系列測試,以評估AI模型在發現錯誤觀念、理解間接言辭以及辨識不敬等多個維度的表現。
值得注意的是,他們使用了GPT和LLaMA2這兩款模型進行實驗,并將其與1907名參與者進行比較。
實驗結果表明,GPT在識別間接請求、錯誤觀念和誤導信息時,有時甚至超過了人類的平均水平;然而,在辨識不敬信息方面,LLaMA2優于人類,而GPT表現欠佳。
對此,Strachan解釋說,LLaMA2的成功可能源于其較低的偏見程度,而非真正對不敬信息敏感;至于GPT的表現不佳,他認為主要原因在于它過于保守地堅持自己的結論,而非推理出錯。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
AI
+關注
關注
87文章
30146瀏覽量
268418 -
模型
+關注
關注
1文章
3172瀏覽量
48714 -
GPT
+關注
關注
0文章
351瀏覽量
15315
發布評論請先 登錄
相關推薦
NVIDIA AI助力初創企業為心理治療師提供AI工具
NVIDIA AI 助力初創企業為心理治療師提供 AI 工具,以此來優化和提升心理健康服務水平,為人們的心理健康保駕護航。
心智理論測試:人工智能擊敗人類
測試結果并不一定意味著人工智能可以“理解”人。 心智理論是指可以理解他人心理狀態的能力,正是它驅使著人類社會運轉。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么,以
AI大模型在自然語言處理中的應用
AI大模型在自然語言處理(NLP)中的應用廣泛且深入,其強大的語義理解和生成能力為NLP任務帶來了顯著的性能提升。以下是對AI大模型在NLP
人工智能的定義和發展過程
、識別、生成和交互等類人智能的能力,從而執行各種復雜任務,甚至在某些方面超越人類的智能表現。隨著科技的飛速發展,人工智能已經滲透到我們生活的
邊緣AI網關,將具備更強大的計算和學習能力
電子發燒友網報道(文/李彎彎)網關又稱網間連接器、協議轉換器。網關在網絡層以上實現網絡互連,是復雜的網絡互連設備,僅用于兩個高層協議不同的網絡互連。 ? 邊緣AI網關是指在邊緣計算環境中,負責處理
Meta AI主管楊立昆:大語言模型尚未到達人類智能水平
他明確提出,雖然此類模型在特定任務中展現出優越性能,但其內在局限性使其難以媲美人類的智慧,如推理與規劃能力等方面的不足。
阿里云發布通義千問2.5大模型,多項能力超越GPT-4
阿里云隆重推出了通義千問 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環境中的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方面表現出色,
【大語言模型:原理與工程實踐】大語言模型的應用
操作。所謂零樣本提示(Zero-Shot Prompt),指的是在提示詞中不包含與指令任務相似的任何示例。
當大語言模型訓練完成后,它便具備了分析情緒和識別命名實體等常見任務的
發表于 05-07 17:21
谷歌發布Axion新款數據中心AI芯片,性能超越x86及云端
谷歌預計將通過Google Cloud提供Axion AI芯片給客戶。谷歌強調這款基于ARM的CPU產品具有優越的性能表現,甚至超越了傳統的x86芯片及云端通用ARM芯片。
馬斯克預測明年或2026年AI將超越最聰明的人類
馬斯克認為,如果將 AGI 界定為超越最聰明的人類智力水平,那么這可能發生在明年或兩年內。AGI 研究務求打造出具備類似人類般的智能決策與自學能力
NanoEdge AI的技術原理、應用場景及優勢
硬件設計則是為了確保設備在執行這些任務時能夠保持低能耗,從而提高其續航能力。
2、應用場景
NanoEdge AI 可以廣泛應用于各種物聯網設備和傳感器,如智能家居、工業自動化、智能交通、醫療健康
發表于 03-12 08:09
谷歌發布ASPIRE訓練框架,提升AI選擇性預測能力
該框架分為三步驟:“特定任務調整”、“答案采樣”以及“自我評估學習”。首先,“特定任務調整”階段針對基本訓練的大型語言模型進一步深化訓練,重點提高預測
AI Agent爆發在即!深剖AI Agent技術原理及發展趨勢
電子發燒友網報道(文/李彎彎)AI Agent指人工智能代理,是一種能夠感知環境、進行決策和執行動作的智能實體。AI Agent通常基于機器學習和人工智能技術,具備自主性和自適應性,在特定
評論