人工智能和大數據時代的到來為心理學的研究打開了全新的大門。人工智能除了在心理實驗方面有著無法取代的潛力,在其他方面也會大大拓展心理學的研究領域。隨著智能終端的不斷發展,移動數據的不斷提速,人工智能不僅可以提供心理干預的平臺,更有可能成為心理干預的主力。科學的研究方法將心理學從哲學中分離開來,而人工智能和大數據則可能將心理學更深刻地帶入生活。
心理學是研究人的行為和心理活動規律的科學,自人類出現,便有了對人類心理和行為的關注。直到 1879 年,構造主義學派創始人馮特在德國萊比錫大學建立第一個心理學實驗室,心理學從哲學的襁褓中分離出來,成為一門獨立的科學。
心理學通過科學的方法去分析人的行為和心理,主要包括觀察法、調查法(問卷法和訪談法)、測驗法、實驗法等。這些方法很容易受到主試和被試自身期待或動機的影響,而產生虛假或迷惑性的結果,即內部效度可能會受到影響;由于是在一定的時間段內選取有限的、有代表性的研究對象進行研究,然后將結論推廣到相同的群體中,這些方法的外部效度和實效性也備受質疑。
目前心理學研究主要以自我報告或者主觀觀察為主要技術手段,對現實或網絡環境中人們的行為和心理進行研究。隨著技術的發展,網絡環境已不能單純地看作一種工具,它已經與人類的生存及其環境深度融合,具有與既往傳統心理學研究環境完全不同的復雜性與特殊性,同時也為研究提供了新的思路。
人工智能和大數據時代的到來為心理學的研究打開了全新的大門。隨著網絡及各種智能可穿戴設備的普及,虛擬環境與真實生活不斷融合,現實社會中人的各種心理與行為現象能夠被電子化記錄成大數據保存下來,例如網絡訪問行為、社會情緒、社會態度、心理健康問題等。研究人員通過用戶留下的這些數據對其人格特質或者行為進行預測,Gosling等利用在線社交網站觀察到的人格結果對大五人格(big- five)的測量結果與基于Facebook的網絡行為自我報告進行了相關分析,結果發現大五人格的不同維度與網絡行為顯著相關;同時,依賴于現代生活方式,尤其是網絡信息傳播與人際互動,已經深刻地影響甚至改變了人們的心理與行為特征,產生出一系列亟待解決的全新課題,例如謠言傳播、網絡煽動群體性事件、網絡成癮等。Zhou 等在研究利用中國社交媒體預測社會事件的發展趨勢時發現,群體憤怒情緒會對集體行為產生影響,并且意見領袖、參與者的社會態度以及事件的持續時間都在預測網絡社交事件發展趨勢中發揮著重要作用。
大數據不僅在研究內容上為心理學家帶來了新的課題,更重要的是,大數據與人工智能的結合,使得我們可以利用生態化的行為數據,結合人工智能技術,實現對人們心理指標的自動識別,即生態化識別(ecological recognition),從而大大拓展了心理學研究和應用范疇。Conroy等分析人工智能大數據與政治參與之間的關系發現,利用互聯網新媒體可以增加投票率,促進公民參與積極性。此外,有研究者利用用戶在網絡上留下的數字足跡來對其心理特質進行預測,并嘗試針對不同人格的用戶推送統一廣告的不同類型的廣告圖,結果顯示通過這一方式推送的廣告點擊率上升了40%。
生態化識別是指一種非接觸式的心理特征測量方法,利用機器學習,建立心理指標預測模型,從而實現對受試者的心理指標的自動識別。相比于傳統的心理學研究方法,生態化識別具有以下優勢:首先,由于數據自身的特點,不同時間粒度的縱向追蹤成為可能;其次,可以通過時間回溯,獲取重大事件發生前后受試者的心理狀態和行為表現及其變化規律,從而對事件的影響進行量化研究,例如利用社交媒體探索家庭暴力對心理健康的影響,通過分析家庭暴力前后不同時間段的心理健康狀況了解家庭暴力對心理健康的負面影響;最后,生態化識別不依賴于被試的主觀報告,也不依賴于主試的操控,從而可以有效避免實驗條件帶來的誤差,提高了研究結果的內部效度和外部效度。
以下將主要從人格預測模型的建立介紹如何將人工智能大數據應用于心理學研究,然后通過主動自殺干預以及輿情分析介紹在心理學實踐中的應用,最后討論特別需要關注的倫理問題。
01、建立心理指標預測模型——以人格預測為例
人格是構成一個人思想、情感、行為的獨特模式。人格一直以來都備受心理學家的關注,逐漸形成了特質理論、類型理論以及整合理論。目前最被接受的大五人格理論,就是特質理論的一個典型代表。大五人格理論認為,人格可以分為5個因子:開放性(openness)、盡責性(conscientiousness)、外傾性(extroversion)、宜人性(agreeableness)和神經質(neuroticism)。
現有的人格結構主要是從現實語境中產生的,在解釋網絡用戶行為過程中常常遇到困難,研究網絡人格結構將有助于我們從心理層面識別網絡用戶身份,深入了解網絡用戶的行為特征并預測用戶的網絡行為。中國科學院心理研究所計算網絡心理 實 驗 室(computational cyber psychology lab,CCPL)對網絡人格結構開展相關研究:根據詞匯學假設建立微博人格結構;利用機器學習,以期建立一個對網絡用戶行為心理具有更好描述和預測效果的模型,即建立人格預測模型。
傳統的心理學主要采用詞匯學的方法,對于自然語言中獲得的人格詞匯進行分析,得到一組數目有限的特質,用以代表在這一語言背景下的人們的最重要的特點。以新浪微博文本數據為研究材料,開展詞匯學研究。選取 100 個新浪微博活躍用戶的微博,通過人工標記的方式,得到描述穩定人物特點的術語1945個。經過對這些屬于進行刪除生僻、長度不宜詞匯和合并同義詞,獲得210個穩定人格形容詞,隨后對形容詞好惡度、熟悉度和意義度進行評定,將形容詞化簡到63個形容詞,并增加具有微博特色的形容詞15個,最終得出共78個形容詞的詞表。通過對106名被試的78個形容詞的評定結果進行因素分析,得出了微博人格7因素:
道德善良、獨立擔當、團結包容、幽默活潑、網絡個性、謙虛淡定、自信低調(KMO=0.534)。分別對 7因素與人格5因子進行雙向回歸分析發現,7因素對大五的解釋度(0.3264±0.115)比大五對7因素的解釋度(0.2917±0.159)好。
在利用詞匯學方法建立微博人格預測模型的基礎上,我們利用深度學習建立網絡用戶行為和心理的向量化表征。考慮用戶在微博上一般都能夠充分自主地表達自我,通過對微博數據進行深度學習和挖掘,可以直接在微博數據上建立更有效的表征向量,通過對微博數據的多層抽象學習,建立對用戶行為和心理特征的計算描述,同時該結構由于完全由數據計算得來,避免了由于用戶主觀符合度評判帶來的偏差,能夠實現對大規模人群的快速分析。心理指標的自動識別為進一步研究網絡心理提供了基礎性研究,能更有效地進行網絡用戶身份識別、預測用戶行為等。
02、在線主動自殺干預
據統計,中國每年有 28.7 萬人死于自殺,200萬人自殺未遂,因此造成的直接和間接經濟、社會、心理損失不可估量,成為一個嚴重的公共衛生問題。傳統的自殺風險評估研究主要采用心理測驗、訪談、問卷等分析方法,但從應用效果上說,以上方法具有較大的被動性;往往有自殺企圖或傾向的人主動求助率低,而且很難防止他們刻意隱藏內心的真實想法,難以起到及時預警的作用。
不同于傳統研究方法的被動性,隨著近年來越來越多的社交網絡平臺給人們更多機會在虛擬集群中吐露自己的感受和觀點,通過社交網絡能主動尋找有潛在自殺傾向的個體,并對他們產生影響。
在新浪微博用戶文本分析基礎上,結合用戶行為數據分析,我們全面比較了自殺用戶和無自殺傾向用戶在社交行為、語言使用上的差別,歸納有自殺傾向的用戶的可識別模式,建立自殺意念識別模型。該模型的精確率、召回率、F值和準確率分別為 0.88、0.85、0.85 和 0.86,優于之前相同領域內自殺識別的模型的結果。目前,本研究組通過對各種網絡媒介內容的實時分析,甄別出其中帶有自殺意念的發言,并通過對發言用戶的以往行為和內容的分析,更進一步確認該用戶的自殺意念后,會向他們提供及時有效的干預,通過微博私信及時推送各地區的自殺干預熱線,提供心理健康的一般常識及情緒調節策略。另外,通過志愿者為那些有自殺意念的微博用戶提供免費的心理危機干預及轉介服務。研究結果表明,通過與志愿者的交流,有自殺意念的微博用戶情況得到好轉。
這種自動識別并主動預防社交媒體用戶,特別是年輕人的自殺干預方法,在世界范圍內是一種全新的嘗試。結果表明,該方法可用于識別有自殺風險的人群并提供危機管理。高危人群的識別是自動且及時的,干預不僅是主動的,而且效率高且接受度好,是對現有預防自殺方法的有效補充。促進主動自殺危機管理可以提高公眾對自殺想法尋求幫助的認識,從而改善公共衛生。該模式還可以緩解像中國這樣的大型發展中國家心理服務薄弱、現有自殺預防系統不完善、人口龐大等問題的困境。
03、青島大蝦事件分析
心理預測模型不僅可以適用于人格、心理健康等方面的研究,同樣可以適用于社會心理心態的預測。我們利用心理預測模型對2015年10月的一個熱點事件——青島大蝦宰客事件(原本 38 元一份的海捕大蝦,結賬時變成38元一只)進行了分析。
通過新浪微博API (application programming interface,應用程序編程接口)獲取了全國100萬活躍微博用戶在該熱點事件期間發布的微博,并采用topic model 文本挖掘技術對相關文本進行了分析。結果表明,事件爆發后2天,網友主要是對該事件本身進行討論,從第3天開始,網友開始將事件發散,關注點已經不在青島大蝦這一事件本身,而是以“段子”的形式討論不同地區旅游景點宰客的普遍現象,通過講述自己的親身經歷或聽說的類似事件,表達對景點宰客這一現象的不滿。同時,結果表明,網友們對官方發布和回應的內容都高度關注,每次都會引發熱議。同時利用心理預測模型,計算了參與青島大蝦事件的用戶的社會態度,其中包括生活滿意度、收入滿意度、社會地位滿意度、憤怒情緒、國家政府滿意度、地方政府信心、國家經濟滿意度、地方經濟滿意度等多個維度。結果表明,與沒有參與該話題討論的微博用戶相比,該事件當中的積極傳播者大多收入較高,有一定的社會地位,個人生活滿意較高同時憤怒情緒也較少;但他們也認為社會發展中還存在一定問題,當前政府的管理工作還有待提高。
通過利用心理預測模型分析此類事件,不僅可以及時獲取事件發生變化趨勢,了解事件背后大眾的心理變化和態度取向,更可以為國家相關機構進行輿情監控提供先行指數(antecedent index),提高相關部門應對危機事件的能力。
04、造福社會與隱私保護的均衡
技術往往都具有兩面性,大數據也不例外。一方面,大數據的應用不僅拓展了人類的認知范圍,提高了科學家們的研究能力,更為諸如抑郁干預、自殺預防、社會熱點事件分析等問題提供了新的解決方案;另一方面,隨之而來的隱私保護問題也不容小覷。Facebook 公司最近兩年頻頻卷入非法使用用戶數據的丑聞當中,尤其在2018年3月份,還卷入了普朗特選舉的政治風波中。人們在享受互聯網以及大數據代表的便利之余,也會擔心在這個網絡時代,自己是否還有隱私可言。因噎廢食是絕對不可取的,如何在勢不可擋的大數據時代利用好這項技術,是學術界不可忽視的一項重要議題。
目前,學術界關于大數據的使用一般有這樣的共識:應當遵守人類被試研究的一般倫理原則,在使用需要用戶授權的數據前,必須征得用戶的知情同意,并嚴格按照經由倫理委員會審核批準的程序進行,尤其不能將研究數據用于倫理委員會批準范圍之外的目的(如轉賣給第三方)。在使用那些開放的無需用戶授權的網絡數據,在用于科研時也應同時滿足以下標準:(1)用戶對數據公開是知情的;(2)數據收集后應匿名處理;(3)在公開發表物中不得出現能夠識別用戶個人身份的信息。
在將大數據應用于心理學研究的過程中,我們嚴格遵循一般共識:在獲取用戶個體數據之前,首先會征得用戶的知情同意,明確告知用戶實驗設計以及以后的數據用途;在數據處理過程中,也采用了匿名處理的方式,一方面采用多次加密的方式保護用戶原始數據的隱私性,另一方面也很大程度地做好數據的保存與管理,防止數據外泄;在數據發表過程中,杜絕使用任何可識別出用戶身份信息的內容。除了以上策略外,我們還專門對典型用戶進行了訪談,直接詢問他們對隱私以及對實驗的看法,之后的實驗設計提供了理論指導和實證證據。
合理合規地使用大數據和人工智能技術,是造福社會和保護隱私的重要底線。在看到這種結合對心理學的潛在促進作用的同時,也應該特別關注其帶來的隱私方面的潛在危害,通過立法等手段做到防患于未然。
05、結論
利用人工智能大數據技術,能夠幫助我們以更生態化的方式對個體與群體的心理行為規律進行研究。利用行為大數據研究人們的認知、情感和行為規律,結合人工智能建立基于社會實時感知數據的心理預測模型,形成個體心理、行為特征預測和群體心理、行為分析及決策支持的關聯架構。生態化識別(ecological recognition)的提出,為心理學家提供了新的研究工具和視角。為網絡時代下理解人格、幸福感、自殺干預乃至社會熱點事件的分析都提供了全新的可能。通過深入不同環境下的個體與群體的行為與心理,能夠幫助實現人們的心理健康或社會態度等進行大規模、實時性的描述、預測、解釋和控制,從而有效防范風險。
隨著計算機軟硬件的不斷迭代更新,未來大數據在心理學中的應用一定會更加深入,如可穿戴設備和體感設備的應用。人工智能除了在心理實驗方面有著無法取代的潛力,在其他方面也會大大拓展心理學的研究領域。隨著智能終端的不斷發展,移動數據的不斷提速,人工智能不僅可以提供心理干預的平臺,更有可能成為心理干預的主力。科學的研究方法將心理學從哲學中分離開來,而人工智能和大數據則可能將心理學更深刻地帶入生活。在充分享受使用新技術帶來的便利的同時,也要保證大數據的合規使用,才能避免再次發生Facebook的丑聞事件,才能保證取之于眾的大數據最終成為為大眾服務的利器而不是威脅。
責任編輯:ct
評論
查看更多