2023年3月17日,OpenAI官網(wǎng)發(fā)布了最新的研究論文《大語言模型對(duì)勞動(dòng)力市場(chǎng)影響潛力的早期研究》,其研究顯示,持有學(xué)士、碩士和專業(yè)學(xué)位的人比沒有正式教育證書的人更容易受到GPT的影響。元戰(zhàn)略觀察員對(duì)本篇文章核心內(nèi)容進(jìn)行了編譯,將GPT類大模型對(duì)勞動(dòng)力市場(chǎng)以及不同職業(yè)和行業(yè)產(chǎn)生的深刻的潛在影響呈現(xiàn)給讀者。
摘要:本文研究了大語言模型(LLM),例如生成預(yù)訓(xùn)練轉(zhuǎn)換器(GPT),對(duì)美國(guó)勞動(dòng)力市場(chǎng)的潛在影響。研究人員采用了一種創(chuàng)新性評(píng)級(jí)方法,用來評(píng)估GPT模型在不同行業(yè)工作任務(wù)中的匹配度。研究發(fā)現(xiàn),約80%的美國(guó)勞動(dòng)力可能會(huì)因?yàn)镚PT的應(yīng)用而受到影響,而約19%的工作崗位中至少一半的工作任務(wù)可能會(huì)受到影響。
研究方法與數(shù)據(jù)
1按職業(yè)劃分的活動(dòng)和任務(wù)數(shù)據(jù)
研究人員使用美國(guó)勞工部的O*NET 27.2數(shù)據(jù)庫,其中包含了1016個(gè)職業(yè)的信息,包括各自的詳細(xì)工作活動(dòng)(Detailed Work Activities, DWAs)。同時(shí),本文制定了共19265項(xiàng)任務(wù)用于評(píng)估GPT-4對(duì)工作的輔助效果,這些任務(wù)大多數(shù)與DWAs相關(guān)。
表1 計(jì)算機(jī)工程師/設(shè)計(jì)師、緊急救護(hù)、賭場(chǎng)服務(wù)、電商、幼兒園教師、小學(xué)教師等職業(yè)的工作活動(dòng)內(nèi)容和任務(wù)描述
我們使用的兩個(gè)數(shù)據(jù)集包括:
?19,265個(gè)任務(wù),每個(gè)任務(wù)具有一個(gè)“任務(wù)描述”和相應(yīng)的職業(yè),大多數(shù)任務(wù)與一個(gè)或多個(gè)DWA相關(guān)聯(lián);
?2,087個(gè)DWA,大多數(shù)DWA與一個(gè)或多個(gè)任務(wù)相關(guān)聯(lián),任務(wù)可能與一個(gè)或多個(gè)DWA相關(guān)聯(lián),盡管有些任務(wù)缺乏相關(guān)的DWA。
2工資、就業(yè)和人口統(tǒng)計(jì)數(shù)據(jù)
本文使用美國(guó)勞工統(tǒng)計(jì)局(Bureau of Labor Statistics, BLS)提供的2020-2021年職業(yè)就業(yè)系列數(shù)據(jù),包括職業(yè)名稱、每個(gè)職業(yè)的就業(yè)人數(shù)及工資、2031年這些職業(yè)的前景預(yù)測(cè)、職業(yè)準(zhǔn)入的教育水平以及獲得職業(yè)能力所需的在職培訓(xùn)情況等信息。BLS數(shù)據(jù)庫可以與O*NET數(shù)據(jù)庫相關(guān)聯(lián),通過當(dāng)前人口調(diào)查(Current Population Survey, CPS),將O*NET中的任務(wù)和工作活動(dòng)數(shù)據(jù)集與BLS勞動(dòng)力人口統(tǒng)計(jì)數(shù)據(jù)進(jìn)行對(duì)應(yīng),截取相關(guān)數(shù)據(jù)。
3GPT對(duì)完成任務(wù)的有用程度(暴露度)
研究采用暴露度(Exposure)作為GPT對(duì)工作任務(wù)影響的評(píng)估標(biāo)準(zhǔn)。本次研究將暴露度定義為一個(gè)衡量標(biāo)準(zhǔn):是否能夠通過利用GPT將完成特定工作任務(wù)的時(shí)間減少至少50%。具體而言,本文主要采用了三種評(píng)估標(biāo)準(zhǔn):
1.無暴露度(E0):應(yīng)用模型不能減少50%的任務(wù)耗時(shí),或者降低了任務(wù)的完成質(zhì)量。
2.直接暴露度(E1):在保障任務(wù)質(zhì)量的前提下,完成任務(wù)耗時(shí)減少50%。
3.LLM+暴露度(E2):雖然無法直接節(jié)省50%的任務(wù)耗時(shí),但在LLM的基礎(chǔ)上開發(fā)其他額外功能以節(jié)省50%以上的耗時(shí)。
值得注意的是,本文所采用的暴露度評(píng)估標(biāo)準(zhǔn)旨在評(píng)估GPT對(duì)于特定任務(wù)的輔助效果,而非評(píng)估其完全替代人類完成任務(wù)的能力。
評(píng)估方法
研究人員使用了兩種評(píng)估方法來評(píng)估GPT系統(tǒng)的整體暴露度,分別為人工評(píng)分和GPT-4評(píng)分。
表2 GPT-4評(píng)分和人工評(píng)分的一致性以及皮爾遜相關(guān)分?jǐn)?shù)的比較。一致性得分是通過觀察兩組分?jǐn)?shù)的一致程度來確定的
通過這種分析方法,我們可以更好地了解GPT對(duì)不同職業(yè)的潛在影響。通過將各種任務(wù)和職業(yè)與GPT的暴露程度聯(lián)系起來,能夠預(yù)測(cè)哪些工作可能受到更大的影響。這有助于政策制定者和利益相關(guān)者了解GPT對(duì)勞動(dòng)力市場(chǎng)的潛在影響,從而制定相應(yīng)的政策和措施。
研究結(jié)果
1數(shù)據(jù)匯總
表3 人類和GPT-4暴露數(shù)據(jù)的匯總統(tǒng)計(jì)
匯總統(tǒng)計(jì)數(shù)據(jù)如表3所示。人類和GPT-4評(píng)分都表明,平均職業(yè)水平的α(即E1)值在0.14和0.15之間,這表明對(duì)于普通職業(yè)來說,大約15%的任務(wù)會(huì)對(duì)GPT直接暴露(即耗時(shí)縮短一半以上)。這個(gè)數(shù)字對(duì)于β(即E1+0.5*E2)增加到超過30%,對(duì)于ζ(即E1+E2)超過50%。巧合的是,人類和GPT-4評(píng)分均將整個(gè)數(shù)據(jù)集中14%-15%的任務(wù)評(píng)為直接暴露。根據(jù)β值,80%的員工至少有一項(xiàng)任務(wù)暴露于GPT,而19%的員工有一半以上的任務(wù)被記錄為暴露于GPT。
2工資與就業(yè)
表4 左邊顯示為受影響職業(yè)的百分比,右邊顯示為受影響工人的百分比
上圖展示了整個(gè)經(jīng)濟(jì)體相對(duì)于GPT的暴露強(qiáng)度,左圖顯示受影響職業(yè)的百分比,右圖顯示受影響人數(shù)的百分比。暴露強(qiáng)度的分布在職業(yè)和個(gè)人之間是相似的,這表明某職業(yè)的從業(yè)人數(shù)與職業(yè)相對(duì)于GPT的暴露度沒有很高的相關(guān)性,它可能與為特定領(lǐng)域開發(fā)GPT驅(qū)動(dòng)軟件的投資密切相關(guān)。
3技能重要性
為探究職業(yè)技能的重要性和暴露度的關(guān)系,本文使用了O*NET數(shù)據(jù)集提供的基本技能,并對(duì)每個(gè)職業(yè)的技能重要性進(jìn)行量化,對(duì)暴露度進(jìn)行了回歸分析,以探究技能重要性與暴露程度之間的關(guān)聯(lián)。
研究結(jié)果表明,科學(xué)和批判性思維技能的重要性與暴露度呈現(xiàn)出強(qiáng)烈的負(fù)相關(guān)性,這意味著需要這些技能的職業(yè)不太可能受到當(dāng)前GPT的影響。相反,編程和寫作技能與暴露呈現(xiàn)出強(qiáng)烈的正相關(guān)關(guān)系,這意味著涉及這些技能的職業(yè)更容易受到當(dāng)前GPT的影響。
4研究方法
本研究還將職業(yè)準(zhǔn)入門檻作為標(biāo)準(zhǔn)來觀察不同工作類型的暴露差異,通過研究“準(zhǔn)入所需的典型教育”和“達(dá)到職業(yè)能力要求所需的在職培訓(xùn)”兩個(gè)因素,揭示GPT對(duì)勞動(dòng)力具有潛在影響的趨勢(shì)。
上表結(jié)果表明,持有學(xué)士、碩士和專業(yè)學(xué)位的人比沒有正式教育證書的人更容易接觸到GPT,部分完成大學(xué)課程但沒有學(xué)位的人也具有高水平的GPT暴露度。
研究結(jié)果顯示:
1.持有學(xué)士、碩士和專業(yè)學(xué)位的人比沒有正式教育證書的人更容易受到GPT的影響,部分完成大學(xué)課程但沒有學(xué)位的人也具有高水平的GPT暴露度。
2.暴露最少的工作需要最長(zhǎng)時(shí)間的培訓(xùn),起薪水平也不高。相反,不需要在職培訓(xùn)或僅需要實(shí)習(xí)的工作有更高的收入,但更容易受到GPT的影響。
5暴露度最高的職業(yè)
在人工評(píng)估下,暴露度最高的十大行業(yè)領(lǐng)域分別為:證券、大宗商品合同及其他金融投資服務(wù)、保險(xiǎn)公司、數(shù)據(jù)加工托管及相關(guān)服務(wù)、其他信息服務(wù)、出版業(yè)(除了互聯(lián)網(wǎng))、借貸信用中介、出租非金融無形資產(chǎn)(版權(quán)作品除外)、基金、信托及其他金融工具、央行及貨幣當(dāng)局、電子批發(fā)市場(chǎng)及中介機(jī)構(gòu)。
在GPT-4評(píng)估下,暴露度最高的十大行業(yè)分別為:數(shù)據(jù)處理托管及相關(guān)服務(wù)、其他信息服務(wù)、出版業(yè)(互聯(lián)網(wǎng)除外)、保險(xiǎn)公司、借貸信用中介、證券、大宗商品合約及其他金融投資服務(wù)、科學(xué)及技術(shù)專業(yè)服務(wù)、非金融無形資產(chǎn)出租(版權(quán)作品除外)、廣播電視(互聯(lián)網(wǎng)除外),央行及貨幣當(dāng)局。
結(jié) 論
研究發(fā)現(xiàn),對(duì)于LLM,大多數(shù)職業(yè)都有一定程度的暴露度,薪資較高的職業(yè)通常有更多高暴露度的任務(wù)。分析表明,根據(jù)當(dāng)前LLM的技術(shù)水平,約19%的工作崗位至少有50%的任務(wù)暴露于GPT。
研究結(jié)果顯示,LLM(如GPT)的廣泛應(yīng)用對(duì)美國(guó)經(jīng)濟(jì)發(fā)展和勞動(dòng)力市場(chǎng)產(chǎn)生了重要影響。雖然LLM技術(shù)對(duì)于提高人類勞動(dòng)效率和能力的作用是顯而易見的,但是社會(huì)、經(jīng)濟(jì)、監(jiān)管和其他因素將綜合影響實(shí)際的勞動(dòng)生產(chǎn)結(jié)果。隨著技術(shù)能力的不斷發(fā)展,LLM對(duì)經(jīng)濟(jì)的影響力可能會(huì)持續(xù)提高,政策制定者需要關(guān)注它們可能帶來的倫理和安全風(fēng)險(xiǎn),并采取措施來減輕其可能帶來的負(fù)面影響。
審核編輯 :李倩
-
轉(zhuǎn)換器
+關(guān)注
關(guān)注
27文章
8627瀏覽量
146869 -
語言模型
+關(guān)注
關(guān)注
0文章
506瀏覽量
10245 -
GPT
+關(guān)注
關(guān)注
0文章
351瀏覽量
15315
原文標(biāo)題:OpenAI發(fā)布!大語言模型對(duì)勞動(dòng)力市場(chǎng)的影響
文章出處:【微信號(hào):AI智勝未來,微信公眾號(hào):AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論