“得數(shù)據(jù)者,得人工智能”。如今人工智能早已在我們的生活中屢見不鮮,像“Siri”、“指紋解鎖”、“人臉識別”等等都屬于人工智能的范疇,然而人工智能的上游基礎(chǔ)產(chǎn)業(yè),數(shù)據(jù)標(biāo)注卻鮮為人知。數(shù)據(jù)標(biāo)注是一個極為龐大的產(chǎn)業(yè),在數(shù)標(biāo)行業(yè)內(nèi)部,從業(yè)者也必將隨著AI行業(yè)而一同進入細(xì)分市場追逐階段,可謂機遇與挑戰(zhàn)并行,為創(chuàng)業(yè)者創(chuàng)造力大量的機會,為社會造就了大量新興的就業(yè)機會。那么數(shù)據(jù)標(biāo)注的應(yīng)用場景都有哪些,它為什么如此火熱呢?
數(shù)據(jù)標(biāo)注的應(yīng)用場景
人臉識別
人臉識別也稱人像識別、面部識別,是基于人的臉部特征信息進行多年齡段、多角度、多表情、多光線的人臉圖像采集,從而完成身份識別的一種生物識別技術(shù)。人臉識別涉及的技術(shù)主要包括計算機視覺、圖像處理等。
人臉識別(視覺識別技術(shù)的一種應(yīng)用)在國內(nèi)的應(yīng)用大致經(jīng)歷從公共安全領(lǐng)域擴展到商業(yè)領(lǐng)域的過程。最初,機嘗高鐵站以及酒店等場景使用這項技術(shù)對個人身份進行驗證,隨后商業(yè)銀行也開始采用人臉識別實現(xiàn)遠(yuǎn)程開戶。再之后,刷臉支付、刷臉門禁也相繼出現(xiàn),人臉識別逐漸從少數(shù)有限場景滲透到人們的日常生活之中,目前,人臉識別技術(shù)已廣泛應(yīng)用于多個領(lǐng)域,如金融、司法、公安、邊檢、航天、電力、教育、醫(yī)療等。
隨著人臉識別技術(shù)的進一步成熟和社會認(rèn)同度的提高,其將應(yīng)用在更多領(lǐng)域,給人們的生活帶來更多改變。
智能交通
近年來,隨著人工智能浪潮的興起,無人駕駛、智能交通安全系統(tǒng)一度走進我們的生活,國內(nèi)許多公司紛紛投入到自動駕駛和無人駕駛的研究,例如百度啟動的“百度無人駕駛汽車”計劃,其自主研發(fā)的無人駕駛汽車Apollo還曾亮相2018年央視春晚。
再比如近日上海街頭出現(xiàn)的地鎖停車黑科技,當(dāng)你停好車,協(xié)管員就會協(xié)管員將一張停車提示卡置于門把手上。停車7分鐘后,停車位下的指示燈由綠轉(zhuǎn)紅,金屬地鎖升起,卡住車身底盤。取車時,用手機掃了掃地面上的二維碼,停車時長、費用信息一目了然。支付停車費后,地面指示燈由紅轉(zhuǎn)綠,地鎖降下,電子發(fā)票也能實時獲齲
而這些都要依賴于人工智能數(shù)據(jù)標(biāo)注的介入,對于行車視頻進行采集,路況進行提取,停車點進行標(biāo)注,包括D點云障礙物、紅綠燈、車道燈及高精地圖。為行人識別、車輛識別、紅綠燈識別、車道線識別等技術(shù)提供精確訓(xùn)練數(shù)據(jù),為智能交通保駕護航。
智能語音
智能語音即實現(xiàn)人與機器以語言為紐帶的通信。人類大腦皮層每天處理的信息中,聲音信息占20%,它是溝通最重要的紐帶。人類對機器語音識別的探索始于20世紀(jì)50年代,迄今已逾70年。2016年,在深度神經(jīng)網(wǎng)絡(luò)的幫助下,機器語音識別準(zhǔn)確率第一次達到人類水平,意味著智能語音技術(shù)落地期到來。
數(shù)據(jù)標(biāo)注主要在語音方面的應(yīng)用場景主要是語音語言采集,語音內(nèi)容加工處理,情感判斷,語音文字等轉(zhuǎn)化。為語音識別(ASR)、語音合成(TTS)等提高質(zhì)量語音數(shù)據(jù)讓您的智能設(shè)備更懂得用戶心聲。我們常用到的小愛同學(xué)、天貓靜音,手機語音輸入,甚至包括有時候接到的營銷電話都有著智能語音的身影。
圖像處理之醫(yī)學(xué)圖像
醫(yī)學(xué)圖像處理是目前人工智能在醫(yī)療領(lǐng)域的典型應(yīng)用,它的處理對象是由各種不同成像機理,如在臨床醫(yī)學(xué)中廣泛使用的核磁共振成像、超聲成像等生成的醫(yī)學(xué)影像。
傳統(tǒng)的醫(yī)學(xué)影像診斷,主要通過觀察二維切片圖去發(fā)現(xiàn)病變體,這往往需要依靠醫(yī)生的經(jīng)驗來判斷。而利用計算機圖像處理技術(shù),可以對醫(yī)學(xué)影像進行圖像分割、特征提娶定量分析和對比分析等工作,進而完成病灶識別與標(biāo)注,針對腫瘤放療環(huán)節(jié)的影像的靶區(qū)自動勾畫,以及手術(shù)環(huán)節(jié)的三維影像重建。
該應(yīng)用可以輔助醫(yī)生對病變體及其他目標(biāo)區(qū)域進行定性甚至定量分析,從而大大提高醫(yī)療診斷的準(zhǔn)確性和可靠性。另外,醫(yī)學(xué)圖像處理在醫(yī)療教學(xué)、手術(shù)規(guī)劃、手術(shù)仿真、各類醫(yī)學(xué)研究、醫(yī)學(xué)二維影像重建中也起到重要的輔助作用。
得數(shù)據(jù)者,得人工智能
人工智能主要算法應(yīng)用領(lǐng)域集中在計算機視覺、語音識別/語音合成,以及自然語言處理三個方面。
圖像方面:一個新研發(fā)的計算機視覺算法需要上萬張到數(shù)十萬張不等的標(biāo)注圖片訓(xùn)練,新功能的開發(fā)需要近萬張圖片訓(xùn)練,而定期優(yōu)化算法也有上千張圖片的需求,一個用于智慧城市的算法應(yīng)用,每年都有數(shù)十萬張圖片的穩(wěn)定需求。
語音方面:頭部公司累計應(yīng)用的標(biāo)注數(shù)據(jù)集已達百萬小時以上,每年需求仍以20%-30%的增速上升,要求數(shù)據(jù)服務(wù)商不僅要掌握專業(yè)的聲學(xué)知識、數(shù)據(jù)標(biāo)注經(jīng)驗,還要擁有語音合成的算法能力。
自然語言處理方面:隨著工業(yè)、醫(yī)療、教育的AI應(yīng)用產(chǎn)品進一步爆發(fā),將會有更多交互方式出現(xiàn),自然語義數(shù)據(jù)處理的需求將會持續(xù)增長,有望成為繼圖像、語音之后的第三大增量市常
這些海量的數(shù)據(jù)幾乎全部依賴數(shù)據(jù)標(biāo)注師手工進行標(biāo)注,數(shù)據(jù)標(biāo)注行業(yè)的缺口十分可觀,并且數(shù)據(jù)標(biāo)注已經(jīng)在各行業(yè)產(chǎn)生了極廣的應(yīng)用,行業(yè)也開始逐漸升級,走向產(chǎn)業(yè)化。在行業(yè)發(fā)展的過程中,行業(yè)人才的培養(yǎng)必然是最大的內(nèi)驅(qū)力。
“得數(shù)據(jù)者,得人工智能”。未來,隨著AI應(yīng)用場景逐漸多領(lǐng)域化,在數(shù)據(jù)標(biāo)注行業(yè)內(nèi)部,從業(yè)者也必將隨著AI行業(yè)而一同進入細(xì)分市場追逐階段,可謂機遇與挑戰(zhàn)并行。
責(zé)任編輯:YYX
-
人工智能
+關(guān)注
關(guān)注
1791文章
46858瀏覽量
237552 -
人臉識別
+關(guān)注
關(guān)注
76文章
4005瀏覽量
81768 -
智能語音
+關(guān)注
關(guān)注
10文章
781瀏覽量
48709
發(fā)布評論請先 登錄
相關(guān)推薦
評論