精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云知聲數(shù)據(jù)標(biāo)注團(tuán)隊(duì)--關(guān)于研究機(jī)器人說(shuō)話(huà)的研究

云知聲 ? 來(lái)源:djl ? 作者:云知聲 ? 2019-08-08 16:02 ? 次閱讀

“如果機(jī)器在某些現(xiàn)實(shí)的條件下,能夠非常好地模仿人回答問(wèn)題,讓提問(wèn)者在相當(dāng)長(zhǎng)時(shí)間里誤認(rèn)它不是機(jī)器,那么機(jī)器就可以被認(rèn)為是能夠思維的。”

—— 阿蘭·圖靈

人機(jī)對(duì)話(huà)是人類(lèi)對(duì)人工智能最初的設(shè)想,也一直是人工智能領(lǐng)域的目標(biāo)之一。

即使我們經(jīng)常聽(tīng)到“這個(gè)問(wèn)題我還沒(méi)有學(xué)會(huì)”,但是不可否認(rèn),人工智能已經(jīng)基本實(shí)現(xiàn)”可以說(shuō)話(huà)”了。那么,機(jī)器人是怎樣學(xué)習(xí)的呢?這就需要提到人工智能需求下誕生的一個(gè)新職業(yè),也是人工智能背后的“隱形者”——數(shù)據(jù)標(biāo)注專(zhuān)員。

眾所周知,我們教小孩子認(rèn)識(shí)海豚,就要拿海豚的圖片告訴他,這是海豚。久而久之,他記住了海豚的特征,當(dāng)他去動(dòng)物園看到了海豚,就知道那是海豚。類(lèi)比機(jī)器人,為了讓機(jī)器人“像人一樣說(shuō)話(huà)”,我們先要教它學(xué)習(xí),通過(guò)大量的學(xué)習(xí)之后,它才能對(duì)事物做出分辨。

AI 領(lǐng)域,教機(jī)器人學(xué)習(xí)必須有大量的訓(xùn)練集和測(cè)試集,訓(xùn)練集通俗說(shuō)就像是我們學(xué)習(xí)時(shí)做的習(xí)題集,測(cè)試集像我們考試做的試題。測(cè)試集和訓(xùn)練集里的數(shù)據(jù)必須是支持算法可用的標(biāo)注數(shù)據(jù),而將采集的原始數(shù)據(jù)變成算法可用數(shù)據(jù)的過(guò)程叫做“數(shù)據(jù)標(biāo)注”。即對(duì)采集來(lái)的文本、圖片、語(yǔ)音數(shù)據(jù)進(jìn)行梳理、整理、定性的過(guò)程。而數(shù)據(jù)標(biāo)注專(zhuān)員就成了為人工智能的發(fā)展供應(yīng)重要且源源不斷的“數(shù)據(jù)燃料”的人。

云知聲就有一個(gè)龐大的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)從事數(shù)據(jù)服務(wù)工作,并且,僅有的數(shù)據(jù)標(biāo)注團(tuán)隊(duì)還在云知聲的東南總部廈門(mén)公司哦。團(tuán)隊(duì)的小伙伴幾乎每天默默戴著耳機(jī)對(duì)著電腦 7-8 小時(shí),真的是此處無(wú)聲勝有聲!

數(shù)據(jù)標(biāo)注是一項(xiàng)重復(fù)且繁瑣的工作,如果把人工智能比作金字塔,最頂端的是人工智能應(yīng)用(比如機(jī)器人、無(wú)人駕駛等),而最底端的則是數(shù)據(jù)服務(wù),數(shù)據(jù)服務(wù)既是根基,也是人工智能必要且必不可少的一環(huán)。

數(shù)據(jù)標(biāo)注工作真的像是工廠(chǎng)里的流水線(xiàn)操作嗎?只是重復(fù)性地對(duì)數(shù)據(jù)進(jìn)行標(biāo)注嗎?

云知聲數(shù)據(jù)標(biāo)注團(tuán)隊(duì)的負(fù)責(zé)人許建說(shuō),目前人工智能領(lǐng)域?qū)τ跀?shù)據(jù)采集和標(biāo)注的需求量非常大,數(shù)據(jù)采集后首先進(jìn)行數(shù)據(jù)清洗,清洗之后才是數(shù)據(jù)標(biāo)注,標(biāo)注要求盡可能地詳盡、清楚,最后的審查階段對(duì)標(biāo)記的數(shù)據(jù)進(jìn)行正確率、精確度、完備性等方面的審查。實(shí)際是,數(shù)據(jù)質(zhì)量會(huì)影響到算法效果,一旦標(biāo)注人員出現(xiàn)了錯(cuò)誤,也會(huì)影響到機(jī)器犯錯(cuò)。

目前主要有語(yǔ)音、圖像、文本、視頻數(shù)據(jù)的采集標(biāo)注。云知聲日常所涉及的是語(yǔ)音的標(biāo)注,與智能產(chǎn)品進(jìn)行語(yǔ)音交互和我們平時(shí)與人的交流對(duì)話(huà)相似,在生活中,你可能突然問(wèn)你身邊的人,“小云,現(xiàn)在幾點(diǎn)了”,現(xiàn)在 3 點(diǎn) 15 分”,“小云”就是喚醒詞,“現(xiàn)在幾點(diǎn)了”就是命令詞,喚醒詞和命令詞均要采集。

為了讓即便帶有背景嘈雜聲、或是略帶方言口音也能準(zhǔn)確識(shí)別,這背后有一個(gè)數(shù)量龐大的數(shù)據(jù)訓(xùn)練集支撐。每個(gè)語(yǔ)音命令需要采集至少 100 人的語(yǔ)音數(shù)據(jù),既要羅列出所有可能的句子,又要搜集盡可能多的人不同的說(shuō)話(huà)方式,覆蓋到地域、性別、各年齡段。

比如我們的 Pandora A1 客房智能管家,當(dāng)查詢(xún)酒店服務(wù)時(shí),就有多種表達(dá)方式,“提供什么服務(wù)”、“包括哪些服務(wù)”、“有哪些服務(wù)”、“有什么服務(wù)”等。同時(shí),會(huì)有嚴(yán)格的性別、年齡段、口音采集人數(shù)占比,以保證最終的精準(zhǔn)識(shí)別。

對(duì)每一個(gè)采集的詞句,都要做到精細(xì)標(biāo)注,采集的語(yǔ)音需要符合相應(yīng)的技術(shù)要求,標(biāo)注的時(shí)間點(diǎn)要精準(zhǔn)控制在 100 毫秒以?xún)?nèi)。數(shù)據(jù)標(biāo)注的速度決定了 AI 產(chǎn)品的研發(fā)速度,提高標(biāo)注的效率也就顯得很重要。

為了配合數(shù)據(jù)標(biāo)注團(tuán)隊(duì)的工作廈門(mén)展廳還藏著一個(gè)神秘的聲學(xué)實(shí)驗(yàn)室,這里可以說(shuō)是整個(gè)公司最安靜的地方了。

聲學(xué)實(shí)驗(yàn)室的主要用途是采集原始聲音數(shù)據(jù),為了貼近產(chǎn)品實(shí)際使用場(chǎng)景,整個(gè)裝修布置符合家居場(chǎng)景。

實(shí)驗(yàn)室采用減振隔聲墻體,房間被墻體隔開(kāi),墻面、吊頂與外部房間沒(méi)有任何剛性連接,完全與外界隔絕。墻內(nèi)的吸聲材料主要由多孔的玻璃纖維板組成,具有較好的聲音吸收能力,除了吸聲材料外,聲學(xué)實(shí)驗(yàn)室四周還布置了窗簾,可以讓聲音充分?jǐn)U散,使整個(gè)空間內(nèi)的聲場(chǎng)均勻分布。地板采用的是地磚和吸聲地毯,實(shí)現(xiàn)實(shí)驗(yàn)室與建筑基座的分隔,無(wú)反射和回聲。

聲學(xué)實(shí)驗(yàn)室內(nèi)五臟俱全—標(biāo)準(zhǔn)麥克風(fēng)、高保真音箱、聲卡……應(yīng)有盡有。

許建說(shuō),為了達(dá)到設(shè)備在實(shí)際應(yīng)用場(chǎng)景中達(dá)到最優(yōu)效果,在聲學(xué)實(shí)驗(yàn)室采集時(shí)就要模擬真實(shí)環(huán)境,需要覆蓋不同的噪音、信噪比、距離和角度。

為了保證支持遠(yuǎn)講的語(yǔ)音產(chǎn)品出廠(chǎng)前的效果,在前期的采集階段就要把產(chǎn)品在實(shí)際應(yīng)用中受到的噪音干擾和不同距離、角度的聲音效果考慮進(jìn)去。

像我們有些設(shè)備是支持 5 米遠(yuǎn)講識(shí)別的,就要求錄音人距離錄音設(shè)備一米、三米、五米距離的錄音數(shù)據(jù),同時(shí)會(huì)設(shè)置 0° 、 -30° 、 -60° 等不同角度的設(shè)備疊加采集。經(jīng)常在采集的過(guò)程中根據(jù)場(chǎng)景需要加入音樂(lè)噪聲、電視噪聲、辦公噪聲、室外噪聲等,模擬出真實(shí)場(chǎng)景的噪音干擾。

人工智能的發(fā)展,催生了數(shù)據(jù)標(biāo)注這個(gè)新職業(yè),隨著人工智能大規(guī)模的落地應(yīng)用,至少在未來(lái)的五六年內(nèi),人工智能像是一個(gè)嗷嗷待哺的嬰兒,等待著數(shù)據(jù)的喂養(yǎng)。數(shù)據(jù)標(biāo)注專(zhuān)員賦予冷冰冰的機(jī)器以鮮活的“生命”,教他們我們的知識(shí),讓他們變得有“溫度”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28231

    瀏覽量

    206620
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    781

    瀏覽量

    48714
  • 語(yǔ)音交互
    +關(guān)注

    關(guān)注

    3

    文章

    283

    瀏覽量

    27986
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于結(jié)構(gòu)自適應(yīng)的多機(jī)器人協(xié)作機(jī)制研究

    基于結(jié)構(gòu)自適應(yīng)的多機(jī)器人協(xié)作機(jī)制研究
    發(fā)表于 08-20 13:43

    機(jī)器人足球識(shí)別算法研究

    `機(jī)器人足球識(shí)別算法研究`
    發(fā)表于 08-20 19:59

    美國(guó)最著名的十所機(jī)器人研究頂尖高校

    美國(guó)總統(tǒng)是該校的畢業(yè)生。此外,學(xué)校的醫(yī)學(xué)、法學(xué)、商學(xué)和新聞學(xué)院都名列前茅,其新聞學(xué)院頒發(fā)的普利策獎(jiǎng)是美國(guó)新聞界的最高榮譽(yù)。  據(jù)網(wǎng)上評(píng)價(jià),哥倫比亞大學(xué)的機(jī)器人研究團(tuán)隊(duì)令人印象深刻。該校學(xué)生已經(jīng)制造適合
    發(fā)表于 01-13 17:15

    【Aworks申請(qǐng)】基于ARM的智能清掃機(jī)器人研究

    申請(qǐng)理由:現(xiàn)正在進(jìn)行一個(gè)關(guān)于智能清掃機(jī)器人的項(xiàng)目研究,希望基于ARM搭建一款可以實(shí)現(xiàn)自動(dòng)清掃和自動(dòng)返回充電的,具有自主管理能力的清掃機(jī)器人,同時(shí)對(duì)相應(yīng)功能進(jìn)行改造完善。需要用到ARM芯
    發(fā)表于 07-06 10:59

    【MiCOKit申請(qǐng)】關(guān)于機(jī)器人熱感應(yīng)系統(tǒng)的開(kāi)發(fā)與研究

    申請(qǐng)理由:本人是一研究生,研究的是機(jī)器人方向,里面需要的很多參數(shù)和MiCOKit 開(kāi)發(fā)板有關(guān),很希望能申請(qǐng)到,謝謝.項(xiàng)目描述:這是一款基于F2812DSP的一款和熱感應(yīng)有關(guān)的機(jī)器人系統(tǒng)
    發(fā)表于 07-24 07:18

    智易申請(qǐng)】智能控制機(jī)器人-腦存儲(chǔ)

    申請(qǐng)理由:目前我們團(tuán)隊(duì)正在研發(fā)的這個(gè)腦存儲(chǔ)智能機(jī)器人,原則上需要大量的內(nèi)存空間,所以需要進(jìn)行儲(chǔ)存,wifi連接,通訊等方面的硬件開(kāi)發(fā)板需要。目前也正在尋找這樣一款合適的開(kāi)發(fā)板能夠搭配我們團(tuán)隊(duì)
    發(fā)表于 07-24 10:07

    OFweek行業(yè)研究中心:服務(wù)機(jī)器人將成為新一代智能終端

    概要:從產(chǎn)業(yè)生命周期來(lái)看,服務(wù)機(jī)器人正處于市場(chǎng)導(dǎo)入期,在計(jì)算和大數(shù)據(jù)日趨成熟的背景下,深度學(xué)習(xí)等人工智能關(guān)鍵技術(shù)取得一定實(shí)質(zhì)性的進(jìn)展,語(yǔ)音和圖片系統(tǒng)的識(shí)別率得到大大的提高。OFweek行業(yè)
    發(fā)表于 01-26 14:11

    機(jī)器人在線(xiàn)】工業(yè)噴涂機(jī)器人誤差修正方法發(fā)展趨勢(shì)

    的運(yùn)動(dòng)學(xué)問(wèn)題進(jìn)行了研究,但由于研究對(duì)象適用于Pieper準(zhǔn)則,故逆解可以運(yùn)動(dòng)封閉解法來(lái)求解,沒(méi)有對(duì)于不滿(mǎn)足Pieper的情況進(jìn)行進(jìn)一步討論,且由于關(guān)于機(jī)器人加速度的理論
    發(fā)表于 07-13 16:03

    LabVIEW 的Tripod 機(jī)器人視覺(jué)處理和定位研究

    針對(duì)傳統(tǒng)的物流分揀過(guò)程效率低、成本高的現(xiàn)狀以及利用機(jī)器視覺(jué)進(jìn)行分揀快速、可靠的優(yōu)點(diǎn)對(duì)機(jī)器視覺(jué)、圖像處理和Tiropd機(jī)器人進(jìn)行了研究基于LabVIEW設(shè)計(jì)了Tripod
    發(fā)表于 06-01 06:00

    基于CAN總線(xiàn)和雙傳感器仿人機(jī)器人運(yùn)動(dòng)控制系統(tǒng)的研究

    一。引言  機(jī)器人研究是自動(dòng)化領(lǐng)域最復(fù)雜。最具挑戰(zhàn)性的課題,它集機(jī)械。電子。計(jì)算機(jī)。材料。傳感器。控制技術(shù)等多門(mén)學(xué)科于一體,是多學(xué)科高技術(shù)成果的集中體現(xiàn)。而仿步行機(jī)器人技術(shù)的
    發(fā)表于 08-19 06:57

    功率放大器基于振動(dòng)驅(qū)動(dòng)的旋轉(zhuǎn)及攀爬軟體機(jī)器人研究

    實(shí)驗(yàn)名稱(chēng):基于振動(dòng)驅(qū)動(dòng)的旋轉(zhuǎn)及攀爬軟體機(jī)器人研究研究方向:利用振動(dòng)驅(qū)動(dòng)原理,設(shè)計(jì)了能夠?qū)崿F(xiàn)快速旋轉(zhuǎn)運(yùn)動(dòng)和攀爬運(yùn)動(dòng)的兩種軟體驅(qū)動(dòng)結(jié)構(gòu)。實(shí)驗(yàn)內(nèi)容:旋轉(zhuǎn)軟體機(jī)器人具有可實(shí)現(xiàn)大變形、柔性接觸
    發(fā)表于 04-09 10:02

    功率放大器基于振動(dòng)驅(qū)動(dòng)的旋轉(zhuǎn)及攀爬軟體機(jī)器人研究

    實(shí)驗(yàn)名稱(chēng):基于振動(dòng)驅(qū)動(dòng)的旋轉(zhuǎn)及攀爬軟體機(jī)器人研究研究方向:利用振動(dòng)驅(qū)動(dòng)原理,設(shè)計(jì)了能夠?qū)崿F(xiàn)快速旋轉(zhuǎn)運(yùn)動(dòng)和攀爬運(yùn)動(dòng)的兩種軟體驅(qū)動(dòng)結(jié)構(gòu)。實(shí)驗(yàn)內(nèi)容:旋轉(zhuǎn)軟體機(jī)器人具有可實(shí)現(xiàn)大變形、柔性接觸
    發(fā)表于 04-14 09:56

    機(jī)器人視覺(jué)系統(tǒng)研究

    視覺(jué)系統(tǒng)成為研究的新課題。1965年, Stanford建立機(jī)器人實(shí)驗(yàn)室開(kāi)始研究機(jī)器人機(jī)器人的定義:【
    發(fā)表于 09-07 08:37

    基于TRIZ輪式機(jī)器人驅(qū)動(dòng)輪的研究

    基于TRIZ輪式機(jī)器人驅(qū)動(dòng)輪的研究 根據(jù)亞太機(jī)器人大賽規(guī)則,要求機(jī)器人車(chē)輪與地面有較大的摩擦力,以保證機(jī)器人在規(guī)定的時(shí)間內(nèi)完成比賽任務(wù)。文中
    發(fā)表于 09-13 07:12

    智慧醫(yī)療解決方案詳細(xì)介紹與分享

    值得一提的是,除以上幾大智慧醫(yī)療產(chǎn)品與方案外,本次展會(huì)上還首次公布了旗下最新醫(yī)療產(chǎn)品——
    的頭像 發(fā)表于 08-08 17:03 ?4697次閱讀