精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

炬芯科技 2019 多模態(tài)交互技術(shù)開發(fā)者大會(huì):AI多模態(tài)交互如何助力教育

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:Carol Li ? 2019-12-24 11:46 ? 次閱讀

2020年AI多模態(tài)交互技術(shù)將會(huì)迎來較大爆發(fā)。12月19日,在炬芯科技第四屆Techlife炬芯2019多模態(tài)交互技術(shù)開發(fā)者大會(huì)上,來自喜馬拉雅、達(dá)摩院、玩瞳科技、IP方CEVA的行業(yè)大咖們,從內(nèi)容賦能、語音賦能到視覺算法賦能、IP加速等多角度,共同探討多模態(tài)交互在教育上的落地情況。

多模態(tài)交互技術(shù)賦能新智能硬件

喜馬拉雅今年的用戶突破6億,擁有7000萬以上的主播,其中100萬以上是認(rèn)證主播,在整個(gè)音頻行業(yè)的覆蓋率73%,每個(gè)用戶平均每天的播放時(shí)長(zhǎng)超過170分鐘,喜馬拉雅硬件生態(tài)事業(yè)部總經(jīng)理余濤表示,“我們的目標(biāo)是,提供高度粘性,給用戶提供有價(jià)值的產(chǎn)品。”

喜馬拉雅硬件生態(tài)事業(yè)部總經(jīng)理余濤

硬件生態(tài)事業(yè)部主要做內(nèi)容賦能,喜馬拉雅希望通過內(nèi)容賦能,讓大家能夠把產(chǎn)品的體驗(yàn)做得更好。在余濤看來,人們擁有很多碎片化的時(shí)間,從古代到現(xiàn)代,人本質(zhì)上的需求是不會(huì)變的,而變的是我們以怎樣的方式去實(shí)現(xiàn)人們的需求。就像喜馬拉雅現(xiàn)在做的音頻的產(chǎn)業(yè)一直是存在的,而必須求變的是,需要通過怎樣的交互,生意模式,去給大家?guī)砀嗟乃伎肌?/p>

為此,喜馬拉雅接下來將會(huì)基于場(chǎng)景化,給大家?guī)聿煌瑘?chǎng)景化的東西。怎么做呢?即基于場(chǎng)景,讓人們?cè)诓煌乃槠瑫r(shí)間,可以有不同碎片時(shí)間的音頻的享受。所以我們?cè)诟鞣N場(chǎng)景下,對(duì)內(nèi)容做了篩選,比如從現(xiàn)在的故事維度到教課維度,把所有的內(nèi)容分為10個(gè)大類,包括博學(xué)、英語到科普,從不同維度輸出內(nèi)容。

實(shí)際上,所有的硬件廠商,未來也是一樣。如何讓用戶把愛不釋手的硬件拿到手,那就是要能為這些用戶提供更多的價(jià)值。

喜馬拉雅正在打造深圳硬件生態(tài),已經(jīng)為很多頭部廠商輸出內(nèi)容,比如為阿里、天貓、小米里面的喜馬專區(qū),小米、小天才、華為的手表,三星、聯(lián)想的手機(jī)的內(nèi)容。此外,喜馬拉雅硬件事業(yè)創(chuàng)業(yè)部2020年提出了一個(gè)雙百計(jì)劃,即三年內(nèi),有一百個(gè)年收入分成超過一百萬的企業(yè),這是接下來的目標(biāo)。

相信,喜馬拉雅的內(nèi)容在更多的智能產(chǎn)品中出現(xiàn),豐富的內(nèi)容體系將在多模態(tài)交互技術(shù)賦能的新智能硬件中煥發(fā)更蓬勃的生命力。

“阿里巴巴在語音助手方面,比谷歌更好。”

“談到達(dá)摩院語音實(shí)驗(yàn)室的時(shí)候,經(jīng)常有朋友很驚訝的問到,阿里巴巴還做語音嗎,那做得怎么樣呢?”阿里巴巴達(dá)摩院語音實(shí)驗(yàn)室資深算法專家高杰在會(huì)上說到。事實(shí)上,阿里巴巴達(dá)摩院的語音技術(shù)的表現(xiàn)已經(jīng)相當(dāng)優(yōu)秀,今年MIT Technology Review中講到2019年十大技術(shù)突破,有一點(diǎn)提到語音助手技術(shù),是這么說的,“阿里巴巴在語音助手方面,比谷歌更好。”這個(gè)評(píng)論是針對(duì),阿里菜鳥送貨電話機(jī)器人去做的。高杰表示,在我們擅長(zhǎng)的小小領(lǐng)域,比如電商客服,送貨,人工智能對(duì)話方面是實(shí)實(shí)在在做得最好的。

圖:阿里巴巴達(dá)摩院語音實(shí)驗(yàn)室資深算法專家高杰

圖:MIT Technology Review 2019提到“阿里巴巴在語音助手方面,比谷歌更好。”

高杰還從三個(gè)方面談到了達(dá)摩院的語音能力和優(yōu)勢(shì),他說,“數(shù)據(jù)積累、算法和計(jì)算能力是語音AI三大基石。在數(shù)據(jù)積累方面,達(dá)摩院語音技術(shù)連續(xù)4年,每年識(shí)別阿里巴巴集團(tuán)內(nèi)超過1億通的電話,還提供手機(jī)淘寶、支付寶、手機(jī)高德等阿里巴巴集團(tuán)內(nèi)所有App的語音識(shí)別相關(guān)功能,具有電視、車載、兒童教育、公共空間等多領(lǐng)域的語音交互數(shù)據(jù),具備多語音、重口音、方言能力;在算法方面,具有三國(guó)五地精英齊聚的百人精英團(tuán)隊(duì),具備信號(hào)處理、語音識(shí)別、語音合成、對(duì)話處理的能力;在計(jì)算能力方面,背靠阿里云,彈性計(jì)算百萬并發(fā)經(jīng)受雙十一考驗(yàn),語音識(shí)別使業(yè)內(nèi)最先進(jìn)的CTC-LFR建模技術(shù)提速3倍以上。”

在會(huì)上,高杰重點(diǎn)介紹兩款產(chǎn)品,語音原子產(chǎn)品和語音交互產(chǎn)品。語音原子產(chǎn)品,包含語音識(shí)別和語音合成,具有自學(xué)習(xí)、彈性計(jì)算、穩(wěn)定、方便接入的特點(diǎn)。語音交互產(chǎn)品旨在讓每臺(tái)設(shè)備都能聽會(huì)說懂你,該產(chǎn)品從2015年到2018年,已經(jīng)在手機(jī)、汽車、電視、智能家居等場(chǎng)景中應(yīng)用,包括支付寶、蝦米音樂、多模態(tài)地鐵售票機(jī)、手機(jī)高德APP、兒童機(jī)器人、榮威系列、海爾遠(yuǎn)場(chǎng)景語音電視等等。

高杰表示,達(dá)摩院語音實(shí)驗(yàn)室的愿景是為阿里巴巴經(jīng)濟(jì)體提供無處不在的語音交互能力。語音技術(shù)作為多模態(tài)中發(fā)展最成熟,也是最重要的一環(huán),我們期待語音技術(shù)在多模態(tài)交互場(chǎng)景中有著更多的亮眼表現(xiàn)。

視覺將是下一代機(jī)器人的基本能力

玩瞳科技VisionTal專注于實(shí)體學(xué)習(xí)桌面的智能視覺分析,旨在打造多模態(tài)的智能學(xué)習(xí)體驗(yàn)。在會(huì)上,玩瞳科技CTO潘鑫表示,政策利好產(chǎn)業(yè)發(fā)展,2018年,中國(guó)發(fā)布的《教育信息2.0行動(dòng)計(jì)劃》強(qiáng)調(diào)“智慧教育創(chuàng)新發(fā)展行動(dòng)”要加強(qiáng)智能教學(xué)助手、教育機(jī)器人、智能學(xué)伴、語音文字信息化等關(guān)鍵技術(shù)研究與應(yīng)用。教育機(jī)器人作為機(jī)器人應(yīng)用于教育領(lǐng)域的代表,將成為智慧學(xué)習(xí)環(huán)境的重要組成部分。

玩瞳科技CTO潘鑫

在談到下一代機(jī)器人的發(fā)展方向時(shí),潘鑫認(rèn)為,視覺將是下一代機(jī)器人的基本能力。視覺的能力將使機(jī)器人改變以往的被動(dòng)服務(wù)形式,邁向主動(dòng)服務(wù)。從而為使用者提供更好的服務(wù)體驗(yàn)。

玩瞳科技在教育視覺領(lǐng)域深耕多年,在視覺識(shí)別算法上走在行業(yè)前列,在完整的技術(shù)體系支持下,推出了多款視覺識(shí)別的教育硬件產(chǎn)品,并且和機(jī)器人/故事機(jī)、教育電子、互聯(lián)網(wǎng)巨頭、垂直教育多領(lǐng)域合作,積累了豐富的實(shí)踐經(jīng)驗(yàn)。

讓教育硬件從聽到到看,多模態(tài)的交互趨勢(shì),玩瞳已做好準(zhǔn)備。

CEVA DSP一站式解決方案助力極速開發(fā)產(chǎn)品

CEVA是一家以色列的IP授權(quán)公司,在DSP領(lǐng)域處于領(lǐng)先地位,客戶遍布全球各地,行業(yè)應(yīng)用覆蓋非常廣,包括計(jì)算機(jī)視覺、AI、通訊等領(lǐng)域。CEVAKeyAccountsMananger田元在會(huì)上表示,CEVA每年出貨量非常可觀,有CEVAinside的終端產(chǎn)品出貨超過10億臺(tái)。

CEVA Key Accounts Mananger 田元

在會(huì)上,田元重點(diǎn)談到音頻相關(guān)的應(yīng)用,重點(diǎn)講到智能音箱和TWS耳機(jī),調(diào)研機(jī)構(gòu)數(shù)據(jù)顯示,接下來幾年,TWS耳機(jī)每年都有500—800 milion的出貨量,智能音箱市場(chǎng)表現(xiàn)更為穩(wěn)定,接下來幾年會(huì)維持大概200 milion的出貨量,在田元看來,未來幾年,整個(gè)市場(chǎng)需求相當(dāng)可觀。

那么,面對(duì)如此大的市場(chǎng)需求,為什么用DSP而不是通用處理器來處理跟語音相關(guān)的東西?田元解釋道,DSP,即數(shù)字信號(hào)處理器,語音作為數(shù)字信號(hào),天然需要用DSP處理。那么又為什么用CEVA的DSP?田元說,“CEVA可以同時(shí)提供低功耗產(chǎn)品和高性能產(chǎn)品,此外,還和軟件合作伙伴們一起,打造非常完備的生態(tài)系統(tǒng),可以保證開發(fā)者芯片客戶、終端用戶,快速開發(fā)產(chǎn)品,快速落地。CEVA除了提供DSPIP本身之外,還提供整套一站式解決方案,涵蓋DSP IP、跟音頻相關(guān)的軟件等等。”

CEVA還會(huì)陣對(duì)不同的場(chǎng)景需求,提供不同的解決方案,這樣,IC設(shè)計(jì)公司可以有更多的選擇。以炬芯的芯片為例,超低功耗的解決方案對(duì)應(yīng)炬芯ATS283X平臺(tái),高性能解決方案對(duì)應(yīng)ATS3609D平臺(tái),優(yōu)質(zhì)的芯片集成的優(yōu)質(zhì)IP,可為終端智能硬件的產(chǎn)生做好充足準(zhǔn)備。

AI多模態(tài)交互技術(shù)智啟新教育

人機(jī)交互正在從鍵盤鼠標(biāo)的交互轉(zhuǎn)變成語音視覺等多模態(tài)交互。交互門檻的不斷降低,給交互體驗(yàn)帶來了明顯提升。炬芯科技產(chǎn)品總監(jiān)肖凱平表示,語音和視覺是AI交互主要的交互手段,語音方面,不同的產(chǎn)品,要求會(huì)有不同,但體驗(yàn)一定要“過門檻”,2mic是入門級(jí)要求,需要在本地完成AFE+WMC所有的計(jì)算;視覺方面,算法的計(jì)算量很大,本地化NN的性價(jià)比不夠,在本地完成一部分計(jì)算,大部分工作在“云”完成。

炬芯科技產(chǎn)品總監(jiān)肖凱平

為實(shí)現(xiàn)更優(yōu)質(zhì)交互體驗(yàn),炬芯作為一家芯片設(shè)計(jì)廠商的也在持續(xù)深耕技術(shù),希望用更優(yōu)質(zhì)產(chǎn)品給智能機(jī)器賦能。炬芯科技推出了ATS3607、ATS3607D、ATS3609、ATS3609D四款多模態(tài)智能交互芯片,充足的算力、超低的功耗、強(qiáng)大的可擴(kuò)展性,將賦予機(jī)器更多的可能性。

圖:炬芯多模態(tài)交互AI芯片平臺(tái)ATS3609D

據(jù)肖凱平介紹,炬芯多模態(tài)交互AI芯片平臺(tái)ATS3609D,具有語音+圖像智能、音視頻能力、教育內(nèi)容等,其中語音+圖像智能更適用“重”語音,“輕”圖像雙模交互的場(chǎng)景;音視頻能力雙向視頻通話,應(yīng)用在線教育產(chǎn)品;教育+AI,可以給傳統(tǒng)教育提供不一樣的體驗(yàn)。

圖:炬芯多MIC語音芯片平臺(tái)ATS3607D,可應(yīng)用于車載、家電、辦公領(lǐng)域

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30107

    瀏覽量

    268401
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1610

    瀏覽量

    47109
  • 炬芯科技
    +關(guān)注

    關(guān)注

    2

    文章

    106

    瀏覽量

    10720
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    高通與智譜推動(dòng)模態(tài)生成式AI體驗(yàn)的終端側(cè)部署

    此前,驍龍峰會(huì)首日,智譜與高通技術(shù)公司宣布合作將GLM-4V端側(cè)視覺大模型,面向驍龍8至尊版進(jìn)行深度適配和推理優(yōu)化,支持豐富的模態(tài)交互方式,進(jìn)一步推動(dòng)
    的頭像 發(fā)表于 11-08 09:55 ?143次閱讀

    利用OpenVINO部署Qwen2模態(tài)模型

    模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進(jìn)行融合,通過學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實(shí)現(xiàn)更加智能化的信息處理。簡(jiǎn)單來說,模態(tài)
    的頭像 發(fā)表于 10-18 09:39 ?318次閱讀

    云知聲推出山海模態(tài)大模型

    在人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心
    的頭像 發(fā)表于 08-27 15:20 ?364次閱讀

    慕尼黑電子展回顧:?jiǎn)⒚髦秋@模態(tài)硬件智能體引領(lǐng)科技潮流

    人流如織,熱鬧非凡。模態(tài)硬件智能體:未來科技的集大成展會(huì)現(xiàn)場(chǎng),啟明智顯隆重推出了其自主研發(fā)的模態(tài)硬件智能體。這一創(chuàng)新產(chǎn)品融合了HMI(
    的頭像 發(fā)表于 07-10 16:17 ?328次閱讀
    慕尼黑電子展回顧:?jiǎn)⒚髦秋@<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件智能體引領(lǐng)科技潮流

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/模態(tài)交互/英語評(píng)測(cè)SDK合集)

    豐富外設(shè)配件 配套模態(tài)應(yīng)用示例,支持快速上手體驗(yàn)大模型語音交互、智能視覺等 AI 應(yīng)用 板載 DAPLINK 調(diào)試器,外接一條USB 線即可實(shí)現(xiàn)燒錄、調(diào)試、串口日志查看 板載網(wǎng)絡(luò)模組
    發(fā)表于 06-18 17:33

    Build 2024發(fā)布多項(xiàng)Azure AI Speech全新模態(tài)功能

    客戶們持續(xù)使用 Azure OpenAI 和 Azure AI Speech 進(jìn)行創(chuàng)新,為企業(yè)引入新的效率,并構(gòu)建新的模態(tài)體驗(yàn)。
    的頭像 發(fā)表于 05-28 09:08 ?539次閱讀
    Build 2024發(fā)布多項(xiàng)Azure <b class='flag-5'>AI</b> Speech全新<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>功能

    谷歌發(fā)布模態(tài)AI新品,加劇AI巨頭競(jìng)爭(zhēng)

    在全球AI競(jìng)技場(chǎng)上,谷歌與OpenAI一直穩(wěn)居領(lǐng)先地位。近日,谷歌在I/O開發(fā)者大會(huì)上掀起了一股新的技術(shù)浪潮,發(fā)布了多款全新升級(jí)的
    的頭像 發(fā)表于 05-16 09:28 ?417次閱讀

    李未可科技正式推出WAKE-AI模態(tài)AI大模型

    李未可科技模態(tài) AI 大模型正式發(fā)布,積極推進(jìn) AI 在終端的場(chǎng)景應(yīng)用 ? 4月18日,2024中國(guó)生成式AI
    發(fā)表于 04-18 17:01 ?565次閱讀
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型

    谷歌推出模態(tài)VLOGGER AI

    谷歌最新推出的VLOGGER AI技術(shù)引起了廣泛關(guān)注,這項(xiàng)創(chuàng)新的模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供一張人物肖像照片和一段音頻內(nèi)容,VLOGGER
    的頭像 發(fā)表于 03-22 10:45 ?783次閱讀

    MWC2024:高通推出全新AI Hub及前沿模態(tài)大模型

    2024年世界移動(dòng)通信大會(huì)(MWC)上,高通再次展現(xiàn)其技術(shù)領(lǐng)導(dǎo)力,通過發(fā)布全新的高通AI Hub和展示前沿的模態(tài)大模型
    的頭像 發(fā)表于 02-26 16:59 ?1197次閱讀

    韓國(guó)Kakao宣布開發(fā)模態(tài)大語言模型“蜜蜂”

    韓國(guó)互聯(lián)網(wǎng)巨頭Kakao最近宣布開發(fā)了一種名為“蜜蜂”(Honeybee)的模態(tài)大型語言模型。這種創(chuàng)新模型能夠同時(shí)理解和處理圖像和文本數(shù)據(jù),為更豐富的交互和查詢響應(yīng)提供了可能性。
    的頭像 發(fā)表于 01-19 16:11 ?641次閱讀

    語音識(shí)別技術(shù)最新進(jìn)展:視聽融合的模態(tài)交互成為主要演進(jìn)方向

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)所謂“模態(tài)”,英文是modality,用通俗的話說,就是“感官”,模態(tài)即將多種感官融合。模態(tài)
    的頭像 發(fā)表于 12-28 09:06 ?3624次閱讀
    語音識(shí)別<b class='flag-5'>技術(shù)</b>最新進(jìn)展:視聽融合的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>交互</b>成為主要演進(jìn)方向

    模態(tài)加持底座,大模型提速AI未來,星宸科技2023開發(fā)者大會(huì)暨產(chǎn)品發(fā)布會(huì)圓滿落幕

    ? 12月22日,星宸科技股份有限公司(以下簡(jiǎn)稱:星宸科技)以“Leading AI Everywhere”為主題的2023開發(fā)者大會(huì)暨產(chǎn)品發(fā)布會(huì)在深圳益田威斯汀酒店隆重舉行。 ? 大會(huì)
    的頭像 發(fā)表于 12-23 18:58 ?2015次閱讀
    <b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>加持<b class='flag-5'>芯</b>底座,大模型提速<b class='flag-5'>AI</b>未來,星宸科技2023<b class='flag-5'>開發(fā)者</b><b class='flag-5'>大會(huì)</b>暨產(chǎn)品發(fā)布會(huì)圓滿落幕

    人工智能領(lǐng)域模態(tài)的概念和應(yīng)用場(chǎng)景

    隨著人工智能技術(shù)的不斷發(fā)展,模態(tài)成為了一個(gè)備受關(guān)注的研究方向。模態(tài)技術(shù)旨在將不同類型的數(shù)據(jù)和
    的頭像 發(fā)表于 12-15 14:28 ?9181次閱讀

    大模型+模態(tài)的3種實(shí)現(xiàn)方法

    我們知道,預(yù)訓(xùn)練LLM已經(jīng)取得了諸多驚人的成就, 然而其明顯的劣勢(shì)是不支持其他模態(tài)(包括圖像、語音、視頻模態(tài))的輸入和輸出,那么如何在預(yù)訓(xùn)練LLM的基礎(chǔ)上引入跨模態(tài)的信息,讓其變得更強(qiáng)大、更通用呢?本節(jié)將介紹“大模型+
    的頭像 發(fā)表于 12-13 13:55 ?1626次閱讀
    大模型+<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的3種實(shí)現(xiàn)方法