精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Google Assistant的新功能——Duplex雙工技術(shù)

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 10:00 ? 次閱讀

在6月的1400多篇機(jī)器學(xué)習(xí)相關(guān)的文章/項(xiàng)目中,Mybridge甄選了10篇最熱文章(入選率0.7%)。主題包括:Google Duplex,網(wǎng)格單元,神經(jīng)網(wǎng)絡(luò),TensorFlow,Keras,第一名解決方案,CVPR 2018等。

在 5 月的1400多篇機(jī)器學(xué)習(xí)相關(guān)的文章/項(xiàng)目中,Mybridge甄選了10篇最熱文章(入選率0.7%)。

此列表中的主題:Google Duplex,網(wǎng)格單元,神經(jīng)網(wǎng)絡(luò),TensorFlow,Keras,第一名解決方案,CVPR 2018等。

Top 10文章由Mybridge AI選出,綜合考慮文章分享數(shù)量、閱讀時間等,并使用機(jī)器學(xué)習(xí)算法對文章進(jìn)行排序。相信這些文章分享的機(jī)器學(xué)習(xí)經(jīng)驗(yàn)和技巧是有用的。

1. Google Duplex:一個通過電話完成真實(shí)世界任務(wù)的AI系統(tǒng)

5月份最受關(guān)注的是谷歌在I/O大會演示的Google Assistant的新功能——Duplex雙工技術(shù)。

利用Duplex雙工技術(shù),谷歌的智能助理能用非常類似人聲的角色完成真實(shí)世界的任務(wù)。在demo中,谷歌CEO Pichai告訴聽眾,“你將要聽到的是,谷歌的助理實(shí)際地打電話給一家真實(shí)的美容院,為你安排一個預(yù)約?!碑?dāng)然,智能助理幾乎毫無破綻地完成了任務(wù)。雖然后來這個演示是否真實(shí)受到一些質(zhì)疑,但這一技術(shù)引發(fā)了業(yè)界熱議。

在這篇文章中,谷歌首席工程師Yaniv Leviathan和工程副總裁Yossi Matias詳細(xì)介紹了Google Duplex使用到的技術(shù),包括:

Duplex的核心是一個循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),使用TensorFlow Extended(TFX)構(gòu)建。

使用谷歌自己的自動語音識別(ASR)技術(shù)來處理語音,將語音轉(zhuǎn)換為文本。

使用連續(xù)文本到語音(TTS)引擎和綜合TTS引擎(使用Tacotron和WaveNet)的組合,根據(jù)情況控制語調(diào)。

https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

2. “換臉術(shù)”Deep Video Portraits

Deep Video Portraits是斯坦福大學(xué)、慕尼黑技術(shù)大學(xué)等的研究人員提交給今年8月SIGGRAPH大會的一篇論文,描述了一種經(jīng)過改進(jìn)的“換臉”技術(shù),可以在視頻中用一個人的臉再現(xiàn)另一人臉部的動作、面部表情和說話口型。

例如,將普通人的臉換成奧巴馬的臉。Deep Video Portraits可以通過一段目標(biāo)人物的視頻(在這里就是奧巴馬),來學(xué)習(xí)構(gòu)成臉部、眉毛、嘴角和背景等的要素以及它們的運(yùn)動形式。

論文地址:https://arxiv.org/abs/1805.11714

3.在人工智能體中使用網(wǎng)格表示進(jìn)行導(dǎo)航

雖然AI在圍棋等許多任務(wù)超過了人類,空間導(dǎo)航能力對于人工智能體來說仍然是一個巨大的挑戰(zhàn)。DeepMind在Nature上發(fā)表的一篇論文引起AI領(lǐng)域和神經(jīng)科學(xué)領(lǐng)域的極大震撼:AI展現(xiàn)出與人腦“網(wǎng)格細(xì)胞”高度一致的空間導(dǎo)航能力。

通過一系列實(shí)驗(yàn)操作,研究人員發(fā)現(xiàn)網(wǎng)格單元對于基于矢量的導(dǎo)航至關(guān)重要。例如,當(dāng)網(wǎng)絡(luò)中的網(wǎng)格單元被掐斷時,agent的導(dǎo)航能力就會受損,而且對目標(biāo)的距離和方向的判斷等關(guān)鍵指標(biāo)的表示變得不那么準(zhǔn)確。這項(xiàng)發(fā)現(xiàn)有助于AI可解釋性的研究。

地址:https://deepmind.com/blog/grid-cells

4.如何用Python從頭開始構(gòu)建一個神經(jīng)網(wǎng)絡(luò)

這是一個入門教程,初學(xué)者可以從這個教程開始,了解深度學(xué)習(xí)的內(nèi)部運(yùn)作。

神經(jīng)網(wǎng)絡(luò)是什么呢?許多介紹性文章會將其與大腦進(jìn)行類比,但如果拋開神經(jīng)網(wǎng)絡(luò)和人腦的類比,將其描述為一個給定的輸入和一個期望的輸出之間的映射的數(shù)學(xué)函數(shù),會更好理解。

神經(jīng)網(wǎng)絡(luò)包含以下元素:

一個輸入層x

任意數(shù)量的隱藏層

一個輸出層?

每一層之間的一組權(quán)重W和偏差b

每個隱藏層的激活函數(shù)σ。在這個教程中,使用Sigmoid激活函數(shù)。

圖:一個2層神經(jīng)網(wǎng)絡(luò)的架構(gòu)

地址:https://towardsdatascience.com/how-to-build-your-own-neural-network-from-scratch-in-python-68998a08e4f6

5.對Airbnb上的照片進(jìn)行分類

Airbnb為數(shù)百萬的民宿提供了一個平臺,也因此獲得了一大批民宿的房間細(xì)節(jié)照片和用戶數(shù)據(jù)。在這個任務(wù)中,Airbnb的數(shù)據(jù)團(tuán)隊(duì)利用計(jì)算機(jī)視覺深度學(xué)習(xí)對民宿房屋照片進(jìn)行分類。

其目的一方面是將具有相似風(fēng)格的房源聚集到一起,方便用戶瀏覽。另一方面,分類也可以幫助驗(yàn)證房間數(shù)量和房屋信息的準(zhǔn)確性。該團(tuán)隊(duì)表示,利用這些圖片數(shù)據(jù),還將發(fā)掘出更多潛在的信息。

地址:https://medium.com/airbnb-engineering/categorizing-listing-photos-at-airbnb-f9483f3ab7e3

6. Loc2Vec:用triplet-loss網(wǎng)絡(luò)學(xué)習(xí)位置嵌入

這是一個以智能手機(jī)傳感器數(shù)據(jù)作為輸入,例如加速度計(jì)、陀螺儀和位置信息,并從中提取行為洞察的平臺,用于了解用戶的模式,并能夠預(yù)測和解釋事情發(fā)生的原因。

這個平臺的一個重要組成部分是場地映射算法(venue mapping algorithm)。venue mapper的目標(biāo)是弄清楚你要訪問的地點(diǎn)。

地址:http://www.sentiance.com/2018/05/03/loc2vec-learning-location-embeddings-w-triplet-loss-networks/

7.在瀏覽器中使用TensorFlow.js進(jìn)行實(shí)時人體姿態(tài)估計(jì)

這是來自TensorFlow博客的教程,與谷歌創(chuàng)意實(shí)驗(yàn)室合作,發(fā)布了TensorFlow.js版本的PoseNet。PoseNet是一個機(jī)器學(xué)習(xí)模型,可以在瀏覽器中實(shí)時估計(jì)人體姿態(tài)。

PoseNet可以利用單姿態(tài)或多姿態(tài)算法檢測圖像和視頻中的人物,所有這些都可以在瀏覽器中實(shí)現(xiàn)。

PoseNet的姿態(tài)估計(jì)分兩個階段進(jìn)行:

將一個RGB圖像作為輸入,輸入給卷積神經(jīng)網(wǎng)絡(luò)。

利用單姿態(tài)或多姿態(tài)解碼算法解碼來解碼模型輸出中的姿態(tài)、姿態(tài)置信度分?jǐn)?shù)、關(guān)鍵點(diǎn)位置和關(guān)鍵點(diǎn)置信度分?jǐn)?shù)。

PoseNet返回檢測到的每個人的置信度值以及檢測到的每個姿勢關(guān)鍵點(diǎn)。

https://medium.com/tensorflow/real-time-human-pose-estimation-in-the-browser-with-tensorflow-js-7dd0bc881cd5

8.用Keras進(jìn)行多標(biāo)簽分類

這是一個關(guān)于多標(biāo)簽分類的Keras教程,包括以下4個部分:

討論多標(biāo)簽分類數(shù)據(jù)集(以及如何快速構(gòu)建自己的分類數(shù)據(jù)集)。

簡要討論SmallerVGGNet,這是將用來實(shí)現(xiàn)多標(biāo)簽分類的Keras神經(jīng)網(wǎng)絡(luò)架構(gòu)。

實(shí)現(xiàn)SmallerVGGNet,并使用多標(biāo)簽分類數(shù)據(jù)集對其進(jìn)行訓(xùn)練。

最后,在示例圖像上測試網(wǎng)絡(luò),并討論一些注意事項(xiàng)

https://www.pyimagesearch.com/2018/05/07/multi-label-classification-with-keras

9.谷歌地標(biāo)檢索挑戰(zhàn)賽:第一名解決方案解讀

四個月前,谷歌在Kaggle發(fā)布了一項(xiàng)地標(biāo)檢索挑戰(zhàn)賽(Google Landmark Retrieval Challenge),參賽者被要求在所有圖像數(shù)據(jù)集中檢索到含有給定圖像中地標(biāo)的圖片。

這篇文章是第一名團(tuán)隊(duì)的解決方案總結(jié),包括兩個主要部分:

首先,創(chuàng)建一個高性能的全局描述符(global descriptor),它可以將數(shù)據(jù)集中的圖像表示為奇異向量(singular vector);

然后,創(chuàng)建一個高效框架,將這些向量和最可能的圖像匹配,最后提交到積分榜上。

以下是一個流程圖,每一步都標(biāo)記LB分?jǐn)?shù)。

https://www.kaggle.com/c/landmark-retrieval-challenge/discussion/57855

10.學(xué)會“夜視”

這是伊利諾伊大學(xué)香檳分校(UIUC)和Intel Labs合作的論文,提出一個基于端到端訓(xùn)練的用全卷積網(wǎng)絡(luò)進(jìn)行低照度圖像處理的模型。這個網(wǎng)絡(luò)直接處理原始傳感器數(shù)據(jù),并且基本不使用傳統(tǒng)的圖像處理流程。

兩個大型新數(shù)據(jù)集

伯克利大學(xué)發(fā)布大型駕駛視頻數(shù)據(jù)集BDD100K

伯克利大學(xué)發(fā)布了BDD100K,這是目前為止最大規(guī)模也是最多樣化的駕駛視頻數(shù)據(jù)集。這些數(shù)據(jù)具有四個主要特征:大規(guī)模,多樣化,在真實(shí)的街道采集,并帶有時間信息。利用這個數(shù)據(jù)集,你還可以參加伯克利在CVPR 2018舉辦的自動駕駛競賽。

地址:http://bair.berkeley.edu/blog/2018/05/30/bdd/

骨骼X-ray數(shù)據(jù)集

Andrew Ng帶領(lǐng)的斯坦福大學(xué)ML團(tuán)隊(duì)發(fā)布了一個目前為止最大規(guī)模的醫(yī)學(xué)影像數(shù)據(jù)集MURA(musculoskeletal radiographs),這個數(shù)據(jù)集包含4萬多張多角度射線檢測圖像,來自對12173名病人的14863項(xiàng)研究,X光影像包含人體上肢的7個部分:肘、指、小臂、手、肱、肩、腕。最近,該團(tuán)隊(duì)推出了基于此數(shù)據(jù)集的識別挑戰(zhàn)賽:MURA骨骼X-ray深度學(xué)習(xí)競賽。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:5月機(jī)器學(xué)習(xí)TOP 10熱文: Google Duplex,“換臉術(shù)”、網(wǎng)格單元(附文章地址)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    谷歌語音助理服務(wù)新功能:可為用戶整合日常有用信息

      導(dǎo)讀:近日,谷歌宣布為其語音助理服務(wù)Google Assistant推出一種新功能,向客戶提供日??赡苡玫降母鞣N信息的“可視化快照”。   谷歌周二宣布為其語音助理服務(wù)Google
    發(fā)表于 07-19 09:27

    WCDMA系統(tǒng)原理概述-多址技術(shù)雙工技術(shù)

    1.多址技術(shù)時分多址頻分多址碼分多址2.雙工技術(shù)時分雙工頻分雙工直接擴(kuò)頻碼分多址多用戶完全同一時間、同一地點(diǎn)占用同一頻率資源可以
    發(fā)表于 06-01 16:16 ?53次下載
    WCDMA系統(tǒng)原理概述-多址<b class='flag-5'>技術(shù)</b>和<b class='flag-5'>雙工技術(shù)</b>

    Google Assistant搭配Google Duplex技術(shù)就能成為智能音箱霸主

    Google、亞馬遜和蘋果三大廠商力拚智能音箱市場,因整合了多項(xiàng)技術(shù),根據(jù)研調(diào)機(jī)構(gòu)Canalys的調(diào)查結(jié)果,智能音箱霸主在第1季換手,首度由Google Home系列產(chǎn)品取代Amazon Echo
    發(fā)表于 05-31 09:14 ?2284次閱讀

    Google Assistant即將登陸Wear OS

    Assistant功能也變得更加強(qiáng)大。在今天發(fā)表的官方博文中,Google預(yù)告了即將登陸Wear OS的諸多Google Assistant
    的頭像 發(fā)表于 06-14 09:45 ?3580次閱讀

    Google Assistant活躍用戶超五億,將推出新功能

    在亞馬遜宣布整合 Alexa 語音助手的設(shè)備突破 1 億之后,Google 宣布它的語音助手 Google Assistant 活躍用戶超過了五億。
    的頭像 發(fā)表于 01-09 15:38 ?2411次閱讀

    使用Google Assistant的燈光監(jiān)控系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant的燈光監(jiān)控系統(tǒng).zip》資料免費(fèi)下載
    發(fā)表于 11-24 10:43 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>的燈光監(jiān)控系統(tǒng)

    使用Google Assistant監(jiān)控室溫

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant監(jiān)控室溫.zip》資料免費(fèi)下載
    發(fā)表于 12-13 09:23 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>監(jiān)控室溫

    通過Google Assistant控制燈光

    電子發(fā)燒友網(wǎng)站提供《通過Google Assistant控制燈光.zip》資料免費(fèi)下載
    發(fā)表于 12-16 10:14 ?0次下載
    通過<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>控制燈光

    使用Google Assistant的警報系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant的警報系統(tǒng).zip》資料免費(fèi)下載
    發(fā)表于 12-22 16:55 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>的警報系統(tǒng)

    基于Google Assistant的中繼控制

    電子發(fā)燒友網(wǎng)站提供《基于Google Assistant的中繼控制.zip》資料免費(fèi)下載
    發(fā)表于 01-31 14:35 ?0次下載
    基于<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>的中繼控制

    什么是雙工技術(shù)?有哪些雙工方式?

    鴿子從A驛站到B驛站,或者從B驛站到A驛站,這兩個方向的信息在交互協(xié)調(diào)的過程就是雙工技術(shù)。
    發(fā)表于 05-18 14:29 ?6530次閱讀
    什么是<b class='flag-5'>雙工技術(shù)</b>?有哪些<b class='flag-5'>雙工</b>方式?

    Google Assistant控制的Jarvis

    電子發(fā)燒友網(wǎng)站提供《由Google Assistant控制的Jarvis.zip》資料免費(fèi)下載
    發(fā)表于 06-29 14:55 ?0次下載
    由<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>控制的Jarvis

    Google Assistant語音控制開關(guān)

    電子發(fā)燒友網(wǎng)站提供《Google Assistant語音控制開關(guān).zip》資料免費(fèi)下載
    發(fā)表于 06-30 15:11 ?0次下載
    <b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>語音控制開關(guān)

    使用Google Assistant控制蜂鳴器

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant控制蜂鳴器.zip》資料免費(fèi)下載
    發(fā)表于 07-04 11:28 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>控制蜂鳴器

    使用Google Assistant和IFTTT控制蜂鳴器

    電子發(fā)燒友網(wǎng)站提供《使用Google Assistant和IFTTT控制蜂鳴器.zip》資料免費(fèi)下載
    發(fā)表于 07-04 10:06 ?0次下載
    使用<b class='flag-5'>Google</b> <b class='flag-5'>Assistant</b>和IFTTT控制蜂鳴器