微軟運用深度學習技術構建多模態(tài)3D肖像模型，成就逼真虛擬肖像

據(jù)美國商標與專利局近日發(fā)布的信息，微軟已獲新型專利，利用深度學習構建真實感十足的多模態(tài) 3D 面部模擬肖像。

此項專利名為《多模態(tài)三維面部建模及追蹤，制作栩栩如生的虛擬肖像》。其系統(tǒng)包括處理器和存儲器系統(tǒng)，前者負責收集初始數(shù)據(jù)（即面部初始模樣）以及多元數(shù)據(jù)信號（例如用戶聲波等音頻數(shù)據(jù)），再將兩者整合并進行擬合處理。

3D 面部建模與追蹤技術通過捕捉用戶面部特征，建立 3D 頂點，并對中性面部頂點進行變形，以呈現(xiàn)出數(shù)字面部模型的各種表情。

此外，該系統(tǒng)運用深度學習技術設計虛擬肖像，可模擬用戶面部表情，用戶亦可進行微調，使之更具個性。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

微軟

微軟

+關注

關注
4

文章
6567

瀏覽量
103957
存儲器

存儲器

+關注

關注
38

文章
7453

瀏覽量
163608
深度學習

深度學習

+關注

關注
73

文章
5493

瀏覽量
120979

利用OpenVINO部署Qwen2多模態(tài)模型

多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)（如文本、圖像、音頻和視頻等）進行融合，通過學習不同模態(tài)之間的關聯(lián)，實現(xiàn)更加智能化的信息處理。簡單來說

發(fā)表于 10-18 09:39 ?319次閱讀

發(fā)掘3D文件格式的無限潛力：打造沉浸式虛擬世界

在當今數(shù)字化時代，3D技術的應用范圍日益廣泛，涵蓋電影后期制作、產品原型設計、虛擬現(xiàn)實（VR）、增強現(xiàn)實（AR）、游戲等眾多領域。而3D文件格式作為

發(fā)表于 09-26 18:14 ?1456次閱讀

依圖多模態(tài)大模型伙伴CTO精研班圓滿舉辦

大模型在不同行業(yè)領域的應用前景;7月19日， “依圖科技多模態(tài)大模型伙伴CTO精研班”在杭州圓滿舉辦，讓更多的伙伴們深度體驗了依圖

發(fā)表于 07-23 15:16 ?386次閱讀

裸眼3D筆記本電腦——先進的光場裸眼3D技術

隨著科技的不斷進步，裸眼3D技術已經不再是科幻電影中的幻想。如今，英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D

發(fā)表于 07-16 10:04 ?460次閱讀

3D建模的重要內容和應用

3D建模是一種技術，通過計算機軟件創(chuàng)建虛擬三維模型，模擬現(xiàn)實世界中的物體或場景。這項技術廣泛應用于建筑設計、電影制作、游戲開發(fā)、工程仿真等領

發(fā)表于 06-21 14:48 ?567次閱讀

VR虛擬空間中的3D 技術

空間中塑造3D模型索尼在CES 2024上展示了其最新的具有“空間內容創(chuàng)建”功能的MR頭顯，讓用戶在佩戴頭顯的同時也能編輯和塑造3D模型。用戶可以使用左右兩個不同形狀的控制器同時操縱

發(fā)表于 04-29 09:36 ?1504次閱讀

ad19中3d模型不顯示？

封裝庫導入3d模型不顯示，但導入3d模型后的封裝庫生成pcb文件時顯示3d模型，這是什么原因導致

發(fā)表于 04-24 13:41

包含具有多種類型信息的3D模型

、安全和高效的建筑系統(tǒng)，讓居住者能夠擁有可持續(xù)、彈性舒適且符合人體工程學的建筑。建筑信息模型（BIM）是建筑工程師在建筑物和其他結構設計中使用的一種3D建模過程。BIM軟件提供了一個基于模型

發(fā)表于 03-28 17:18

谷歌推出多模態(tài)VLOGGER AI

谷歌最新推出的VLOGGER AI技術引起了廣泛關注，這項創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供一張人物

發(fā)表于 03-22 10:45 ?784次閱讀

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像中生成多

發(fā)表于 03-22 10:30 ?788次閱讀

Adobe Substance 3D整合AI功能：基于文本生成紋理、背景

Substance 3D Stager是以Adobe Dimension為基礎改造而成，使用者可直觀地進行3D場景構建，包括模型、材質和燈光等要素。借助其強大功能，能夠生成極具觀賞性的

發(fā)表于 03-20 10:28 ?669次閱讀

谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內容

具體來說，VLOGGER AI 采用一種適應虛擬肖像的多模態(tài) Diffusion 模型，通過 MENTOR 數(shù)據(jù)庫進行訓練，涵蓋了超80萬個

發(fā)表于 03-19 14:27 ?747次閱讀

CASAIM沙盤模型3D打印的優(yōu)勢和應用

隨著3D打印技術的不斷發(fā)展，沙盤模型3D打印已經成為建筑行業(yè)中的一項創(chuàng)新應用。這種技術能夠將設計師的創(chuàng)意以實體形式呈現(xiàn)，為建筑項目的溝通和展

發(fā)表于 12-19 16:44 ?556次閱讀

大模型+多模態(tài)的3種實現(xiàn)方法

我們知道，預訓練LLM已經取得了諸多驚人的成就，然而其明顯的劣勢是不支持其他模態(tài)（包括圖像、語音、視頻模態(tài)）的輸入和輸出，那么如何在預訓練LLM的基礎上引入跨模態(tài)的信息，讓其變得更強

發(fā)表于 12-13 13:55 ?1627次閱讀

阿迪達斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建逼真的 3D 內容

Covision 的基于 AI 的 3D 技術可幫助企業(yè)掃描數(shù)千種產品，為網站和移動應用創(chuàng)建逼真的 3D 圖像、視頻和 AR 體驗。將實體產品掃描成

發(fā)表于 11-28 18:45 ?628次閱讀

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數(shù)字信號的區(qū)別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業(yè)HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

其利天下技術·FOC控制和方波控制的區(qū)別？分別應用場景是什么？無刷電機驅動方案

其利天下技術
2小時前

147 閱讀

CAN XL物理層探秘（上）：革新要點與顯著優(yōu)勢

虹科技術
3小時前

158 閱讀

功率器件熱設計基礎（六）——瞬態(tài)熱測量

英飛凌工業(yè)半導體
12小時前

174 閱讀

被人忽視的“ILD”指標，竟隱藏著高速設計的核心思維

海馬硬件
21小時前

312 閱讀

湖北移動，以5G-A規(guī)模商用“換”出內需新活力

腦極體
21小時前

437 閱讀

舞臺頻閃燈電路及原理

神之小風
344

10積分

340下載

opa2314 pdf datasheet (RRI/O CMOS運算放大器)

dplion
1322 KB

免費

72下載

許思維老師HarmonyOS IoT硬件開發(fā)案例分享

KK
15.77 MB

免費

39下載

供鴻蒙開發(fā)者使用的計數(shù)動畫文本視圖

姚小熊27
0.08 MB

免費

1下載

基于JY1252A 12V20A雙管正激拓撲開關電源設計指南

DSHY2010
0.82 MB

2積分

28下載

雷龍CS SD NAND：貼片式TF卡體驗與性能測試

aquamanfeng
13小時前

63 閱讀

工業(yè)現(xiàn)場經常用到的 RS485 通信，原來它的收發(fā)機制是這樣的

手托初夢
13小時前

128 閱讀

QCC74xM RISC-V 架構可編程連接模組

ben111
1天前

405 閱讀

開源項目！可以自主演奏音樂的尤克里里機器人！

紅舊衫
1天前

447 閱讀

【開箱評測】米爾電子PG2L100H開發(fā)板深度體驗報告

asdfsdfsd
1天前

430 閱讀

推薦專欄
更多

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

微軟運用深度學習技術構建多模態(tài)3D肖像模型，成就逼真虛擬肖像

評論

利用OpenVINO部署Qwen2多模態(tài)模型

發(fā)掘3D文件格式的無限潛力：打造沉浸式虛擬世界

依圖多模態(tài)大模型伙伴CTO精研班圓滿舉辦

裸眼3D筆記本電腦——先進的光場裸眼3D技術

3D建模的重要內容和應用

VR虛擬空間中的3D 技術

ad19中3d模型不顯示？

包含具有多種類型信息的3D模型

谷歌推出多模態(tài)VLOGGER AI

Stability AI推出全新Stable Video 3D模型

Adobe Substance 3D整合AI功能：基于文本生成紋理、背景

谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內容

CASAIM沙盤模型3D打印的優(yōu)勢和應用

大模型+多模態(tài)的3種實現(xiàn)方法

阿迪達斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建逼真的 3D 內容