據(jù)美國商標與專利局近日發(fā)布的信息,微軟已獲新型專利,利用深度學習構建真實感十足的多模態(tài) 3D 面部模擬肖像。
此項專利名為《多模態(tài)三維面部建模及追蹤,制作栩栩如生的虛擬肖像》。其系統(tǒng)包括處理器和存儲器系統(tǒng),前者負責收集初始數(shù)據(jù)(即面部初始模樣)以及多元數(shù)據(jù)信號(例如用戶聲波等音頻數(shù)據(jù)),再將兩者整合并進行擬合處理。
3D 面部建模與追蹤技術通過捕捉用戶面部特征,建立 3D 頂點,并對中性面部頂點進行變形,以呈現(xiàn)出數(shù)字面部模型的各種表情。
此外,該系統(tǒng)運用深度學習技術設計虛擬肖像,可模擬用戶面部表情,用戶亦可進行微調,使之更具個性。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6567瀏覽量
103957 -
存儲器
+關注
關注
38文章
7453瀏覽量
163608 -
深度學習
+關注
關注
73文章
5493瀏覽量
120979
發(fā)布評論請先 登錄
相關推薦
利用OpenVINO部署Qwen2多模態(tài)模型
多模態(tài)大模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態(tài)之間的關聯(lián),實現(xiàn)更加智能化的信息處理。簡單來說
發(fā)掘3D文件格式的無限潛力:打造沉浸式虛擬世界
在當今數(shù)字化時代,3D技術的應用范圍日益廣泛,涵蓋電影后期制作、產品原型設計、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、游戲等眾多領域。而3D文件格式作為
依圖多模態(tài)大模型伙伴CTO精研班圓滿舉辦
大模型在不同行業(yè)領域的應用前景;7月19日, “依圖科技多模態(tài)大模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗了依圖
裸眼3D筆記本電腦——先進的光場裸眼3D技術
隨著科技的不斷進步,裸眼3D技術已經不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D
3D建模的重要內容和應用
3D建模是一種技術,通過計算機軟件創(chuàng)建虛擬三維模型,模擬現(xiàn)實世界中的物體或場景。這項技術廣泛應用于建筑設計、電影制作、游戲開發(fā)、工程仿真等領
VR虛擬空間中的3D 技術
空間中塑造3D模型 索尼在CES 2024上展示了其最新的具有“空間內容創(chuàng)建”功能的MR頭顯,讓用戶在佩戴頭顯的同時也能編輯和塑造3D模型。用戶可以使用左右兩個不同形狀的控制器同時操縱
包含具有多種類型信息的3D模型
、安全和高效的建筑系統(tǒng),讓居住者能夠擁有可持續(xù)、彈性舒適且符合人體工程學的建筑。建筑信息模型
(BIM) 是建筑工程師在建筑物和其他結構設計中使用的一種3D建模過程。BIM軟件提供了一個基于模型
發(fā)表于 03-28 17:18
谷歌推出多模態(tài)VLOGGER AI
谷歌最新推出的VLOGGER AI技術引起了廣泛關注,這項創(chuàng)新的多模態(tài)模型能夠讓靜態(tài)肖像圖“活”起來并“說話”。用戶只需提供一張人物
Stability AI推出全新Stable Video 3D模型
近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此模型具備從單張圖像中生成多
Adobe Substance 3D整合AI功能:基于文本生成紋理、背景
Substance 3D Stager是以Adobe Dimension為基礎改造而成,使用者可直觀地進行3D場景構建,包括模型、材質和燈光等要素。借助其強大功能,能夠生成極具觀賞性的
谷歌發(fā)布VLOGGER AI模型,實現(xiàn)肖像朗讀音頻內容
具體來說,VLOGGER AI 采用一種適應虛擬肖像的多模態(tài) Diffusion 模型,通過 MENTOR 數(shù)據(jù)庫進行訓練,涵蓋了超80萬個
CASAIM沙盤模型3D打印的優(yōu)勢和應用
隨著3D打印技術的不斷發(fā)展,沙盤模型3D打印已經成為建筑行業(yè)中的一項創(chuàng)新應用。這種技術能夠將設計師的創(chuàng)意以實體形式呈現(xiàn),為建筑項目的溝通和展
大模型+多模態(tài)的3種實現(xiàn)方法
我們知道,預訓練LLM已經取得了諸多驚人的成就, 然而其明顯的劣勢是不支持其他模態(tài)(包括圖像、語音、視頻模態(tài))的輸入和輸出,那么如何在預訓練LLM的基礎上引入跨模態(tài)的信息,讓其變得更強
阿迪達斯與 Covision Media 使用 AI 和 NVIDIA RTX 創(chuàng)建逼真的 3D 內容
Covision 的基于 AI 的 3D 技術可幫助企業(yè)掃描數(shù)千種產品,為網站和移動應用創(chuàng)建逼真的 3D 圖像、視頻和 AR 體驗。 將實體產品掃描成
評論