精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CityDreamer:一鍵生成無(wú)邊界的3D城市

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來(lái)源:未知 ? 2023-10-15 20:25 ? 次閱讀
近些年,3D 自然場(chǎng)景的生成出現(xiàn)了大量的研究工作,但是 3D 城市生成的研究工作還寥寥無(wú)幾。這主要是因?yàn)?3D 城市生成更難,人類(lèi)對(duì)于其中的結(jié)構(gòu)失真更敏感。近日,來(lái)自南洋理工大學(xué) S-Lab 的研究者提出了一個(gè)新的框架 CityDreamer,專(zhuān)注于生成無(wú)邊界的 3D 城市,讓我們先看一下效果。





看起來(lái)還不錯(cuò)?這都來(lái)自于以下的這篇研究。


  • 論文地址:https://arxiv.org/abs/2009.00610
  • 項(xiàng)目地址:https://haozhexie.com/project/city-dreamer
  • 代碼地址:https://github.com/hzxie/city-dreamer

為滿(mǎn)足元宇宙中對(duì) 3D 創(chuàng)意工具不斷增長(zhǎng)的需求,三維場(chǎng)景生成最近受到了相當(dāng)多的關(guān)注。其中,生成 3D 城市比 3D 自然場(chǎng)景更復(fù)雜。在自然場(chǎng)景中,相同類(lèi)別的物體通常有相似的外觀(guān),例如樹(shù)通常是綠色的。但是在城市中,建筑的外觀(guān)非常多樣,但它們被賦予了相同的類(lèi)別,這將導(dǎo)致建筑外觀(guān)的質(zhì)量下降。

為了解決這個(gè)問(wèn)題,研究人員提出了 CityDreamer 以生成無(wú)邊界的 3D 城市,它將建筑和城市背景(包括道路、綠化、水域)生成分別用 2 個(gè)不同的模塊生成。這兩個(gè)模塊都采用鳥(niǎo)瞰(Bird's Eye View, BEV)作為場(chǎng)景表示,并采用體積渲染器(Volumetric Renderer )通過(guò)對(duì)抗訓(xùn)練生成逼真的圖像。

值得注意的是,場(chǎng)景參數(shù)化的方式經(jīng)過(guò)精心定制,以適應(yīng)背景物體和建筑物的獨(dú)特特征。每個(gè)類(lèi)別中的背景對(duì)象通常具有相似的外觀(guān),同時(shí)呈現(xiàn)出不規(guī)則的紋理。因此,CityDreamer 引入生成哈希網(wǎng)格來(lái)保持自然性,同時(shí)維護(hù) 3D 一致性。相比之下,建筑實(shí)例表現(xiàn)出各種各樣的外觀(guān),但其立面的紋理通常顯示出規(guī)則的周期性圖案。研究人員因此,設(shè)計(jì)了周期性位置編碼,這對(duì)于處理多樣性的建筑立面來(lái)說(shuō)是簡(jiǎn)單而有效的。

為了使生成的城市在布局上和外觀(guān)上都更逼真,研究人員們構(gòu)建了 2 個(gè)數(shù)據(jù)集:OSM 和 GoogleEarth。前者從 OpenStreetMap [1] 提取了超過(guò) 80 個(gè)知名城市、超過(guò) 6000km2 的俯視視角的高度圖和語(yǔ)義分割圖;后者從 Google Earth Studio [2] 上提取了美國(guó)紐約市的 400 環(huán)形軌跡,包含 24,000 張圖像及對(duì)應(yīng)的語(yǔ)義分割和建筑實(shí)例分割標(biāo)注。這些標(biāo)注是通過(guò)將從 OSM 數(shù)據(jù)集生成的 3D 城市布局投影至圖像上生成的。這種方式可以很容易地將標(biāo)注數(shù)據(jù)擴(kuò)展至世界上的其他城市。



方法


CityDreamer 將 3D 城市生成分解為 4 步:無(wú)邊界城市布局生成、城市背景生成、建筑實(shí)例生成和圖像融合。

無(wú)邊界城市布局生成

CityDreamer 將無(wú)限的城市布局生成轉(zhuǎn)化為可擴(kuò)展的語(yǔ)義地圖和高度場(chǎng)的生成問(wèn)題。為此,CityDreamer 采用了基于 MaskGIT [3] 的無(wú)邊界布局生成器(Unbounded Layout Generator, ULG),它天然地支持 inpainting 和 outpainting 功能。具體來(lái)說(shuō),ULG 使用了 VQVAE 來(lái)編碼語(yǔ)義圖和高度場(chǎng)的圖像切片,將它們轉(zhuǎn)換為離散潛在空間并創(chuàng)建 Codeboook。在推理過(guò)程中,ULG 以自回歸的方式生成 Codebook 索引,隨后,ULG 使用 VQVAE 的解碼器生成一對(duì)語(yǔ)義圖和高度場(chǎng)。由于 VQVAE 生成固定大小的語(yǔ)義圖和高度場(chǎng),因此 ULG 使用圖像 outpainting 來(lái)創(chuàng)建任意大小的語(yǔ)義圖和高度場(chǎng)。在此過(guò)程中,ULG 采用滑動(dòng)窗口來(lái)預(yù)測(cè)每一步的局部 Codebook 索引,滑動(dòng)期間有 25% 的重疊。

城市背景生成

City Background Generator (CBG) 主要用于生成城市的背景,具體包括道路、綠化和水域。該模塊使用了鳥(niǎo)瞰視圖(BEV)作為場(chǎng)景的表示。具體而言,該表示使用由語(yǔ)義圖和高度圖組成的 BEV 表征來(lái)表達(dá)一個(gè)大尺度三維場(chǎng)景。

針對(duì)城市背景相同類(lèi)別通常具有相似外觀(guān)的特性,CBG 引入生成哈希網(wǎng)格(Generative Hash Grid)作為場(chǎng)景的參數(shù)化:保持自然性,同時(shí)維護(hù) 3D 一致性。具體而言,CBG 使用哈希函數(shù)來(lái)將場(chǎng)景特征 和空間點(diǎn)坐標(biāo)映射到多尺度混合的可學(xué)習(xí)參數(shù)上:


為了保證渲染的三維一致性,我們使用基于體積渲染的渲染網(wǎng)絡(luò)來(lái)完成三維空間特征到二維圖像的映射。對(duì)于相機(jī)光線(xiàn)上的一點(diǎn),我們經(jīng)過(guò)查詢(xún)生成式哈希網(wǎng)格得到其對(duì)應(yīng)的特征,使用經(jīng)風(fēng)格噪聲調(diào)制的多層 MLP 來(lái)得到其對(duì)應(yīng)點(diǎn)的顏色和體密度,最終通過(guò)體渲染來(lái)將一條相機(jī)光線(xiàn)上的所有點(diǎn)積分為對(duì)應(yīng)像素的顏色。

建筑實(shí)例生成

Building Instance Generator (BIG) 用于生成城市的建筑。和城市背景生成一樣,我們使用了鳥(niǎo)瞰視圖作為場(chǎng)景的表示,使用基于體積渲染的渲染網(wǎng)絡(luò)來(lái)完成三維空間特征到二維圖像的映射。觀(guān)察到建筑立面和屋頂分布的顯著差異,建筑立面和屋頂在 BIG 中被分配了 2 個(gè)不同的類(lèi)別標(biāo)簽

針對(duì)建筑立面所呈現(xiàn)出的周期性規(guī)律,我們?cè)O(shè)計(jì)了更輕量化的場(chǎng)景參數(shù)化方式:基于周期性函數(shù)的場(chǎng)景參數(shù)化。具體而言,BIG 將建筑特征和空間坐標(biāo)通過(guò)周期性函數(shù)映射到一個(gè)高維空間中:


其中,$ m Concat$ 表示連接(Concatenation)操作,?被定義為


圖像融合

給定城市背景的圖像和掩膜(分別用表示) 以及 建筑實(shí)例的圖像和掩膜的集合( 分別用表示),CityDreamer 使用如下方式得到融合后的圖像


其中 n 表示建筑實(shí)例的數(shù)量。

實(shí)驗(yàn)

下圖展示了 CityDreamer 和其他 SOTA 方法的對(duì)比,這些方法包括 PersistentNature [4]、SceneDreamer [5] 和 InfiniCity [6]。實(shí)驗(yàn)結(jié)果表明,CityDreamer 的效果明顯優(yōu)于其他方法。



下圖展示了更多視角的生成結(jié)果,該結(jié)果證明了 CityDreamer 的魯棒性。



參考文獻(xiàn):
[1] https://openstreetmap.org
[2] https://earth.google.com/studio
[3] Chang et al. MaskGIT: Masked Generative Image Transformer. CVPR 2022.
[4] Lin et al. InfiniCity: Infinite-Scale City Synthesis. ICCV 2023.
[5] Chai et al. Persistent Nature: A Generative Model of Unbounded 3D Worlds. CVPR 2023.
[6] Chen et al. SceneDreamer: Unbounded 3D Scene Generation from 2D Image Collections. arXiv 2023.



原文標(biāo)題:CityDreamer:一鍵生成無(wú)邊界的3D城市

文章出處:【微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:CityDreamer:一鍵生成無(wú)邊界的3D城市

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    一鍵斷電開(kāi)關(guān)的種類(lèi)有哪些

    一鍵斷電開(kāi)關(guān)的種類(lèi)主要可以從其功能和實(shí)現(xiàn)方式上進(jìn)行分類(lèi)。以下是些常見(jiàn)的一鍵斷電開(kāi)關(guān)種類(lèi): 1. 繼電器式一鍵斷電開(kāi)關(guān) 定義 :這種開(kāi)關(guān)通過(guò)繼電器或接觸器控制電路的通斷,實(shí)現(xiàn)
    的頭像 發(fā)表于 09-13 16:45 ?180次閱讀

    變電站一鍵順控系統(tǒng)和開(kāi)關(guān)柜一鍵順控有區(qū)別嗎?

    變電站一鍵順控系統(tǒng)和開(kāi)關(guān)柜一鍵順控技術(shù)雖然都涉及到“一鍵順控”的概念,但它們?cè)趹?yīng)用范圍和具體實(shí)現(xiàn)上有所不同,因此變電站一鍵順控系統(tǒng)和開(kāi)關(guān)柜一鍵
    的頭像 發(fā)表于 07-31 13:34 ?218次閱讀
    變電站<b class='flag-5'>一鍵</b>順控系統(tǒng)和開(kāi)關(guān)柜<b class='flag-5'>一鍵</b>順控有區(qū)別嗎?

    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

    1 騰訊元寶首發(fā)3D生成應(yīng)用 只需張照片,便能迅速打造獨(dú)無(wú)二的3D角色。7月16日,騰訊旗下大模型應(yīng)用“騰訊元寶”上線(xiàn)了“
    的頭像 發(fā)表于 07-18 11:39 ?617次閱讀
    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應(yīng)用

    Meta推出革命性3D Gen AI模型:1分鐘內(nèi)生成高質(zhì)量3D內(nèi)容

    在科技日新月異的今天,Meta再次引領(lǐng)創(chuàng)新潮流,宣布了項(xiàng)令人矚目的技術(shù)突破——3D Gen AI模型的誕生。這款先進(jìn)的模型以其前所未有的高效性與卓越品質(zhì),重新定義了3D內(nèi)容創(chuàng)作的邊界
    的頭像 發(fā)表于 07-04 18:12 ?871次閱讀

    奧比中光3D相機(jī)打造高質(zhì)量、低成本的3D動(dòng)作捕捉與3D動(dòng)畫(huà)內(nèi)容生成方案

    高質(zhì)量、低成本的3D動(dòng)作捕捉與3D動(dòng)畫(huà)內(nèi)容生成方案。 Moverse公司總部位于希臘塞薩洛尼基,是三維動(dòng)畫(huà)相關(guān)媒體和娛樂(lè)行業(yè)的家科技創(chuàng)業(yè)公司。基于奧比中光
    的頭像 發(fā)表于 06-25 16:37 ?827次閱讀

    GIS智慧城市 3D 可視化,應(yīng)急管控屏解決 #三維可視化 #智慧城市 #GIS

    3D智慧城市
    阿梨是蘋(píng)果
    發(fā)布于 :2024年05月23日 11:23:26

    簡(jiǎn)析智慧燈桿一鍵告警功能的實(shí)用場(chǎng)景

    智慧路燈桿是種兼具智能化和多功能的新型物聯(lián)網(wǎng)基礎(chǔ)設(shè)施,通過(guò)搭載一鍵告警對(duì)講盒,能夠大大豐富安防及報(bào)警求助資源,對(duì)提升城市的安全性和管理效能具有重要的作用。本篇就結(jié)合城市中的不同場(chǎng)景,
    的頭像 發(fā)表于 04-28 16:42 ?241次閱讀
    簡(jiǎn)析智慧燈桿<b class='flag-5'>一鍵</b>告警功能的實(shí)用場(chǎng)景

    NVIDIA生成式AI研究實(shí)現(xiàn)在1秒內(nèi)生成3D形狀

    NVIDIA 研究人員使 LATTE3D款最新文本轉(zhuǎn) 3D 生成式 AI 模型)實(shí)現(xiàn)雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?366次閱讀
    NVIDIA<b class='flag-5'>生成</b>式AI研究實(shí)現(xiàn)在1秒內(nèi)<b class='flag-5'>生成</b><b class='flag-5'>3D</b>形狀

    Adobe Substance 3D整合AI功能:基于文本生成紋理、背景

    Substance 3D Stager是以Adobe Dimension為基礎(chǔ)改造而成,使用者可直觀(guān)地進(jìn)行3D場(chǎng)景構(gòu)建,包括模型、材質(zhì)和燈光等要素。借助其強(qiáng)大功能,能夠生成極具觀(guān)賞性的虛擬照片。
    的頭像 發(fā)表于 03-20 10:28 ?525次閱讀

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動(dòng)起來(lái)的新方法!

    因此,本文研究者的目標(biāo)是實(shí)現(xiàn)快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D種全新的單階段的全類(lèi)別擴(kuò)散模型,能
    的頭像 發(fā)表于 01-30 16:20 ?672次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b><b class='flag-5'>生成</b>只需30秒!讓文本、圖像都動(dòng)起來(lái)的新方法!

    4DGen:基于動(dòng)態(tài)3D高斯的可控4D生成新工作

    盡管3D和視頻生成取得了飛速的發(fā)展,由于缺少高質(zhì)量的4D數(shù)據(jù)集,4D生成始終面臨著巨大的挑戰(zhàn)。
    的頭像 發(fā)表于 01-04 15:57 ?694次閱讀
    4DGen:基于動(dòng)態(tài)<b class='flag-5'>3D</b>高斯的可控4<b class='flag-5'>D</b><b class='flag-5'>生成</b>新工作

    3D人體生成模型HumanGaussian實(shí)現(xiàn)原理

    3D 生成領(lǐng)域,根據(jù)文本提示創(chuàng)建高質(zhì)量的 3D 人體外觀(guān)和幾何形狀對(duì)虛擬試穿、沉浸式遠(yuǎn)程呈現(xiàn)等應(yīng)用有深遠(yuǎn)的意義。傳統(tǒng)方法需要經(jīng)歷系列人工制作的過(guò)程,如
    的頭像 發(fā)表于 12-20 16:37 ?1294次閱讀
    <b class='flag-5'>3D</b>人體<b class='flag-5'>生成</b>模型HumanGaussian實(shí)現(xiàn)原理

    一鍵開(kāi)關(guān)電路的好處?生活中的一鍵開(kāi)關(guān)電路有哪些?

    一鍵開(kāi)關(guān)電路的好處?生活中的一鍵開(kāi)關(guān)電路有哪些? 一鍵開(kāi)關(guān)電路是指個(gè)電路設(shè)計(jì),可以用個(gè)按鈕或開(kāi)關(guān)來(lái)控制多個(gè)電器或燈具的開(kāi)關(guān)。
    的頭像 發(fā)表于 10-22 15:18 ?1762次閱讀

    通過(guò)“3D城市模型”加速發(fā)展的智能城市、數(shù)字孿生的構(gòu)建、電子領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)

    通過(guò)“3D城市模型”加速發(fā)展的智能城市、數(shù)字孿生的構(gòu)建、電子領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)
    的頭像 發(fā)表于 10-16 17:36 ?511次閱讀
    通過(guò)“<b class='flag-5'>3D</b><b class='flag-5'>城市</b>模型”加速發(fā)展的智能<b class='flag-5'>城市</b>、數(shù)字孿生的構(gòu)建、電子領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)

    如何一鍵生成mybatisplus

    Mybatis代碼生成器相信大家用過(guò),本篇博客我們來(lái)介紹如何一鍵生成mybatisplus 的相關(guān)Entity、Mapper、Mapper XML、Service、Controller 等各個(gè)模塊
    的頭像 發(fā)表于 09-25 14:23 ?643次閱讀
    如何<b class='flag-5'>一鍵</b><b class='flag-5'>生成</b>mybatisplus