免费xxxx大片国产片_精品在线一区_亚洲午夜福利av_亚洲色大成人一区二区_无码熟妇人妻AV在线影片免费

您的位置:首頁(yè) >城市 >

快消息!數(shù)字文藝復(fù)興來(lái)了:英偉達(dá)造出「AI版」米開(kāi)朗基羅,實(shí)現(xiàn)高保真3D重建

2023-06-23 09:45:41 來(lái)源:機(jī)器之心
機(jī)器之心報(bào)道

編輯:Panda W

正如米開(kāi)朗基羅能用大理石雕刻出令人驚嘆、栩栩如生的作品,英偉達(dá)宣稱 Neuralangelo 生成的 3D 結(jié)構(gòu)也帶有精細(xì)的細(xì)節(jié)和紋理。

對(duì)通過(guò)基于圖像的神經(jīng)渲染來(lái)恢復(fù)密集的 3D 表面,神經(jīng)表面重建已被證明是可行的。然而,目前的方法很難恢復(fù)真實(shí)世界場(chǎng)景的詳細(xì)結(jié)構(gòu)。

為了解決這個(gè)問(wèn)題,英偉達(dá)和約翰霍普金斯大學(xué)發(fā)布了一項(xiàng)研究,開(kāi)發(fā)了一種命名為 Neuralangelo(即神經(jīng)朗基羅)的模型,其可以將 2D 視頻片段重建成細(xì)節(jié)豐富的 3D 結(jié)構(gòu),比如生成建筑、雕塑和其它現(xiàn)實(shí)物體的逼真虛擬復(fù)制品。


(資料圖片僅供參考)

項(xiàng)目網(wǎng)站:/labs/dir/neuralangelo/

論文地址:/labs/dir/neuralangelo/

附加材料:/labs/dir/neuralangelo/

這項(xiàng)研究已入選 CVPR 2023。英偉達(dá)在其官方博客上使用了「數(shù)字文藝復(fù)興」來(lái)形容這項(xiàng)研究,足見(jiàn)其潛在的重要價(jià)值。

正如米開(kāi)朗基羅能用大理石雕刻出令人驚嘆、栩栩如生的作品,英偉達(dá)宣稱 Neuralangelo 生成的 3D 結(jié)構(gòu)也帶有精細(xì)的細(xì)節(jié)和紋理。創(chuàng)意專業(yè)人士可以將這些 3D 對(duì)象導(dǎo)入到設(shè)計(jì)應(yīng)用中,進(jìn)一步編輯它們來(lái)創(chuàng)造藝術(shù)作品、開(kāi)發(fā)視頻游戲、創(chuàng)造機(jī)器人和產(chǎn)業(yè)數(shù)字人應(yīng)用。

Neuralangelo 能將復(fù)雜的材料紋理(比如屋頂瓦、玻璃板和光滑大理石)從 2D 視頻轉(zhuǎn)譯到成 3D 結(jié)構(gòu),其能力已經(jīng)顯著超越之前的方法。其具有非常高的保真度,讓開(kāi)發(fā)者和創(chuàng)意專業(yè)人士能更輕松地快速創(chuàng)建可用的虛擬對(duì)象,而所需的材料不過(guò)是用手機(jī)拍攝的一段視頻。

該研究的作者之一同時(shí)也是一位高級(jí)研究主管的 Ming-Yu Liu 表示:「Neuralangelo 具備的 3D 重建能力將能極大地造福創(chuàng)作者,幫助他們?cè)跀?shù)字世界中創(chuàng)建出現(xiàn)實(shí)世界。這一工具最終能讓開(kāi)發(fā)者將細(xì)節(jié)豐富的對(duì)象 —— 不管是小型雕像還是大型建筑 —— 導(dǎo)入到虛擬環(huán)境中,進(jìn)而用于視頻游戲或產(chǎn)業(yè)數(shù)字孿生人?!?/p>

英偉達(dá)給出了一段演示視頻,可以看到該模型既能重建出米開(kāi)朗基羅那著名的大衛(wèi)雕像,也能重建出日??梢?jiàn)的平板卡車。Neuralangelo 還能重建出建筑的內(nèi)部和外部 —— 視頻中給出了英偉達(dá)的灣區(qū)公園的詳細(xì) 3D 模型。

下面我們來(lái)看看 Neuralangelo 的具體方法和論文中的一些實(shí)驗(yàn)結(jié)果。

方法

Neuralangelo 采用了實(shí)時(shí) NGP 作為底層 3D 場(chǎng)景的一種神經(jīng) SDF 表征,并通過(guò)神經(jīng)表面渲染根據(jù)多視角圖像觀察進(jìn)行優(yōu)化;其中 NGP 是指 Neural Graphics Primitives(神經(jīng)圖形基元);SDF 是指 signed distance function(有符號(hào)的距離函數(shù))。為了充分釋放多分辨率哈希編碼的潛力,英偉達(dá)研究者提出了兩大發(fā)現(xiàn)。一,使用數(shù)值梯度來(lái)計(jì)算高階導(dǎo)數(shù)對(duì)實(shí)現(xiàn)優(yōu)化穩(wěn)定來(lái)說(shuō)至關(guān)重要,比如用于程函正則化(eikonal regularization)的表面法線。二,為了重建出不同細(xì)節(jié)程度的結(jié)構(gòu),需要一種漸進(jìn)式的優(yōu)化方案。研究者將這兩種思路組合到了 Neuralangelo 中,實(shí)驗(yàn)也證明了這樣做確實(shí)可行,能極大提升神經(jīng)表面重建的重建準(zhǔn)確度和視圖合成質(zhì)量。

Neuralangelo 重建場(chǎng)景的密集結(jié)構(gòu)使用的是多視角圖像。它會(huì)跟隨相機(jī)視角方向采樣 3D 位置,并使用一種多分辨率哈希編碼來(lái)對(duì)這些位置進(jìn)行編碼。編碼后的特征會(huì)被輸入一個(gè) SDF MLP 和一個(gè)顏色 MLP,以使用基于 SDF 的體積渲染來(lái)合成圖像。

數(shù)值梯度計(jì)算

研究者表示,有關(guān)哈希編碼位置的解析梯度會(huì)受到局部性的影響。因此,優(yōu)化更新只會(huì)傳遞給局部哈希網(wǎng)格,缺乏非局部的平滑性。針對(duì)這種局部性問(wèn)題,英偉達(dá)提出了一種簡(jiǎn)單的補(bǔ)救方案:使用數(shù)值梯度。圖 2 給出了該方法的概況。

圖 2:為高階導(dǎo)數(shù)使用數(shù)值梯度可將反向傳播更新散播到局部哈希網(wǎng)格單元之外,由此變成解析梯度的一種平滑化版本。

SDF 有一種特殊性質(zhì):其在單位范數(shù)的梯度方面是可微的。SDF 的梯度幾乎在所有地方都滿足程函方程(eikonal equation)。為了迫使經(jīng)過(guò)優(yōu)化的神經(jīng)表征成為可行的 SDF,通過(guò)會(huì)在 SDF 預(yù)測(cè)結(jié)果上施加一個(gè)程函損失。

為了實(shí)現(xiàn)端到端優(yōu)化,需要在 SDF 預(yù)測(cè)結(jié)果上使用一種雙重反向操作。

在計(jì)算 SDF 的表面法線時(shí),人們事實(shí)上采用的方法就是使用解析梯度。但是,在三線性插值(trilinear interpolation)下,與位置相關(guān)的哈希編碼的解析梯度在空間上不是連續(xù)的。為了找到體素網(wǎng)格中的采樣位置,需要首先根據(jù)網(wǎng)格分辨率對(duì)每個(gè) 3D 點(diǎn)進(jìn)行縮放。

哈希編碼的導(dǎo)數(shù)是局部的,即當(dāng) 3D 點(diǎn)越過(guò)網(wǎng)格單元邊界時(shí),對(duì)應(yīng)的哈希項(xiàng)將會(huì)不同。因此,前述的程函損失就只會(huì)反向傳播到本地采樣的哈希項(xiàng)。當(dāng)連續(xù)表面(比如平墻)橫跨多個(gè)網(wǎng)格單元時(shí),這些網(wǎng)格單元應(yīng)當(dāng)產(chǎn)生連貫一致的表面法線,而不該有突然的過(guò)渡。為了確保表面表征中的一致性,需要對(duì)這些網(wǎng)格單元進(jìn)行聯(lián)合優(yōu)化。但是,解析梯度卻受限于局部網(wǎng)格單元,除非對(duì)應(yīng)的網(wǎng)格單元碰巧能被同時(shí)采樣和優(yōu)化。但我們很難保證總是能夠這樣采樣。

為了克服哈希編碼的解析梯度的局部性問(wèn)題,英偉達(dá)提出的方案是使用數(shù)值梯度來(lái)計(jì)算表面法線。如果數(shù)值梯度的步長(zhǎng)小于哈希編碼的網(wǎng)格大小,則數(shù)值梯度就等于解析梯度;否則,多個(gè)網(wǎng)格單元的哈希項(xiàng)就會(huì)參與到表面法線計(jì)算中。

這樣一來(lái),通過(guò)表面法線的反向傳播就能讓多個(gè)網(wǎng)格單元的哈希項(xiàng)同時(shí)收到優(yōu)化更新。直觀來(lái)說(shuō),使用精心選擇的步長(zhǎng)的數(shù)值梯度可被解讀成在解析梯度表達(dá)式上的平滑化操作。還有另一種方法可以替代法線監(jiān)督,即 teacher-student curriculum,其中要使用預(yù)測(cè)的有噪聲法線來(lái)幫助 MLP 輸出,這樣就能利用到 MLP 的平滑性。但是,這樣的教師 - 學(xué)生損失的解析梯度仍然只會(huì)反向傳播給局部網(wǎng)格單元。相較而言,數(shù)值梯度無(wú)需添加網(wǎng)絡(luò)便能夠解決局部性問(wèn)題。

要使用數(shù)值梯度計(jì)算表面法線,還需要額外的 SDF 樣本。給定一個(gè)采樣過(guò)的點(diǎn),還需要在該點(diǎn)周圍一定步長(zhǎng)內(nèi)沿正則坐標(biāo)的每個(gè)軸額外采樣兩個(gè)點(diǎn)。

漸進(jìn)式的細(xì)節(jié)水平

為了避免陷入錯(cuò)誤的局部最小值,從粗到細(xì)的優(yōu)化可以更好地塑造損失圖景。這樣的策略已被用于許多計(jì)算機(jī)視覺(jué)應(yīng)用。Neuralangelo 也采用了一種從粗到細(xì)的優(yōu)化方案來(lái)在細(xì)節(jié)上漸進(jìn)式地重建表面。使用高階導(dǎo)數(shù)的數(shù)值梯度能自然地讓 Neuralangelo 執(zhí)行從粗到細(xì)的優(yōu)化,這需要考慮兩個(gè)方面。

步長(zhǎng):前面已經(jīng)提到,數(shù)值梯度可被解釋成一種平滑化操作,其中步長(zhǎng)控制著分辨率及重建的細(xì)節(jié)量。如果讓程函損失用更大的步長(zhǎng)來(lái)計(jì)算數(shù)值表面法線,能在更大規(guī)模上確保表面法線的一致性,由此能得到一致和連續(xù)的表面。反過(guò)來(lái),如果程函損失的步長(zhǎng)更小,就只能影響更小的區(qū)域,就能避免細(xì)節(jié)平滑。在實(shí)踐中,英偉達(dá)的做法是先將步長(zhǎng)初始化為最粗的哈希網(wǎng)格大小,然后在整個(gè)優(yōu)化過(guò)程中指數(shù)級(jí)地降低步長(zhǎng)以匹配不同的哈希網(wǎng)格大小。

哈希網(wǎng)格分辨率:如果從優(yōu)化一開(kāi)始,所有哈希網(wǎng)格都被激活,為了捕獲幾何細(xì)節(jié),細(xì)粒度哈希網(wǎng)格就必須首先「忘記」粗粒度優(yōu)化(更大步長(zhǎng))所學(xué)到的東西,并用更小的步長(zhǎng)「重新學(xué)習(xí)」。如果優(yōu)化收斂而導(dǎo)致這個(gè)過(guò)程失敗,那么就會(huì)丟失幾何細(xì)節(jié)。因此,一開(kāi)始只會(huì)激活一組初始的粗粒度哈希網(wǎng)格,當(dāng)步長(zhǎng)縮小至其空間大小時(shí),會(huì)在優(yōu)化過(guò)程中漸進(jìn)式地激活更細(xì)的哈希網(wǎng)格。這樣一來(lái),就能避免「重新學(xué)習(xí)」過(guò)程,從而更好地捕獲細(xì)節(jié)。在實(shí)踐中,英偉達(dá)研究者的做法是在所有參數(shù)上應(yīng)用權(quán)重衰減,以避免最終結(jié)果被單一分辨率特征主導(dǎo)。

優(yōu)化

為了進(jìn)一步促進(jìn)重建表面的平滑性,他們還提出添加一個(gè)先驗(yàn),具體做法是正則化 SDF 的平均曲率。平均曲率是通過(guò)離散拉普拉斯算子計(jì)算的,類似于表面法線計(jì)算,否則當(dāng)使用三線性插值時(shí),哈希編碼的二階解析梯度在任意位置都為零。

Neuralangelo 的整體損失定義為所有損失(RGB 合成損失、程函損失、曲率損失)的加權(quán)和,如下所示:

包括 MLP 和哈希編碼在內(nèi)的所有網(wǎng)絡(luò)參數(shù)都是以端到端方式聯(lián)合訓(xùn)練的。

實(shí)驗(yàn)

圖 3:在 DTU 基準(zhǔn)上的定性比較

可以看到,Neuralangelo 得到的表面更加準(zhǔn)確,保真度也更高。

圖 4:定性比較不同的從粗到細(xì)優(yōu)化方案

當(dāng)使用解析梯度時(shí)(AG 和 AG+P),粗粒度的表面通常帶有偽影。當(dāng)使用數(shù)值梯度時(shí)(NG),可以得到更好的粗粒度形狀,細(xì)節(jié)也更為平滑。英偉達(dá)的新方法(NG+P)得到的表面既平滑又有精細(xì)細(xì)節(jié)。

表 1:在 DTU 數(shù)據(jù)集上的定量實(shí)驗(yàn)結(jié)果

可以看到,Neuralangelo 的重建準(zhǔn)確度最高,圖像合成質(zhì)量也最好。

圖 5:在 Tanks 和 Temples 數(shù)據(jù)集上的定性比較

相比于其它對(duì)比方法會(huì)丟失表面細(xì)節(jié)或有較多噪聲,Neuralangelo 能更好地捕獲場(chǎng)景細(xì)節(jié)。

?THE END

轉(zhuǎn)載請(qǐng)聯(lián)系本公眾號(hào)獲得授權(quán)

投稿或?qū)で髨?bào)道:content@

關(guān)鍵詞: