(資料圖片僅供參考)
Stability AI 近日發(fā)布了 Stable Diffusion XL 0.9,這是 Stable Diffusion 文本-圖像模型套件中最先進(jìn)的開發(fā)成果。繼 4 月發(fā)布 Stable Diffusion XL Beta 之后,Stable Diffusion XL 0.9 在圖像和構(gòu)圖細(xì)節(jié)方面比前者有了巨大的改進(jìn)。
示例
在 SDXL Beta 版(左)和 0.9 版上測試的一些 prompt 例子顯示了這個(gè)模型在短短兩個(gè)月內(nèi)取得了多大進(jìn)展。
變化
SDXL 系列還提供了一系列超越基本文本提示的功能。這些功能包括輸入一個(gè)圖像以獲得該圖像的變化、重建圖像的缺失部分和構(gòu)建一個(gè)現(xiàn)有圖像的無縫擴(kuò)展。
SDXL 0.9 在構(gòu)圖上的這一進(jìn)步的關(guān)鍵驅(qū)動(dòng)力是它的參數(shù)數(shù)(模型所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)中所有權(quán)重和偏差的總和)比測試版大幅增加。
SDXL 0.9 是所有開源圖像模型中參數(shù)數(shù)量最多的一個(gè),它擁有一個(gè) 35 億的參數(shù)基礎(chǔ)模型和一個(gè) 66 億的參數(shù)模型集合管道(最終輸出是通過在兩個(gè)模型上運(yùn)行并匯總結(jié)果而產(chǎn)生的)。管道的第二階段模型被用來為第一階段生成的輸出添加更精細(xì)的細(xì)節(jié)。
作為對(duì)比,兩個(gè)月前發(fā)布的測試版只在 31 億參數(shù)的單個(gè)模型上運(yùn)行。
系統(tǒng)要求
盡管 SDXL 0.9 具有強(qiáng)大的輸出和先進(jìn)的模型架構(gòu),但它能夠在現(xiàn)代消費(fèi)級(jí) GPU 上運(yùn)行,其所需的系統(tǒng)配置為 Windows 10/11 或 Linux 操作系統(tǒng)、配備 16GB 內(nèi)存、至少 8GB 的 VRAM 的 Nvidia GeForce RTX 20 顯卡(同等或更高標(biāo)準(zhǔn)),Linux 用戶也能夠使用 16GB VRAM 的兼容 AMD 顯卡。
統(tǒng)計(jì)數(shù)據(jù)
自從 SDXL 的測試版于 4 月推出以來,Discord 社區(qū)的用戶數(shù)量達(dá)到了近 7000 人,反應(yīng)非常好。這些用戶已經(jīng)生成了 70 多萬張圖片,平均每天超過 2 萬張。
規(guī)劃
SDXL 0.9 之后,將于 7 月中旬全面公開發(fā)布 SDXL 1.0
更多詳情可查看:https://stability.ai/blog/sdxl-09-stable-diffusion