發(fā)布時(shí)間:2024-08-14 18:40:37 瀏覽量:204次
機(jī)器之心報(bào)道
編輯:張倩、陳萍
生成式模型進(jìn)入「實(shí)時(shí)」時(shí)代?
文生圖、圖生圖已經(jīng)不再是新鮮事。但使用這類(lèi)工具時(shí),我們往往要忍受等待才能看到生成結(jié)果。
最近,一種名為「LCM」的模型改變了這一現(xiàn)狀,實(shí)現(xiàn)了實(shí)時(shí)的連續(xù)圖像生成。
圖源:https://twitter.com/javilopen/status/1724398666889224590
LCM全稱為L(zhǎng)atent Consistency Models(潛在一致性模型),由清華大學(xué)交叉信息研究院的研究者們構(gòu)建。LCM能將主流文生圖模型的效率提高5-10倍,實(shí)現(xiàn)了實(shí)時(shí)圖像生成。
該文章發(fā)布一個(gè)月內(nèi)瀏覽量超百萬(wàn),作者也被邀請(qǐng)?jiān)贖ugging Face、Replicate、浦源等多個(gè)平臺(tái)展示新研發(fā)的LCM模型和demo。
LCM-LoRA技術(shù)進(jìn)一步改進(jìn)了LCM的快速采樣能力,為多模型提供了有效的解決方案,實(shí)現(xiàn)了實(shí)時(shí)圖像生成效果。
技術(shù)報(bào)告鏈接:https://arxiv.org/pdf/2311.05556.pdf
潛在一致性模型的快速生成能力開(kāi)啟了圖像生成技術(shù)新局面。用戶可以根據(jù)輸入的文本處理和渲染實(shí)時(shí)捕捉到的畫(huà)面,實(shí)現(xiàn)高速圖像生成,實(shí)現(xiàn)自定義展示場(chǎng)景或視覺(jué)效果。
X平臺(tái)上研究者展示了利用該模型實(shí)現(xiàn)的圖像生成效果,包括圖生圖、視頻生成等應(yīng)用。
圖源:https://twitter.com/javilopen/status/1724398666889224590
圖源:https://twitter.com/javilopen/status/1724398708052414748
LCM的代碼已開(kāi)源,在Hugging Face官方倉(cāng)庫(kù)中也有相關(guān)支持。LCM模型在文生圖模型熱度中名列前茅。
接下來(lái),我們將介紹LCM和LCM-LoRA這兩項(xiàng)研究成果。
LCM:只用幾步推理就能生成高分辨率圖像
在AIGC時(shí)代,擴(kuò)散模型如Stable Diffusion和DALL-E 3備受關(guān)注。然而,擴(kuò)散模型生成圖片通常需要多步采樣,過(guò)程較慢,推理成本高。
一致性模型為解決該問(wèn)題提供了思路,但局限于無(wú)條件圖片生成。LCM的出現(xiàn)彌補(bǔ)了這一不足,支持給定條件的圖像生成任務(wù)。
LCM要求對(duì)常微分方程進(jìn)行直接單步求解,理論上可在單步內(nèi)生成圖像。
LCM的訓(xùn)練通過(guò)微調(diào)預(yù)訓(xùn)練的擴(kuò)散模型,在極少資源消耗下賦予模型快速生成效果。其中,使用自動(dòng)編碼器來(lái)編碼圖片到潛在空間,并采用無(wú)分類(lèi)器引導(dǎo)、跳步策略等關(guān)鍵技術(shù)。
LCM生成的圖像
LCM-LoRA:一個(gè)通用的Stable Diffusion加速模塊
LCM-LoRA建立在LCM基礎(chǔ)上,通過(guò)LoRA等高效微調(diào)技術(shù)訓(xùn)練模型。它展示了強(qiáng)大的泛化能力,支持各種微調(diào)的SD模型和LoRA。
LCM-LoRA概況圖。通過(guò)在LCM的蒸餾過(guò)程中引入LoRA,降低蒸餾的內(nèi)存開(kāi)銷(xiāo),使得能夠訓(xùn)練更大的模型,如SDXL和SSD-1B。
LCM-LoRA技術(shù)方法改善了模型的生成效果,展示出強(qiáng)大的泛化能力和優(yōu)越性。
團(tuán)隊(duì)介紹
論文作者來(lái)自清華叉院,兩位共一作分別是駱?biāo)济?、譚亦欽。
駱?biāo)济惝厴I(yè)于復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院,研究方向?yàn)槎嗄B(tài)生成模型。譚亦欽畢業(yè)于清華大學(xué)電子工程系,研究方向包括深度強(qiáng)化學(xué)習(xí)。
指導(dǎo)老師包括清華交叉信息院副教授李建、黃隆波,助理教授趙行。
第一行(從左到右):駱?biāo)济?、譚亦欽。第二行(從左到右):黃隆波、李建、趙行。
熱門(mén)資訊
1. 照片變漫畫(huà)效果,這4個(gè)方法操作簡(jiǎn)單有效,快來(lái)試試吧!
想將照片變成漫畫(huà)效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡(jiǎn)單操作就能實(shí)現(xiàn),快來(lái)嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過(guò)簡(jiǎn)單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
3. 四款值得推薦的AI以圖生圖軟件,有需要的趕緊來(lái)試試!
近年來(lái),人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語(yǔ)以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來(lái),創(chuàng)意無(wú)限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來(lái),快來(lái)了解Viggle AI的功能和優(yōu)勢(shì)吧!
5. Logo Diffusion——基于sd繪畫(huà)模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來(lái)詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說(shuō)關(guān)于怎么樣利用AI來(lái)提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫(huà),教大家如何用AI生成自己的漫畫(huà)
接下來(lái),我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來(lái)盈利的漫畫(huà)。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫(huà)作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類(lèi)型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. 一款免費(fèi)無(wú)限制的AI視頻生成工具火了!國(guó)內(nèi)無(wú)障礙訪問(wèn)!附教程
人人都可以動(dòng)手制作AI視頻! 打開(kāi)網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開(kāi)始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫(huà)排行榜:4090無(wú)懸念,最具性價(jià)比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫(huà)的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫(huà)軟件,提供詳細(xì)操作!有需要的快來(lái)...
最新文章
同學(xué)您好!