當前位置：首頁 >人工智能 >AI繪圖|Stable Diffusion基礎(chǔ)篇—— 圖生圖(img2img)

AI繪圖|Stable Diffusion基礎(chǔ)篇—— 圖生圖(img2img)

發(fā)布時間：2024-03-30 15:45:49 瀏覽量：364次

#挑戰(zhàn)30天在頭條寫日記#

前言

本文講一下Stable Diffusion的Automatic1111的圖生圖（img2img，簡稱i2i）功能。

在圖生圖的頁面上，大部分的功能跟文生圖的功能一樣，請直接查閱 AI繪圖|Stable Diffusion基礎(chǔ)篇—— 文生圖（txt2img），這邊就不復(fù)述了。這邊來討論不一樣的功能：

img2img的頁面與功能分區(qū)

這邊最重要的功能是1（圖片放置區(qū)）跟4（Denoising strength）。我們之后會常常用到。

功能分區(qū)

圖片放置區(qū)：這個區(qū)域我們有三個重要的次要區(qū)域在這邊，
第一個是分頁標簽，里面有圖生圖（img2img），涂鴉（sketch），局部修改（inpaint）等等，我們這邊主要聚焦于圖生圖這功能。
第二區(qū)是圖片放置區(qū)，在這里我們可以用拖拽或者點擊打開文件選擇器，把自己要修改的圖放入。
第三區(qū)是拷貝圖片到其他區(qū)域，在這邊我們可以把同一張圖自由切換到不同功能去，例如你用img2img載入圖片，突然發(fā)現(xiàn)其實你要的只是局部修改某個區(qū)域，就可以直接按Copy image to Inpaint把圖直接送進inpaint分頁來修改。
尺寸變動選項：當你的輸出尺寸設(shè)定與原先圖片尺寸不一致時，Automatic1111就會依照這邊選取的選項來調(diào)整畫面：
Just resize：無視比例，直接把圖片縮放成目標尺寸（原圖內(nèi)容無損失，但比例可能扭曲）。
Crop and resize：依照目標尺寸的比例，先把多余的內(nèi)容都去除掉再縮放到目標尺寸（會損失原圖的內(nèi)容）。
Resize and fill：依照目標尺寸的比例，在不足的地方填充雜訊，然后縮放到目標尺寸，接下來靠img2img來把雜訊轉(zhuǎn)換成有意義的內(nèi)容（會增加原圖的內(nèi)容）。
Just resize (latent upscale)：與第一個功能Just resize相同，但是Just resize是直接縮放，而這個選項是使用AI放大演算法來縮放圖片，所以需時較久，但是在放大后可能產(chǎn)生比較多的細節(jié)（原圖內(nèi)容無損失，但比例可能扭曲）。
輸出尺寸設(shè)定：我們可以在img2img的時候指定成品圖的新尺寸，有兩種方法：
Resize to：直接指定成品圖的長與寬。
Resize by：指定成品圖的放大或縮小倍率，預(yù)設(shè)是1，也就是不變動。
去躁力度（Denosing strength）：輸出圖片的變動程度。在img2img的第一步，Stable Diffusion會將噪訊加進輸入圖片中，然后依照提示詞的內(nèi)容來產(chǎn)生圖片。數(shù)值越大的話，第一步加入的噪訊就會越多，輸出圖片會差異越大。例如0.1到0.2時，只會在細微的圖樣，陰影產(chǎn)生變化。到了0.4以上，就會對畫面中的小物品產(chǎn)生明顯變化，到了0.6以上會對整張圖的組成產(chǎn)生很明顯的影響，例如人物姿勢與位置，甚至整個構(gòu)圖都會不一樣。到了1就會產(chǎn)生一個跟輸入圖毫無關(guān)聯(lián)的圖，其實就等于純粹的文生圖。
除此之外，AI跑新圖的時間也與去噪力度有關(guān)，數(shù)值越大就會跑越久。當你設(shè)定要跑100步，但是去噪力度為0.1時，它實際上只跑了100*0.1=10步。
提示詞提取按鈕：讓使用者可以從輸入圖提取可能的提示詞。Automatic1111提供了兩種不同的演算法來提取提示詞。
Interrogate CLIP：使用OpenAI開發(fā)的CLIP演算法來提取提示詞。使用這個方法提取的提示詞使用的是自然英語的語法。由于大部分的網(wǎng)路圖片都是自然英文，而Stable Diffusion使用的是網(wǎng)上圖片以及其敘述來訓(xùn)練基本模型，所以理論上使用這個方法得到的提示詞在生成真實世界照片時效果較佳。
Interrogate DeepBooru：針對2D動畫的模型，例如Waifu-Diffusion或NovalAI都是從DanBooru這個網(wǎng)站抓圖下來訓(xùn)練，而這個網(wǎng)站使用的分類標簽系統(tǒng)，就成了DeepBooru這個演算法的基本資料。使用這個方法會提取出以標簽為主的提示詞，以逗號分隔。常用的提示詞如1girl，long hair都是這個提示詞演算法引入的。也因此只有在動漫畫相關(guān)的模型里面，這樣的提示詞才有明顯作用。如果是純粹的Stable Diffusion基本模型，應(yīng)該沒有自然英文語法來得好用。

下面是一個原版圖片，依照不同的提示詞與0.65的Denoising strength來重繪的比較圖：

上一篇北師大未來設(shè)計學(xué)院在第六屆中國教博會發(fā)布五項PBL大挑戰(zhàn)項目

下一篇老鹿學(xué)Ai繪畫:三種方法制作文字融入圖片效果

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實現(xiàn)，快來嘗試一下吧！
2. 華為手機神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動起來，創(chuàng)意無限！

Viggle AI是一款免費制作視頻的AI工具，能讓靜態(tài)人物圖片動起來，快來了解Viggle AI的功能和優(yōu)勢吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學(xué)習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具

以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念，最具性價比出人意料

在AI繪圖領(lǐng)域，Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程

人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
10. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

AI繪圖|Stable Diffusion基礎(chǔ)篇—— 圖生圖(img2img)

前言

功能分區(qū)

請綁定手機號