發(fā)布時間:2024-10-04 14:34:55 瀏覽量:140次
機器之心報道
作者:杜偉、澤南
要問今年的 WAIC 世界人工智能大會,誰是主角?AI 大模型當之無愧。
大會一共三天,各家公司機構(gòu)陸續(xù)要亮相 30 多個大模型。
這場大模型的盛宴中少不了語言大模型,當然也有屢?guī)Ыo人視覺感官震撼的繪畫大模型。這不,在 AI 畫圖領(lǐng)域,又一個國內(nèi)大將入場了。
繼發(fā)布大語言模型通義千問三個月后,阿里的 AI 繪畫創(chuàng)作大模型也來了,而且是基于自研的組合式生成模型 Composer。
7 月 7 日的 WAIC 大會上,阿里云通義大模型家族揭幕了旗下最新成員「通義萬相」。
WAIC 阿里云《MaaS:以模型為中心的 AI 開發(fā)新范式》主題論壇上,通義萬相登場。
它的文本生成圖像效果是這樣的,生成速度很快。
通義萬相還可以為一張原圖生成另一種指定風格的新圖。
更有一種套娃玩法,為一張原圖生成一些相似的圖片。
阿里表示,通義萬相擁有的文生圖和圖生圖能力,可以輔助人類進行圖片創(chuàng)作,大幅降低圖片設(shè)計門檻。未來還可應(yīng)用于藝術(shù)設(shè)計、游戲和文創(chuàng)等應(yīng)用場景。
目前,該模型已開啟定向邀測。
在 ChatGPT 火起來之前,AI 領(lǐng)域最出圈的話題就是 AI 畫圖。擴散模型把生成式 AI 向前帶進了一大步,一時間業(yè)內(nèi)出現(xiàn)大量輸入文字、生成各種風格圖像的 AI 模型。之后又出現(xiàn)了圖像生成圖像、圖像指定風格轉(zhuǎn)換的更多玩法,讓人們眼花繚亂的同時感嘆于生成式 AI 的神奇。
在 WAIC 這個大舞臺上,阿里推出了這個既能文生圖又能圖生圖的 AI 神器,可見對其生成效果非常有信心。
在拿到體驗資格后,機器之心當然要先試上一把。
通義萬相實測:玩法多樣、一出手就是大作
這個通義家族的新模型究竟有沒有給 AI 畫圖領(lǐng)域帶來改變呢?我們用結(jié)果來說話。
目前,通義萬相上線了文本生成圖像、相似圖像生成和圖像風格遷移三大功能.
我們先從標準的文本生成圖像測起。在文生圖時,你可以在水彩、油畫、中國畫、扁平插畫、二次元、素描、3D 卡通等多種風格中進行選擇。在輸入文字描述并選定風格后,AI 便可自動生成創(chuàng)作圖片了。同時為了方便使用,輸出圖像的比例有現(xiàn)成的 1:1、16:9 和 9:16 三種可選。
我們先來點不那么復(fù)雜的,選取元曲四大家之一馬致遠《天凈沙?秋思》中的一組文字描述「小橋、流水、人家」,風格則選擇「中國畫」。
結(jié)果出來,通義萬相完全向我們展示了一幅幅古韻十足的畫作,細節(jié)豐富,還添加了描述中沒有的一些元素,比如遠處的山、水里游的鴨子等。
我們不妨再換兩種風格,這次選擇「素描」和「油畫」。通義萬相多種風格切換自如,生成的素描和油畫圖片同樣驚艷。不夸張地說,這些圖片完全是可以拿來直接用的水平。
再來另一組文字描述「穿宇航服的貓咪、太空、遨游、星空」,這次風格上選擇「二次元」和「3D 卡通」。效果一目了然,尤其是 3D 卡通風格這組,貓咪太可愛了。
這里突然想讓通義萬相與大名鼎鼎的 Stable Diffusion 較量一下。同樣的文字描述翻譯成英文「cat in a spacesuit, space, travel, starry sky」,然后再加上「style of 3D carton」,生成的圖片是下面這樣的。
這波沒想到是通義萬相贏了,Stable Diffusion 生成的貓咪要么太抽象,要么太寫實了,沒有表現(xiàn)出 3D 卡通風格。
既然簡單的文字描述難不倒通義萬相,那就給它上上難度。
這次來段更長的「一位日系女孩、棕色直發(fā)、白皙肌膚、身穿連衣裙、蕾絲和蝴蝶結(jié)、挎著小提包、面帶微笑」,風格選擇「二次元」。想問一下喜歡二次元的小伙伴,這些生成的圖片符合你們心目中的日系女孩嗎?
再來一組魔幻風格的描述「超現(xiàn)實主義、質(zhì)感突出、4k 分辨率、賽博朋克、戰(zhàn)艦、氣勢磅礴、硝煙、金屬巨物、激光武器、辛烷渲染器」,風格選擇「油畫」。看著下面這些圖片,瞬間升起了一種末日之戰(zhàn)來襲的緊張氛圍感。
我們再次將相同的描述放進 Stable Diffusion。在細節(jié)豐富度上,Stable Diffusion 更勝一籌,但其畫面風格看起來灰暗,給不了人強烈的色彩沖擊感。而且更偏寫實風格,與超現(xiàn)實主義略有出入。
看起來,至少在文生圖這個賽道,通義萬相似乎完全拿捏住了。讓人不由感嘆,生成式 AI 在畫圖領(lǐng)域的能力一直在進化。
接下來講通義萬相的相似圖生成功能,用戶只要提供一張參考圖像,就能夠獲得內(nèi)容、風格相似的 AI 畫作。這里要注意,上傳的圖像大小要在 10M 以下,格式則支持常見的 JPG、JPEG、PNG、BMP 等。
我們先放進去一張 AI 畫圖世界的??婉R斯克,看看通義萬相眼中的馬斯克「分克」長什么樣子。相較于馬斯克真身,生成的圖片偏老一些,但笑容同樣開朗。
再來一張風景圖,生成效果非常不錯。溪水潺潺流下,水中也點綴了更多落葉,跟原圖比毫不遜色。
在體驗中,機器之心還發(fā)現(xiàn),通義萬相文本生成的圖片可以直接生成相似圖。這里選取上文 3D 卡通風格「穿宇航服的貓咪」的其中一張作為原圖,結(jié)果一出來,生成的貓咪更呆萌了,背景元素也更加豐富。
最后看風格遷移功能,你只要上傳想要變換風格的原圖和目標風格的示意圖,就可以很快將原圖處理為目標風格的創(chuàng)意圖了。與相似圖像生成一樣,原圖和風格圖的大小不得超過 10M,格式相同。
我們首先選擇一張偏寫實的原圖、一張印象派的風格圖。結(jié)果來看,偏寫實的原圖完全變換了風格,成了一幅幅印象派畫作。
接著嘗試一張 3D 卡通原圖、一張素描風格圖。從結(jié)果看得出來,兩種風格之間的切換游刃有余。
最后選擇一張中國畫風格的原圖、一張水彩風格圖。生成結(jié)果同樣不錯。
一番體驗下來,無論是文生圖還是圖生圖,通義萬相從語義相關(guān)性、畫面完整性以及細節(jié)豐富度等方面來看,都給了我們很大的驚喜。尤其是風格遷移功能,不同風格的切換如此絲滑,生成的圖片幾乎沒有拼接感和涂抹感,就像本就屬于目標風格一樣。
作為阿里云通義大模型家族的新成員,阿里表示,通義萬相現(xiàn)有的能力只是牛刀小試,其能力仍在不斷進化中。未來也會逐步向行業(yè)客戶開放相關(guān)能力。
自研 Composer 模型:50 億參數(shù)、登上頂會
此前很多公司的大模型都在立「多模態(tài)」的人設(shè),帶有 AI 畫圖能力。相比之下,阿里這個通義萬相有多少技術(shù)含量呢?看起來它不是簡單的模仿,而是有自己
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學(xué)習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
最新文章
同學(xué)您好!