激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

內(nèi)測了下阿里的AI畫圖,帶來了點大廠的震撼

發(fā)布時間:2024-10-04 14:34:55 瀏覽量:140次

機器之心報道

作者:杜偉、澤南

要問今年的 WAIC 世界人工智能大會,誰是主角?AI 大模型當之無愧。

大會一共三天,各家公司機構(gòu)陸續(xù)要亮相 30 多個大模型。

這場大模型的盛宴中少不了語言大模型,當然也有屢?guī)Ыo人視覺感官震撼的繪畫大模型。這不,在 AI 畫圖領(lǐng)域,又一個國內(nèi)大將入場了。

繼發(fā)布大語言模型通義千問三個月后,阿里的 AI 繪畫創(chuàng)作大模型也來了,而且是基于自研的組合式生成模型 Composer。

7 月 7 日的 WAIC 大會上,阿里云通義大模型家族揭幕了旗下最新成員「通義萬相」。

WAIC 阿里云《MaaS:以模型為中心的 AI 開發(fā)新范式》主題論壇上,通義萬相登場。

它的文本生成圖像效果是這樣的,生成速度很快。

通義萬相還可以為一張原圖生成另一種指定風格的新圖。

更有一種套娃玩法,為一張原圖生成一些相似的圖片。

阿里表示,通義萬相擁有的文生圖和圖生圖能力,可以輔助人類進行圖片創(chuàng)作,大幅降低圖片設(shè)計門檻。未來還可應(yīng)用于藝術(shù)設(shè)計、游戲和文創(chuàng)等應(yīng)用場景。

目前,該模型已開啟定向邀測。

在 ChatGPT 火起來之前,AI 領(lǐng)域最出圈的話題就是 AI 畫圖。擴散模型把生成式 AI 向前帶進了一大步,一時間業(yè)內(nèi)出現(xiàn)大量輸入文字、生成各種風格圖像的 AI 模型。之后又出現(xiàn)了圖像生成圖像、圖像指定風格轉(zhuǎn)換的更多玩法,讓人們眼花繚亂的同時感嘆于生成式 AI 的神奇。

在 WAIC 這個大舞臺上,阿里推出了這個既能文生圖又能圖生圖的 AI 神器,可見對其生成效果非常有信心。

在拿到體驗資格后,機器之心當然要先試上一把。

通義萬相實測:玩法多樣、一出手就是大作

這個通義家族的新模型究竟有沒有給 AI 畫圖領(lǐng)域帶來改變呢?我們用結(jié)果來說話。

目前,通義萬相上線了文本生成圖像、相似圖像生成和圖像風格遷移三大功能.

我們先從標準的文本生成圖像測起。在文生圖時,你可以在水彩、油畫、中國畫、扁平插畫、二次元、素描、3D 卡通等多種風格中進行選擇。在輸入文字描述并選定風格后,AI 便可自動生成創(chuàng)作圖片了。同時為了方便使用,輸出圖像的比例有現(xiàn)成的 1:1、16:9 和 9:16 三種可選。

我們先來點不那么復(fù)雜的,選取元曲四大家之一馬致遠《天凈沙?秋思》中的一組文字描述「小橋、流水、人家」,風格則選擇「中國畫」。

結(jié)果出來,通義萬相完全向我們展示了一幅幅古韻十足的畫作,細節(jié)豐富,還添加了描述中沒有的一些元素,比如遠處的山、水里游的鴨子等。

我們不妨再換兩種風格,這次選擇「素描」和「油畫」。通義萬相多種風格切換自如,生成的素描和油畫圖片同樣驚艷。不夸張地說,這些圖片完全是可以拿來直接用的水平。

再來另一組文字描述「穿宇航服的貓咪、太空、遨游、星空」,這次風格上選擇「二次元」和「3D 卡通」。效果一目了然,尤其是 3D 卡通風格這組,貓咪太可愛了。

這里突然想讓通義萬相與大名鼎鼎的 Stable Diffusion 較量一下。同樣的文字描述翻譯成英文「cat in a spacesuit, space, travel, starry sky」,然后再加上「style of 3D carton」,生成的圖片是下面這樣的。

這波沒想到是通義萬相贏了,Stable Diffusion 生成的貓咪要么太抽象,要么太寫實了,沒有表現(xiàn)出 3D 卡通風格。

既然簡單的文字描述難不倒通義萬相,那就給它上上難度。

這次來段更長的「一位日系女孩、棕色直發(fā)、白皙肌膚、身穿連衣裙、蕾絲和蝴蝶結(jié)、挎著小提包、面帶微笑」,風格選擇「二次元」。想問一下喜歡二次元的小伙伴,這些生成的圖片符合你們心目中的日系女孩嗎?

再來一組魔幻風格的描述「超現(xiàn)實主義、質(zhì)感突出、4k 分辨率、賽博朋克、戰(zhàn)艦、氣勢磅礴、硝煙、金屬巨物、激光武器、辛烷渲染器」,風格選擇「油畫」。看著下面這些圖片,瞬間升起了一種末日之戰(zhàn)來襲的緊張氛圍感。

我們再次將相同的描述放進 Stable Diffusion。在細節(jié)豐富度上,Stable Diffusion 更勝一籌,但其畫面風格看起來灰暗,給不了人強烈的色彩沖擊感。而且更偏寫實風格,與超現(xiàn)實主義略有出入。

看起來,至少在文生圖這個賽道,通義萬相似乎完全拿捏住了。讓人不由感嘆,生成式 AI 在畫圖領(lǐng)域的能力一直在進化。

接下來講通義萬相的相似圖生成功能,用戶只要提供一張參考圖像,就能夠獲得內(nèi)容、風格相似的 AI 畫作。這里要注意,上傳的圖像大小要在 10M 以下,格式則支持常見的 JPG、JPEG、PNG、BMP 等。

我們先放進去一張 AI 畫圖世界的??婉R斯克,看看通義萬相眼中的馬斯克「分克」長什么樣子。相較于馬斯克真身,生成的圖片偏老一些,但笑容同樣開朗。

再來一張風景圖,生成效果非常不錯。溪水潺潺流下,水中也點綴了更多落葉,跟原圖比毫不遜色。

在體驗中,機器之心還發(fā)現(xiàn),通義萬相文本生成的圖片可以直接生成相似圖。這里選取上文 3D 卡通風格「穿宇航服的貓咪」的其中一張作為原圖,結(jié)果一出來,生成的貓咪更呆萌了,背景元素也更加豐富。

最后看風格遷移功能,你只要上傳想要變換風格的原圖和目標風格的示意圖,就可以很快將原圖處理為目標風格的創(chuàng)意圖了。與相似圖像生成一樣,原圖和風格圖的大小不得超過 10M,格式相同。

我們首先選擇一張偏寫實的原圖、一張印象派的風格圖。結(jié)果來看,偏寫實的原圖完全變換了風格,成了一幅幅印象派畫作。

接著嘗試一張 3D 卡通原圖、一張素描風格圖。從結(jié)果看得出來,兩種風格之間的切換游刃有余。

最后選擇一張中國畫風格的原圖、一張水彩風格圖。生成結(jié)果同樣不錯。

一番體驗下來,無論是文生圖還是圖生圖,通義萬相從語義相關(guān)性、畫面完整性以及細節(jié)豐富度等方面來看,都給了我們很大的驚喜。尤其是風格遷移功能,不同風格的切換如此絲滑,生成的圖片幾乎沒有拼接感和涂抹感,就像本就屬于目標風格一樣。

作為阿里云通義大模型家族的新成員,阿里表示,通義萬相現(xiàn)有的能力只是牛刀小試,其能力仍在不斷進化中。未來也會逐步向行業(yè)客戶開放相關(guān)能力。

自研 Composer 模型:50 億參數(shù)、登上頂會

此前很多公司的大模型都在立「多模態(tài)」的人設(shè),帶有 AI 畫圖能力。相比之下,阿里這個通義萬相有多少技術(shù)含量呢?看起來它不是簡單的模仿,而是有自己

熱門課程推薦

熱門資訊

請綁定手機號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定