激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

發(fā)布時(shí)間:2023-11-06 11:03:14 瀏覽量:104次

順便進(jìn)來考考咱自個(gè)兒的眼力

豐色 發(fā)自 凹非寺

|  

GPT-4V挑戰(zhàn)視覺錯(cuò)誤圖,結(jié)果令人“大跌眼鏡”。

像這種判斷“哪邊顏色更亮”的題,一個(gè)沒做對(duì):

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

讀圖片中隱藏信息的也傻傻看不出,怎么問都說“沒有啊”

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

但是呢,這種人類乍一看絕對(duì)會(huì)錯(cuò)的圖,它又成功答對(duì):

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

以及這樣的錯(cuò)位圖,它對(duì)了又沒完全對(duì)。。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(GPT-4V直接看出來頭盔是位于男的大腿上的,沒有女的,但它還是表示圖里有倆人,另一個(gè)躲在男的身后戴著那頂頭盔==)

看完這些,是不是覺得很迷?

整個(gè)一“該對(duì)的不對(duì),該錯(cuò)的又對(duì)了”。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了
大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

測試者則表示:

在測之前,他以為GPT-4V對(duì)這種挑戰(zhàn)完全不在話下,誰知結(jié)果竟是這樣。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

不止是他,網(wǎng)友也都不理解GPT-4V作為一個(gè)“精準(zhǔn)的”AI系統(tǒng),按理很智能,為什么還會(huì)犯和人類一模一樣的錯(cuò)覺??!

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

所以,這到底怎么回事?

GPT-4V五大錯(cuò)覺挑戰(zhàn)

下面是來自網(wǎng)友的更多測試案例。

首先是次次都錯(cuò)誤的顏色錯(cuò)覺題。

(1)除了開頭的兩顆小樹圖,還有這個(gè):

問它哪邊的綠色更亮一些,果不其然還是左邊亮,右邊暗,實(shí)際明明都一樣。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(2)還有這張稍微復(fù)雜一點(diǎn)的:

兩只眼睛其實(shí)都是灰色,但讓GPT-4V來描述圖像時(shí),它回答一只為藍(lán)色,另一只做了灰度處理,無法得知顏色。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(3)這張就更別提了,直接被糊弄地死死的。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

當(dāng)然,這確實(shí)很難,大部分人類也識(shí)別不出來所有的球其實(shí)都是棕色

其次是會(huì)產(chǎn)生動(dòng)態(tài)錯(cuò)覺的圖。

(1)有一點(diǎn)意外,當(dāng)我們問GPT-4V“你看見了什么?描述細(xì)節(jié)”時(shí),它直接挑明了這是一張看久了就會(huì)讓人產(chǎn)生眩暈感的錯(cuò)覺圖,本質(zhì)就是一些波浪線而已。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(2)這張也沒有難倒它。

但奇怪的是問它圖中有幾種顏色,它怎么都只能識(shí)別出黃色和藍(lán)色,看不到黑色和白色。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

接下來是另一類比較平面的錯(cuò)覺圖。

(1)如開頭所示的這張:

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

一般人類真的表示很懵圈,但是GPT-4V居然對(duì)了。

But,別急??!有人拿著測試者的圖去問“自己的”GPT-4V,讓它再檢查一下時(shí),它居然改變了答案。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

然而還沒完。評(píng)論區(qū)驚現(xiàn)套娃操作,有人又拿著這倆人的對(duì)話圖再問GPT-4V,您猜怎么著?它又改回去了。。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

大伙可是玩上癮了,又是一次又一次套娃。好在最終GPT-4V堅(jiān)持了己見。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

總的來說,對(duì)于這種錯(cuò)覺陷阱是完全沒問題。

(2)我們自己也測了一個(gè)長度錯(cuò)覺題:

結(jié)果是so easy~

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

再來一組找隱藏信息的圖。

很遺憾,這種對(duì)于人類來說真的還算輕松的題,GPT-4V是一點(diǎn)也搞不定。

(1)先看這張,“遠(yuǎn)看”可以看到“NYC”三個(gè)大寫字母。但它描述了一堆有的沒的,就是表示沒發(fā)現(xiàn)任何隱藏信息。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(2)如果說上門這個(gè)有點(diǎn)隱晦,看不出也罷。但對(duì)于這種圖形隱藏,它也不行。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

它描述到的只有其中的小女孩,即使測試者讓它“往遠(yuǎn)了看,又沒有新發(fā)現(xiàn)”,也無濟(jì)于事。

不過,如果我們把這張圖片手動(dòng)縮小再丟給它,它行了,看到了骷髏。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

最后是一組真實(shí)世界的錯(cuò)位圖。

(1)除了開頭展示的人騎摩托,這張小貓“懸浮”,它居然對(duì)了。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(2)這張?bào)@悚圖,也OK。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(3)但這個(gè)就失敗了,實(shí)際后面是一只狗和小baby的重合,它認(rèn)成法斗犬幼崽。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(4)至于這張,它壓根兒就沒提鞋子的事兒,說了也些不痛不癢的話。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

為什么會(huì)這樣?

所以,為什么會(huì)發(fā)生上面這些情況:有的錯(cuò)覺它可以識(shí)別出來,有的又表現(xiàn)得很差勁?

首先,對(duì)于顏色錯(cuò)覺的圖,網(wǎng)友首先認(rèn)為是提示詞的問題。

就像兩顆小樹那張,我們問它“哪個(gè)更亮”,其實(shí)就是給了GPT-4V暗示或偏見,它會(huì)順著咱的偏見來回答。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

我們自己的測試也是如此:

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

但如果我們不帶立場的問:圖中兩種顏色一樣嗎?它完全沒問題。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

不過,也有網(wǎng)友指出,當(dāng)我們問它哪棵樹更亮?xí)r,如果是非常嚴(yán)謹(jǐn)?shù)貙?duì)所有像素進(jìn)行平均,GPT-4V的回答沒有毛病。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

甚至有網(wǎng)友還用測色計(jì)實(shí)測了一把:

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了
大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

但!又有人指出如果只顯示一部分時(shí),兩者明明一樣。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

暫且不再爭論這個(gè)問題,可以肯定的是,“提示詞”的使用方法會(huì)對(duì)它的判斷造成影響是沒問題的。

另外,網(wǎng)友發(fā)現(xiàn):

如果我們?nèi)?strong>追問GPT-4V,讓它再仔細(xì)確認(rèn)一下,它也能糾正回答

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

至于無法識(shí)別遠(yuǎn)景圖像的問題,有網(wǎng)友認(rèn)為這可能是因?yàn)镚PT-4V只會(huì)從左往右地讀取圖像。

而對(duì)于“為什么有時(shí)它會(huì)和人類一樣發(fā)昏被錯(cuò)覺誤導(dǎo)、完全不像個(gè)智能AI”的疑問,不少人則表示這毫不意外,是訓(xùn)練問題。

即大模型是根據(jù)人類數(shù)據(jù)、人的反饋、人的注釋進(jìn)行訓(xùn)練的,自然會(huì)產(chǎn)生和人一樣的錯(cuò)誤。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

因此,還有人戲謔:

看來我們?nèi)祟悇?chuàng)造了那么多科幻作品,描述AI是如何冷酷、完美,但當(dāng)現(xiàn)在我們真正擁有它時(shí),發(fā)現(xiàn)它也不過如此。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

(手動(dòng)狗頭)

你認(rèn)為該如何讓GPT-4V的錯(cuò)覺識(shí)別能力更強(qiáng)呢?

One More Thing

值得一提的是,我們也測試了其中的一些案例。

發(fā)現(xiàn)GPT-4V的表現(xiàn)不大一樣,有些題它在“我們這里”是可以的。

比如這張判斷球顏色的:

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

還有這個(gè):

盡管把大圖認(rèn)成老女人而非骷髏,但還是表明它可以“遠(yuǎn)觀” 的。

大跌眼鏡!GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄:該錯(cuò)的沒錯(cuò),不該錯(cuò)的反而錯(cuò)了

參考鏈接:
[1]https://twitter.com/fabianstelzer/status/1717131235644875024
[2]https://twitter.com/BeyondTodAI/status/1713279431681118557
[3]https://twitter.com/janbobrowicz/status/1717229335076393350

熱門課程推薦

熱門資訊

請(qǐng)綁定手機(jī)號(hào)

x

同學(xué)您好!

您已成功報(bào)名0元試學(xué)活動(dòng),老師會(huì)在第一時(shí)間與您取得聯(lián)系,請(qǐng)保持電話暢通!
確定