當(dāng)前位置：首頁 >人工智能 >大跌眼鏡！GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄：該錯(cuò)的沒錯(cuò)，不該錯(cuò)的反而錯(cuò)了

大跌眼鏡！GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄：該錯(cuò)的沒錯(cuò)，不該錯(cuò)的反而錯(cuò)了

發(fā)布時(shí)間：2023-11-06 11:03:14 瀏覽量：104次

順便進(jìn)來考考咱自個(gè)兒的眼力

豐色發(fā)自凹非寺

|

GPT-4V挑戰(zhàn)視覺錯(cuò)誤圖，結(jié)果令人“大跌眼鏡”。

像這種判斷“哪邊顏色更亮”的題，一個(gè)沒做對(duì)：

大跌眼鏡！GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄：該錯(cuò)的沒錯(cuò)，不該錯(cuò)的反而錯(cuò)了

讀圖片中隱藏信息的也傻傻看不出，怎么問都說“沒有啊”：

但是呢，這種人類乍一看絕對(duì)會(huì)錯(cuò)的圖，它又成功答對(duì)：

以及這樣的錯(cuò)位圖，它對(duì)了又沒完全對(duì)。。

（GPT-4V直接看出來頭盔是位于男的大腿上的，沒有女的，但它還是表示圖里有倆人，另一個(gè)躲在男的身后戴著那頂頭盔==）

看完這些，是不是覺得很迷？

整個(gè)一“該對(duì)的不對(duì)，該錯(cuò)的又對(duì)了”。

測試者則表示：

在測之前，他以為GPT-4V對(duì)這種挑戰(zhàn)完全不在話下，誰知結(jié)果竟是這樣。

不止是他，網(wǎng)友也都不理解GPT-4V作為一個(gè)“精準(zhǔn)的”AI系統(tǒng)，按理很智能，為什么還會(huì)犯和人類一模一樣的錯(cuò)覺？？！

所以，這到底怎么回事？

GPT-4V五大錯(cuò)覺挑戰(zhàn)

下面是來自網(wǎng)友的更多測試案例。

首先是次次都錯(cuò)誤的顏色錯(cuò)覺題。

（1）除了開頭的兩顆小樹圖，還有這個(gè)：

問它哪邊的綠色更亮一些，果不其然還是左邊亮，右邊暗，實(shí)際明明都一樣。

（2）還有這張稍微復(fù)雜一點(diǎn)的：

兩只眼睛其實(shí)都是灰色，但讓GPT-4V來描述圖像時(shí)，它回答一只為藍(lán)色，另一只做了灰度處理，無法得知顏色。

（3）這張就更別提了，直接被糊弄地死死的。

當(dāng)然，這確實(shí)很難，大部分人類也識(shí)別不出來所有的球其實(shí)都是棕色。

其次是會(huì)產(chǎn)生動(dòng)態(tài)錯(cuò)覺的圖。

（1）有一點(diǎn)意外，當(dāng)我們問GPT-4V“你看見了什么？描述細(xì)節(jié)”時(shí)，它直接挑明了這是一張看久了就會(huì)讓人產(chǎn)生眩暈感的錯(cuò)覺圖，本質(zhì)就是一些波浪線而已。

（2）這張也沒有難倒它。

但奇怪的是問它圖中有幾種顏色，它怎么都只能識(shí)別出黃色和藍(lán)色，看不到黑色和白色。

接下來是另一類比較平面的錯(cuò)覺圖。

（1）如開頭所示的這張：

一般人類真的表示很懵圈，但是GPT-4V居然對(duì)了。

But，別急??！有人拿著測試者的圖去問“自己的”GPT-4V，讓它再檢查一下時(shí)，它居然改變了答案。

然而還沒完。評(píng)論區(qū)驚現(xiàn)套娃操作，有人又拿著這倆人的對(duì)話圖再問GPT-4V，您猜怎么著？它又改回去了。。

大伙可是玩上癮了，又是一次又一次套娃。好在最終GPT-4V堅(jiān)持了己見。

總的來說，對(duì)于這種錯(cuò)覺陷阱是完全沒問題。

（2）我們自己也測了一個(gè)長度錯(cuò)覺題：

結(jié)果是so easy～

再來一組找隱藏信息的圖。

很遺憾，這種對(duì)于人類來說真的還算輕松的題，GPT-4V是一點(diǎn)也搞不定。

（1）先看這張，“遠(yuǎn)看”可以看到“NYC”三個(gè)大寫字母。但它描述了一堆有的沒的，就是表示沒發(fā)現(xiàn)任何隱藏信息。

（2）如果說上門這個(gè)有點(diǎn)隱晦，看不出也罷。但對(duì)于這種圖形隱藏，它也不行。

它描述到的只有其中的小女孩，即使測試者讓它“往遠(yuǎn)了看，又沒有新發(fā)現(xiàn)”，也無濟(jì)于事。

不過，如果我們把這張圖片手動(dòng)縮小再丟給它，它行了，看到了骷髏。

最后是一組真實(shí)世界的錯(cuò)位圖。

（1）除了開頭展示的人騎摩托，這張小貓“懸浮”，它居然對(duì)了。

（2）這張?bào)@悚圖，也OK。

（3）但這個(gè)就失敗了，實(shí)際后面是一只狗和小baby的重合，它認(rèn)成法斗犬幼崽。

（4）至于這張，它壓根兒就沒提鞋子的事兒，說了也些不痛不癢的話。

為什么會(huì)這樣？

所以，為什么會(huì)發(fā)生上面這些情況：有的錯(cuò)覺它可以識(shí)別出來，有的又表現(xiàn)得很差勁？

首先，對(duì)于顏色錯(cuò)覺的圖，網(wǎng)友首先認(rèn)為是提示詞的問題。

就像兩顆小樹那張，我們問它“哪個(gè)更亮”，其實(shí)就是給了GPT-4V暗示或偏見，它會(huì)順著咱的偏見來回答。

我們自己的測試也是如此：

但如果我們不帶立場的問：圖中兩種顏色一樣嗎？它完全沒問題。

不過，也有網(wǎng)友指出，當(dāng)我們問它哪棵樹更亮?xí)r，如果是非常嚴(yán)謹(jǐn)?shù)貙?duì)所有像素進(jìn)行平均，GPT-4V的回答沒有毛病。

甚至有網(wǎng)友還用測色計(jì)實(shí)測了一把：

但！又有人指出如果只顯示一部分時(shí)，兩者明明一樣。

暫且不再爭論這個(gè)問題，可以肯定的是，“提示詞”的使用方法會(huì)對(duì)它的判斷造成影響是沒問題的。

另外，網(wǎng)友發(fā)現(xiàn)：

如果我們?nèi)?strong>追問GPT-4V，讓它再仔細(xì)確認(rèn)一下，它也能糾正回答。

至于無法識(shí)別遠(yuǎn)景圖像的問題，有網(wǎng)友認(rèn)為這可能是因?yàn)镚PT-4V只會(huì)從左往右地讀取圖像。

而對(duì)于“為什么有時(shí)它會(huì)和人類一樣發(fā)昏被錯(cuò)覺誤導(dǎo)、完全不像個(gè)智能AI”的疑問，不少人則表示這毫不意外，是訓(xùn)練問題。

即大模型是根據(jù)人類數(shù)據(jù)、人的反饋、人的注釋進(jìn)行訓(xùn)練的，自然會(huì)產(chǎn)生和人一樣的錯(cuò)誤。

因此，還有人戲謔：

看來我們?nèi)祟悇?chuàng)造了那么多科幻作品，描述AI是如何冷酷、完美，但當(dāng)現(xiàn)在我們真正擁有它時(shí)，發(fā)現(xiàn)它也不過如此。

（手動(dòng)狗頭）

你認(rèn)為該如何讓GPT-4V的錯(cuò)覺識(shí)別能力更強(qiáng)呢？

One More Thing

值得一提的是，我們也測試了其中的一些案例。

發(fā)現(xiàn)GPT-4V的表現(xiàn)不大一樣，有些題它在“我們這里”是可以的。

比如這張判斷球顏色的：

還有這個(gè)：

盡管把大圖認(rèn)成老女人而非骷髏，但還是表明它可以“遠(yuǎn)觀” 的。

參考鏈接：
[1]https://twitter.com/fabianstelzer/status/1717131235644875024
[2]https://twitter.com/BeyondTodAI/status/1713279431681118557
[3]https://twitter.com/janbobrowicz/status/1717229335076393350

上一篇北師大未來設(shè)計(jì)學(xué)院在第六屆中國教博會(huì)發(fā)布五項(xiàng)PBL大挑戰(zhàn)項(xiàng)目

下一篇產(chǎn)品設(shè)計(jì)中的游戲化

熱門課程推薦

熱門資訊

1. 照片變漫畫效果，這4個(gè)方法操作簡單有效，快來試試吧！

想將照片變成漫畫效果？這篇文章分享了4個(gè)方法，包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖，簡單操作就能實(shí)現(xiàn)，快來嘗試一下吧！
2. 華為手機(jī)神奇“AI修圖”功能，一鍵消除衣服！原圖變身大V領(lǐng)深V！

最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議，通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎？點(diǎn)擊查看！
3. 四款值得推薦的AI以圖生圖軟件，有需要的趕緊來試試!

近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle：讓靜態(tài)人物動(dòng)起來，創(chuàng)意無限！

Viggle AI是一款免費(fèi)制作視頻的AI工具，能讓靜態(tài)人物圖片動(dòng)起來，快來了解Viggle AI的功能和優(yōu)勢吧！
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器

這下LOGO設(shè)計(jì)徹底不用求人了。接下來詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫，教大家如何用AI生成自己的漫畫

接下來,我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具

以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。用戶可以使...
8. 一款免費(fèi)無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程

人人都可以動(dòng)手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫排行榜:4090無懸念，最具性價(jià)比出人意料

在AI繪圖領(lǐng)域，Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn)，以及2023年3月顯卡AI繪圖效率排行榜和性價(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
10. 四款軟件讓你一鍵生成AI美女!

就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來...

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

大跌眼鏡！GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄：該錯(cuò)的沒錯(cuò)，不該錯(cuò)的反而錯(cuò)了

GPT-4V五大錯(cuò)覺挑戰(zhàn)

為什么會(huì)這樣？

One More Thing

請(qǐng)綁定手機(jī)號(hào)

激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

大跌眼鏡！GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄：該錯(cuò)的沒錯(cuò)，不該錯(cuò)的反而錯(cuò)了

GPT-4V五大錯(cuò)覺挑戰(zhàn)

為什么會(huì)這樣？

One More Thing

請(qǐng)綁定手機(jī)號(hào)

大跌眼鏡！GPT-4V錯(cuò)覺挑戰(zhàn)實(shí)錄：該錯(cuò)的沒錯(cuò)，不該錯(cuò)的反而錯(cuò)了

為什么會(huì)這樣？