發(fā)布時間:2023-11-08 14:36:54 瀏覽量:126次
DALL·E已至L3?
豐色 發(fā)自 凹非寺
|
AGI應該如何發(fā)展、最終呈什么樣子?
現(xiàn)在,業(yè)內第一個標準率先發(fā)布:
AGI分級框架,來自谷歌DeepMind。
該框架認為,發(fā)展AGI必須遵循6個基本原則:
在此原則之上,AGI將呈現(xiàn)6大發(fā)展階段,每個階段都有對應的深度(性能)和廣度(通用性)指標。
我們當前的AI產(chǎn)品走到哪一階段了?這里也有答案。
詳細來看。
什么是AGI?
對于這個問題,許多科學家、研究機構都給出了自己的理解。
比如圖靈提出的圖靈測試認為機器是否能“思考”就是一個衡量指標;強人工智能的概念提出者則認為,AGI是一個擁有意識的系統(tǒng);還有人說AGI一定是能在復雜性和速度上與人腦一樣甚至超越人腦……
谷歌認為,這些定義都不全面。
像圖靈測試,一些LLM已經(jīng)可以通過,但我們能稱那些模型為AGI嗎?
像類人腦說法,Transformer架構的成功就已表明,嚴格基于大腦的思考過程對于AGI來說并不是必須的。
通過分析這些定義(一共9種,詳情可翻閱原文)的優(yōu)缺點,谷歌重新理出了6項基本原則:
一、關注能力,而非過程。
這可以幫助我們去除一些不一定是實現(xiàn)AGI的必備要求:
比如AGI不一定要用類似人類的方式思考或理解,也不意味著系統(tǒng)必須具有主觀意識等能力(主要是這種能力無法也通過固定的方法去測量)。
二、注重通用性和技能水平。
目前所有的AGI定義都強調了通用性,這一點不必多說。但谷歌強調,性能也是AGI的關鍵組成部分(也就是可以達到人類的幾分水平)。在后面的具體階段制定中,主要也是根據(jù)這倆指標進行分類的。
三、專注于認知和元認知任務。
前者目前基本為共識,即AGI可以執(zhí)行各種非體力任務。不過谷歌在此強調,AI系統(tǒng)執(zhí)行物理任務的能力也需要加強,因為它對于認知能力是有推動作用的。
此外,元認知能力,如學習新任務或知道何時向人類尋求幫助,是系統(tǒng)走向通用性的關鍵先決條件。
四、關注最高潛力,而非實際落地水平
證明一個系統(tǒng)可以在給定的標準上完成任務,就足以宣布該系統(tǒng)為AGI,我們不要求一定得在開放世界中完全部署出水平相同的系統(tǒng)。
因為,這可能會面臨一些非技術阻礙,比如法律和社會考慮、潛在道德問題。
五、注重生態(tài)有效性。
所謂生態(tài)有效性,谷歌指的是選擇真正有用的現(xiàn)實任務去benchmark系統(tǒng)的進步,這些任務不僅包括經(jīng)濟價值也包括社會和藝術價值,要避開那些容易自動匹配和量化的傳統(tǒng)AI指標。
六、關注整條AGI之路的發(fā)展,而非單一的終點。
這也是為什么谷歌要制定我們接下來將要看到的6個發(fā)展階段。
AGI之路的6個階段由深度指標(即技能水平,與人類相比)和廣度指標(通用性)進行劃分。
第零階段為“No AI”,計算軟件、編譯器等屬于該范疇,在通用性上只能執(zhí)行human-in-the-loop任務。
第一階段為“涌現(xiàn)級”(Emerging),技能相當于或略比沒有相關技能的人類要強。
ChatGPT、Bard和Llama 2等大模型就屬于該階段,并且已經(jīng)滿足了該階段要達到的通用性。
第二階段可理解為“剛剛合格級”(Competent),可以達到正常成年人50%的水平。
像語音助手Sir、能在短文寫作/簡單編碼等任務中達到SOTA水平的大模型都屬于這一階段。
不過,它們都只是在技能指標上合格了,通用性還夠不上,也沒有其它能夠達到這一階段通用性水平的AI產(chǎn)品。
第三階段為“專家級”(Expert),可達到正常成年人90%的水平。
谷歌認為,拼寫和語法檢查器如Grammarly、圖像生成模型Imagen等可以劃為該階段,主要也是在技能水平上達標了,通用性還不夠。
第四階段為“大師級”(Virtuoso),可達到正常人類99%的水平。
深藍、AlphaGo等都屬于。同樣,還沒有哪個AI產(chǎn)品可以達到屬于這一級別的通用能力。
最后一階段為“超人級”(Superhuman),在技能指標上,已經(jīng)可以超越頂尖科學家的AlphaFold、AlphaZero也可劃入該階段。
毫無疑問,具備超人智能級通用性的AI還沒誕生。
從中我們看出,按照谷歌這個標準來看,大多數(shù)已有AI產(chǎn)品其實都分別進入了不同的AGI階段,但只僅限于在技能水平上——要談及通用性,目前只有ChatGPT等模型完全合格。
但它們也只還處于最底層的“一級AGI”階段。
不過,正如原則2所說,評價AGI就是要看這技能水平和通用性這兩個指標,這樣劃分也算說得過去。
值得一提的是,我們可以看到,像DALLE-2這樣的圖像生成模型已經(jīng)可以歸類于“三級AGI”。
谷歌給出的理由是,因為它生成的圖像已經(jīng)比大多數(shù)人都要強了(也就是超越90%人類)。
這一劃分并未考慮大多數(shù)用戶由于提示技巧不佳,無法達成最佳性能的情況。
因為遵循原則4,我們只需要關注一個系統(tǒng)的潛力到了就夠了。
另外,對于最終階段的AGI,谷歌暢想,它除了蛋白質結構預測,還可能能同時進行與動物交流、分析大腦信號、進行高質量預測等各種人類難以企及的任務,這樣才不枉費我們的期待。
最后,對于這個層級劃分,谷歌也承認還有很多事情要做:
比如在通用性維度上,應該用哪些標準任務集進行測量?完成多大比例的任務才行?有哪些任務是一定要滿足的?
這些問題一時都不大可能全部摸清。
你同意谷歌提出的這些原則和階段劃分嗎?
原文:
https://huggingface.co/papers/2311.02462
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術尤為引人注目。只需在特定軟件中輸入關鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領域,Stable Diffusion的顯卡繪圖性能備受關注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費無限制的AI視頻生成工具火了!國內無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
同學您好!