發(fā)布時(shí)間:2023-11-28 14:54:58 瀏覽量:99次
近日,中文通用大模型綜合性評(píng)測(cè)基準(zhǔn)SuperCLUE發(fā)布9月總排行榜和各個(gè)分類任務(wù)榜單,商湯商量SenseChat 3.0 位列中文大模型總榜排名第一。
近日,中文通用大模型綜合性評(píng)測(cè)基準(zhǔn)SuperCLUE發(fā)布9月總排行榜和各個(gè)分類任務(wù)榜單,商湯商量SenseChat 3.0 位列中文大模型總榜排名第一。在新增的AI Agent(AI智能體)子榜中,SenseChat 3.0 同樣排名第一,領(lǐng)先所有國(guó)內(nèi)中文大模型以及GPT-3.5 和 Claude 2,表現(xiàn)僅次于GPT-4,展示了商湯在大模型領(lǐng)域創(chuàng)新發(fā)展及釋放生產(chǎn)力的優(yōu)勢(shì),以及在探索AGI道路上的積累與潛力。
注:國(guó)外代表性模型(GPT4.0/Claude2/gpt-3.5)不參與排名。
SuperCLUE是中文通用大模型的綜合性評(píng)測(cè)基準(zhǔn),旨在對(duì)大模型在各個(gè)能力維度上的表現(xiàn)進(jìn)行全方位的評(píng)估,是國(guó)內(nèi)最具專業(yè)性和代表性的中文大模型評(píng)測(cè)基準(zhǔn)之一。此次評(píng)測(cè)選取了目前國(guó)內(nèi)外最具代表性的20個(gè)通用大語(yǔ)言模型。
商量總榜第一,客觀題成績(jī)超GPT-3.5
9月最新發(fā)布的SuperCLUE總排行榜和各個(gè)分類任務(wù)榜單,主要聚焦于大模型的四個(gè)能力象限,語(yǔ)言理解與生成,包括語(yǔ)言理解與抽取、上下文對(duì)、生成與創(chuàng)作、角色扮演;專業(yè)技能與知識(shí),包括知識(shí)與百科、計(jì)算、代碼、邏輯與推理;Agent智能體,包括工具使用、任務(wù)規(guī)劃;安全性,包括系統(tǒng)安全、指令攻擊,總共12項(xiàng)基礎(chǔ)能力。
在總排行榜中,商湯科技商量SenseChat 3.0以總分62.75分位列第一,其中在OPT客觀題部分,商湯SenseChat 3.0得分還超過(guò)了GPT-3.5,展示了在中文大模型方面極強(qiáng)的綜合競(jìng)爭(zhēng)力。
商湯商量SenseChat于2023年4月正式推出,是國(guó)內(nèi)最早的基于千億參數(shù)大語(yǔ)言模型之一,并不斷迭代更新。其背后依托的是商湯AI大裝置SenseCore,目前上線GPU數(shù)量約30,000塊,算力規(guī)模提升至6 ExaFLOPS,有效支持語(yǔ)言大模型的訓(xùn)練、升級(jí)迭代和服務(wù)。
推動(dòng)AI智能體發(fā)展,加速邁向AGI
隨著大模型發(fā)展,“聊天”已遠(yuǎn)遠(yuǎn)不能滿足人們的要求,能夠準(zhǔn)確使用工具成為解放大模型生產(chǎn)力的關(guān)鍵。SuperCLUE新增的AI Agent(AI智能體)子榜,是業(yè)界首個(gè)AI Agent榜單,它重點(diǎn)評(píng)估了AI Agent在“工具使用”和“任務(wù)規(guī)劃”兩個(gè)關(guān)鍵能力上的表現(xiàn)。評(píng)測(cè)顯示商湯商量SenseChat 3.0具備作為人類超級(jí)助手的潛力,可以根據(jù)人類需求自主完成任務(wù),進(jìn)而充分釋放大模型的生產(chǎn)力,使其在 AI Agent 榜單上表現(xiàn)僅次于GPT-4,全面領(lǐng)先其余參評(píng)大模型。
目前全球領(lǐng)先的AI 智能體,幾乎都以領(lǐng)先大模型GPT-4為核心驅(qū)動(dòng),它們借助強(qiáng)大的工具使用能力等,可將復(fù)雜問(wèn)題拆解成可實(shí)現(xiàn)的子任務(wù)、類人的自然語(yǔ)言交互等能力。商量SenseChat 3.0作為領(lǐng)先的中文大模型,通過(guò)使用代碼解釋器、API調(diào)用和搜索三類常用工具來(lái)解決復(fù)雜任務(wù),靈活搭建AI智能體應(yīng)用,支撐企業(yè)的生產(chǎn)力革新。
目前,商量SenseChat已經(jīng)在金融、手機(jī)、醫(yī)療、汽車、地產(chǎn)、能源、傳媒、工業(yè)制造等眾多垂直行業(yè)與超過(guò)500家客戶建立了深度合作。作為具備強(qiáng)大工具使用能力的大模型,商量SenseChat的持續(xù)快速提升,為商湯發(fā)展更強(qiáng)大的、能夠像人類一樣進(jìn)行交互的AI智能體,以及面向AGI道路的探索,都將提供重要的基礎(chǔ)和支撐。
熱門資訊
1. 照片變漫畫效果,這4個(gè)方法操作簡(jiǎn)單有效,快來(lái)試試吧!
想將照片變成漫畫效果?這篇文章分享了4個(gè)方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡(jiǎn)單操作就能實(shí)現(xiàn),快來(lái)嘗試一下吧!
2. 華為手機(jī)神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機(jī)Pura70推出的“AI修圖”功能引發(fā)熱議,通過(guò)簡(jiǎn)單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點(diǎn)擊查看!
3. 四款值得推薦的AI以圖生圖軟件,有需要的趕緊來(lái)試試!
近年來(lái),人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語(yǔ)以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動(dòng)起來(lái),創(chuàng)意無(wú)限!
Viggle AI是一款免費(fèi)制作視頻的AI工具,能讓靜態(tài)人物圖片動(dòng)起來(lái),快來(lái)了解Viggle AI的功能和優(yōu)勢(shì)吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計(jì)徹底不用求人了。接下來(lái)詳細(xì)演示一遍操作流程首先進(jìn)入Logo D... 想學(xué)習(xí)更多AI技能,比如說(shuō)關(guān)于怎么樣利用AI來(lái)提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來(lái),我將親自引導(dǎo)你,使用AI工具,創(chuàng)作一本既有趣又能帶來(lái)盈利的漫畫。我們將一起探索如何利用這個(gè)工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個(gè)完全免費(fèi)的AI視頻制作網(wǎng)站和工具
以下是一些免費(fèi)的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個(gè)基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. AI顯卡繪畫排行榜:4090無(wú)懸念,最具性價(jià)比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價(jià)比排行榜。歡迎查看最新的AI顯卡算力排行榜。
9. 一款免費(fèi)無(wú)限制的AI視頻生成工具火了!國(guó)內(nèi)無(wú)障礙訪問(wèn)!附教程
人人都可以動(dòng)手制作AI視頻! 打開(kāi)網(wǎng)址https://pixverse.ai/,用郵箱注冊(cè)后,點(diǎn)擊右上角Create,就可以開(kāi)始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實(shí)中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細(xì)操作!有需要的快來(lái)...
最新文章
同學(xué)您好!