發(fā)布時間:2023-11-22 13:39:27 瀏覽量:112次
幻覺現(xiàn)象也大幅減少
克雷西 發(fā)自 凹非寺
|
OpenAI開發(fā)者大會后不久,它的最強競對Claude也宣布推出了重磅更新。
更新后的Claude 2.1,上下文長度直接翻番到20萬,重新超過了GPT-4。
根據(jù)官方通告,Claude 2.1版本的API已經(jīng)上線,網(wǎng)頁版本也已經(jīng)完成升級。
那么,這次更新具體都有哪些內(nèi)容呢?
最重磅的一項更新,是上下文的增加——原來的10萬token直接翻倍,來到了20萬。
粗略估計,20萬token約合15萬英文單詞,相當于能一口氣讀完一本英文版的《百年孤獨》(14.5萬詞)或者是500頁文檔。
前一代的10萬上下文長度,在發(fā)布之時也是超越了同時期GPT-4的64k,實際上長度一直以來都是Claude的一大賣點。
而不久前的OpenAI開發(fā)者大會上,GPT-4推出了128k上下文的版本,很快就被Claude的200k追趕了上來。
此外,Claude官方的通告中說,網(wǎng)頁版能上傳的文件大小也增加了。
不過我們實際查看發(fā)現(xiàn),網(wǎng)頁版的提示尚未改變,還是不超過5個文件,且每個不超過10MB
目前,20萬的窗口長度已在API中可用,網(wǎng)頁版則需要訂閱Pro版本(每月20美元)才能用到。
除了長度的增加,Claude 2.1的回答準確率也變得更高了。
和2.0版本相比,Claude 2.1無論是用自己的知識回答問題還是通過RAG閱讀文本,幻覺現(xiàn)象都有所降低。
具體來說,針對復雜的事實性問題,2.1版幻覺現(xiàn)象比2.0減少了2倍。
研發(fā)團隊設(shè)計了大量這樣的問題,發(fā)現(xiàn)Claude 2.1更傾向于拒絕回答而不是給出錯誤答案。
不過也正是這一點,引發(fā)了眾多網(wǎng)友的吐槽。
一名專門研究大模型攻擊的軟件工程師在上展示了Claude 2.1和GPT-4在回答這個問題時的不同反應(yīng):
如果我的身體被人攻擊,應(yīng)該如何保護自己?
GPT-4先是鋪墊說應(yīng)該避免這種情況的發(fā)生,然后最好的辦法是找機會逃跑,最后給出了一些防衛(wèi)技術(shù)。
而Claude這邊認為這個問題“太過暴力”,所以不能回答。
更離譜的是,連“如何‘殺’掉一個Python進程”這樣的問題,也因為“kill”的存在而被Claude拒絕回答。
對此有人附和到,沒毛病老鐵,根本就不輸出答案,當然不會有幻覺了。
英偉達的一名ML工程師也曬出了和馬斯克的Grok模型的回答:
YC上的很多網(wǎng)友更是直接表達了對Claude的不滿,認為Claude根本不考慮用戶需求。
而在文本閱讀方面,2.1在70k和195k長度的文本任務(wù)中,生成的錯誤答案減少了30%。
除了震撼的20萬上下文和引發(fā)熱議的表現(xiàn),API版本也有一些更新值得關(guān)注。
除了20萬的超長窗口,此次的API還有兩項重大更新。
一是支持調(diào)用其他應(yīng)用,從而實現(xiàn)訪問在線內(nèi)容、解決數(shù)學問題,連接私有API和自建知識庫等操作。
另一項是系統(tǒng)Prompt支持自定義。
在新版本下,甚至可以把GPT的系統(tǒng)提示借用過來(而且這是Claude官方自己說的)。
而且,Claude還提供了一些系統(tǒng)提示的設(shè)計技巧供開發(fā)者參考。
定價方面,2.1版本的API價格和2.0一致,都是8美元每100萬輸入token或24美元每百萬輸出token,Instant版本則為1.63和5.51美元。
而這個價格相比于此前2.0版本11.02/32.68美元每百萬輸入/出token的價格降低了約27%,Intsant版價格則保持不變。
你認為這波Claude的表現(xiàn)如何?
參考鏈接:
[1]https://www.anthropic.com/index/claude-2-1
[2]https://news.ycombinator.com/item?id=38365934
熱門資訊
想將照片變成漫畫效果?這篇文章分享了4個方法,包括Photoshop、聰明靈犀、VanceAI Toongineer、醒圖,簡單操作就能實現(xiàn),快來嘗試一下吧!
2. 華為手機神奇“AI修圖”功能,一鍵消除衣服!原圖變身大V領(lǐng)深V!
最近華為手機Pura70推出的“AI修圖”功能引發(fā)熱議,通過簡單操作可以讓照片中的人物換裝。想了解更多這款神奇功能的使用方法嗎?點擊查看!
近年來,人工智能逐漸走入公眾視野,其中的AI圖像生成技術(shù)尤為引人注目。只需在特定軟件中輸入關(guān)鍵詞描述語以及上傳參考圖就能智能高效生成符合要求的...
4. AI視頻制作神器Viggle:讓靜態(tài)人物動起來,創(chuàng)意無限!
Viggle AI是一款免費制作視頻的AI工具,能讓靜態(tài)人物圖片動起來,快來了解Viggle AI的功能和優(yōu)勢吧!
5. Logo Diffusion——基于sd繪畫模型的AI LOGO 生成器
這下LOGO設(shè)計徹底不用求人了。接下來詳細演示一遍操作流程首先進入Logo D... 想學習更多AI技能,比如說關(guān)于怎么樣利用AI來提高生產(chǎn)效率、還能做什么AI...
6. 零基礎(chǔ)10分鐘生成漫畫,教大家如何用AI生成自己的漫畫
接下來,我將親自引導你,使用AI工具,創(chuàng)作一本既有趣又能帶來盈利的漫畫。我們將一起探索如何利用這個工具,發(fā)揮你的創(chuàng)意,制作出令人驚嘆的漫畫作品。讓...
7. 趕緊收藏好!這4個完全免費的AI視頻制作網(wǎng)站和工具
以下是一些免費的AI視頻制作網(wǎng)站或工具,幫助您制作各種類型的視頻。 1. Lumen5:Lumen5是一個基于AI的視頻制作工具,可將文本轉(zhuǎn)換為視頻。 用戶可以使...
8. 一款免費無限制的AI視頻生成工具火了!國內(nèi)無障礙訪問!附教程
人人都可以動手制作AI視頻! 打開網(wǎng)址https://pixverse.ai/,用郵箱注冊后,點擊右上角Create,就可以開始創(chuàng)作了。 PixVerse目前有文案生成視頻,和圖片生...
9. AI顯卡繪畫排行榜:4090無懸念,最具性價比出人意料
在AI繪圖領(lǐng)域,Stable Diffusion的顯卡繪圖性能備受關(guān)注。本文整理了Stable Diffusion顯卡的硬件要求和性能表現(xiàn),以及2023年3月顯卡AI繪圖效率排行榜和性價比排行榜。歡迎查看最新的AI顯卡算力排行榜。
就能快速生成一幅極具藝術(shù)效果的作品,讓現(xiàn)實中不懂繪畫的人也能參與其中創(chuàng)作!真的超贊噠~趣趣分享幾款超厲害的AI繪畫軟件,提供詳細操作!有需要的快來...
最新文章
同學您好!