ChatGPT最強競品重磅升級,免費可用!第一手實測在此,網友:有個性

衡宇 克雷西 發自 凹非寺

在OpenAI祭出GPT-4的API和「最強外掛」程式碼直譯器後,競爭對手顯然坐不住了。

就在剛剛,Anthropic旗下Claude發佈第二代——沒錯,就是被外界評價為GPT-4最強競品的那一個。

淺劃一下這次更新動作的重點:

免費,不用排隊,自己用郵箱註冊即可登陸。

科技大佬們打起來真是妙啊,媽媽再也不用擔心ChatGPT/GPT-4將我拒之門外後,打工或寫作業時沒有AI用了!

英偉達AI高級科學家Jim Fan火速嚐鮮,並在Twitter上分享了自己的Claude2使用者體驗。

關於Jim Fan老師談到的Things you should know,量子位挑了些重點:

  • 免費使用

  • Claude2(100K 上下文)比GPT-4-4K便宜了4-5倍

  • 實際可以支持20萬token上下文,約15萬個單詞,輸入一本書不在話下;不過現在只開放了10萬token長度

  • 知識更新鮮,知識截止時間是2023年初,而GPT-4停在2021年9月;

  • 可以將多個文件匯入後,詢問文件之間概念的關係,支持txt、pdf多種格式(ChatPDF之類的應用,危

  • 程式碼、小學數學能力,比初代Claude有所進步。

國內AI博主海辛也在微博上驚訝連連

國內AI博主海辛也在微博上驚訝連連。

因為上傳自己的簡歷後,Claude2分析出了她的MBTI人格

除了他們,第一波衝進網頁體驗Claude2的網友們已經在激情分享了自己的體驗感:

不錯子,和GPT-4-32k比,Claude2的回答更個性化~

於是乎,量子位先衝了一波網頁對話,來看我們的人肉測驗——

咦,Claude更新了?註冊一個試試

首先奉上最有節目效果的弱智吧Benchmark,給讀者朋友們開開胃。

問的問題無外乎弱智吧的典中典,譬如「咖啡算不算豆漿」「資料線可不可以暫存資料」之類的。

看到Claude2一本正經地回答弱智吧問題,就會發現AI還是太單純了,看不出人類的小心機。

不過正經地看,這些回答倒也沒毛病。

上面的兩個問題算Claude2順利過關,那麼如果提問一些更無厘頭的問題呢?

問,玉皇大帝到底住在九重天的哪一層?

答,從立足點來看,玉皇大帝所在的天庭,應該處於平流層,因為「這更符合天庭聖潔的定位」。

當然,沒有人能評判這個回答到底對還是錯,但至少Claude2的這一通分析,還算有理有據。

開胃小菜就展示到這裡,下面上正餐!

開胃小菜就展示到這裡,下面上正餐!

長文件是本次更新的一大亮點,這一點已經被Twitter網友們驚呼鵝妹子嚶了。

比如上傳兩個pdf,可以看到,Claude2可以從兩個pdf文件中做出摘要,這兩個文件一個關於「語言流變模式」,一個關於「對稱性」,並且將文件內容分點列在對話方塊中:

此前,量子位就出過讓初代Cladue-100k版本在20秒速通92頁論文的攻略《白嫖GPT-4最強競品!》。

不只是較大的文件,根據Claude2開放的10萬token的上下文來看,一次性上傳一本書讓它讀,也是小菜一碟。

對普通使用者來說,現在不僅能夠上傳長文件,還可以用上傳的檔案構建自己的知識庫,對Claude翻閱文件後進行回答,真的是非常實用。

以至於內心出現一個疑問,會不會在ChatGPT攤薄Jasper、Notion等公司的蛋糕後,Claude也要對ChatPDF類工具下手了?

最後,我們為大家奉上今天的餐後甜點:讓Claude2來寫個程序試試

為了考驗Claude設計演算法的能力,我們選擇了一種古典密碼,讓它試著寫個解密程序出來。

這種密碼叫做維吉尼亞密碼,可以理解成二維的凱撒(位移)密碼,其中包括金鑰。

舉個例子說明一下它的演算法

舉個例子說明一下它的演算法:

假如明文是B,金鑰是C,B是字母表中第二個,那麼從C開始數的第二個字母D就是密文。

如果數到了Z,就重新從A開始接著數,金鑰長度不足時則進行循環。

解密自然就是把加密過程倒過來。

Claude輸出了這樣的程式碼(C++,下同):

#include #include using namespace std;string decryptVigenere(string ciphertext, string keyword) {string plaintext;int keywordIndex = 0;for (int i = 0; i < ciphertext.length(); i++) {int p = (ciphertext[i] - 'A') - (keyword[keywordIndex] - 'A');p = (p + 26) % 26;plaintext += (char)(p + 'A');keywordIndex = (keywordIndex + 1) % keyword.length();}return plaintext;}int main() {string ciphertext;cout << "請輸入密文:";cin >> ciphertext;string keyword;cout << "請輸入金鑰:";cin >> keyword;string plaintext = decryptVigenere(ciphertext, keyword);cout << "明文是:" << plaintext << endl;return 0;}

我們把「CHATGPT」用金鑰「CLAUDE」進行了加密,密文是「ESANJTV」,並嘗試用Claude給出的程序解密。

一次就成功了,看來Claude的程式碼能力的確沒讓我們失望。

這個問題可能有些簡單,我們再加大難度試試。

我們試著從LeetCode中找了一道中等難度的問題,人類解這道題的通過率大概是60%。

給定一個長度為n的整數陣列 height 。有 n 條豎直的線,第 i 條線的兩個端點是 (i, 0) 和 (i, height[i]) 。找出其中的兩條線,使得它們與 x 軸共同構成的容器可以容納最多的水(容器不能傾斜)。返回容器可以儲存的最大水量。

這樣說可能不那麼容易想象,下面的這張圖或許更加直觀:

原題中給出的示例一共有9條線,高度分別為「1,8,6,2,5,4,8,3,7」,相應的最大水量是49。

我們給Claude2的Promot是醬嬸兒的:

寫一個C++程序解決這個問題,不要自己設定初始值,讓使用者輸入:(接上面的問題)

Claude2給出了這樣的答案:

#include #include using namespace std;int maxArea(vector& height) {int max_area = 0;int n = height.size();for (int i = 0; i < n; i++) {for (int j = i + 1; j < n; j++) {int width = j - i;int h = min(height[i], height[j]);max_area = max(max_area, width * h);}}return max_area;}int main() {vector height;int input;cout << "請輸入一系列整數:" << endl;while(cin >> input) {height.push_back(input);}cout << "最大面積為: " << maxArea(height) << endl;return 0;}}

我們沒讓Claude2專門調整輸入和輸出格式,所以沒有提交給LeetCode,而是直接運行的。

用的資料也是上面提到的,結果表明,Claude2給出的程式碼至少在核心演算法上是正確的。

(下圖輸入中的a是告訴CPU這一系列整數輸入完了,可以替換成任意非數字字符)

看來這個問題也沒能難倒Claude2

看來這個問題也沒能難倒Claude2。

除了程式碼,Claude2據稱還擁有小學級別的數學水平。

那就順便用經典的雞兔同籠問題考一考它(這道題是ChatGPT出的):

反覆嘗試了很多次,雖然方程式列得沒有問題,但Claude2解出的答案都是20(正確答案應該是40)。

看來計算這種事,對Claude2來說還是有點困難。

有關這次更新的更多資訊,可以看下Anthropic的宣傳片:

與OpenAI「撕」出來的AI公司

見識過Claude2的表現後,那就不得不提一下背後的公司Anthropic,畢竟真的有點意思。

Anthropic自稱是一家AI安全公司,且具有公益性(PBC)。

眼下,它和OpenAI同樣將重心放在生成式AI上。1月份,公司在市場上已經有50億美元估值。

Anthropic由OpenAI前研究副總裁Dario Amodei帶領10名員工創業,於2021年成立。

這裡面既有

這裡面既有GPT-3首席工程師Tom Brown,也有OpenAI安全和政策副總裁Daniela Amodei(Dario的姐姐),可以說是帶走了相當一批核心人才。

出走成立新公司的原因之一,自然是對OpenAI現狀並不滿意。

從前幾年開始,微軟頻頻給OpenAI注資,隨後又要求他們使用Azure超算來搞研究,而且將技術授權給微軟,甚至為微軟自己的投資活動籌集資金。

這與OpenAI創立的初衷相悖,一批員工便想到了離職創業。

當然,還有一部分原因是這群人想做能控制、可解釋的AI,說白了就是先搞明白AI模型背後的原理,從而在提供工具的同時設計更多可解釋的AI模型。

於是,在OpenAI徹底變成「微軟攬錢機器」後,他們便從這家公司離開,創辦了Anthropic。

現如今,微軟真的和OpenAI有了「深度綁定」的味道。

然而既狗血又八卦味十足的事情是,今年2月,GoogleCEO劈柴哥重磅宣佈,斥資3億美元,投的就是Anthropic。

之所以被外界抱以厚望,稱呼Claude2為GPT-4最強競品,不僅僅是因為Claude實測下來體驗確實位於第一梯隊,還因為背後實力強大的「爸爸們」:

今年5月,該公司表示籌集了4.5億美元,使Anthropic籌集的資金總額超過10億美元

在Google入股之前,Anthropic就已經獲得了多位大佬的投資,如Skype創始人Jaan Tallinn,Facebook聯創Dustin Moskovitz,Google前CEO、現技術顧問Eric Schmidt等人。

現在,合作伙伴列表裡除了Zoom和Notion.AI,還多了Jasper.AI的名字。

不僅如此,公司

不僅如此,公司核心技術Constitution AI也備受矚目。

它主要圍繞「語言模型如何決定它將涉及哪些問題以及它認為哪些問題不合適?為什麼它會鼓勵一些行動而阻止另一些行動?語言模型可能具有哪些價值?」展開。

為了解決上述問題,它讓AI儘可能遵循很多原則。

原則條目有很多,包括聯合國宣言、Anthropic從研究中自己發現的原則,DeepMind在Sparrow研究中提出的原則,甚至還借鑑了蘋果的服務條款。

並且是通過AI反饋的方式,來評估輸出,應對目前AI的缺點。具體體現在AI訓練過程中,分為兩個階段:

第一階段,模型被訓練使用一套原則和一些過程的例子,來評估和修改自己的反應;

第二階段,模型通過強化學習進行訓練,使用基於原則集的AI生成的反饋來選擇和輸出更無害的內容。

這一點與ChatGPT的的殺手鐧RLHF(人類反饋強化學習)大相徑庭,而Anthropic給出的解釋是:

基於Constitution AI的強化學習,比從RLHF中強化學習得出的生成內容,更有用,且更無害。

並且,還更容易規模化。

在這套Constitution AI,迭代到2.0的Claude,確實在匯入檔案、上下文窗口理解等功能方面,比GPT-4更引人注目。

不過也不是完美的,比如GRE考試成績上,Claude2就5局3敗,輸給了GPT-4。

但不可否認,巨佬們在AI方面你追我趕的局面,讓本普通使用者切切實實感受了一波漁翁得利的快樂,嘻嘻嘻(狗頭)。

速來自己肉測:

http://claude.ai

聯繫作者

相關文章

馬斯克機器人炫技引千萬網友圍觀!

馬斯克機器人炫技引千萬網友圍觀!

夢晨 克雷西 發自 凹非寺 特斯拉機器人,開始幹家務了。 馬斯克通過最新視訊,晒起特斯拉擎天柱機器人疊衣服,引發大量網友圍觀。 現在機器人疊...