
大模型的技術能力,和它影響世界的能力,都在光速進化。
作者 | Founder Park
真是瘋狂的一週。
GPT-4、Microsoft 365 Copilot、Midjourney V5、Google PaLM API、文心一言,一顆顆 AI 大模型領域的重磅炸彈,扎堆在這周引爆。
GPT 開啟了大模型的多模態應用,微軟說讓工具迴歸工具,Midjourney 解決了 AI 作畫的手指問題,學術界與開源勢力也不甘落後,中國網際網路公司總算有了第一個大模型產品……
像創世紀一樣,日新月異。
我們從沒有像今天這樣,好奇兩個月後的世界會變得如何。
但我們首先要做的,是記住這不尋常的一週。
注:封面圖片由 DreamStudio 生成,prompt:god。產品發佈時間以為準。
週一
暴風雨前的平靜。

圖片由 DreamStudio 生成
週二
低門檻:史丹佛大學發佈 Alpaca7B
成本降到超低,性能匹敵 GPT-3.5
史丹佛大學推出了由 Meta 的 LLaMA 7B 微調而來的全新模型 Alpaca。僅用 52k 資料,性能約等於 GPT-3.5。關鍵是訓練成本奇低,不到 600 美元,評估效果與 GPT-3.5 相當。
這意味著人們可以以更低的成本獲得與 GPT-3.5 相當的性能。
低門檻:清華髮布 ChatGLM-6B
消費級顯示卡就能部署,準確度接近 GPT-3 175B (davinci)

下面是 ChatGLM 的自我介紹:
由清華技術成果轉化的公司智譜 AI 開源了 GLM 系列模型的新成員——中英雙語對話模型 ChatGLM-6B,支持在單張消費級顯示卡上進行推理使用。雖然依然會有和 ChatGPT 一樣的事實錯誤、胡說八道的問題,但作為開源模型,ChatGLM-6B 可以在消費級顯示卡上部署使用。
週三
OpenAI:GPT-4 來了!
人類歷史上最慌的一天

我們之前的文章裡有更詳細的資訊:GPT-4 發佈後的 20 個小時
一個可能不太恰當的類比,在擁有了多模態能力後,GPT-4 的發佈可能就是大模型產業的 iPhone 4 時刻。
能夠與人類正常對話,又能夠看懂圖片,輸出和推理能力更強大,你應該擔心的不是會不會被取代,而是如何更快學會使用它。
高素質:Anthropic 發佈 Claude
在適當的時候,學會沉默
由前 OpenAI 研究副總裁 Dario Amodei 創立,Google投資的人工智慧公司 Anthropic 宣佈聊天機器人 Claude 開放公測。它具有 ChatGPT 的對話推理能力,同時又可以像 New Bing 一樣調整 AI 的語氣、個性和行為。
Anthropic 聲稱 Claude 不太容易產生有害的輸出,因為它使用的是「以人為本」的語言建模方法,並根據語言的「深層結構」來構建模型。當被問及超出其知識領域的話題時,Claude 會推遲迴答,降低產生虛假資訊的風險。
Google:PaLM API 開放以及更多
AI 屆汪峰:明明週三是我先來的

Google在 3 月 14 日晚間開放了其大語言模型 API——PaLM API。開發人員可以通過 API 訪問Google的基礎模型,並可以使用開箱即用的模板,在幾分鐘或幾小時內啟動生成式應用程序的創建。Google還推出了 MakerSuite 工具和 Generative AI App Builder 平臺等人工智慧企業工具。
PaLM API 的另一應用場景是 Gmail 和 Google Docs。使用者只需鍵入您想要寫的主題,即可立即生成草稿。MakerSuite 工具是簡化開發人員在模型流程製作、迭代等領域的工具。MakerSuite 可以簡化此工作流程,讓使用者將能夠根據 prompt 進行迭代,使用合成資料擴充資料集,並輕鬆調整自定義模型。當你準備好程式設計時,MakerSuite 允許將 prompt 匯出為你最喜歡的語言和框架(如 Python 和 Node.js)的程式碼。
然而,同一天更晚的時間,OpenAI 推出了多模態的 GPT4,引起了科技圈轟動。
Google 一度是網際網路公司在 AI 領域的半壁江山,但在這瘋狂的一週裡,它的發佈卻沒有引起預期中的關注(Twitter互動數與 OpenAI 相差 20 倍)。
週四
訓練速度:Pytorch 2.0 正式版發佈
一行程式碼,訓練模型 2 倍速!
PyTorch 是一個開源的 Python 機器學習庫,用於構建和訓練深度學習模型,比如各類 GPT 預訓練語言模型,目前 TensorFlow、PyTorch 是國際兩大主流深度學習框架,不少產品都在利用 PyTorch 培訓大模型,比如 Salesforce。
2.0 相比 1.0 編譯時間縮短 43%,簡單來說,人類製造 AI 大模型的速度更快了。
圖像生成:Midjourney V5 發佈
AI 畫不好手指?那是上週的事。

這是最新發布的 Midjourney V5 生產的作品。大概用到的提示詞是:一位在越南街頭市場賣河粉的婦女的街頭風格照片, 日落, 使用 fujifilm –ar 16:9 –v 5 拍攝。
注意看,一直被詬病的「AI 不會畫手指」的問題,被解決了。
不是每個人都能成為攝影家,但未來每個人都能利用 AI 生成這樣一張高質量的圖片。
大規模應用:Microsoft 365 Copilot
48 歲的巨頭靠 AI 再次走上巔峰!

微軟王炸發佈Microsoft 365 Copilot,一夜之間在中外網際網路上刷屏。
Copilot 應用了最新的 GPT-4 技術,能夠幫助使用者在 Word、Excel、PowerPoint、Outlook 和 Teams 等軟體中進行寫作、編輯、總結、創作、簡報等工作。
Copilot 在 Microsoft 365 界面中和其他應用程序並排出現在側邊欄,使用者可以通過聊天對話,讓 Copilot 幫助進行工作生產。微軟計劃將這些產品接入 GPT-4,以提高人工智慧軟體的開發速度和質量。微軟正在與 20 位客戶一起測試 Microsoft 365 Copilot,並將在未來幾個月內擴展預覽版。此外,微軟正在開發在客戶資料上訓練這些模型,而不會洩露給其他客戶或落入不良行為者手中。
「Word,你是個成熟的軟體了,該學會自己碼字了。」
微軟:「在做… 不對,做好了。」
中文大模型:百度發佈文心一言
沒見過這麼緊張的 Robin

在文心一言發佈會上,百度董事長李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。此外,百度智慧雲即將面向企業客戶開放文心一言 API 接口調用服務。
在股價和梗圖之外,有個事實是:
文心一言是目前 AI 商業化產品浪潮中唯一的中國網際網路大廠代表。
也許最著急的是 Robin。
週五
提示詞:Stable Diffusion Reimagine
人人都是 prompt 工程師的時代,還沒開始就結束了

在 Stability.AI 宣佈收購圖片工具 Clipdrop 開發商的短短一週後,它發佈了新工具 Stable Diffusion Reimagine。SDR 允許使用者無限制地生成單個圖像的多種變體。使用者只需將圖像上傳到演算法中,就可以創建他們想要的儘可能多的變體,而不需要複雜的 prompt。這個工具基於 Stability.AI 創建的一種新演算法。
最後,你當然會猜到,這篇文章大部分是使用 AI 工具生成的,可你又怎麼會在意呢?

Is there anything else you would like to know?
*頭圖來源:DreamStudio