Stable Diffusion 到底是誰的 Stable Diffusion?
前幾天,一家 AI 公司融資的訊息吸引了不少人的目光。這家公司名叫 Stability AI,成立於 2020 年,在拿到本輪 1.01 億美元的融資之後成為新晉獨角獸,估值高達 10 億美元。
在很多媒體的報道中,這家公司還有一個特別的身份——Stable Diffusion 背後的公司,因為他們為近段時間大火的、可以在消費級 GPU 上快速生成高質量圖像的 Stable Diffusion 內容生成模型提供了算力支持。

Stable Diffusion 生成的高質量圖像。
在 Stability AI 的高調宣傳下,許多人以為這家公司就是 Stable Diffusion 的所有者,畢竟一個月前他們剛剛官宣發佈 Stable Diffusion,並引發業內極大的關注。

Stability AI 官方部落格發佈
但其實,這個模型的技術來源是發表在 CVPR 2022 中的一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分別來自慕尼黑大學、海德堡大學和 AI 視訊剪輯技術創業公司 Runway。

為了在此基礎上訓練出 Stable Diffusion,研究團隊動用了 4000 個 A100 Ezra-1 AI 超大集群,而 Stability AI 公司正是這些算力的提供者。
總之,你大體可以理解為:在 Stable Diffusion 的最出名的版本中,Stability AI 出錢搞定了 GPU,慕尼黑大學、海德堡大學、Runway 的研究團隊完成了研發。
至少在 GitHub 項目的描述中,Stability AI 和 Runway 的貢獻是「平等的」,不能說 Stability AI 就是 Stable Diffusion 的所有者。

當然,這一成果的誕生背後還有許多其他的支持力量,包括非營利組織 LAION 提供的資料集。Stable Diffusion 模型最初就是在 LAION-5B 的一個大子集上訓練的。LAION-5B 於今年 3 月發佈,而創建這一資料集的資助者是 Doodlebot、Hugging Face 和 Stability AI。
創業未半,爭端已起。當 Stable Diffusion 大火,最終成為價值 1 億美金的項目時,事情就開始變得富有戲劇性。
誰才是真正的官方?
事情還要從 Stable Diffusion 的新版本發佈說起。
今天,Runway 公司官宣發佈了 Stable Diffusion v1.5,同時還把模型權重放到了 Hugging Face 的平臺上。

這就讓一直以為 Stability AI 是 Stable Diffusion 所有者的網友看不懂了:「這是官方發佈嗎?我怎麼在 Stability AI 的官方渠道沒有看到任何公開聲明呢?」

隨後,整個開源社區圍觀了一場鬧劇:
在 Hugging Face 平臺 Runway 發佈的 Stable Diffusion v1.5 版本帖子上,Hugging Face 技術長 Julien Chaumond 提示了一個法律問題:Stability AI 法務團隊要求 Hugging Face 刪除發佈的新版本 Stable Diffusion,且聲稱是侵犯知識版權。

在大家迷惑的時候,Runway 的 CEO、聯合創始人也下場解釋了,表示自家發佈 Stable Diffusion 1.5 版本是沒問題的,是對「他們」創造、發佈的原始研究的更新。此外,他再次強調了:這個研究的作者們來自 Runway ML 和慕尼黑大學,研究和程式碼去年也已經開源。

那篇 Stable Diffusion 論文的作者之一 Patrick Esser,身份是 Runway 的首席研究科學家。

在網友看來,他還陰陽怪氣了一波:「我們確定沒有違反任何智慧財產權問題,也感謝 Stability AI 為原始版本模型貢獻算力。」(ps. 難道是想說,後續版本不需要你們了?)
目前,這場鬧劇還沒有一個清晰的結果。
PyTorch 創始人 Soumith Chintala 也通過Twitter表明了自己的想法:「我一直以為 Stability AI 代表著人工智慧的去中心化,所以這一舉動讓我感到驚訝。」

Soumith Chintala 對 Stability AI 的這一印象可能來自該公司創始人兼 CEO Emad Mostaque 近期的一些表態,後者確實表明他們要推進 AI 模型的民主化,去做一些「更獨立的、更去中心化的事情」,讓 10 億人用上開源大模型。
也許真的就如人們所說,當開源工作變成了一個 1 億美元的項目時,創始團隊成員之間的「關係」就不再穩定了。
參考連結:
https://huggingface.co/runwayml/stable-diffusion-v1-5