價值1億美金時,Stable Diffusion背後的團隊開始互撕,誰才是真官方?

Stable Diffusion 到底是誰的 Stable Diffusion?

前幾天,一家 AI 公司融資的訊息吸引了不少人的目光。這家公司名叫 Stability AI,成立於 2020 年,在拿到本輪 1.01 億美元的融資之後成為新晉獨角獸,估值高達 10 億美元。

在很多媒體的報道中,這家公司還有一個特別的身份——Stable Diffusion 背後的公司,因為他們為近段時間大火的、可以在消費級 GPU 上快速生成高質量圖像的 Stable Diffusion 內容生成模型提供了算力支持。

Stable Diffusion 生成的高質量圖像。

在 Stability AI 的高調宣傳下,許多人以為這家公司就是 Stable Diffusion 的所有者,畢竟一個月前他們剛剛官宣發佈 Stable Diffusion,並引發業內極大的關注。

Stability AI 官方部落格發佈

Stability AI 官方部落格發佈

但其實,這個模型的技術來源是發表在 CVPR 2022 中的一篇論文《High-Resolution Image Synthesis with Latent Diffusion Models》,署名作者一共五位,分別來自慕尼黑大學、海德堡大學和 AI 視訊剪輯技術創業公司 Runway。

為了在此基礎上訓練出 Stable Diffusion,研究團隊動用了 4000 個 A100 Ezra-1 AI 超大集群,而 Stability AI 公司正是這些算力的提供者。

總之,你大體可以理解為:在 Stable Diffusion 的最出名的版本中,Stability AI 出錢搞定了 GPU,慕尼黑大學、海德堡大學、Runway 的研究團隊完成了研發。

至少在 GitHub 項目的描述中,Stability AI 和 Runway 的貢獻是「平等的」,不能說 Stability AI 就是 Stable Diffusion 的所有者。

當然,這一成果的誕生背後還有許多其他的支持力量,包括非營利組織 LAION 提供的資料集。Stable Diffusion 模型最初就是在 LAION-5B 的一個大子集上訓練的。LAION-5B 於今年 3 月發佈,而創建這一資料集的資助者是 Doodlebot、Hugging Face 和 Stability AI。

創業未半,爭端已起。當 Stable Diffusion 大火,最終成為價值 1 億美金的項目時,事情就開始變得富有戲劇性。

誰才是真正的官方?

事情還要從 Stable Diffusion 的新版本發佈說起。

今天,Runway 公司官宣發佈了 Stable Diffusion v1.5,同時還把模型權重放到了 Hugging Face 的平臺上。

這就讓一直以為 Stability AI 是 Stable Diffusion 所有者的網友看不懂了:「這是官方發佈嗎?我怎麼在 Stability AI 的官方渠道沒有看到任何公開聲明呢?」

隨後,整個開源社區圍觀了一場鬧劇

隨後,整個開源社區圍觀了一場鬧劇:

在 Hugging Face 平臺 Runway 發佈的 Stable Diffusion v1.5 版本帖子上,Hugging Face 技術長 Julien Chaumond 提示了一個法律問題:Stability AI 法務團隊要求 Hugging Face 刪除發佈的新版本 Stable Diffusion,且聲稱是侵犯知識版權。

在大家迷惑的時候,Runway 的 CEO、聯合創始人也下場解釋了,表示自家發佈 Stable Diffusion 1.5 版本是沒問題的,是對「他們」創造、發佈的原始研究的更新。此外,他再次強調了:這個研究的作者們來自 Runway ML 和慕尼黑大學,研究和程式碼去年也已經開源。

那篇 Stable Diffusion 論文的作者之一 Patrick Esser,身份是 Runway 的首席研究科學家。

在網友看來,他還陰陽怪氣了一波:「我們確定沒有違反任何智慧財產權問題,也感謝 Stability AI 為原始版本模型貢獻算力。」(ps. 難道是想說,後續版本不需要你們了?)

目前,這場鬧劇還沒有一個清晰的結果。

PyTorch 創始人 Soumith Chintala 也通過Twitter表明了自己的想法:「我一直以為 Stability AI 代表著人工智慧的去中心化,所以這一舉動讓我感到驚訝。」

Soumith Chintala 對 Stability AI 的這一印象可能來自該公司創始人兼 CEO Emad Mostaque 近期的一些表態,後者確實表明他們要推進 AI 模型的民主化,去做一些「更獨立的、更去中心化的事情」,讓 10 億人用上開源大模型。

也許真的就如人們所說,當開源工作變成了一個 1 億美元的項目時,創始團隊成員之間的「關係」就不再穩定了。

參考連結:

https://huggingface.co/runwayml/stable-diffusion-v1-5

相關文章

6G來了?全球6G研究發展綜述

6G來了?全球6G研究發展綜述

摘 要 隨著5G R16標準的完成以及商用規模的不斷擴大,針對下一代行動通訊即6G的研究也逐步開展起來,旨在為2030年的需求提供服務。儘管...

全球6G最新研究動態

全球6G最新研究動態

本文針對下一代行動通訊即6G系統,梳理了全球各大標準組織、地區及國家組織、高校研究機構的研究背景及相關進展,分析了目前潛在的無線側及網路側技...

福布斯:2022 區塊鏈 50 強榜單

福布斯:2022 區塊鏈 50 強榜單

區塊鏈已經走了很長一段路了!自 2019 年首次發佈區塊鏈 50 強以來,福布斯年度榜單上的十億美元級公司 (按銷售額或市值計算至少是十億美...

建設 Web3,現在最需要 Web2 的移民?

建設 Web3,現在最需要 Web2 的移民?

Web3 處在「大規模應用」爆發的前夜 從國際局勢,到新冠疫情,過去三年「新常態」的衝擊,讓外部環境充斥著不確定性,也令這個時代的人們處於前...

中國半導體企業的上半年縮影

中國半導體企業的上半年縮影

因為中美貿易和Covid-19的影響,在今年上半年,有很多分析機構對整個半導體產業的2020有了很悲觀的表現,來自ST和NXP等領先車載晶片...

TikTok 也開始「模仿」了?

TikTok 也開始「模仿」了?

「一直被模仿、從未被超越」的 TikTok,開始學起了更年輕的產品。 作者 | 魚三隹編輯| 鄭玄 「Join me on #TikTokN...