Google 闢謠放棄 TensorFlow,它還活著

作者 | 蘇宓

不知道是不是之前「TensorFlow 將死」的謠言傳得過盛,Google 於日前緊急發佈了一篇標題為《Bringing Machine Learning to every developer’s toolbox》(將機器學習帶入每位開發者的工具箱)的公告,廣而告之,TensorFlow 沒有「死」,而且各種資料表明,其現如今發展地非常好,也是全球 300 萬軟體開發者最常用的 ML 工具。

與此同時,Google 也沒有放棄繼續開發 TensorFlow,未來它將與 JAX 同在。

被左右夾擊的 TensorFlow

TensorFlow,是 Google 在 2015 年開源的端到端機器學習平臺。其一經發布,業內如蘋果、Netflix、Stripe、騰訊、Uber、LinkedIn、Twitter、百度、Orange、LVMH 等公司常將它用來最佳化運營工作,同時也應用在深度神經網路的訓練和推理中。

隨著時間的迭代,TensorFlow 最強勁的競爭對手 PyTorch 在 2016 年出現了,它帶來了比 TensorFlow 更快的原型設計。此外,PyTorch 與 Python 生態系統的集成比 TensorFlow 更為緊密,調試體驗也簡單得多。

來源:The Gradient

來源:The Gradient

多年間,TensorFlow 與 PyTorch 的競爭可以說已經到了較為焦灼的狀態。

然而,當時間來到 2020 年,Google 的一個決策,給本就與 PyTorch 競爭稍顯被動局勢下的 TensorFlow 澆了一波涼水,其同屬於一個母公司 Alphabet 旗下的 DeepMind 對外表示,他們正在使用 JAX 來加速 AI/ML 研究。

根據 JAX 在 GitHub 上的官方介紹顯示:

JAX 是由 Google Brain 團隊推出的進行高性能機器學習研究的新框架,其前身是 Autograd 和 XLA 的結合體。

通過 Autograd 的更新版本,JAX 可以對 Python 程序與 NumPy 運算執行自動微分,且支持循環、分支、遞迴、閉包函數求導。另外,JAX 還可以使用 XLA 實現在 GPU 和 TPU 上編譯和運行 NumPy 程序。默認情況下,編譯按照系統調用被 JIT 編譯和執行。但是 JAX 也允許開發者使用一個單一函數的 API jit 將自己的 Python 函數編譯為 XLA 最佳化的核心。

現如今 JAX 發展的勢頭似乎比此前 TensorFlow 剛推出時更為迅猛。截至目前,其在 GitHub 上已獲得了 19k 個 Star。

因此,很難不讓眾人對 TensorFlow 未來去向擔心。

就連圖靈獎得主、CNN 之父 Yann LeCun 也曾評價道,「深度學習框架之間的激烈競爭進入了一個新階段。現在 Google 的 TensorFlow 已經輸給了 Meta 的 PyTorch,Google 內部也正在轉向 JAX。」

那麼,Google 是否真的用後起之秀 JAX 將眾人所熟知的 TensorFlow 取而代之?

TensorFlow 依然是開發者最常用的框架

就目前而言,Google 給出了確信以及肯定的答覆:不會

在最新的公告中,Google 用諸多的資料來說明 TensorFlow 的當前現狀。

正如此前Stack Overflow 開發者調查的資料結果顯示,TensorFlow 是開發者最常用的 ML 工具,被全球 300 萬的軟體開發者採用,以此增強他們的產品和解決方案。與此同時,TensorFlow 也是不少開發者在未來最想使用的框架,預期在不久的將來,TensorFlow 的使用者群體將會達到 400 萬。

最想要嘗試的框架和庫

最想要嘗試的框架和庫

TensorFlow 現在每月下載超過 1800 萬次,並在 GitHub 上積累了 166k 顆個 Star,這個資料在當前所有深度學習框架中也處於領先地位。

Google 稱,在其公司內部,TensorFlow 幾乎支持所有 AI 研發的工作流程,包括搜尋、廣告、YouTube、GMail、地圖、播放、照片等等。與此同時,每個月,Google Scholar 都會為超過 3,000 篇提及 TensorFlow 或 Keras 的新科學出版物編制索引,其中包括重要的應用科學,如 CANDLE(癌症分散式學習環境框架)對理解癌症的研究。

一種框架不足以走天下

對於為何要研發一種新的框架,Google 也做出解釋,「單一的通用框架不可能適用於所有情況——特別是,「現實的生產環境」和「頂端的科學研究」的需求經常發生衝突。

故而,其推出了一個用於分散式數值計算的極簡主義 API——JAX,來為下一個時代的科學計算研究提供動力。

簡單來看,TensorFlow 和 JAX 的受眾各有所傾向性,前者傾向於 ML 開發者群體,後者則主要面向研究人員。

Google 表示,「在這個新的多框架世界中,TensorFlow 是我們對應用 ML 開發人員需求的回應——在任何規模和任何平臺上,工程師需要構建和部署可靠、穩定、高性能的 ML 系統。我們的願景是創建一個有凝聚力的生態系統,研究人員和工程師可以利用協同工作的元件,無論它們起源於哪個框架。我們已經在 JAX 和 TensorFlow 互操作性方面取得了長足的進步,特別是通過 jax2tf。開發 JAX 模型的研究人員將能夠通過 TensorFlow 平臺的工具將它們投入生產。」

展望 TensorFlow 的未來,Google 進一步表明了態度,「我們打算繼續開發 TensorFlow,作為應用 ML 的一流平臺,與 JAX 並肩,推動 ML 的研究範圍。

我們將繼續投資這兩個 ML 框架,以推動數百萬使用者的研究和應用。」

國產深度學習框架衝破「壟斷」的機遇

TensorFlow 未曾放棄,PyTorch 依然引領,JAX 奮起直追,深度學習框架領域已然越來越熱鬧。而放眼國內,也有不少深度學習框架迅速崛起。

全球AI開源框架Star數4月、5月榜TOP2,來源:OSS Insight 資料

與此同時,MindSpore、OneFlow、MegEngine、Jittor 等框架也正在滲透各個領域的應用中。

對於這一趨勢,一流科技 OneFlow 創始人袁進輝不久前也在朋友圈評價道,「我原本也以為 Google 放棄了 Tensorflow,因為很久沒看到顯著的更新,不過最近看正在引入 dtensor,以及重構 runtime,這說明 TF 並沒有被放棄,應該是兩條腿走路的策略。最近看到,國內框架進步也很快,聚焦於創新和本土化策略,還是很有機會。」

不過,根據資料調研顯示,TensorFlow 與 PaddlePaddle 的 Star 數差距接近 10:1。同時,TensorFlow 與 PaddlePaddle 的 Commits 數量,中美差距近 3 倍。儘管從 AI 發展歷程上,國外具有一定的先發優勢,但開源框架 Star 數和 Commits 數的欠缺仍能反映出開源生態中存在的些許問題。

前瞻產業研究院報告指出, AI 的發展更偏向於應用層。對此,CSDN 創始人&董事長、極客幫創投創始合夥人蔣濤表示,「重應用,輕生態」的 AI 開源模式並非長久之計。「目前的開源生態尚且存在問題,甚至形成了一種「各自為政」的局面,這會導致內部消耗,增加使用者選擇成本,以及技術複用難度,阻礙整個行業的大規模發展。所以,開源生態建設對發展至關重要。」而這也是「彎道超車」的最佳突破口。

參考連結:

https://blog.tensorflow.org/2022/06/%20bringing-machine-learning-to-every-developers-toolbox.html?m=1

https://github.com/google/jax

相關文章

重磅!PyTorch 落地 Linux 基金會

重磅!PyTorch 落地 Linux 基金會

整理 | 蘇宓 近幾年間,隨著人工智慧的迅速普及與落地應用,相關基礎架構得到了很大的突破,如深度學習領域誕生了不少非常實用的平臺和框架,如 ...