不管你是否身處 ICT 行業,這兩年有一個詞你肯定聽說過,那就是 DPU 。
作為一個全新興起的科技概念,DPU 正在以驚人的速度崛起,成為整個行業甚至整個社會的關注重點。尤其是投資領域,對 DPU 簡直是趨之如騖,將其視為未來顛覆行業的潛力技術。
究竟什麼是 DPU ?它和我們熟悉的 CPU 、 GPU 有什麼區別?
今天,小棗君就帶大家徹底搞明白 DPU 的來龍去脈。
█什麼是 DPU
DPU 的英文全稱叫做 Data Processing Unit ,也就是資料處理器。

英偉達執行長黃仁勳曾在演講中表示:「 DPU 將成為未來計算的三大支柱之一,未來的資料中心標配是‘ CPU + DPU + GPU ’。CPU 用於通用計算, GPU 用於加速計算, DPU 則進行資料處理。」
聽著有點暈, DPU 到底進行什麼樣的資料處理?有了 CPU 和 GPU ,為啥還要 DPU ?
眾所周知,自從計算機誕生以來,就是採用的著名的馮諾依曼架構。

馮諾依曼架構
這是一個以計算和儲存為核心的架構, CPU 作為處理器單元,負責完成各種算術和邏輯計算。而記憶體(運存)和硬碟(外部儲存),負責儲存資料,與 CPU 互動。
除了 CPU 、記憶體和硬碟之外,就是鍵盤、顯示器這樣的輸入和輸出設備。隨著時間的推移,後來,我們有了滑鼠,又有了顯示卡、網路卡。最終,形成了現在大家看到的電腦的基本構造。
有了顯示卡,就有了 GPU(Graphics Processing Unit),圖形處理器。大家都玩過遊戲,很明白,正是遊戲、 3D 設計等多媒體圖形軟體的高速發展,要處理的工作量越來越大,也越來越複雜, CPU 實在忙不過來,所以就有了專門進行圖像和圖形相關運算工作的 GPU ,分擔 CPU 的壓力。
DPU 的出現,道理也是一樣的。同樣是因為 CPU 難以負擔一些複雜的計算,所以需要進行任務分工。
█DPU 到底算些什麼
好了,終於到了關鍵點了。說了半天, DPU 到底分擔了 CPU 的哪些工作呢?
說實話,想要從技術上解釋 DPU 分擔的工作內容,稍微有點困難,不容易看懂。但是,我們可以從工作場景上進行解釋。
大致來看, DPU 分擔的工作可以歸納為四個關鍵詞,分別是虛擬化、網路、儲存以及安全。

特別需要提醒大家, DPU 是一個緊密圍繞資料中心的概念。也就是說,它主要用於資料中心這種大規模算力場景,而非我們每個人的桌上型電腦、膝上型電腦或手機(至少目前不是)。
DPU 服務於雲端運算,主要作用是提升資料中心等算力基礎設施的效率,減少能耗浪費,進而降低成本。
前面提到的虛擬化、網路、儲存以及安全,是資料中心非常重要的工作,也是大量消耗算力資源的工作。

以網路為例。
在資料中心裡,時時刻刻都有大量的資料在進行傳輸。主機在收發資料時,需要進行海量的⽹絡協議處理。根據傳統的計算架構,這些協議處理都是由 CPU 完成的。
有人統計過,想要線速處理 10G 的⽹絡,需要的⼤約4個 Xeon CPU 的核。也就是說,僅僅是進行⽹絡資料包的處理,就要佔用⼀個8核⾼端CPU⼀半的算⼒。現在資料中心網路不斷升級,從 10G 到 40G 、 100G ,甚至 400G ⾼速⽹絡,這些性能開銷如何承受?
這些開銷如此之大,以至於被稱為「 Datacenter Tax(資料中心稅)」。
業務程序尚未運行,僅是接入網路資料,就消耗了這麼多算力資源,這是無法忍受的。所以,就有公司提出了SmartNIC (智慧網路卡)的概念,將網路協議處理的工作從 CPU 「卸載」到網路卡上,以此分擔 CPU 的負載。
2015年,雲端運算廠商 AWS 率先開始探索這種 SmartNIC 模式。他們收購了晶片廠商 Annapurna Labs ,並於2017年正式推出 Nitro 系統。同年,阿里雲也官宣了有類似功能的神龍( X-Dragon )架構。
2019年3月,英偉達花費69億美元收購了以色列晶片公司 Mellanox 。英偉達將 Mellanox 的 ConnectX 系列高速網路卡技術與自己的已有技術相結合,於2020年正式推出了兩款 DPU 產品:BlueField-2 DPU 和 BlueField-2X DPU 。

從此, DPU 這個概念正式進入了公眾視野。2020年,也被稱為 DPU 元年。
正因為 DPU 和 SmartNIC 有這樣的淵源,所以,人們普遍將 DPU 視為 SmartNIC 的擴展升級版。
DPU 在 SmartNIC 的基礎上,將儲存、安全和虛擬化等工作負載也從 CPU 卸載到自己身上。
上世紀90年代末,以 VMWare 為代表的虛擬化技術剛剛出現的時候,完全是由軟體進行模擬線的,缺乏硬體的支持,所以,性能很差,幾乎難以使用。
後來,2005年,隨著技術的演進, CPU 和記憶體的硬體虛擬化問題逐漸解決,才讓虛擬化系統的性能有了大幅的提升,也激活了這項技術的發展前景和價值。眾所周知,我們現在的整個雲端運算架構,都是基於虛擬化技術發展起來的。
虛擬化技術發展的過程,是硬體能力不斷取代軟體能力的過程。前面我們提到 AWS 發佈 Nitro 系統。這個系統除了 SmartNIC 之外,也完成了 I/O 的硬體虛擬化。它還將虛擬化管理程序 Hypervisior 從 CPU 卸載到專用硬體上。這樣做帶來的結果就是,虛擬化技術的性能損耗趨近於零, CPU 的負擔進一步下降。
儲存也是如此。
現在資料中心對儲存讀取和寫入的速率要求很高。SSD 價格逐漸下降後,將 SSD 通過本地 PCIe 或高速網路與系統相連接,成為了一種主流的技術路線。針對分散式系統,在以往 InfiniBand 、 FC(Fiber Channel,光纖通道)、 Ethernet 的基礎上, RDMA(Remote Direct Memory Access,遠端直接資料存取)技術開始流行。

在 RDMA 模式中,應用程序的資料,不再經過 CPU 和複雜的作業系統,直接和網路卡通訊。這就意味著, DPU 可以承擔儲存相關的高速接口標準協議處理,進一步為 CPU 分擔壓力。
最後再看看安全。
在目前越來越嚴峻的安全形勢下,為了確保網路和系統的安全可靠,引入了大量的加密演算法。以往,這些演算法都是由 CPU 負責完成加密和解密的。
但事實上,網路接口才是最理想的隱私邊界。在網路接口上進行加密和解密,才是最合理的。所以,像國密標準的非對稱加密演算法 SM2 、哈希演算法 SM3 和對稱分組密碼演算法 SM4 等,其實都可以交給 DPU 進行計算。未來,區塊鏈技術成熟應用後,相關演算法也是可以從 CPU 卸載到 DPU 進行的。
綜上所述,大家應該也看明白了, DPU 的作用本質,就是卸載、加速和隔離——把 CPU 的部分工作卸載到自己身上;利用自己的算力特長,對這些工作進行加速運算;整個過程,實現了計算的隔離。
█DPU 的未來前景
DPU 是一個新型可程式設計多核處理器,是一塊 SoC(System On Chip)晶片。它符合行業標準,具有很高的算力,還具備高性能的網路接口,能高速解析、處理資料,並高效地將資料傳輸到 CPU 和 GPU 。
DPU 和 CPU 的最大不同,是 CPU 擅長通用性計算任務(什麼任務都能接,比較「雜」),而 DPU 更擅長基礎層應用任務(做特定的任務,比較「專注」),例如網路協議處理,交換路由計算,加密解密,資料壓縮等「髒活累活」。
所以說, DPU 是 CPU 的一個好幫手,將與 CPU 、 GPU 形成「鐵三角」,徹底顛覆資料中心的運算模式。

這就是為什麼 DPU 如今備受關注的原因。
正如本文開頭所說, DPU 目前的火爆程度,已經不能用詞語來形容。資本對於 DPU 的熱情,更是令人印象深刻。不管是巨頭還是初創公司,都紛紛入局 DPU 賽道。DPU 的市場仍在升溫,發展前景可期。
還是以英偉達為例。繼 BlueField-2 DPU 和 BlueField-2X 之後,2021年4月, NVIDIA 又發佈了新一代資料處理器—— BlueField-3 DPU 。

BlueField-3 DPU
這是首款為 AI 和加速計算而設計的 DPU ,針對多租戶、雲原生環境進行了最佳化,提供資料中心級的軟體定義和硬體加速的網路、儲存、安全和管理等服務。
據稱,一個 BlueField-3 DPU 所提供的資料中心服務,可相當於多達300個 x86 核才能實現的服務。這就釋放了大量的 CPU 資源,用於運行關鍵業務應用。
要想發揮 DPU 在現代資料中心的核心價值,離不開軟體的加持。換句話說,沒有軟體的晶片,只是昂貴的沙子。
為了構建更為強大的DPU生態,英偉達專門推出了給 BlueField DPU 量身打造的軟體開發平臺——NVIDIA DOCA。
DOCA 的全稱叫 Data Center Infrastructure On A Chip Architecture ,即「線上資料中心基礎設施體系結構」。藉助於 DOCA ,開發人員能夠利用行業標準的 API ,在 NVIDIA BlueField DPU 上快速創建網路,儲存,安全和管理服務,以及 AI/HPC 的一系列應用程序和服務。
在2022年5月, NVIDIA 發佈了 DOCA 1.3 。該版本不僅新增了121個 API 開發接口,還添加了最佳化資料流插入的 DOCA Flow 庫、通訊通道庫( Communication Channel )、正規表示式庫( Regular Expression )和基於 OVN 的資料路徑加密等功能,更添加了 HBN (基於主機的網路)等服務,深受開發者的歡迎。

DOCA 1.3的架構
近日, NVIDIA 又發佈了 DOCA 1.4 ,在不重啟主機的情況下支持DPU韌體升級,在 BlueField-2 DPU 25G & 100G w/BMC 產品上支持 32GB DDR 記憶體,新增對 AArch64 伺服器主機支持,以及基於最長前綴匹配( LPM )管道的路由功能。
藉助 DOCA 1.4 版本,開發者可以更靈活、更簡單、更快捷地在 BlueField DPU 上進行開發環境的搭載,從而迅速推出新產品。
大家隨時都可以註冊,成為 NVIDIA DOCA 開發者,參與到 DPU 的時代浪潮之中:

長按識別二維碼,即刻註冊成為NVIDIA DOCA 開發者,加速在DPU上的創新突破
█結語
根據預測,到2025年, DPU 全球市場容量預計將達到120億美金。
隨著摩爾定律逐漸進入瓶頸,為了更高效地利用算力資源,我們需要大力發展 DPU ,讓 CPU 、 GPU 、 DPU 進行合理分工,各自更加專注於自己擅長的工作。這樣,我們才能將資料中心的能效發揮到最大,為整個社會的數字化轉型提供強勁且綠色的動力。
最後,讓我們以一段精彩的 DPU 視訊作為文章的結束。DPU 到底能帶給我們怎樣的改變,讓我們拭目以待!
