雲端運算風向標:自研晶片重構雲上算力

預言未來最好的方法,就是去實現它

預言未來最好的方法,就是去實現它。

作者 | 北方編輯| 鄭玄

2017 年,網易遊戲《荒野行動》出海日本。2018 年,這款遊戲在日本手遊年度收入榜排名第四,為網易帶來約 25 億元收入。

這個遊戲出海成功案例的背後,是穩定、響應快、能快速擴展的計算基礎設施。在國內,網易往往自己建設計算基礎設施;而在海外,則採用混合雲。通過亞馬遜雲科技提供的基礎服務,網易搭建了一個可以快速擴展的雲基礎架構,滿足了海外遊戲業務快速增長的要求。

同年,亞馬遜雲科技推出第三代自研的 Nitro 系統,可支持最多 8 個彈性網路卡,將網路負載均衡分佈到 8 個 CPU 核心上,計算資源的總利用率提升了一倍。使《荒野行動》雲端運算成本降低了四成;而通過使用 Amazon EC2 A1 實例,音訊語音服務和網路轉發服務的雲端運算成本節省了一半。降低成本,提升效率,這是雲端運算的意義所在,而這還只是開始。

01

再次突破雲技術邊界

在 2018 年,亞馬遜雲科技發佈了 Arm 架構的 Amazon Graviton 處理器。這是亞馬遜雲科技自研、為雲端運算而設計開發的晶片。2020 年 Graviton2 發佈,性能比第一代提升了 7 倍;2021 年推出了第三代,性能比二代提升四分之一,浮點計算性能提高了兩倍。

Epic Games 的高級工程總監 Mark Imbriaco 說:「基於 Amazon Graviton3 的 EC2 C7g 實例適用於最苛刻的延遲敏感型工作負載,同時能提供顯著的價效比優勢,並擴展了《堡壘之夜》內的可能性和任何虛幻引擎營造的體驗。」F1 賽車管理公司發現,C7g 實例比 Graviton2 C6gn 實例快 40%;Twitter 認為基於 C7g 實例的性能比基於 Graviton2 的 C6g 實例高出 20-80%,同時還將尾延遲減少了 35%。

今年,正在拉斯維加斯召開的 re:Invent 2022 大會上,亞馬遜雲科技發佈了 Graviton3E。這是針對高效能運算最佳化的版本,面向機器學習浮點和向量數學計算做了最佳化,在 HPL 基線測試中,工作負載的性能提高 35%。基於 Graviton3E 晶片,亞馬遜雲科技推出了面向高效能運算的 HPC7g,適用於天氣預報、生命科學、工程計算等高效能運算場景,最多可以提供 64 個 vCPU 和 128GiB 記憶體。

Graviton 並不是亞馬遜雲科技設計的第一塊晶片。2013 年,亞馬遜雲科技就推出了首顆自研的 Nitro 晶片,意在通過定製硬體,降低虛擬化的消耗,將更多伺服器資源提供給使用者。這是長期探索後的必然之舉。2006 年,亞馬遜開始嘗試提供雲服務,起初使用基於 Xen 架構的虛擬化系統,但很快發現這種方式大概只能將七成伺服器資源提供給使用者,而且無法滿足使用者的穩定性和性能要求。

Nitro 系統的引入,提升了計算實例的安全、性能以及創新速度。亞馬遜雲科技在 2017 年推出了第三代 Nitro 晶片,2020 年開始使用第四代 Nitro 晶片作為所有計算實例的基礎。經過迭代,Nitro 系統提供輸入/輸出資源和管理功能,包括網路、塊儲存、安全與虛擬機器管理等。

在今年的 re:Invent 2022 大會上,亞馬遜雲科技高級副總裁 Peter DeSantis 發佈了第五代 Nitro 系統,相比於前一代產品,電晶體數量比前一代增加了一倍,提供更高的計算性能,同時 DRAM 記憶體性能提升了一半,PCle 頻寬提升兩倍,降低約三成延遲,每瓦性能提高四成,網路轉發性能提高六成。配備 Graviton3E 和新一代 Amazon Nitro v5 的 C7gn 實例,比 C7g 網路頻寬提升了一倍,每秒資料包轉發性能提升 50%,為網路密集型工作負載提供了超高的網路頻寬、資料包轉發性能和價效比。

「我們一直在創新。」Peter DeSantis 說,「在不需要犧牲安全的情況下,減少我們的成本,同時提高我們的性能,讓客戶應用獲得更好的體驗。」

至於網路,今年 re:Invent 大會上也公佈了新的進展。Peter DeSantis 表示,相比於傳統的 TCP 單路徑路由網路,亞馬遜雲科技自己的 SRD(Scalable Reliable Datagram)協議使用了多路徑路由,將「以微秒而不是毫秒」重新傳輸丟棄的資料包,並加速託管在亞馬遜雲科技上的網路。SRD 基於 Nitro 硬體調整和最佳化,其性能優於 TCP。亞馬遜雲科技推出了 ENA Express,以為 Elastic Fabric Adapters 提供支持的 SRD 協議為基礎,與 TCP 相比,P99 延遲減少了 50%,P99.9 延遲減少了 85%,同時還將最大單流頻寬從 5Gbps 到增加到了 25Gbps。

也許可以這樣說

也許可以這樣說:Nitro v5 + Graviton3E + SRD for Everything——亞馬遜雲科技再次突破了雲技術邊界。當計算能力提升了,資源限制減少了,網路性能提升了,那麼接下來呢?

亞馬遜雲科技認為,雲端運算的未來,是 Serverless——無伺服器技術。

「Serverless」這個術語最早出現在 2012 年發表在 ReadWrite 上的一篇文章中。作者 Ken Fromm 認為,Serverless 意味著開發人員不再需要考慮對基礎設施資源的管理。通過消除後端基礎設施的複雜性,Serverless 讓開發人員將注意力從伺服器級別轉移到應用和任務級別。Serverless 意味著計算資源對開發人員透明,開發人員只要關注業務邏輯即可。

但是在當時,這個概念並沒有掀起什麼波瀾。2014 年,Amazon.com 技術長 Werner Vogels 博士在 re:Invent 全球大會上發佈了 Lambda 服務,重新定義了雲端運算的 Serverless 化發展理念,這一概念才開始廣為人知。至今,亞馬遜雲科技已累計發佈了超過 100 款新的 Serverless 功能,活躍使用者超過 100 萬,同時每月的調用請求量超過 100 萬億次。

現在,Lambda 的改進依然在繼續。長期以來,冷啟動時間一直是對 Lambda 最大的最佳化需求之一。過去,藉助 Firecracker MicroVM,已經可以將冷啟動時間從幾秒縮短到不到一秒,而在這次 re:Invent 大會上,亞馬遜雲科技宣佈了新功能 SnapStart,通過創建客戶 Lambda 函數快照,可將冷啟動時間進一步縮短 90%,幾乎即用即開。

即需即用,按觸發次數付費,不使用不付費;功能鬆散耦合,降低開發難度,提升開發敏捷性。對雲端運算的使用者和開發者來說,Serverless 看起來都是好選擇。

02

Serverless 時代

已全面到來

11 月 30 日,亞馬遜雲科技 CEO Adam Selipsky 的主題演講開始了。這場演講重點圍繞資料、安全、計算性能和行業應用,旨在幫助雲端運算使用者快速實現數字化轉型。Adam Selipsky 認為,資料世界的方向是資料、資料分析、資料庫、機器學習的結合,要真正了解資料流的全過程,從資料進入組織,到利用資料協作、共享、做決策,需要從端到端的視角認識資料。亞馬遜雲科技在正努力研究端到端的資料之旅,並在資料之旅的每一站都構建強大的功能和服務。

在這場演講中,「Serverless」一直是個隱藏的關鍵詞。畢竟,使用者在面對越來越多的資料服務時,會更關注其易用程度,而非底層的基礎設施。

Serverless 架構讓應用開發更敏捷,並改進了性能和可擴展性,從而滿足快速資料增長、多樣化的資料來源和資料模型。亞馬遜雲科技已經實現了資料的無感知自動化流轉與一體化融合,並且幫助縮短人工智慧相關應用的開發週期,幫助實現模型驗證流程自動化。

在 Serverless 環境下,開發人員只需要編寫雲函數,設置好觸發雲函數運行的事件就可以了,對計算資源的管理工作完全由雲端運算提供商來承擔:選擇實例、部署、容錯、監控、日誌、安全補丁等等等等,都無需使用者操心。而且,與傳統雲端運算收費方式不同,Serverless 按照函數執行時間收費,而非按照預留的資源收費。這意味著更細粒度的管理方式,更低的成本支出。目前來看,Serverless 是開發新應用最快速的方式,也是總成本最低的方式。

亞馬遜雲科技已經從計算、儲存、應用集成、資料庫、資料分析、人工智慧等多個服務領域全面推進 Serverless 進程,領跑完成了 Serverless 在雲服務上的全面佈局。在計算領域,有 8 年曆史的 Amazon Lambda 是無需設置和管理伺服器即可運行程式碼的計算服務,Amazon Fargate 是隨用隨付的計算引擎;在資料儲存領域,最受歡迎的 Amazon Aurora 早在 2018 年就已推出 Serverless 版本;2012 年上線的 Amazon DynamoDB 作為雲原生的 Serverless 架構鍵-值資料庫,能為使用者提供了極高彈性、可用性和性能。除了這兩款知名度較高的產品外,適用於低延遲高速處理的寬列資料庫 Amazon Keyspace 和圖資料庫 Amazon Neptune 也同樣有 Serverless 版本——事實上,亞馬遜雲科技已經有 7 款 Serverless 資料庫引擎了。

而在資料分析領域,從久負盛名的 Redshift、大資料分析 EMR、流式資料管道 MSK 和資料引擎 Kinesis,到資料集成工具 Glue、資料查詢工具 Athena,再到日誌分析工具 OpenSearch 和商業智慧服務 QuickSight Q,都已經實現了 Serverless 化。Adam Selipsky 在 re:Invent 大會的主題演講中特別介紹了這一系列工具,這是行業中的首創,沒有任何其他廠商做到——亞馬遜雲科技已經在資料分析 PaaS 領域實現了資料倉儲、大資料平臺、流式資料分析的 Serverless 化,將資料 Serverless 能力拓展到了全棧。

與此同時,不確定性的壓力也在促使各行各業擁抱 Serverless:無論是大型多人線上遊戲,還是領先的交通和汽車企業,亦或著名的消費品企業,都已經開始使用 Serverless 架構。利用 Serverless 帶來的極致敏捷和高擴展性與低成本,來更好面對這個愈加不確定的世界。

Adam Selipsky 說:「亞馬遜雲科技目前已經提供了 200 多項雲服務,但創新還遠沒有結束。亞馬遜雲科技會在構建新服務、深化現有服務的功能、整合不同服務三個方面不斷投入。」

今天我們的世界已經分成了兩個:一個是由原子構成,另一個則是由比特構成。兩個世界同樣真實,且我們正在越來越多地運用後一個世界來管理和影響前者。人們希望在數字世界更加自由,擺脫物理規則的束縛,而Serverless化是實現這樣的未來的途徑,也是亞馬遜雲科技正在努力的方向。

*頭圖來源:亞馬遜雲科技

相關文章

衛星隱身技術研究進展及發展趨勢

衛星隱身技術研究進展及發展趨勢

摘要: 衛星隱身技術在空間攻防系統中佔有獨特的地位,與在地面裝甲車輛、艦船、飛機上應用的隱身技術有一定的相似之處,但由於衛星研製條件以及所處...

張勇掛帥,阿里押注雲端運算

張勇掛帥,阿里押注雲端運算

雲端運算一直是阿里的重要戰略,組織調整只能證明其重要性的提升。 作者 | 北方編輯| 靖宇 阿里巴巴對阿里雲的重視顯而易見。在昨天發佈的阿里...

地球人丟棄的塑膠垃圾,都去哪了?

地球人丟棄的塑膠垃圾,都去哪了?

今年5月1日開始,最新制定的《北京市生活垃圾管理條例》正式啟用,嚴格的垃圾分類舉措將重新定義這座城市的街頭巷尾。也許,類似去年上海市垃圾分類...

深度學習的可解釋性

深度學習的可解釋性

一、深度學習的可解釋性研究概述 隨著深度學習模型在人們日常生活中的許多場景下扮演著越來越重要的角色,模型的「可解釋性」成為了決定使用者是否能...