剛剛發佈的第50次 《中國互聯網絡發展狀況統計報告》 顯示,中國網民已超10億,網際網路普及率接近75%,其不僅推動了數字經濟的蓬勃發展,而且在滿足人民日益增長的美好生活需要等方面都發揮了重要作用。
[http://www.cnnic.net.cn/gywm/xwzx/rdxw/20172017_7086/202208/t20220831_71825.htm]。
隨著互聯網提供日益新穎而豐富的產品和服務,例如常見的語音視訊聊天、互動遊戲、點對點網路、流媒體、網路電視等等,網路運營商因此吸納了海量客戶資源,帶來了巨大的資料流量,但與此同時也產生了頻寬管理、內容計費、資訊安全等一系列問題。
採用智慧技術,實現網路管理精細化
為應對網際網路的飛速發展,根據網路流量識別業務類型成為網路技術研究的重要方向和運營商的迫切需求。通過業務識別系統,網際網路運營商以及服務提供商能夠採集與分析網際網路中各種應用產生的流量,識別不同的業務流量類型並進行分類,進而根據不同的業務類型提供相應的保障響應和服務品質。
網路流量分析和管理須精細化
面對這一需求,網路運營商開始引入DPI,來提高網路對報文應用資訊的感知能力,讓網路流量分析和管理走向精細化。
DPI是Deep Packet Inspection的縮寫,中文名稱為「深度報文檢測」是一種流量監測和控制技術,針對不同的網路應用層載荷(例如HTTP、DNS等)進行深度檢測,通過對報文的有效載荷檢測決定其合法性。
比如,可通過DPI將流量分為低延時(語音)、保證延時(網路流量)、保證交付(應用流量)和盡最大努力交付的應用程序(檔案共享),以此更好地根據關鍵任務流量、非關鍵流量來最佳化資源並減少網路擁擠,保障各種服務有序開展。
但隨著網際網路加密流量逐年攀升,傳統DPI方案已很難從報文中直接獲取資訊並對流量進行分類,必須尋找新的方法來完成協議分類任務。在此背景下,基於人工智慧的網路流量分析方案應運而生。
這種方式能夠通過機器學習演算法,利用採集的資料樣本,針對目標協議生成相應的模型檔案,幫助系統線上運行時能夠根據當前的報文特徵判斷出正確的應用類型。但同時,這種AI方案也意味著需要CPU提供密集型運算能力,對複雜的大流量資料進行實時檢測、分析和處理,平臺在性能方面可能遭遇挑戰。
尤其是,基於機器學習的網路流量分析方案,額外增加了大量的特徵學習等負載,會帶來較大的性能開銷,導致CPU負載顯著提升,增加系統的整體性能壓力。
綠網打造智慧DPI檢測方案
武漢綠色網路資訊服務有限責任公司(以下簡稱「綠網」), 秉承「因為專注,所以強大」的理念,公司致力於成為電信級網路和安全設備及解決方案的領導者,面向網路管理精細化需求,推出智慧DPI檢測方案。

圖一 綠網固網DPI解決方案架構
該方案以協助運營商等實現網路可視、可管、可控、可增值為宗旨,一站式地提供了針對加密流量的實時流量特徵提取、學習建模、線上推斷等功能,能夠保障高性能的報文處理,實現高效的智慧識別和智慧控制能力。方案同時能夠將網路資料轉換為結構化表單資料(XDR),供上層平臺進行大資料聯動分析,為網路運維、網路安全、資訊安全、網路規劃和市場經營等工作提供強有力的支撐。
綠網固網DPI解決方案主要包括採集、資料處理以及應用分析三大部分,其中採集指DPI設備,負責採集流量資料;資料層提供統一資料儲存,充分發揮大資料價值;應用層負責統一進行應用孵化,提升資料價值。
固網DPI檢測方案因其資料採集機,也是系統的核心設備,對平臺性能要求非常高,主要用於流量的限速轉發、協議識別等功能,而這些功能對實時性要求很高。為了應對加密流量快速增長所帶來的分析難題,DPI方案引入了AI技術,用來補強DPI的功能,卻也對平臺性能提出了更苛刻要求,因此平臺的性能最佳化刻不容緩。
至強® 可擴展平臺與英特爾® TADK軟硬結合,用實力解難題
英特爾近些年來一直致力於AI技術創新,推出了一系列軟硬體產品,幫助產業夥伴提升方案性能,加速AI落地。面對智慧DPI方案開發中遭遇的挑戰,綠網基於至強® 可擴展平臺, 嘗試引入英特爾® TADK來最佳化方案的AI性能。

圖二 英特爾® TADK開發工具套件架構
英特爾® TADK(Intel® Traffic Analytics Development Kit)是一組利用人工智慧加速技術最佳化網路應用的庫和工具,涵蓋了典型的端到端利用人工智慧/機器學習進行網路流量分析流水線。其基於機器學習的應用分類,較傳統基於深度報文檢測的方法具備更廣泛的適用性,並且對於加密報文也有一定的檢測能力。此外,英特爾® TADK不但可以提取特徵及給出推理結果,還能統計流量的協議類型佔比、位元組數目,並進行較為完善的流量分析。
綠網智慧DPI方案利用英特爾® TADK的優異性能,一站式進行性能最佳化。比如在離線訓練層面,實施基於流的業務分類;線上推斷階段,結合初始化時載入的機器學習模型,對每個流進行推斷,按流輸出推斷結果,實現了對加密流量更加高效地採集、處理與分析。
與此同時,基於英特爾® 至強® 可擴展處理器及英特爾® AVX-512,綠網利用至強® 可擴展平臺兼顧通用計算和平行計算的能力,將方案的性能水平進一步提升,實現了流量高效而精準識別,從而幫助運營商實現多項價值,助其為網路使用者提供更高質量和更具價效比的服務:
1.充分挖掘各類流量資料,為網路運維、安全規劃、經營提供強有力支撐;
2.保障高性能報文處理,更有效地應對數字經濟發展所帶來的流量風暴;
3.以軟體最佳化模式,降低傳統方案擴展性能所帶來的硬體採購、運維、能耗等成本。
不止於網路,讓智慧化為人們打造更美好體驗
得益於英特爾® 至強® 可擴展處理器和英特爾® TADK的AI加速能力的雙重加持,綠網智慧DPI方案能夠更高效地採集網路資料,以及實施海量使用者上網資料的處理和挖掘,為運營商更有效利用網路資料,實施產品和服務最佳化,從而實現業務增值和提升使用者體驗提供了有力支撐。
未來,英特爾將與綠網等合作伙伴攜手,進一步推動CPU、iGPU和FPGA等產品在網路運營的應用。以英特爾® 至強® 可擴展處理器為硬體支持,利用業界標準框架和TADK等軟體,助力網路運營商/服務商深挖流量價值,拓展業務,打造一體化服務的新型資訊基礎設施。同時,英特爾也將在AI領域深入耕耘,進一步驅動網路管理智慧化轉型,助力垂直行業構建更多AI應用場景和優質服務,幫助人們打造更美好數字經濟新體驗。