導讀:云數據中心在硬件、軟件和基礎架構上需要巨大的投資,這反過來又推動了性能、效率和投資回報方面的優(yōu)化。
云數據中心是系統(tǒng)計算架構的終極形式。云數據中心可以完成最密集的計算任務,例如COVID疫苗的科學建模、從數十億的數據點開發(fā)人工智能模型等等。因此,云數據中心需要在硬件、軟件和基礎架構方面進行巨大的投資,而這反過來又推動了性能、效率和投資回報(ROI)方面的優(yōu)化。
這些需求正在推動數據中心架構的變化,使得處理器和加速器的優(yōu)化正朝著基于每一種工作負載的方向發(fā)展。我們看到的例子包括定制處理器的興起和圖形處理單元(GPU)、數字信號處理器(DSP)、現場可編程門陣列(FPGA)、神經處理單元(NPU)的使用以及利用定制加速器處理進入或通過數據中心的數據。更多專業(yè)加速器的使用正在興起,其中之一名為數據處理單元(DPU)或基礎架構處理單元(IPU),以下簡稱為DPU。DPU可用于運行數據中心內特定的工作負載,包括安全、網絡管理、存儲管理和其他操作功能。
利用協(xié)處理器進行內部加速其實不是什么新鮮事,而上述的DPU則將協(xié)處理器的概念提升到一個新的水平。DPU并不僅僅是一個獨立的處理器。DPU是加速器,可能配有專門的或可編程的處理元件,以達到加速關鍵數據中心任務的目的,這樣做使得主要處理元件(通常是服務器處理器)可以專門用于創(chuàng)造收入的任務。而且,DPU也與系統(tǒng)架構緊密地整合在一起,可以與主機處理器和工作負載加速器緊密合作。因此,DPU可以為數據中心的處理提供重要提升。根據Nvidia提供的一些數據,其貢獻可能高達2倍之多。那么,既然云計算數據中心可以受益于DPU,企業(yè)服務器也可以受益于DPU嗎?答案是肯定的。
服務器這個詞對不同的人和不同的行業(yè)可能會有不同的含義,但服務器實際上只是一個連接在網絡上的計算資源,通常不支持通過用戶界面設備直接訪問,如鍵盤、鼠標和顯示器。具備特定用戶接口的客戶服務或其他服務器可以通過網絡訪問服務器。許多云服務器可能專門用于完成特定的功能或處理某些數據類型,企業(yè)服務器則不同,企業(yè)服務器可能負責為組織內部的各種團體執(zhí)行廣泛的功能。我們可以把企業(yè)服務器想象成一個組織的數字瑞士軍刀。
一臺企業(yè)服務器可以運行制造業(yè)的庫存系統(tǒng),這時候就是銷售部門的客戶資源管理(CRM)平臺,企業(yè)服務器也可能運行采購部門的發(fā)票系統(tǒng),或托管工程設計應用,或為整個組織提供辦公生產力工具。企業(yè)服務器需要滿足各種廣泛的要求,但即便這樣,DPU也是有益的,甚至在某些方面比用于云環(huán)境更有益。在企業(yè)服務器上運行的各種應用都需要提供一些基本功能,包括存儲和檢索數據、管理網絡上的數據流并確保數據的安全性,數據可能來自于廣泛的數據源和消費者,消費者同時又需要訪問這些數據。而DPU則正好更好地管理這些功能。此外,DPU(例如Nvidia的Bluefield)配備了加速器,可用于加速其他功能(例如運行數據分析或使用人工智能算法、效率、網絡維護)或用于維護其他企業(yè)資源,例如存儲或精確的時間同步。DPU整合到企業(yè)服務器中可以提高平臺的整體性能,同時,通過接管那些可能不太適合傳統(tǒng)的基于CPU主機處理器的開銷任務,進而減少服務器需要的增加。
DPU的硬件和軟件仍在發(fā)展,而且發(fā)展迅速,這一點值得注意。整個行業(yè)都在努力開發(fā)和實現DPU,但不同的芯片和服務器供應商提供了不同的解決方案。目前,芯片供應商AMD(Xilinx和Pensando)、Broadcom、Fungible、英特爾、Nvidia和Marvell都提供了DPU類別的產品,但在架構和功能方面存在很大的差別。
數據中心DPU的引入正在改變數據中心未來的系統(tǒng)架構,正如Nvidia的黃仁勛在GTC問答環(huán)節(jié)所指出的,這只是DPU的開始。DPU的使用增加后,一些功能可能會被分解成更多的專門加速器,其發(fā)展和我們現在看到的工作負載加速器一樣。我們的存儲可能用一顆DPU,網絡用另一顆DPU,安全又用另一顆DPU。這些功能可以在獨立的芯片中實現,也可以作為單獨的晶粒堆疊在一起實現。實現這些加速器的最佳方式也在隨著半導體制造和封裝技術的發(fā)展而變化,但很明顯,DPU將成為業(yè)界寵兒。TIRIAS Research認為,DPU不僅會對云數據中心的設計產生重大影響,也會對企業(yè)服務器的設計產生重大影響。