• 重磅押注CIPU,阿里云要定義下一代云

    來源:電子信息產業網

    點擊:5561

    A+ A-

    所屬頻道:新聞中心

    關鍵詞:CIPU

      今年的阿里云峰會又釋放出了一個重磅炸彈。6月13日,阿里云正式對外發布自主研發的云基礎設施處理器(CIPU)。官方消息稱,CIPU將向下對數據中心的計算、存儲、網絡資源快速云化并進行硬件加速,向上接入飛天云操作系統,管控阿里云全球上百萬臺服務器。多位專家認為,CIPU的登場將徹底顛覆傳統以中央處理器(CPU)為核心的計算架構,成為定義下一代云的關鍵。



      CIPU究竟是什么?

      如果不是圈內人,或許會被CPU、DPU、IPU、CIPU這些“長相相似”的專業術語搞得暈頭轉向。CPU指中央處理器,是計算機系統的運算和控制核心,相當于人的“大腦”。在沒有云計算以前,數據中心的規模通常不會太大,CPU能夠滿足基本的算力需求。但進入云時代以后,超大規模數據中心涌現,需要管理的服務器太多,會消耗CPU大量的算力,且CPU與虛擬化系統以及網絡之間的配合度沒那么高,傳統計算架構也就不再適用了。

      DPU是適用于數據中心的處理器,雖然能夠滿足大規模計算與管理需求,但它純屬硬件范疇,沒有軟件的配合,重點側重解決的是數據遷移帶寬的問題,無法針對特定系統進行優化。相較之下,IPU同樣適用于數據中心,但它更強調虛擬化、云化能力,主要是通過網絡虛擬化、存儲虛擬化、網絡存儲管理以及安全等功能來加速網絡基礎設施、提升應用程序性能。

      而此次阿里云推出的CIPU是為新型云數據中心量身定制的專用處理器,能與飛天云操作系統結合實現軟硬一體化,通過硬件提供高性能,通過軟件保障靈活性,在加速和管理計算資源方面更勝一籌。它更像是DPU和IPU的綜合體,既能解決數據遷移帶寬的問題,又能云化、虛擬化管控數據中心。

      阿里云自研的飛天云操作系統把分布在全球的上百萬臺服務器變成一臺超級計算機,單集群可達10萬臺規模,千億級文件數,EB級別存儲空間。而CIPU的職責就是協助飛天云操作系統對這上百萬臺服務器進行統一納管和整體編排、調度。


      “數據中心的計算、存儲和網絡一旦接入CIPU,資源即可被高效的云化管理,通過CIPU的硬件加速,將實現超高的性能?!卑⒗镌浦悄芸偛脧埥ㄤh說道。具體來看,CIPU與網絡結合,可對高帶寬物理網絡進行硬件加速,建設大規模的彈性RDMA(遠程直接數據存?。┓植际礁咝阅芫W絡(時延最低可達5us);CIPU與存儲結合,對存算分離架構的塊存儲接入進行硬件加速,提供超高性能的云盤(每秒讀寫次數最高可達300萬,長尾時延降低50%);CIPU與計算結合,快速接入不同類型資源的神龍計算平臺,帶來算力的“0”損耗,以及硬件級安全的加固隔離。

      張建鋒表示,被CIPU云化的算力資源,通過飛天操作系統實現規?;?,靈活高效地管理和調度,用戶既能享受到跟物理機一樣的性能,又擁有遠超物理機的敏捷性,還能享受到云計算的彈性。

      實際上,這種以CIPU為核心的計算架構在阿里云內部系統中已打磨多年,在通用計算、大數據、人工智能等核心場景的計算測試中展現了優越的性能。阿里云智能云架構總監黃瑞瑞透露稱,CIPU已經承受過像“雙11”這種體量的性能與壓力“測試”。同時阿里云用戶或多或少都使用過基于CIPU的云計算服務,只是由于不需要修改任何代碼,他們對底層硬件的變化往往是無感的,只會感覺到云上算力資源跑得更快,服務更穩定,性價比也更高了。

      阿里云在下一盤“大棋”

      “今年我們最重要的策略是B2B,就是Back to Basic,回到云計算的本質,云計算的核心競爭力是技術,堅持在技術的長征路上,不斷取得新的突破?!睆埥ㄤh的一席話隱隱點明了阿里云做CIPU的初心——做深基礎,夯實底座。


      追溯云計算本源,虛擬化是其最底層的核心技術之一。如果把云計算看作一個雙層蛋糕,下面一層是無數臺物理機,上面一層則是用虛擬化技術變出來的無數虛擬機。不過,這種虛擬化會讓計算性能受到損耗。換句話說,經過虛擬化技術提供的計算力是“打折”了的,而且越是密集計算的場景,虛擬化帶來的損耗問題越明顯,無數企業因此被擋在云計算的大門之外。

      CIPU的出現從根本上解決了虛擬損耗問題。阿里云自研云操作系統——飛天包含三層架構:最上面一層是飛天原生級服務,包括云原生應用、數據計算與管理、AI與機器學習等;中間一層是飛天系統級服務,包括彈性計算產品、云存儲產品、云網絡產品、云安全產品等;最下面一層是飛天的內核,包括神龍計算、盤古存儲、洛神網絡及安全四大內核。CIPU與飛天的四大內核進行了深度適配,讓飛天云操作系統得以向下延伸定義硬件,將算力的虛擬化損耗直接降為0。CIPU和飛天雙劍合璧,發揮出了“1+1>2”的效果。

      一方面,CIPU與飛天云操作系統的結合,可以說,徹底顛覆了數據中心原本的底層計算與控制邏輯。阿里云技術產品負責人蔣江偉指出,“CIPU要控制的是數以百萬的節點的存儲的資源、網絡的資源,這是單一CPU做不到的?!绷硪环矫?,它還將對傳統計算機終端形態、軟件應用和開發界面產生深遠影響。比如,基于新架構,阿里云的無影(云桌面)將云網端之間的計算存儲資源再均衡,把高算力的工作從本地向云轉移,讓用戶能夠更靈活、更強勁、更安全定義自己的終端。

      據了解,阿里云在全球27個國家和地區、84個可用區、2800個網絡節點,運營著上百萬臺服務器。如此大規模的基礎設施在“飛天云操作系統+CIPU”的穩定支持下,服務器非預期宕機率低于萬分之一,足以代表目前業界的領先水平。

      “阿里云推出CIPU是國內專有化芯片發展的一個里程碑事件,”北京計算機學會數字經濟專委會秘書長王娟指出,“通用芯片與專用芯片是交替出現的,分別解決數據處理中的不同場景需求。不同于更注重產品通用性的傳統處理器廠商,阿里云推出的CIPU是新型數據中心業務而生,它將基礎設施構建在專門的處理器上,對未來大型云網一體的新型基礎設施建設具有重大意義?!?/p>

      下一代云,如何定義?

      在過去十多年,云計算技術發展經歷了兩個階段:第一階段是分布式技術,推動互聯網企業從大機向分布式系統遷移;第二階段誕生了資源池化技術,通過計算存儲分離的架構,對資源統一的調度編排,提高云計算的可靠性和可用性。

      這兩個階段都是基于傳統的、以CPU為中心的計算體系架構,只能解決部分計算需求。隨著數據密集型計算越來越多,云計算面臨著計算和網絡傳輸的時延大、難以滿足數據中心內部交互流量劇增帶來的高帶寬需求、超大規?;A設施難管理等諸多挑戰,正在呼喚一種全新的計算架構。

      在張建鋒看來,云計算最重要的特點是用軟件來重新定義,極大地提升了整個云資源利用的敏捷性。但軟件定義必然會帶來一些性能上的損失?!跋乱淮啤辈粌H要滿足大規模計算與管理要求,還需滿足軟件定義的靈活性要求,同時還得保持硬件設備的原生性能。

      阿里云推出的這種以“飛天+CIPU”為中心的體系架構,把云計算的操作系統和硬件體系結構做到了完美的融合,在低延時、高性能的基礎上實現了算力的規?;?。這是對數據中心內部體系結構的一次顛覆性變革,同時也為整個云計算產業的未來發展方向提供了全新的思路。

      發生在底層的創新往往是最具顛覆性的。自研芯片的創新將會成為云廠商改變云計算游戲規則的重要能力。中國工程院院士鄭緯民認為:“過去這些年,在云計算領域我國主要在軟件層面有所創新,發展了一些開源生態,但整體還是在傳統IT的格局下追趕?,F在,阿里云提出了CIPU完全打破上一代計算架構,在基礎技術上實現了世界領先?!?/p>

      “云計算越來越接近進入下一個時代——全新的架構定義,全新的軟件界面,硬件加速。我們錯過了PC時代,但云這個時代大家起步是一樣的?,F在是重新定義云的窗口期,如果我們定義好了,中國云計算就有了超車的機會?!睆埥ㄤh如是說道。


      (審核編輯: 智匯聞)

      美妇肥臀哀嚎潮喷娇吟