來源:【科學(xué)網(wǎng)】
2022阿里云峰會只有半天時間的云上跨時空連線,時間雖短,但發(fā)布的信息令人震撼。
最重磅的消息,當(dāng)屬阿里云智能總裁張建鋒發(fā)布的全新“處理器”:CIPU(Cloud infrastructure Processing Units 云基礎(chǔ)設(shè)施處理器)。他介紹說,以CIPU為中心的體系架構(gòu)是一個全新的架構(gòu)體系,“將替代CPU成為云時代IDC的處理核心”。
眾所周知,無論是個人計算機(jī)還是數(shù)據(jù)中心、超算集群等基礎(chǔ)設(shè)施,CPU的核心地位都牢不可破。為何在阿里云的話語體系里,這個只比CPU多個“I”的新名詞,一舉成了在云計算架構(gòu)中取代CPU“C位”的存在?
阿里云的葫蘆里,賣的是什么藥?
創(chuàng)新架構(gòu),解決真實(shí)存在的問題
在搞清楚“為什么”之前,要先弄清楚“是什么”。
CIPU意即云基礎(chǔ)設(shè)施處理器。從字面上看,CIPU專門用于云計算,定位是云數(shù)據(jù)中心的管理中樞。在張建鋒的介紹中,CIPU的功能定位也很專一:“專門用于連接服務(wù)器內(nèi)硬件和云上虛擬化資源”。
阿里云給出的 CIPU 架構(gòu)圖顯示,通過“飛天”云計算操作系統(tǒng),CIPU能夠長出“三頭六臂”,分別接入計算加速單元、存儲加速單元和網(wǎng)絡(luò)加速單元??梢钥闯?,CIPU扮演了統(tǒng)籌協(xié)調(diào)各類計算硬件的角色,并實(shí)現(xiàn)計算、存儲、網(wǎng)絡(luò)的加速。過程中,它以中心管理者的姿態(tài),取代了傳統(tǒng)數(shù)據(jù)中心中CPU的位置。
CPU為什么當(dāng)不了核心了?
CPU和GPU等計算單元,是服務(wù)器中最昂貴的部分。而云計算要體現(xiàn)出彈性特征,需要做好資源池化、虛擬化以及網(wǎng)絡(luò)分發(fā)等各項(xiàng)工作。在傳統(tǒng)的數(shù)據(jù)中心,這些“雜活兒”,都要身價不菲的CPU來承載。也就是說,CPU不僅要充當(dāng)計算核心,還要負(fù)責(zé)網(wǎng)絡(luò)管控、安全、訪問協(xié)議等“瑣事”,不僅大材小用,還嚴(yán)重透支著服務(wù)器的計算資源。
而對于云計算服務(wù)商來說,云計算的核心賣點(diǎn)是隨時隨地的彈性計算,但廠商不能為了提供彈性計算服務(wù),就放任計算性能有一定的損失。相反,只有把服務(wù)器的計算資源“吃干榨凈”——盡量多地將CPU用于提供計算能力,用戶才能用上更便宜好用的云服務(wù)。
換言之,要說服更多用戶上云,云服務(wù)商就不僅要提供更好彈性的云,還要提供性能更好、成本更低、安全性佳的云。
那么云服務(wù)商必然要面對這樣的難題:對服務(wù)器物理機(jī)的虛擬化、計算存儲分離都會造成性能損耗、提高延遲,云服務(wù)本身還會承受許多攻擊,需要強(qiáng)調(diào)云上隱私保護(hù)的重要性。這些問題已經(jīng)不是簡單地軟件迭代就能解決得了的,探索更加云化的體系結(jié)構(gòu)是完全合理的方向。
事實(shí)上,阿里云早就注意到了虛擬化等給 CPU 帶來的額外消耗,并致力于解決問題。2017 年,阿里云代表云數(shù)據(jù)中心虛擬化技術(shù)變革、致力于以軟硬協(xié)同設(shè)計提升虛擬化效率的“神龍架構(gòu)”問世。歷經(jīng)多輪迭代,神龍架構(gòu)逐漸加入了編排調(diào)度、硬件加速等更多能力,最終誕生了CIPU的雛形。
飛天+CIPU支撐的云計算技術(shù)體系
阿里云認(rèn)為,云計算歷經(jīng)十余年發(fā)展,有兩個比較標(biāo)志性的階段。
第一階段是分布式和虛擬化技術(shù)替代了大型機(jī)、小型機(jī),滿足了當(dāng)時企業(yè)業(yè)務(wù)擴(kuò)展帶來的算力彈性需求;第二階段出現(xiàn)了資源池化技術(shù),把計算和存儲資源分離,再規(guī)?;幣藕驼{(diào)度,提供了超大規(guī)模的計算和存儲資源池。
“這兩個階段的演進(jìn)推動了云計算發(fā)展,但都是基于傳統(tǒng)的以CPU為中心的體系架構(gòu)去做優(yōu)化,已經(jīng)觸及瓶頸?!卑⒗镌普J(rèn)為,近年來云上的需求發(fā)生了很大變化,數(shù)據(jù)密集型的計算越來越多,提高了對云計算提供的低時延、高帶寬的需求,這些需求“很難通過傳統(tǒng)體系結(jié)構(gòu)去滿足”。
這已經(jīng)成為云計算的下一戰(zhàn)場。以英特爾、英偉達(dá)為代表的硬件廠商,和以亞馬遜為代表的頭部云廠商,都紛紛推出了IPU、DPU,來應(yīng)對愈加棘手的數(shù)據(jù)吞吐、網(wǎng)絡(luò)時延和帶寬的問題。但他們?nèi)匀辉谂f有的計算體系架構(gòu)上做文章,尚未真正實(shí)現(xiàn)突破和大規(guī)模落地。
這也是阿里云構(gòu)建以 CIPU 為基構(gòu)建一個全新架構(gòu)體系的初衷。張建鋒介紹,從最底層的數(shù)據(jù)中心核心部件到最上層云原生軟件,阿里云建立了完整的自研技術(shù)體系,做到了軟硬件無縫結(jié)合,形成了“飛天+CIPU”支撐的云計算技術(shù)體系。
張建鋒介紹說,CIPU替代CPU成為云計算的加速和管控中心,CIPU向下接入數(shù)據(jù)中心的計算、存儲、網(wǎng)絡(luò)資源,快速云化并進(jìn)行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球數(shù)百萬臺服務(wù)器,讓算力“零”損耗對用戶服務(wù),并通過規(guī)?;瘧?yīng)用RDMA網(wǎng)絡(luò)技術(shù),讓訪問云端比訪問本地硬盤更快,網(wǎng)絡(luò)時延最低可達(dá)二十萬分之一秒。
“有利于爭奪云計算定義權(quán)”
目前,阿里云在全球云計算的市場和技術(shù)水平均處于領(lǐng)先地位,在權(quán)威機(jī)構(gòu)Gartner發(fā)布的年度報告里,阿里云的IaaS基礎(chǔ)設(shè)施能力、產(chǎn)品能力獲得了全球最高分。其中,在網(wǎng)絡(luò)技術(shù)上,阿里云被權(quán)威機(jī)構(gòu)AMiner評為全球十大最具影響力的網(wǎng)絡(luò)研究機(jī)構(gòu)。
“云計算越來越接近進(jìn)入下一個時代了——全新的架構(gòu)定義、全新的軟件界面、硬件加速?!睆埥ㄤh表示:“我們錯過了PC時代,但云這個時代大家起步是一樣的。大家在重新定義云的結(jié)構(gòu)的窗口期,如果我們定義好了,中國就可以在下一代的技術(shù)時代有自己的一席之地。”
他認(rèn)為,新一代的技術(shù)架構(gòu),會催生新一代的云原生應(yīng)用,也是中國軟件和企業(yè)數(shù)字化的巨大機(jī)會。所以,阿里云一方面會向下深耕技術(shù),另一方面,也會加大氣力推動生態(tài)的建設(shè)。
中國工程院院士、清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授鄭緯民也認(rèn)為,這是中國爭奪云計算定義權(quán)的重要機(jī)會。
鄭緯民提出:“這幾年的云計算已經(jīng)進(jìn)入一個關(guān)鍵的轉(zhuǎn)換期。過去這些年,我國在云計算領(lǐng)域主要在軟件層面有創(chuàng)新,發(fā)展了一些開源生態(tài),但還是在傳統(tǒng)IT的格局下追趕。現(xiàn)在,阿里云提出了CIPU技術(shù),把上一代計算架構(gòu)的中心完全打破了,在基礎(chǔ)技術(shù)上實(shí)現(xiàn)了世界領(lǐng)先,和國際IT巨頭站在同一個起跑線上。他們提出了CIPU,使得中國正在爭取云計算的定義權(quán)中處于有利的位置,改變了原本由西方技術(shù)制定的游戲規(guī)則,讓我國IT產(chǎn)業(yè)建立了全球領(lǐng)導(dǎo)力?;谶@一點(diǎn)改變格局的事情,我對中國在下一個技術(shù)時代擁有自己的一席之地表示樂觀?!?/p>
阿里云十二年自研“長征路”
自創(chuàng)立以來,阿里云堅持深耕核心技術(shù)。12年前,阿里云大力投入自研云操作系統(tǒng)“飛天”,立志打破國外在云計算底層技術(shù)上的壟斷。飛天是阿里云底層的核心技術(shù),也是國內(nèi)唯一自研的云計算操作系統(tǒng)。十多年來,飛天經(jīng)受“雙11”、12306春運(yùn)購票等極限并發(fā)場景挑戰(zhàn),解決了全球技術(shù)行業(yè)面臨的典型技術(shù)難題,并獲得2017年中國電子學(xué)會科技進(jìn)步獎特等獎,這是該獎項(xiàng)設(shè)立15年來首次頒發(fā)的特等獎。
從飛天開始,阿里云不斷推出自研技術(shù)成果。
阿里自研的數(shù)據(jù)庫起源于“去IOE”浪潮。過去數(shù)據(jù)庫市場一直是Oracle等傳統(tǒng)數(shù)據(jù)庫巨頭的天下,阿里云十年來始終堅持在數(shù)據(jù)庫領(lǐng)域投入,已經(jīng)突破了外國數(shù)據(jù)庫公司的封鎖。2020年,阿里云代表中國科技廠商,挺進(jìn)Gartner全球數(shù)據(jù)庫魔力象限領(lǐng)導(dǎo)者象限,成為基礎(chǔ)軟件領(lǐng)域首次進(jìn)入領(lǐng)導(dǎo)者象限的中國企業(yè)。從阿里巴巴自身“去IOE”,到全行業(yè)去IOE,阿里云94%以上的頭部用戶都購買了云數(shù)據(jù)庫產(chǎn)品。
在云存儲技術(shù)方面,使用阿里云自研的盤古分布式系統(tǒng),協(xié)同CIPU、高密存儲服務(wù)器和Solar-RDMA網(wǎng)絡(luò),可以讓延遲降低到30微秒,這意味著訪問存儲在遠(yuǎn)端的數(shù)據(jù),延遲比訪問本地的硬盤還低。
阿里云也是國內(nèi)最早投入自研綠色科技的云廠商之一。阿里云仁和數(shù)據(jù)中心(位于浙江杭州)是全國規(guī)模最大的單相浸沒液冷數(shù)據(jù)中心。初步估算,如果全國的數(shù)據(jù)中心都采用液冷技術(shù),一年可節(jié)省電量相當(dāng)于三峽電站2020年全年發(fā)電量的三分之二。
2021年云棲大會,阿里云推出首款通用服務(wù)器芯片“倚天710”,以及“磐久”服務(wù)器家族,實(shí)現(xiàn)了芯片、服務(wù)器、操作系統(tǒng)的全棧技術(shù)自研。通過13年的技術(shù)積累、自主研發(fā),阿里云作為國內(nèi)云廠商的代表,正在世界云計算的舞臺上發(fā)出越來越高的聲量。
本文來自【科學(xué)網(wǎng)】,僅代表作者觀點(diǎn)。全國黨媒信息公共平臺提供信息發(fā)布傳播服務(wù)。
ID:jrtt