你的位置:首頁 > 互連技術 > 正文

浪潮信息張東:助力云計算步新,"一云多芯"在挑戰(zhàn)中前行

發(fā)布時間:2023-07-21 責任編輯:wenwei

【導讀】【"一云多芯"是云計算平臺的核心能力之一,是芯與云的融合,是平臺+生態(tài)的協(xié)同;"分層解耦"是構(gòu)建下一代云數(shù)據(jù)中心、構(gòu)建私有云生態(tài)的重要路徑" 】


近年來,我國從芯片、整機、操作系統(tǒng)、云平臺、中間件到應用軟件等技術領域的創(chuàng)新鏈、產(chǎn)業(yè)鏈已初步形成,以X86、ARM、Power等不同架構(gòu)處理器的為基礎的產(chǎn)業(yè)生態(tài)框架已基本就緒。國內(nèi)IT產(chǎn)業(yè)生態(tài)也隨著新一代技術應用場景不斷拓展,已經(jīng)形成了多技術路線全棧式支撐能力。在數(shù)據(jù)中心建設方面,隨著企業(yè)"上云用數(shù)賦智"的不斷加速和深化,新場景下的算力孤島問題逐漸凸顯。如何實現(xiàn)多種芯片技術路線的高效協(xié)同,以應用為導向、從系統(tǒng)設計視角出發(fā),滿足多芯共存、多云異構(gòu)條件下的云原生環(huán)境構(gòu)建,保障業(yè)務應用的穩(wěn)定運行、平滑切換和線性增長,成為新一代云數(shù)據(jù)中心架構(gòu)體系需要攻克的新的挑戰(zhàn)。


6.jpg

浪潮信息副總裁 張東


云計算是協(xié)同紐帶,"一云多芯"是關鍵


‘"一云多芯"是打破小生態(tài)、構(gòu)建大生態(tài)的關鍵紐帶。信息技術產(chǎn)業(yè)鏈發(fā)展迅速,相關技術及產(chǎn)品已開始大規(guī)模應用于金融、通信、政府等關鍵行業(yè)。但從產(chǎn)業(yè)鏈協(xié)同上看,各環(huán)節(jié)垂直封閉、生態(tài)離散,多個小生態(tài)并行存在。自有封閉小生態(tài)的排他性不利于產(chǎn)業(yè)的健康發(fā)展,難以形成產(chǎn)業(yè)合力,同時又給行業(yè)用戶在技術選型上帶來困擾。如何打破小生態(tài)壁壘,避免因技術選型失誤帶來的業(yè)務轉(zhuǎn)型失敗是各個行業(yè)關心的話題。在我們看來,"一云多芯"無疑是個最佳選擇。同時,其在一定程度上激發(fā)了IT產(chǎn)業(yè)鏈上下游的創(chuàng)新活力,進而促進整體生態(tài)的協(xié)同發(fā)展。


"一云多芯"可滿足用戶算力多樣化需求,并且可有效規(guī)避算力孤島。隨著各行各業(yè)業(yè)務創(chuàng)新的爆發(fā)式增長,不同業(yè)務場景對算力需求的差異化也越來越多,更多的算力供給從處理器向各種加速器(包括GPU、DPU、FPGA等)轉(zhuǎn)移。為充分發(fā)揮多元異構(gòu)(不同架構(gòu)、不同種類)芯片的能力優(yōu)勢,金融、能源等關鍵行業(yè)應基于多種芯片架構(gòu)來構(gòu)建云基礎設施底座,實現(xiàn)多元算力的統(tǒng)一池化管理、統(tǒng)一調(diào)度以及業(yè)務的差異化部署等,逐步實現(xiàn)從算力并存到算力統(tǒng)一。


"一云多芯"可有效降低供應鏈風險。"一云多芯"是IT產(chǎn)業(yè)鏈承上啟下的關鍵環(huán)節(jié),具備對下納管底層各種芯片,屏蔽底層基礎設施異構(gòu)芯片差異,對上提供開放、統(tǒng)一的算力接口。但是,目前在云計算產(chǎn)業(yè)中,各服務器芯片的表現(xiàn)參差不一,導致用戶體驗難以一致,應用效果也大相徑庭。用好"一云多芯",可以最大程度的降低技術路線的選擇風險,極大提升業(yè)務穩(wěn)定性以及業(yè)務改造的靈活性。


由此可見,無論是從業(yè)務角度、技術角度,還是產(chǎn)業(yè)鏈角度,踐行"一云多芯"已經(jīng)成為當下及未來云計算產(chǎn)業(yè)發(fā)展的關鍵,是產(chǎn)業(yè)鏈相關廠商的必然選擇。


"一云多芯"勢在必行,但落地挑戰(zhàn)猶存


"一云多芯"在云計算步新中已經(jīng)成為業(yè)內(nèi)共識。雖然"一云多芯"目標明確,但在產(chǎn)業(yè)落地過程中仍存在多方面挑戰(zhàn)。


首先是理念的轉(zhuǎn)變。IT基礎架構(gòu)經(jīng)過長期的發(fā)展,從大機、小機時代逐步演進到云計算時代,開放計算深入人心。但直至今日,芯片指令集、操作系統(tǒng)架構(gòu)上的差異化依然制約著架構(gòu)的橫向協(xié)同,比如一個應用需要同時適配多個指令集和操作系統(tǒng)的問題仍然很嚴重。IT產(chǎn)業(yè)需要新的理念、新的路徑、新的設計,即以CPU為核心的設計模式轉(zhuǎn)變?yōu)橐韵到y(tǒng)為核心的設計,以"以應用為導向,以系統(tǒng)為核心"構(gòu)建新一代產(chǎn)業(yè)生態(tài)。"一云多芯"是就是這種理念的具體體現(xiàn)。


其次是缺乏統(tǒng)一的"一云多芯"建設標準、規(guī)范。算力標準化是產(chǎn)業(yè)的愿景,因此基于"一云多芯"打造的算力平臺需要標準化、統(tǒng)一化、服務化。各廠商因技術能力差別導致理解和落地模式均有所不同,比如部分廠商將納管多個獨立的不同芯片架構(gòu)資源池的這種模式也包裝成"一云多芯",由于無法實現(xiàn)真正的互聯(lián)互通,對業(yè)務的連續(xù)性造成很大的風險。


實現(xiàn)一云多芯,場景驅(qū)動的軟件定義是正道


一云多芯的最終目標是支撐用戶業(yè)務在不同架構(gòu)處理器之間的低成本切換或者自由切換。因此,基于以系統(tǒng)設計為核心的思維,采用以場景驅(qū)動的"硬件重構(gòu)+軟件定義"的融合架構(gòu),是數(shù)據(jù)中心體系結(jié)構(gòu)的發(fā)展方向。我們認為可以分"有-好-優(yōu)"三步走來實現(xiàn)一云多芯的中長期目標。


7.jpg


"一云多芯"三步走技術路線


第一階段,混合部署、統(tǒng)一管理、統(tǒng)一視圖


第一階段解決"有"的問題。以云為入口,通過云操作系統(tǒng)實現(xiàn)異構(gòu)處理器服務器的統(tǒng)一管理,覆蓋國內(nèi)外主流處理器,提供統(tǒng)一操作界面、操作方式及統(tǒng)一監(jiān)控運維等,解決云資源池只能承載單一廠商或單一架構(gòu)處理器的服務器而導致的應用無法跨架構(gòu)部署、協(xié)同的問題。


第二階段,業(yè)務牽引、分層解耦、架構(gòu)升級


第二階段解決"好"的問題。在第一階段的基礎上,進一步實現(xiàn)應用的低成本跨架構(gòu)切換。通過資源層、平臺層和應用層的"分層解耦"設計,實現(xiàn)架構(gòu)升級。


在資源層面,通過跨平臺的遷移實現(xiàn)應用跨架構(gòu)快速部署。


在平臺層面,實現(xiàn)平臺應用的跨架構(gòu)混合部署,如數(shù)據(jù)庫集群在一云多芯平臺上實現(xiàn)跨架構(gòu)的狀態(tài)同步、數(shù)據(jù)同步,實現(xiàn)了多實例在不同處理器架構(gòu)的服務器上的并行運行。


在應用層面,可通過服務網(wǎng)格等技術實現(xiàn)應用的跨架構(gòu)流量切分。


第三階段,算力標準、全棧多芯、生態(tài)共建


這個階段是解決"優(yōu)"的問題。從業(yè)務連續(xù)性的維度,我們認為"一云多芯"的終極目標是實現(xiàn)應用與芯片架構(gòu)的徹底解耦。這需要硬件、云以及應用等產(chǎn)業(yè)鏈上下游的共同協(xié)同,完善異構(gòu)架構(gòu)下有效算力的量化方法,以支持應用在不同架構(gòu)處理器間的等價切換。共同推動應用與云基礎設施的一云多芯相結(jié)合,打造垂直一體化方案,實現(xiàn)應用層面的跨架構(gòu)無感知切換。在標準和測評方面,聯(lián)合專業(yè)軟件測評機構(gòu)及產(chǎn)業(yè)鏈上下游生態(tài),形成一云多芯行業(yè)標準。


寫在最后:               


"一云多芯"已經(jīng)不再是一個簡單的口號,而是構(gòu)建我國IT產(chǎn)業(yè)新生態(tài)的關鍵路徑。浪潮信息參編的基礎設施云管理軟件、虛擬化云平臺和容器平臺等多個國家級、行業(yè)級標準,也是以分層解耦、生態(tài)共建的理念推進我國信息產(chǎn)業(yè)健康有序發(fā)展。同樣,中國人民銀行印發(fā)的金融科技發(fā)展規(guī)劃中,也對金融行業(yè)"一云多芯"的發(fā)展以及相關金融云平臺應用標準提出了明確的目標及要求。浪潮信息配合某國有大型銀行進行了"一云多芯"的實踐,采用多種芯片服務器和云海OS,完成了核心MPP數(shù)倉產(chǎn)品的認證測試并實現(xiàn)大規(guī)模生產(chǎn)系統(tǒng)應用。同時,針對大數(shù)據(jù)、消息中心、緩存系統(tǒng)等核心業(yè)務平臺也全面開展了合作。浪潮信息參與建設的多個行業(yè)云平臺,在支持一云多芯的基礎上,遠程跨域管理、集群規(guī)模及線性擴展能力同樣達到業(yè)界領先水平,單資源池規(guī)模超過1000節(jié)點并可按控制器實現(xiàn)線性擴展,支撐了金融、能源、交通等行業(yè)云數(shù)智多樣化業(yè)務需求。


由此可見,遵從"以應用為導向、以系統(tǒng)為核心"的設計理念,秉承"分層解耦、開放標準"的"一云多芯"建設原則,在云計算步新的發(fā)展中顯得愈發(fā)重要,這必將加速IT產(chǎn)業(yè)生態(tài)的繁榮。


稿源:美通社



免責聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。


推薦閱讀:


如何應對艱巨的耐輻射電源電子系統(tǒng)設計

工程師必須知道的大電流單通道柵極驅(qū)動器設計技巧

如何高效完成大電流單通道柵極驅(qū)動器電路設計?

IBM陳旭東:人工智能引領技術創(chuàng)新,推動企業(yè)高質(zhì)量發(fā)展

PFC電路:死區(qū)時間理想值的考量

特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索
?

關閉

?

關閉