“東數(shù)西算”工程背后不僅僅是投資規(guī)模及其帶來的產(chǎn)業(yè)發(fā)展機遇,更重要的是,統(tǒng)籌優(yōu)化數(shù)據(jù)中心的能源使用效率,提高算力基礎設施的有效利用率,以及通過架構創(chuàng)新來大幅提高系統(tǒng)性能,最終,實現(xiàn)產(chǎn)業(yè)互聯(lián)網(wǎng)驅(qū)動之下的“算力普惠”。
今年,“東數(shù)西算”工程已經(jīng)成為熱點議題。簡單來說,“東數(shù)西算”就是把東部的算力需求調(diào)到西部來處理,和著名的南水北調(diào)、西電東送、西氣東輸是同一個系列的系統(tǒng)工程,分別解決水、電、氣和算力的全國統(tǒng)一資源調(diào)配。尤其是今年1月,國家發(fā)展改革委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局四部委聯(lián)合復函同意京津冀、長三角、粵港澳大灣區(qū)、成渝、貴州、甘肅、內(nèi)蒙古和寧夏啟動建設國家算力樞紐節(jié)點,被外界視作啟動“東數(shù)西算”工程的標志性事件。甚至國內(nèi)資本市場也開始針對大數(shù)據(jù)、云計算、算力建設、數(shù)據(jù)安全等細分領域展開布局。
現(xiàn)今數(shù)字經(jīng)濟的創(chuàng)新發(fā)展正在進入一個至關重要的時間窗口,5G、物聯(lián)網(wǎng)、人工智能,以及集成電路、移動電子設備、自動駕駛汽車等核心產(chǎn)業(yè),正在經(jīng)歷新一輪的高增長?!丁笆奈濉睌?shù)字經(jīng)濟發(fā)展規(guī)劃》指出,數(shù)字經(jīng)濟核心產(chǎn)業(yè)增加值占GDP的比重要從2020年的7.8%增長到2025年的10%?;谶@一宏觀產(chǎn)業(yè)背景,“東數(shù)西算”的系統(tǒng)性布局、推動進度和創(chuàng)新加速,將力推中國全體系化產(chǎn)業(yè)升級。
未來幾年,“東數(shù)西算”驅(qū)動之下的數(shù)字經(jīng)濟將會是這個時代的最大增量。各行各業(yè)將會與之深度融合,成為繼過去10年的網(wǎng)絡化、信息化時代的下一個典型新經(jīng)濟業(yè)態(tài)。
產(chǎn)業(yè)互聯(lián)網(wǎng)是第一驅(qū)動
“東數(shù)西算”絕對不是被突然構想出來的,而是有非常廣泛甚至緊迫的產(chǎn)業(yè)需求推動,產(chǎn)業(yè)互聯(lián)網(wǎng)則是“東數(shù)西算”的第一個驅(qū)動因素,產(chǎn)業(yè)互聯(lián)網(wǎng)主要瞄準企業(yè)級服務。
早在2016年,國內(nèi)就出現(xiàn)一個觀點——“中國的互聯(lián)網(wǎng)進入下半場”。中國互聯(lián)網(wǎng)的上半場是消費互聯(lián)網(wǎng)(面向個人),下半場是產(chǎn)業(yè)互聯(lián)網(wǎng)(面向企業(yè))。當時已經(jīng)出現(xiàn)了兩個發(fā)展瓶頸:一是移動電子產(chǎn)品(主要是手機和可穿戴設備)的普及程度已經(jīng)接近人口總量,To C 數(shù)字經(jīng)濟已經(jīng)接近了產(chǎn)業(yè)發(fā)展的天花板;二是 C 端個人用戶的線上停留時間(人均接近 6 個小時)也已經(jīng)接近極限,數(shù)據(jù)和流量的增長空間非常有限。
所以,全球主要科技公司主動開始轉(zhuǎn)型,利潤來源已經(jīng)開始轉(zhuǎn)向 To B 業(yè)務,比如原本主營 To C 的微軟、亞馬遜目前一半以上的利潤來源是企業(yè)級服務,騰訊、百度、阿里巴巴等國內(nèi)科技公司也在花更大的力氣,在技術層面去推自己的企業(yè)級服務優(yōu)勢。既然產(chǎn)業(yè)互聯(lián)網(wǎng)代表整個“下半場”的共識已經(jīng)形成,就必須跟進,不能被甩出時代。
消費互聯(lián)網(wǎng)的核心邏輯是沉淀用戶,穩(wěn)定的流量和用戶規(guī)模就是一切,但是產(chǎn)業(yè)互聯(lián)網(wǎng)更強調(diào)費用、效率。有人把產(chǎn)業(yè)互聯(lián)網(wǎng)的商業(yè)模式總結為:提效、降費、定價權。產(chǎn)業(yè)互聯(lián)網(wǎng)的核心價值是幫助整個產(chǎn)業(yè)鏈的某個環(huán)節(jié)提升效率或是降低費用,比如,亞馬遜的云計算服務幫助許多家歐美企業(yè)節(jié)省了IT設備費用。而定價權就是你在企業(yè)客戶提升的效率里能夠分到的利益。
產(chǎn)業(yè)互聯(lián)網(wǎng)的創(chuàng)新進取需要堅實的數(shù)字化基礎設施,參考國內(nèi)外的具體經(jīng)驗,企業(yè)的參與當然也非常重要,但國家引導更不可或缺。
消費互聯(lián)網(wǎng)或者 To C 數(shù)字經(jīng)濟的規(guī)?;l(fā)展有國家引導的作用。數(shù)據(jù)顯示,截至2021年6月,我國移動數(shù)據(jù)流量平均資費降至3.22元/GB,用戶月均移動數(shù)據(jù)使用量為12.62GB。根據(jù)第三方數(shù)據(jù)分析機構 Speedtest 公布的數(shù)據(jù),中國固定寬帶速率位居全球第8,移動寬帶上網(wǎng)速率排名全球第9。不可否認,我們每個人都可以使用穩(wěn)定、可靠、廉價的高速寬帶移動通信,政府部門在其中起了非常重要的作用。進入產(chǎn)業(yè)互聯(lián)網(wǎng)時代,在面對企業(yè)客戶多樣化的具體需求時,現(xiàn)有的基礎設施能力還有很多欠缺,包括數(shù)字化連接成本,與通信網(wǎng)絡、云計算能力的融合,乃至基礎設施與應用的集成等方面,迫切需要對數(shù)字化基礎設施進行產(chǎn)業(yè)升級。這也是推進“東數(shù)西算”戰(zhàn)略工程面臨的實際挑戰(zhàn)。
背后的算力革命
“東數(shù)西算”當中的“數(shù)”是數(shù)據(jù),“算”是算力。具體而言,數(shù)字經(jīng)濟時代的三大核心要素就是數(shù)據(jù)、算力、算法。其中,數(shù)據(jù)是新的生產(chǎn)資料,算力是新的生產(chǎn)力,而算法是新的生產(chǎn)關系。三者相互促進——算法迭代需要海量數(shù)據(jù)的喂養(yǎng),而處理爆炸式增長的數(shù)據(jù)需要算力的快速提升,算力的進步又能夠促進更多的新應用、新算法。
目前,三大要素中最緊張的,是算力。中國移動董事長楊杰說:“算力是繼熱力、電力之后,新的關鍵生產(chǎn)力?!庇脟彝度氘a(chǎn)出比模型來計算,在算力產(chǎn)業(yè)上每投入1元錢,可以帶動3~4元的經(jīng)濟產(chǎn)出;算力規(guī)模每增長1%,可以撬動GDP增長0.2%。中國現(xiàn)在處于什么“算力水平”?《中國算力發(fā)展指數(shù)白皮書》指出,各國的算力規(guī)模和GDP水平強相關,美國占全球總算力的36%,中國占31%,日本占6%,歐洲作為一個整體占11%。算力規(guī)模排名前三的國家和GDP排名前三的國家是一致的。而且,目前全球算力處于加速增長的階段。2016年至2020年,全球算力規(guī)模平均每年增長30%;而2020年至2025年,預計全球算力規(guī)模增速會再上一個臺階,達到每年增長50%。全球主要經(jīng)濟體都已經(jīng)投入巨資加快算力布局,為了掌握未來的發(fā)展主動權,必須掌握先進算力。
那么,從微觀層面看,算力的需求端、供給端是怎樣一個格局?
算力需求端:產(chǎn)業(yè)(工業(yè))互聯(lián)網(wǎng)是主要需求來源
比如,為什么現(xiàn)在的天氣預報比原來準多了?過去只能告訴你“局部地區(qū)有雨”,現(xiàn)在你可以隨時在手機上查看未來兩小時精準的降雨云圖。再比如,生物醫(yī)藥的研究上,為什么新藥研發(fā)鑒定的周期可以從5000天縮短到100 天?這主要是算力提升的結果。
真正的自動駕駛,沒有算力的巨大進步完全不可能實現(xiàn)。因為一輛自動駕駛汽車的攝像頭、雷達、導航和各種傳感器每個小時產(chǎn)生的數(shù)據(jù)多達40TB(大概相當于500部智能手機的存儲量),要用這些數(shù)據(jù)對自動駕駛的神經(jīng)網(wǎng)絡進行訓練,僅僅是數(shù)據(jù)處理就需要巨大的算力支持。加上車路協(xié)同的計算需求,對算力的要求更是極其嚴苛。為什么近年特斯拉發(fā)布了自己研發(fā)的超級計算機?根本上就是在拼傳感器和算法,還有拼算力。
算力供給端:與碳中和規(guī)劃要求艱難平衡
算力如此重要,那么,算力產(chǎn)生的成本大不大?不得不說,構建算力場地和數(shù)據(jù)中心的成本是非常昂貴的,“計算”一直是一項高耗能的工作,尤其消耗電力。
一個數(shù)據(jù)中心的運營成本中,電力成本往往占到50%以上。2020年,國內(nèi)的數(shù)據(jù)中心用電量已經(jīng)占到全社會總用電量的2.7%,總能耗超過2000億千瓦時,相當于燃燒6000萬噸煤排放1.6億噸的二氧化碳的發(fā)電量。而《“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃》明確要求,發(fā)展數(shù)字經(jīng)濟需要的基礎設施要符合同為國家戰(zhàn)略的“碳中和”規(guī)劃要求,不能因為自身的發(fā)展而破壞中國對世界的承諾。而且電力的傳輸問題也很多,以當前的技術水平,2000公里長距離輸電的損耗是6%左右,這已經(jīng)比較樂觀了,且特高壓輸電線的建設成本十分驚人。
此外,給數(shù)據(jù)中心服務器冷卻降溫,也需要消耗大量電力。微軟、亞馬遜、Facebook等都曾為了“物理降溫”走了彎路,比如微軟將“北方群島”數(shù)據(jù)中心沉入海底,F(xiàn)acebook在瑞典北部靠近北極圈邊緣的地方興建數(shù)據(jù)中心,國內(nèi)的阿里云、騰訊云、百度、華為等也在將數(shù)據(jù)中心向貴州、甘肅等整體氣溫偏低的地區(qū)遷移。綜合以上因素,如何解決算力和數(shù)據(jù)中心的場地、能耗、分布問題,要做出很多艱難的平衡。哪怕沒有“東數(shù)西算”工程,算力和數(shù)據(jù)中心“向低成本區(qū)域遷移”的趨勢也難以阻擋。
探索最優(yōu)算力結構
如果說是國內(nèi)不均衡的電力資源分布催生了“東數(shù)西算”工程,或者說是“東數(shù)西算”工程要破解這一輪次數(shù)字經(jīng)濟發(fā)展遇到的一大難題——如何在節(jié)能減排的約束框架下建設數(shù)字化基礎設施,可能都不算理解“東數(shù)西算”布局背后的深謀遠慮。其實,將大型和超大型數(shù)據(jù)中心布局到可再生能源等資源相對豐富的西部地區(qū),統(tǒng)籌調(diào)度東西部數(shù)據(jù)中心算力需求與供給,是要實現(xiàn)全國算力、網(wǎng)絡、數(shù)據(jù)、能源的協(xié)同聯(lián)動。
綜合來看,未來數(shù)字經(jīng)濟的創(chuàng)新發(fā)展確實需要史無前例的算力支持,但更重要的,是算力結構的統(tǒng)籌優(yōu)化?;谖覈鴶?shù)字經(jīng)濟長遠發(fā)展所需要的算力結構而言,可以將算力做出以下分類:
一是基礎算力,就是由基于CPU芯片的服務器提供的算力,主要用于基礎通用計算,包括云計算、邊緣計算等,都屬于基礎算力。二是智能算力,就是由基于GPU、FPGA、ASIC等AI芯片的加速計算平臺提供的算力,主要用于人工智能的訓練和推理計算,比如語音、圖像和視頻的處理。三是超算算力,就是由超級計算機提供的算力,主要用于尖端科學領域的計算,比如行星模擬、藥物分子設計、基因分析等。
現(xiàn)今的全球總算力當中,基礎算力占73%,智能算力占25%,超算算力占2%。具體到中國算力資源,我們在基礎算力和超算算力上分別位于全球第二和第三,而在智能算力上保持絕對領先優(yōu)勢,獨占全球52%的份額。僅僅去年一年,全國就有20多個城市在建智算中心。顯然,國內(nèi)這個算力結構不算是“統(tǒng)籌優(yōu)化”的,缺乏總體布局,信息孤島的狀態(tài)是傷害中國數(shù)字經(jīng)濟整體效率的。
與此同時,國內(nèi)的算力資源分布也很不均衡,整體利用效率并不理想。截至2022年初,國內(nèi)已建成的數(shù)據(jù)中心為500萬標準機架,整體算力達到130EFLOPS,并將以20%以上的速度持續(xù)增長。僅從數(shù)字上看,算力規(guī)模的增長非常樂觀,但是北京、廣東、上海的算力規(guī)模位列前三,浙江、廣東、江蘇等東部省份的算力增速超過60%,而內(nèi)蒙古、貴州、甘肅等省份在算力規(guī)模和增速上比較有限。而且,目前國內(nèi)數(shù)據(jù)中心平均利用率約為55%,地區(qū)需求的不均衡導致算力利用率的低下,算力需求大戶(包括新能源車企、AI企業(yè)、互聯(lián)網(wǎng)企業(yè)等)主要集中在東部沿海一線城市和準一線城市。扭轉(zhuǎn)和改變這種需求不均衡導致的低效狀況,無疑是一個循序漸進的系統(tǒng)性工程,“東數(shù)西算”本質(zhì)上是一項長期規(guī)劃。
《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》中明確提出,布局建設全國一體化算力網(wǎng)絡國家樞紐節(jié)點,加快實施“東數(shù)西算”工程,國家樞紐節(jié)點之間進一步打通網(wǎng)絡傳輸通道,加強云算力服務、數(shù)據(jù)流通、數(shù)據(jù)應用、安全保障等方面的探索實踐。因此,“東數(shù)西算”工程最重要的實施原則,就是“加強統(tǒng)籌”,強調(diào)“加強數(shù)據(jù)中心統(tǒng)籌規(guī)劃和規(guī)范管理,開展數(shù)據(jù)中心、網(wǎng)絡、土地、用能、水、電等方面的政策協(xié)同,促進全國范圍數(shù)據(jù)中心合理布局、有序發(fā)展?!?/FONT>
所以,“東數(shù)西算”工程背后不僅僅是多大量級的投資規(guī)模,及其帶來的產(chǎn)業(yè)發(fā)展機遇,更重要的是,統(tǒng)籌優(yōu)化數(shù)據(jù)中心的能源使用效率,提高算力基礎設施的有效利用率,以及通過架構創(chuàng)新來大幅提高系統(tǒng)性能,最終,實現(xiàn)產(chǎn)業(yè)互聯(lián)網(wǎng)驅(qū)動之下的“算力普惠”。
數(shù)字化產(chǎn)業(yè)鏈變革
“東數(shù)西算”無疑會帶來數(shù)字化產(chǎn)業(yè)鏈的巨大變革,可以從資源分布、技術架構、前瞻創(chuàng)新三個角度來進行理解。
資源分布:基于“數(shù)據(jù)的溫度”來配置算力資源
根據(jù)“東數(shù)西算”工程的具體規(guī)劃,國家將在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節(jié)點,并在張家口、蕪湖、韶關等地建設10個國家數(shù)據(jù)中心集群。其中,8個樞紐節(jié)點定位不同:京津冀地區(qū)、長三角地區(qū)、粵港澳大灣區(qū)、成渝地區(qū)作為經(jīng)濟最發(fā)達的核心城市群,地區(qū)用戶規(guī)模較大、應用需求強烈,屬于“服務內(nèi)部”的一類;而內(nèi)蒙古、貴州、甘肅、寧夏都在西部欠發(fā)達地區(qū),當?shù)氐乃懔π枨蟛淮?,作為樞紐節(jié)點“對外輸出算力”。
而且基于通信原理的常識判斷,物理距離一定會帶來通信時延,西部數(shù)據(jù)中心向東部輸送算力,最大的問題就在于時延。因此,中國工程院院士鄔賀銓認為:“受限于網(wǎng)絡長距離傳輸造成的時延,以及相關配套設施等因素影響,一些后臺加工、離線分析、存儲備份等對網(wǎng)絡要求不高的業(yè)務,可率先向西部轉(zhuǎn)移。一些對網(wǎng)絡要求較高的業(yè)務,比如工業(yè)互聯(lián)網(wǎng)、災害預警、遠程醫(yī)療、人工智能推理等,可以在京津冀、長三角、粵港澳大灣區(qū)等東部樞紐布局,樞紐內(nèi)部要重點推動數(shù)據(jù)中心從一線城市向周邊轉(zhuǎn)移?!?/FONT>
依據(jù)網(wǎng)絡時延和訪問頻率不同,可將不同算力要求的數(shù)據(jù)處理分為兩類:一類是訪問頻率低的冷數(shù)據(jù),這類數(shù)據(jù)西部數(shù)據(jù)中心會承接得更多,諸如后臺加工、離線分析、冷數(shù)據(jù)存儲備份等對時延不敏感的網(wǎng)絡應用。比較典型的就是軟件系統(tǒng)中的日志分析、每日每月報表分析、用戶千人千面算法分析、視頻渲染等應用。盡管增加了數(shù)據(jù)傳輸?shù)某杀?,但西部地區(qū)便宜的電價、地價等優(yōu)勢,足可以抵消數(shù)據(jù)傳輸增加的硬性成本。
另一類是訪問頻率高的熱數(shù)據(jù),這類數(shù)據(jù)東部數(shù)據(jù)中心會承接得更多,諸如自動駕駛(車聯(lián)網(wǎng))、工業(yè)制造(機器人)、遠程醫(yī)療、金融證券、災害預警等對時延非常敏感的網(wǎng)絡應用,一定會在所在地或距離所在地最近的數(shù)據(jù)中心完成。上述應用的價值已經(jīng)不能只從性價比上考慮,而是產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的主要方向和可以預見的經(jīng)濟增長動力,相關的產(chǎn)業(yè)帶動效應和擴散效應不可低估。
技術架構:推動分布式IT架構創(chuàng)新發(fā)展
“東數(shù)西算”具體的算力資源配置和運用,可以很大程度上刺激國內(nèi)軟硬件企業(yè)的技術創(chuàng)新。有人認為,數(shù)據(jù)中心的一些利潤較高的軟件和硬件掌握在國外企業(yè)手中,參與其中的很多國內(nèi)企業(yè)沒有那么高的利潤率。這可能是一個誤解。“東數(shù)西算”非常有利于分布式IT架構的創(chuàng)新發(fā)展。
比如,目前所有的傳統(tǒng)行業(yè)中,銀行業(yè)的數(shù)字化程度是最高的。銀行時刻要處理大量數(shù)字,巨大的數(shù)據(jù)量和吞吐量需要銀行業(yè)的IT架構由集中式轉(zhuǎn)向分布式。具體而言,就是把一臺集中式服務器替換為多臺中小型服務器,每一臺服務器不負責全部功能,而是只負責一個模塊,聯(lián)合起來的多臺服務器總體支撐整個系統(tǒng)。
銀行業(yè)務的系統(tǒng)架構從集中式轉(zhuǎn)向分布式,數(shù)據(jù)結構、算力分配、資源調(diào)度的方式都要改,相當于代碼的底層邏輯變了。例如,一個簡單業(yè)務場景轉(zhuǎn)賬,集中式架構中,賬戶、轉(zhuǎn)賬、賬單等模塊都在同一個系統(tǒng)后臺,全程數(shù)據(jù)也都存在同一個數(shù)據(jù)庫里。但在分布式架構中,一個系統(tǒng)被拆分為多個后臺系統(tǒng),數(shù)據(jù)庫也被拆分為多個數(shù)據(jù)庫,同樣的業(yè)務要調(diào)用更多的模塊,就需要通過更改底層代碼邏輯來實現(xiàn)。由此帶來的產(chǎn)業(yè)機會是,上層的各個業(yè)務系統(tǒng),比如核心交易系統(tǒng)、信貸管理系統(tǒng)都要進行相應的改造。
前瞻創(chuàng)新:產(chǎn)業(yè)規(guī)劃牽引技術發(fā)展
可以看到,“東數(shù)西算”的相關政策性文件中,非常強調(diào)對技術的高標準和特殊要求,尤其在時延方面,提出數(shù)據(jù)中心集群端到端單向網(wǎng)絡時延原則上在20毫秒范圍內(nèi);城市內(nèi)部數(shù)據(jù)中心端到端單向網(wǎng)絡時延原則上在10毫秒范圍內(nèi)。
理論上看,只有基礎設施具備提供超低時延的能力(數(shù)據(jù)的快速獲取、算法的快速生成、及時響應變化等),才敢把數(shù)據(jù)中心放在遠端??墒牵巯碌某墒旒夹g和傳統(tǒng)的建設方式確實難以達到這些指標的要求。超遠距離傳輸會有時延,跨網(wǎng)絡、跨運營主體的使用場景還會造成更大的時延,比如,數(shù)據(jù)從深圳的華為云數(shù)據(jù)中心傳動到位于甘肅的阿里云數(shù)據(jù)中心,中間是電信運營商提供的傳輸網(wǎng)絡,端到端時延的達標如何保證?
然而,產(chǎn)業(yè)規(guī)劃必定是具有前瞻性的,技術進步的因素需要被預先考慮,更要通過產(chǎn)業(yè)規(guī)劃來牽引技術的創(chuàng)新突破。況且,規(guī)劃中的指標是基于數(shù)據(jù)中心使用者的需求反推形成的,如果相關技術障礙不能得到解決,未來產(chǎn)業(yè)(工業(yè))互聯(lián)網(wǎng)更大范圍的商用,甚至 To B 數(shù)字經(jīng)濟多個核心產(chǎn)業(yè)的平穩(wěn)發(fā)展,都會遇到不小阻力。
長遠看來,“東數(shù)西算”工程將是一個更大時間尺度的整體性系統(tǒng)化工程,期間還有很多的現(xiàn)實問題需要解決,不能太過在意短期的產(chǎn)業(yè)紅利。但是,可以肯定的是,“東數(shù)西算”將會力推中國全體系化產(chǎn)業(yè)升級,統(tǒng)籌優(yōu)化國內(nèi)經(jīng)濟結構和算力布局,推動產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化的轉(zhuǎn)型,催生出新技術、新產(chǎn)業(yè)、新業(yè)態(tài)和新模式。
周倩 本刊特約撰稿人
本文發(fā)表于《中國工業(yè)和信息化》雜志2022年4月刊總第44期
(轉(zhuǎn)載)