孫凝暉:新一代信息基礎設施的思考
(孫凝暉 2020年5月14日)
信息高鐵的廣義定義是指面向IT 3.0信息基礎設施的一個技術體系,它的狹義定義是指IT 3.0信息基礎設施技術的一個綜合試驗場。
1、信息高鐵技術體系的核心構成
下圖是信息高鐵技術體系的核心構成圖。信息高鐵是由云、網、端三層的新型設備和一個控制中樞組成。
信息高鐵的核心構成圖
控制中樞是我們最近新提出的,信息高鐵跟以前的信息高速公路最主要的區別之一就是要有一個全局測調系統。從技術哲學層面看,互聯網是一個“純民主”的結構,早期的電信網是一個“純集中”的結構,有集中管控。信息高鐵是一個“民主集中制”的結構,組成單元是民主的,不需要審批就可以建一個信息高鐵站,也就是一個數據中心,獨立提供服務;但是也有集中的部分,需要有全局測調和在重載、安全事件突發等情況下一定程度的控制。為了支撐這個控制中樞,在網絡里、在基站里、在服務器里、在系統軟件里,甚至在微體系結構里,都需要提供一些測量、控制與調度上的支持。
下面介紹一下狹義的綜合試驗場。軍事領域的裝備創新需要一個裝備試驗場,集團化的協同作戰需要建一個朱日和綜合試驗場,進行規模化的中試。在IT領域,美國的ARPANet、PlanetLab都是新技術體系的綜合試驗場,中國要在技術體系層面有更多原創的工作,必須有一個自己的信息基礎設施技術綜合試驗場。
所以從去年開始,計算所和南京談合作,支持我所在麒麟區建一個綜合試驗場。這個綜合試驗場包括一個內場和一個外場。內場包括三個中心,其一是試驗中心,就是把外場縮小了放到內場里邊進行仿真模擬,包括衛星網絡、工業5G網絡這兩個新的接入網絡;其二是面向管理的全局測調中心,其三是面向用戶的全局運營中心。計算所與其創辦的曙光、寒武紀、睿芯、天璣等企業以及計算所眾多分所合作,一起用信息高鐵這個統一概念,在全國各地建一些不同類別的信息高鐵站,通過發改委支持的大科學裝置“CENI未來網絡”連接起來,做一個真實環境的外場。在外場有四類算力資源站,第一類叫超算中心,是曙光公司在昆山、北京、深圳等地方建立;第二類叫智能計算中心,是寒武紀公司在珠海、濟南等地方建立;第三類叫高通量中心,是睿芯公司在鹽城、雅安等地方建立;第四類叫大數據中心,是天璣公司在鄭州等地方建立;還有另外一類叫接入站,規劃計算所的十幾個分所在各地建立,這些分所要為地方的企業服務的話,算力資源、行業應用、數據模型等不見得要自己建,通過接入站,讓用戶接入到這個信息高鐵算力網絡中來,就可以虛擬地擁有自己專屬的一個私有云。在這個外場和內場結合的試驗場,研究所、大學、企業等都可以對新的技術體系進行中試,新的技術、新的設備、新的應用都可以進行評測。以后企業如果想銷售自己的產品,給客戶展示自己的技術,都可以到這個綜合試驗場來,先參觀看演示,再談銷售。
信息高鐵的建設規劃分三步走。近期目標,希望通過五年時間,到2025年,建成信息高鐵綜合試驗場,包括1個南京總站,10個信息高鐵資源站,16個信息高鐵接入小站。目前硬件層已經準備的比較充分了,今年網絡計算創新研究院部署了系統軟件的研制任務,希望在兩年之內把系統軟件做好,然后再做信息高鐵新型應用,分層推進與整合。
中長期規劃,第二步到2030年,實現信息高鐵的“小網通”,覆蓋我國100個以上城市,形成一個使用新技術體系建設的信息基礎設施,在我國產業互聯網的發展中展現出優勢。第三步到2035年,實現信息高鐵的“大聯通”,信息高鐵技術體系輻射到全國3000個城市的信息基礎設施建設,并走向一帶一路國家。這是計算所推動“新基建”的一個思路。
信息高鐵的商業推廣模式是“聯邦制”。計算所提供共性技術與標準,每個城市建設的信息高鐵站由計算所合作企業承建,是產權獨立的主體,組成類似歐盟的城市算力聯邦,通過信息高鐵總站進行統一計價和結算。中央測調系統能對全網資源進行測調,對應用的用戶體驗進行測評。用李曉東研究員的說法,未來信息高鐵要實現價值互聯網,價值在城市之間是可以流動的,即一個城市的數據、模型等結果對另一個城市有用。這個價值是可以通過區塊鏈來進行標識,進行結算的。聯邦制的信息高鐵不再是巨頭壟斷式的游戲,是中小城市、中小企業共同結成的一個算力命運共同體。
信息高鐵的商業推廣模式
2、信息高鐵的定位
信息高鐵的定位是一個主要服務產業互聯網的新型信息基礎設施。
當前的信息基礎設施是美國在20世紀90年代提出的信息高速公路計劃的產物,主要服務消費互聯網,比如微信、網絡視頻,通過互聯網普及深刻地影響了數字經濟。信息高鐵是面向互聯網的下半場,服務產業,支撐新一代信息技術與產業的深度融合,加速行業的數字化與智能化進程。信息高鐵并不是替代信息高速公路的下一代技術,而是和信息高速公路長期并存、協同工作,相當于公路和鐵路一樣。
我們給這個綜合試驗場取名信息高鐵,也是從各國發展交通基礎設施的不同思路中得到的啟發。比如日本,它的特點是人多(1.28億),地少(37萬平方公里),民眾集體性強、守紀律,是發達國家(人均3.9萬美元)。從交通數據來看,鐵路2.8萬公里,日均6200萬人次,年均226億人次,是世界第一;新干線3280公里,日均115萬人次;高速公路7920公里,日均441萬輛;飛機場101座,前10名日均71萬人次;東京都的交通出行比例,軌道占比77%,電車占比0.3%,汽車占比15.3%,Bus占比4.3%,出租車占比3.8%。從中可以看出日本交通主要依靠軌道交通,它具備幾個特點,首先是分級,有新干線、JR、城郊、市內等;有多個運營商,包括JR、東京都、私營等;還有多種交通卡,統一結算;新干線車站與綜合性商業設施一體化;高密度發車,高密度車站,而且能做到非常準時。這樣復雜的系統沒有一個強大的測調系統是做不到的。
美國是汽車上的民族,所以他們提出信息高速公路是跟他們的背景有關的。如果60年代是一個中國人在中國發明了互聯網,那么互聯網的標準、互聯網的架構和今天會是一模一樣嗎?科學技術的發明創造,背后是有哲學基礎的,跟思維方式和文化背景相關。中國的國情是“人多”、“地少”、“錢少”、“可控”,中國的選擇是發展大運力的鐵路系統,輔以靈活的公路系統,高速的航空系統。我國的文化是接受讓渡一些個人隱私做到更加的可控,尤其是在擁堵情況下的可控。西方的民眾認為隱私是不能交給政府,或交給某一個組織的。就像疫情突發時,我們愿意讓渡一些個人的隱私來保障社會安全,我們對政府是信任的。
所以用信息高鐵來命名我們的未來信息基礎設施技術體系,是有這些哲學思考在里面。
3. 信息基礎設施技術體系的演進
信息高鐵(Information Superbahn),是IT 3.0時代的信息基礎設施技術體系,面向人-機-物三元融合的計算需求,提供高通量的計算與傳輸能力, 保障高品質的萬物智聯信息服務。
信息基礎設施技術體系的演進路線圖
信息基礎設施技術體系的演進如上圖所示,IT 1.0是高算力,IT 2.0是高帶寬,現在的IT 3.0是高通量。在互聯層面,最早是機器之間的一元互聯,然后演進到人和機之間的二元互聯,現在是人-機-物的三元互聯。算力從最早的超算中心到云計算中心,再到現在的高通量計算中心。
高通量包括四個特征,分別是:1)高并發——海量用戶的吞吐率高,連接千億級互聯物端;2)強實時——端到端延遲可控,支持實時語音等延遲敏感應用;3)全局可調——重載下資源全局可測可調,提高體驗降低資源;4)內構安全——基礎硬軟件與網絡設備內構的安全加固,提高危險時的控制手段。這些技術特征與產業互聯網上的很多新興應用的需求特征是吻合的。
互聯網是終端-云端的消費互聯網應用,萬物智聯網是端-邊-云的AI、大數據、IoT、工業互聯網應用;信息高速公路的標簽是寬帶,從3G、4G到5G,以數據傳輸為主;信息高鐵的標簽是高通量,講求并發數,數據傳輸和數據處理并重。信息高速公路的服務是盡力而為,尾延遲長,且不可控,追求的用戶體驗是快;信息高鐵的服務是可調,尾延遲短、可控,追求的用戶體驗是多和穩。
2010年李國杰院士領導我們做973項目的時候,提出了高通量這個詞,現在來看這個詞具有很長的生命力,它不僅僅作為高性能計算機的一個特征,也可以作為智能處理的一個特征,還可以作為智能網絡與接入的一個特征,是人-機-物三元計算的核心特征。
4、體系結構視角—“ Network is Computer”
信息高鐵技術體系的新在哪里?可以透過“網絡就是計算機”,也就是把整個信息基礎設施看成是一臺計算機系統的話,從體系結構的視角看,有哪些地方需要創新的。
Sun公司在互聯網發展的早期提出來“Network is Computer”的理念。如果把信息基礎設施看成一個計算機系統整體,那么數據中心是處理器,存儲系統是內存,互聯網骨干網是數據總線,無線接入網是I/O總線,IoT設備是各類終端,云存儲是磁盤。消費互聯網是“數據互聯網”,關注的是在終端、數據中心之間怎么移動數據;產業互聯網是“算力互聯網”,關注的是各類終端的數據怎么在各類數據中心上被高效處理。
那么信息高鐵這臺算力互聯網計算機在體系結構上還缺什么?它缺全機地址空間的命名、分配機制,缺數據總線,缺控制信令,缺全機調度器與資源分配算法,缺數據標簽與應用標簽,缺全機編程框架與使用環境,缺全機分布式應用等。
下面舉例說明可能的新在哪里。信息基礎設施的架構與控制機制為什么要變呢?因為現有信息基礎設施缺乏對高載荷的綜合應對能力,在高并發場景下,實時性的保障差,尾延時大幅增加。當負載超過現有信息基礎設施的容量時,就需要通過額外增加大量資源來保證信息服務,否則會引起大量混亂。從控制結構上看,對于復雜的規模很大的系統,強兩維控制才是有效的,局部強、全局也要強。現在互聯網是局部強、全局弱。一個好的可擴展系統都是強兩維結構,比如機群結構就是一個強兩維結構,每一個節點從原來一顆CPU,兩顆CPU,到四顆CPU,再到一顆加速器,四顆加速器,全局互聯的能力也在不斷變強。所以信息高鐵的架構需要變,增加一個全局測調中心,在時間和空間兩個維度做調度,在時間維度可以把大載荷服務的時間拉平一點,在空間維度可以把擁堵地方的負載調到空閑的地方。
5、打造信息基礎設施技術體系的戰略意義
信息高鐵的戰略意義有三點。一,形成信息基礎設施的“C”體系;A體系是美國主導的信息高速公路技術體系;B體系是中國為了國家安全必須打造的自主創新技術體系,是防御性的,底線思維的,較難走向國際的;C體系是面向未來需求的、全球合作、不會被卡死的、先進的技術體系,可以推廣到“一帶一路”國家。二,信息高鐵可以低成本、高品質地大幅提高我國信息基礎設施的服務質量,更大程度消除地域間的信息鴻溝,加速我國數字經濟的進程。三,信息高鐵基礎軟硬件、核心網絡采用內構的安全加固,局部自治、全局可調的架構提供了安全應急新手段,有助于在網絡安全事件突發時的防控。
最后小結一下,信息高鐵的三個關鍵詞就是C體系、高通量、聯邦制。目標就是要形成中國的信息基礎設施的技術體系,提供萬物智聯的高品質信息服務,推動數字經濟的跨越發展。以信息高鐵綜合試驗場為源頭,鏈接遍布全國的算力資源,形成輻射全國的算力互聯網。
(節選自孫凝暉所長在2020年計算所春季戰略規劃會上的講話)