每日經(jīng)濟(jì)新聞 2022-04-28 17:20:54
◎行程碼至今已經(jīng)運(yùn)行了近2年,累計(jì)查詢突破458億次,近期單日查詢量維持在3億次左右,其使用量隨著全國疫情變化波動,成為疫情防控重要工具。
◎行程碼建立的備份容災(zāi)系統(tǒng)開展了多次應(yīng)急演練,可以隨時(shí)進(jìn)行主備切換。相關(guān)團(tuán)隊(duì)開發(fā)了全鏈路監(jiān)控系統(tǒng),能夠監(jiān)控各環(huán)節(jié)流量變化。為應(yīng)對流量高峰,團(tuán)隊(duì)建立了突發(fā)情況的限流機(jī)制,保障系統(tǒng)不中斷服務(wù)。
每經(jīng)記者 張蕊 每經(jīng)編輯 陳旭
**平臺又崩了……生活中,我們不時(shí)就會碰到這類常用APP出現(xiàn)宕機(jī)的事件。
隨著各領(lǐng)域數(shù)字化轉(zhuǎn)型推進(jìn),數(shù)字系統(tǒng)應(yīng)用范圍不斷擴(kuò)大,承載業(yè)務(wù)愈發(fā)關(guān)鍵,用戶高頻訪問成為常態(tài),系統(tǒng)復(fù)雜度呈指數(shù)上升,顯著增加了穩(wěn)定性方面的風(fēng)險(xiǎn)。
2021年,谷歌、亞馬遜、微軟、特斯拉等大型企業(yè)數(shù)據(jù)系統(tǒng)均發(fā)生過宕機(jī)事件,不僅對自身造成巨大損失,也嚴(yán)重影響全球范圍用戶的正常生產(chǎn)和生活。
4月27日,由中國信息通信研究院和中國通信標(biāo)準(zhǔn)化協(xié)會指導(dǎo),中國通信標(biāo)準(zhǔn)化協(xié)會大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)推進(jìn)委員會(CCSA TC601)主辦的首屆“全球數(shù)據(jù)系統(tǒng)穩(wěn)定性峰會”以線上線下結(jié)合的形式召開。
《每日經(jīng)濟(jì)新聞》記者從峰會上獲悉,大會旨在助力我國數(shù)字經(jīng)濟(jì)發(fā)展“又快又穩(wěn)”,推動全球數(shù)據(jù)系統(tǒng)穩(wěn)定性邁上新臺階。
中國信通院云計(jì)算與大數(shù)據(jù)研究所所長何寶宏在峰會上介紹,2021年全球發(fā)生多起嚴(yán)重的信息系統(tǒng)宕機(jī)事件,其中不乏互聯(lián)網(wǎng)基礎(chǔ)設(shè)施、金融核心業(yè)務(wù)系統(tǒng)等,這些關(guān)鍵系統(tǒng)的宕機(jī)事件不僅造成大量經(jīng)濟(jì)損失,也影響了社會的平穩(wěn)運(yùn)行,同時(shí)也給其他系統(tǒng)建設(shè)運(yùn)營者、監(jiān)管機(jī)構(gòu)敲響警鐘,系統(tǒng)的穩(wěn)定性保障成為當(dāng)前熱點(diǎn)問題。
事實(shí)上,在我國,保障關(guān)鍵系統(tǒng)的平穩(wěn)運(yùn)行一直受到高度重視。記者注意到,《關(guān)鍵信息基礎(chǔ)設(shè)施安全保護(hù)條例》自2021年9月1日起正式實(shí)施,明確要求關(guān)鍵基礎(chǔ)設(shè)施的運(yùn)營者要依照條例和有關(guān)法律法規(guī)保障關(guān)鍵信息基礎(chǔ)設(shè)施的安全穩(wěn)定運(yùn)行。
隨著數(shù)字技術(shù)的更新,信息化系統(tǒng)的重要性突顯,系統(tǒng)穩(wěn)定性面臨著新的挑戰(zhàn)。
何寶宏表示,互聯(lián)網(wǎng)等數(shù)字原生企業(yè)為提升數(shù)字能力、滿足用戶需求,不斷擴(kuò)大系統(tǒng)規(guī)模,引入敏捷開發(fā)流程,導(dǎo)致信息系統(tǒng)復(fù)雜性直線上升,穩(wěn)定性風(fēng)險(xiǎn)點(diǎn)增多。
此外,金融、電信等科技密集型行業(yè)系統(tǒng)在線化程度不斷提升,新技術(shù)不斷引入,信息系統(tǒng)功能范圍和復(fù)雜度不斷升級。而政務(wù)、能源等傳統(tǒng)行業(yè)也在政策推動下,將服務(wù)模式從原來5×8小時(shí)的線下模式升級成7×24小時(shí)的線上模式,導(dǎo)致系統(tǒng)穩(wěn)定性壓力激增。
與此同時(shí),當(dāng)前信息系統(tǒng)穩(wěn)定性保障領(lǐng)域在技術(shù)、管理等方面仍存在不足。比如技術(shù)方面,隨著新技術(shù)新架構(gòu)應(yīng)用存在異構(gòu)軟硬件兼容問題,分布式架構(gòu)普及集群規(guī)模擴(kuò)大導(dǎo)致硬件故障更普遍、通信交互更不穩(wěn)定。在管理方面,由于系統(tǒng)涉及的部門機(jī)構(gòu)增多,帶來大量的溝通成本,導(dǎo)致穩(wěn)定性保障鏈路變長,跨團(tuán)隊(duì)協(xié)作更加困難。
為助力我國各領(lǐng)域數(shù)據(jù)系統(tǒng)穩(wěn)定性提升,中國信通院在2020年啟動了穩(wěn)定性相關(guān)工作。以通信大數(shù)據(jù)行程卡(俗稱“行程碼”)為例,何寶宏介紹,行程碼至今已經(jīng)運(yùn)行了近2年,累計(jì)查詢突破458億次,近期單日查詢量維持在3億次左右,其使用量隨著全國疫情變化波動,成為疫情防控重要工具。
防疫工作人員查驗(yàn)旅客健康碼、行程碼 圖片來源:新華社
為保障大數(shù)據(jù)行程卡系統(tǒng)長期穩(wěn)定平穩(wěn)運(yùn)行,相關(guān)團(tuán)隊(duì)實(shí)施了很多保障穩(wěn)定性的措施。
具體而言,首先,通過優(yōu)化技術(shù)架構(gòu),對不同訪問渠道的服務(wù)資源進(jìn)行隔離,將三大運(yùn)營商的服務(wù)通道解耦,實(shí)現(xiàn)各渠道及各運(yùn)營商之間服務(wù)互不影響。
其次,對服務(wù)器負(fù)載均衡、帶寬、數(shù)據(jù)資源等進(jìn)行多次擴(kuò)容,以滿足不斷增長的網(wǎng)絡(luò)請求,目前系統(tǒng)峰值容量較去年已經(jīng)提升10倍以上,并通過周期性壓測隨時(shí)確認(rèn)系統(tǒng)的容量情況。
第三,行程碼建立的備份容災(zāi)系統(tǒng)開展了多次應(yīng)急演練,可以隨時(shí)進(jìn)行主備切換。團(tuán)隊(duì)開發(fā)了全鏈路監(jiān)控系統(tǒng),能夠監(jiān)控各環(huán)節(jié)流量變化。為應(yīng)對流量高峰,團(tuán)隊(duì)建立了突發(fā)情況的限流機(jī)制,保障系統(tǒng)不中斷服務(wù)。
最后,行程卡還建立健全了運(yùn)營維護(hù)的管理制度,形成了日常運(yùn)維、重點(diǎn)保障、應(yīng)急處置三位一體的運(yùn)維保障體系。
談及今后持續(xù)推動信息系統(tǒng)的穩(wěn)定性保障工作,中國工程院院士廖湘科認(rèn)為,應(yīng)當(dāng)從以下幾方面著手:
首先,要堅(jiān)持自主創(chuàng)新,優(yōu)化合作模式。
廖湘科說,對于軟件系統(tǒng)穩(wěn)定性的相關(guān)研究歷時(shí)已久,隨著軟件技術(shù)及研發(fā)理念的深度變革,對于穩(wěn)定性工作的研究也在持續(xù)革新。當(dāng)前,在引進(jìn)外部創(chuàng)新理論及開源技術(shù)工作的同時(shí),也應(yīng)當(dāng)堅(jiān)持自主創(chuàng)新路線,夯實(shí)自身理論基礎(chǔ),強(qiáng)化技術(shù)創(chuàng)新,形成自主可控的穩(wěn)定性保障技術(shù)能力。
“技術(shù)的創(chuàng)新突破不可能憑空產(chǎn)生,需要產(chǎn)學(xué)研用各方更進(jìn)一步深入合作,形成可持續(xù)的密切合作模式。”廖湘科建議,由應(yīng)用方提供真實(shí)的需求和場景,以真實(shí)的系統(tǒng)穩(wěn)定性問題引導(dǎo)產(chǎn)學(xué)研產(chǎn)出可以實(shí)際落地應(yīng)用的技術(shù)和技術(shù)創(chuàng)新。
其次,要統(tǒng)一行業(yè)認(rèn)知,加強(qiáng)服務(wù)支撐。
廖湘科表示,我國軟件技術(shù)目前在各個(gè)行業(yè)高度分散,缺乏統(tǒng)一標(biāo)準(zhǔn)和平臺,在保障信息系統(tǒng)平穩(wěn)運(yùn)行時(shí)也缺乏跨行業(yè)可共享的經(jīng)驗(yàn)和方法論。行業(yè)內(nèi)、行業(yè)間的認(rèn)知也存在碎片化、差異化的現(xiàn)象。
“通過統(tǒng)一行業(yè)認(rèn)知,形成規(guī)范化系統(tǒng)的穩(wěn)定性支持體系,系統(tǒng)保障體系和技術(shù)工具,以及共享化的系統(tǒng)監(jiān)測及運(yùn)營服務(wù)平臺,有利于降低建設(shè)成本,為中小企業(yè)提供普惠支持。”
此外,還要著力人才培養(yǎng),擴(kuò)大產(chǎn)業(yè)革命。“人才是可持續(xù)發(fā)展的基礎(chǔ),各層面的技術(shù)專業(yè)人才是信息系統(tǒng)穩(wěn)定性保障工作可持續(xù)發(fā)展的動力源泉。”
廖湘科說,在信息系統(tǒng)穩(wěn)定性這一領(lǐng)域,人才能力往往來自大量實(shí)踐經(jīng)驗(yàn)積累,因此對人才的培養(yǎng)需要產(chǎn)業(yè)界和高校共建,把行業(yè)積累的知識和實(shí)踐案例投入到教學(xué)和實(shí)踐中,同時(shí)也需要加大對系統(tǒng)穩(wěn)定性相關(guān)產(chǎn)業(yè)的投入,通過擴(kuò)大產(chǎn)業(yè)規(guī)模留住更多專業(yè)人才,甚至吸引更多人才進(jìn)入這個(gè)領(lǐng)域。
對于信息系統(tǒng)的穩(wěn)定運(yùn)行,中央網(wǎng)信辦信息化發(fā)展局副局長張望也提出了三點(diǎn)建議。
一是要注重制度建設(shè)和管理。信息系統(tǒng)運(yùn)營單位應(yīng)當(dāng)在充分發(fā)揮各方技術(shù)能力基礎(chǔ)上,更加注重制度建設(shè)和落實(shí),最大限度地保障信息系統(tǒng)的平穩(wěn)運(yùn)行。
二是提高技術(shù)保障能力。信息系統(tǒng)安全穩(wěn)定運(yùn)行是一項(xiàng)復(fù)雜的技術(shù)工作,既要加強(qiáng)技術(shù)能力建設(shè),也要加強(qiáng)產(chǎn)學(xué)研用的協(xié)作,推動信息系統(tǒng)穩(wěn)定性保障的理論研究和技術(shù)實(shí)踐走向深入。
三是要加強(qiáng)應(yīng)急演練,提高處置能力。
“信息系統(tǒng)運(yùn)行過程中難以避免出現(xiàn)突發(fā)情況,及時(shí)發(fā)現(xiàn)、及時(shí)處置,是保障系統(tǒng)長期穩(wěn)定運(yùn)行的關(guān)鍵一環(huán)。”張望說,信息系統(tǒng)的運(yùn)營單位應(yīng)當(dāng)制定針對各類問題的應(yīng)急預(yù)案,適時(shí)開展應(yīng)急演練,在突發(fā)情況時(shí)能夠快速響應(yīng)、高效處置。
封面圖片來源:新華社
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP