電子發(fā)燒友網(wǎng)報道(文/李彎彎)1月4日,西安“一碼通”又發(fā)生故障了,直到當天下午才逐漸恢復正常,根據(jù)陜西發(fā)布的消息,一碼通首頁顯示正常,但點擊不能順利進入。有市民接到通知:全市核酸檢測應急平臺因當前流量過大,網(wǎng)絡目前繁忙無法登陸,正在搶修。
這不是西安“一碼通”第一次發(fā)生故障,2021年12月20日,西安“一碼通”就曾因訪問量過大導致系統(tǒng)崩潰,無法掃碼,導致許多西安市民,難以進行核酸檢測。
“一碼通”宕機對市民日常生活影響有多大?西安市民出行、上班、出入小區(qū)都需要出示“一碼通”,同時持48小時核酸檢測。一碼通故障,使得西安交通出現(xiàn)擁堵,核酸檢測也需要耗時更長,這不僅影響市民正常生活,還可能增加交叉感染的風險。
西安需要盡快解決“一碼通”接二連三崩潰的問題,而這就需要找到“一碼通”崩潰的真實原因是什么?
真的只是網(wǎng)絡擁堵導致崩潰嗎
根據(jù)官方的說法,是因為網(wǎng)絡擁堵。上一次系統(tǒng)崩潰的時候,即2021年12月20日,在西安疫情防控記者會上,彼時西安市大數(shù)據(jù)局局長劉軍表示,12月20日早7時40分左右,西安“一碼通”用戶訪問量激增,每秒訪問量達到以往峰值的10倍以上,造成網(wǎng)絡擁塞,致使包括“一碼通”在內的部分應用系統(tǒng)無法正常使用。
“對于‘一碼通’平臺中斷對市民造成的不便,我們深表歉意,我們將持續(xù)加強對平臺的監(jiān)控,‘一碼通’平臺技術團隊將24小時不間斷駐場運維,加強網(wǎng)絡及系統(tǒng)資源保障,確保‘一碼通’平臺良好運行。”劉軍說,在全員核酸檢測的特殊時期,為減輕系統(tǒng)***非必要不展碼、亮碼,在出現(xiàn)系統(tǒng)卡頓時,請耐心等待,盡量避免反復刷新。
因為西安“一碼通”多次崩潰,1月5日凌晨,西安市大數(shù)據(jù)資源管理局黨組書記、局長劉軍因履職不力,停職檢查。
那么如何解決網(wǎng)絡擁堵帶來的系統(tǒng)崩潰呢,最直接的辦法是,限流和擴容。在2021年12月30日,工信部總工程師韓夏曾到西安調研,他就強調,要持續(xù)做好大數(shù)據(jù)和信息化支撐,西安“一碼通”要加強技術改進和網(wǎng)絡擴容,確保平臺安全穩(wěn)定運行。
然而真的是網(wǎng)絡擁堵造成系統(tǒng)崩潰,此前武漢疫情的時候,為什么沒有宕機的情況,武漢的長住人口,比西安更多哦,資料顯示,2021年西安市常住人口數(shù)為1295.29萬人,武漢市常住人口達到1351.5萬。
有熟知網(wǎng)絡系統(tǒng)的人士認為,網(wǎng)絡擁堵可能只是表象原因。據(jù)他分析,西安“一碼通”已經上線很長時間,大多數(shù)時候是穩(wěn)定的,西安的上班高峰期,也就是說掃碼高峰期,大概是在8點到9點之間,而幾次崩潰卻都發(fā)生在7點多,這個時候,網(wǎng)絡應該是不擁堵的。
而且即使真是網(wǎng)絡擁堵導致系統(tǒng)崩潰,其實很容易解決,就如上文說的,限流、擴容,這個操作并不難,而且耗時不長。比如說限流,只需要把一部分網(wǎng)絡請求阻攔住,讓另外部分網(wǎng)絡請求通過就可以,擴容就是增加服務器的硬件,比如內存、CPU,或者如果服務器有集群,可以增加更多服務器。
如今計算機系統(tǒng),基本都是部署在云上,西安“一碼通”聽說是部署在阿里云上,在云計算平臺上限流、擴容,可能并不需要花費大半天時間,而西安“一碼通”上一次崩潰,到恢復耗費了一整天時間,這次也花費大半天。
另外還有一個很奇怪的現(xiàn)象,就是在12月20日當天,“一碼通”的樣式回滾到了幾個月前,據(jù)描述,從10月底開始,“一碼通”二維碼就有了邊框注明***接種的狀態(tài),而在12月20日上午這個樣式里是有邊框的,到下午系統(tǒng)恢復之后,卻沒有邊框,顯示的是幾個月前的樣式,據(jù)該人士分析,如果是流量太大,直接優(yōu)化網(wǎng)絡和硬件就可以,程序怎么會回滾到幾個月前,真正的原因可能是,程序出了問題,一時改不好,所以直接找到以前的版本運行。
再次崩潰的真實原因是什么
另一位技術工作人員就“一碼通”再次崩潰原因也進行了分析,他認為,是因為高并發(fā)下緩存被擊穿,且未用時序數(shù)據(jù)庫,要解決這個問題,只有幾天時間是來不及的。
該工作人員表示,集群擴容、性能調優(yōu),這些快速見效的方法肯定都已經做了,還是會瞬間宕機,而最深層的原因是,“一碼通”平臺自身系統(tǒng)設計的問題,系統(tǒng)性能不夠,短時間很難解決,現(xiàn)在只能是做好限流熔斷,避免全面崩潰。
針對“一碼通”崩潰的問題,有10余位來自騰訊、華為、中興等企業(yè)人士,從前端、后端、測試等多個方面進行過分析,也談到系統(tǒng)設計的不足。
比如說,市民因為長時間無法刷出健康嗎,多次退出刷新,導致更多新流量送達服務器,給服務器帶來壓力,這其實也說明西安“一碼通”的系統(tǒng)在限流措施上沒有做好。
再比如,“一碼通”平臺在設計的時候,可能并沒有考慮到高流量、高負載的情況,產品設計未考慮千萬級的并發(fā)訪問,而且交付前未進行同等級的壓力測試。
為什么會出現(xiàn)這些情況,或許與項目實施過程中的一些不妥舉措有關。據(jù)了解,現(xiàn)在正在運行的“一碼通”,是由市大數(shù)據(jù)資源管理局牽頭,中國電信西安分公司開發(fā)部署,作為總承包方,中國電信將該項目全部外包招標,而采購來源單一。
這里列出部分采購信息:
“一碼通”系統(tǒng)建設單一來源:西安東軟
“一碼通”安全配套單一來源:杭州安恒
可視化工程單一來源:中譯語通
200W的短信服務單一來源:阿里云
并不是說單一來源就一定會出問題,讓人疑惑的是,這么大的項目,為何不可以進行多渠道采購,比如說,配套安全項目,全部采購自杭州安恒,估計這么大的項目,金額都是百萬以上,因為都是標準設備,其實市面上可供選擇的產品很多,為什么只選擇一家。
另外還有一個很奇怪的情況,在2020年上線的時候,由西安市大數(shù)據(jù)管理局為主單位籌建的西安“一碼通”系統(tǒng),因為建成效果非常好,曾獲得表彰。然而在2021年11月26日,以西安科技局為甲方牽頭單位的西安“一碼通”系統(tǒng)開發(fā)項目公開采購結果。
也就是說,西安已經計劃不再使用由西安市大數(shù)據(jù)管理局為主籌建的“一碼通”系統(tǒng),而將更換為由西安科技局牽頭的“一碼通”,這不猶讓人猜測,是不是在2021年12月20日之前,現(xiàn)行的西安“一碼通”系統(tǒng)已經顯現(xiàn)出問題,因此更換牽頭方。
總結
截至1月4日,西安現(xiàn)有確診病例1741例,新增確診病例95例,幾乎成為繼2020年武漢以來疫情非常嚴重的城市。因此,保證“一碼通”系統(tǒng)的穩(wěn)定性,攻克上述提到的問題,是目前的當務之急。
然而就如上文所言,如果是系統(tǒng)本身架構設計的問題,短期內只能做到讓系統(tǒng)恢復運行,未來崩潰宕機的情況可能還是會時而發(fā)生,或許當前也只能期待由西安科技局牽頭的“一碼通”新系統(tǒng)項目早日完成,而且期望它在系統(tǒng)設計上做到更好。
-
電信
+關注
關注
2文章
732瀏覽量
61986
發(fā)布評論請先 登錄
相關推薦
評論