
近期某主要雲端服務商的核心區域發生大規模「當機」,影響全球數千家企業,但也有公司成功應對這次危機。這次「當機」的根源是身分驗證服務故障,導致逾100項服務癱瘓。從技術層面看,這是典型的「級聯失效」;但從架構角度看,這則暴露過度集中依賴的問題。這不僅是技術事故,更是一堂價值千金的架構課。
許多企業為降低成本選擇無伺服器(serverless)架構,但忽略了一個關鍵風險—每次函數冷啟動都需要身分驗證授權。當認證服務不可用時,即使計算資源完好,整個服務仍會崩潰。這也提醒我們一個重要的思維轉變:從Cost Optimization(成本優化)走向Value Resilience(價值韌性),我們不僅要問這個架構能省多少錢,更要問架構在最壞情況下,能保護多少價值。評估一個架構的優劣,不只看各組件的可靠性,更要看組件間的依賴關係設計。
某成功應對此次「當機」的電商平台,將影響控制在30分鐘內,他們的做法體現經典的架構分層思維:其邊緣業務(數據分析、營銷)使用serverless架構,而這些服務即使短暫中斷,也不會影響核心交易;其核心業務(訂單、支付)則採用長期運行的虛擬機實例,配合預留容量,雖然成本比serverless高30%,但提供了穩定保障。從整體看,總成本優化約25%,同時大幅降低業務中斷風險。
許多人將預留實例僅視為省錢工具,但從架構韌性角度,預留容量更重要的價值是減少動態擴展依賴、容量保證和可預測性。這裡體現一個關鍵思維:保留閒置容量比極致的資源利用率,更符合商業利益。解決方案架構師的核心能力要能根據業務重要性進行差異化投資,而不是一刀切地追求成本最小化。
這次「當機」事件最重要的啟示是,架構韌性不是額外成本,而是系統設計的核心要求。真正優秀的解決方案架構師,是那些能在成本、性能和風險之間,找到最佳平衡點的人。掌握這種平衡藝術的專業人士,將成為市場上最搶手的人才。
文:陳曉煒博士
香港電腦學會企業架構專家小組執行委員會成員