Iccsz訊 在近日召開的“GNTC全球網絡技術大會”上,阿里技術保障部高級網絡專家曹捷表示,阿里網絡從最開始千兆、萬兆,到現在25G,以及到明年的100G,花了近五年的時間,這個過程當中經歷了很多次的技術迭代和很多次的試錯,最終阿里決定要把網絡做到最簡單,簡單到一個網絡里面只有一個路由協議,而且這個BCP路由協議沒有任何擴展的協議組。網絡在接入交換機就在最后的端口上,提供給服務器接入。
據曹捷介紹,在2013年和2014年,阿里第一次做網絡架構的標準化, 13年底實現了整個阿里數據中心的標準化建設,不管北京、上海、深圳,還是在云南、成都,機房里數據中心的網絡hope圖完全一樣,設備型號完全一樣,設備配置也完全一樣。之后,阿里做超大規模的網絡部署,解決了服務器分散,運維團隊忙不過來的問題。
2016年,為適應阿里云的迅猛發展,阿里網絡再次進行改造,第一次嘗試自己做網管,雖然成功的實現了網絡的正常運轉,但由于業務與網絡間過于耦合導致業務線對產品進行調整就需要網絡部門配合對網絡進行修改。為此,阿里開始將網絡與業務進行分離,從而實現網絡與業務的解耦。
曹捷認為,通過一次次迭代,讓阿里網絡的架構設計原則,變為越簡單越好。簡單才能穩定可靠,穩定可靠才可以活下來。
此外,曹捷認為,對于整個數據中心網絡流量監控也至關重要,要做流量可視化。流量可視化解決三個問題:第一個問題解決看不見問題,比如延時、轉發路徑等;第二個問題解決找不到問題,通過隨包的檢測和拓撲的維護,快速定位問題所在的位置;第三個是摸不準問題,通過可視化看網絡真實的轉發數據,把數據整合起來做分析,會找到整個網絡設計架構的盲點,解決收斂比、規模等設計難點。
曹捷表示,可視化將會在未來3-5年之內是阿里全力投入的數據中心網絡技術,其會幫助阿里在沒有辦法實現完全自研支持最大可能的掌握數據交配。