主頁 > 知識庫 > 資深網(wǎng)絡架構師揭秘金山云骨干網(wǎng)

資深網(wǎng)絡架構師揭秘金山云骨干網(wǎng)

熱門標簽:成都云外呼系統(tǒng)價錢 貴陽防封電銷卡售后有保障 電銷機器人立法 灌云探銳電話機器人價格優(yōu)惠 云外呼系統(tǒng)教程 新一代電銷機器人 小鳴電話機器人 沃能汽車店地圖標注 地圖標注創(chuàng)意項目
 

 骨干網(wǎng)(Internet Backbone Network)是連接國與國、城市與城市之間的高速互聯(lián)網(wǎng)絡。如下圖所示,它通過海纜和路纜,將分布在世界各地的數(shù)據(jù)中心連接起來,是互聯(lián)網(wǎng)辦事提供商和云計算辦事提供商的重要基礎設施,肩負著滿足全球范圍內網(wǎng)絡數(shù)據(jù)通信需求的重任。

  全球骨干網(wǎng)示意圖

  骨干網(wǎng)的角色如此重要,以至于與此有關的話題,常常會引起業(yè)界的關注和討論。作為云計算的基礎,國內的云計算辦事提供商是如何運維本身的骨干網(wǎng)的?又是如何實現(xiàn)自動化運維的?有哪些值得分享、思考的經(jīng)驗和做法?作為一名從業(yè) 10 年的網(wǎng)絡架構師,我向大家介紹一下金山云骨干網(wǎng)的現(xiàn)況,希望對大家有所幫手。

  如何快速發(fā)現(xiàn)骨干網(wǎng)級別故障?

  首先簡要介紹一下建設進展。金山云目前在北京和上海兩地之間租用專線搭建起了骨干網(wǎng)絡,根據(jù)計劃,本年金山云會在廣州安排節(jié)點,將進一步擴大環(huán)網(wǎng)規(guī)模,搭建北上廣骨干環(huán)網(wǎng),大幅提升金山云公有云辦事的網(wǎng)絡質量SLA。

  當然,這并不是說建設骨干環(huán)網(wǎng)后就不會出故障了,,對于互聯(lián)網(wǎng)公司和云計算辦事商來說,運營商的骨干網(wǎng)絡故障是很讓人頭痛的,因為在通常情況下,這種故障會影響到多個省份用戶網(wǎng)絡的拜候質量。

  例如, 2016 年 11 月 19 日晚 8 點,包孕華南、西南、華中等在內的國內多個地區(qū),超過 10 個省份的用戶,在拜候華北地區(qū)的辦事節(jié)點時,均出現(xiàn)了問題。測試結果顯示,ICMP丟包率高達30%,延遲增大了約100ms,這種級另外丟包率和延遲情況,如果不及時處理,將導致用戶的業(yè)務嚴重受損。

  那么,對于這種骨干網(wǎng)級另外故障,云辦事商能否做到快速發(fā)現(xiàn)定位呢?當然是可以的。

  金山云的做法是,通過自研開源監(jiān)控的方式,研發(fā)出辦事于金山云整個骨干網(wǎng)的網(wǎng)絡質量監(jiān)控系統(tǒng)(Netbench)。

  金山云網(wǎng)絡質量監(jiān)控系統(tǒng)監(jiān)控圖

  如上圖所示,金山云的這套系統(tǒng)支持多地區(qū)、多ISP監(jiān)控,可在運營商發(fā)生骨干網(wǎng)故障時,快速發(fā)現(xiàn)并準確定位故障,同時采用電子地圖這種直不雅觀形式,顯示出各省份各地級市的網(wǎng)絡質量(延遲、丟包等數(shù)據(jù)),如果某地出現(xiàn)問題,地圖上相應位置的顏色就會變得差別。

  金山云網(wǎng)絡質量監(jiān)控系統(tǒng)架構圖

  金山云這套網(wǎng)絡質量監(jiān)控系統(tǒng)的主要特點,分為定位策略、主要功能、應用場景三部分:

  一、定位策略

  抓取拜候客戶辦事的用戶IP作為監(jiān)控目的IP;

  多對多的監(jiān)控模式,多個源IP監(jiān)控全國各個省市的用戶IP(保證數(shù)據(jù)的準確性制止路由ecmp不均勻的問題);

  通過對抓取到的IP進行篩選,排除掉一些不準確的IP,最終篩選出每省份數(shù)百個有效IP進行監(jiān)控;

  商用的IP地址庫與BGP IP結合對抓取到的IP進行區(qū)分(ISP、省、市等);

  Master-Slave的安排模式,監(jiān)控周期可精確到分鐘級(每 1 分鐘)。

  二、主要功能

  提供短信、微信、郵件告警;

  提供故障時的MTR數(shù)據(jù)(平均每省份多個MTR),可幫手判斷l(xiāng)oss節(jié)點;

  提供柱狀圖、歷史數(shù)據(jù)展示等功能,可追溯故障,查看故障時的丟包以及延遲情況;

  可針對重要的IP進行指定監(jiān)控。

  三、應用場景

  可覆蓋CDN、靜態(tài)、BGP等多網(wǎng)絡類型;

  目前可針對EIP(計算)、KS3(存儲)、KLS(視頻)等業(yè)務類型進行監(jiān)控。

  骨干網(wǎng)調度架構圖

  如何快速解決骨干網(wǎng)級別故障?

  對于骨干網(wǎng)級另外故障,除了需要快速發(fā)現(xiàn),更需要快速解決。

  有些互聯(lián)網(wǎng)和云計算辦事提供商,會通過多線BGP切換故障ISP流量至其他的ISP的方式繞開故障點,由于我國南北互通問題,跨網(wǎng)拜候的質量很差,丟包和延遲都無法保證,并且在跨網(wǎng)切換時,會有較長時間的路由收斂,導致客戶長連接業(yè)務中斷。

  金山云制止了這些問題。因為金山云的自建骨干網(wǎng)絡擁有支持跨區(qū)域調度能力,當出現(xiàn)故障時,能夠通過骨干網(wǎng)跨地區(qū)調度故障運營商流量,這種調度只是在同ISP差別地區(qū)之間的調度,只增加地區(qū)間的延遲,對整體丟包并無影響,這樣一來,整體辦事質量就得到了保障,同ISP內的路由切換收斂時間,可保證用戶無感知,在近幾次運營商南北骨干網(wǎng)故障中,金山云均做到了故障的快速調度恢復,客戶也不必再因為運營商骨干網(wǎng)的故障而頭疼了。

  骨干網(wǎng)絡調度前后對比圖

標簽:安順 喀什 亳州 丹東 梧州 合肥 襄陽 贛州

巨人網(wǎng)絡通訊聲明:本文標題《資深網(wǎng)絡架構師揭秘金山云骨干網(wǎng)》,本文關鍵詞  資深,網(wǎng)絡,架構,師,揭秘,;如發(fā)現(xiàn)本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《資深網(wǎng)絡架構師揭秘金山云骨干網(wǎng)》相關的同類信息!
  • 本頁收集關于資深網(wǎng)絡架構師揭秘金山云骨干網(wǎng)的相關信息資訊供網(wǎng)民參考!
  • 推薦文章