近幾年,中國電信運營商都開始大規(guī)模建設軟交換網絡。軟交換網絡和傳統(tǒng)PSTN的一個很大區(qū)別是從電路交換轉變?yōu)榉纸M交換,其承載網絡從傳輸網絡轉變?yōu)镮P分組網絡。這種轉變在網絡和業(yè)務上給運營商帶來各種優(yōu)勢的同時,也對維護提出了一些新的挑戰(zhàn)。其中,軟交換和承載網關聯(lián)性故障的處理就是一個困擾軟交換網絡維護的主要難題。
軟交換和承載網關聯(lián)性故障是指故障現(xiàn)象體現(xiàn)在交換側,但實際故障點在IP承載網上網絡故障。軟交換網絡運行中已發(fā)生過多次相關故障,故障影響大、處理難,已成為相關維護部門普遍面臨的問題。
關聯(lián)性問題分析
目前軟交換網絡和IP承載網仍是松耦合關系,這種松耦合具體體現(xiàn)在兩個方面:首先體現(xiàn)在維護管理上,往往由不同的團隊分專業(yè)維護管理,由不同的網管系統(tǒng)監(jiān)控,且IP網維護時往往只考慮了原有上網和專線數(shù)據(jù)業(yè)務的特點,未考慮話音這種實時業(yè)務的特征,其對承載網端到端服務質量的變化,缺乏相應的手段;其次體現(xiàn)在技術上,軟交換網絡在業(yè)務層缺乏感知承載網端到端服務質量的有效手段,承載網發(fā)生故障或服務質量劣化時,軟交換無法及時準確告警并切換。
由于這種松耦合關系,造成設備和網管上都缺乏詳細準確的告警信息,且故障主要處理人員一般仍為交換專業(yè)人員,造成運維人員對故障處理不知如何下手,嚴重影響故障修復的效率。
同時,軟交換網絡相比于原有PSTN網絡,由于采用了IP網絡作為其承載網絡,其在承載和業(yè)務故障關聯(lián)上也體現(xiàn)出不同的特征,具體如下。
——交換側保護切換能力方面:PSTN網絡中交換機能感知TDM傳輸問題(如中斷、滑碼)并切換,而IP網絡只能感知與承載網物理層中斷情況,不能感知承載網QoS的變化,因而軟交換網絡也無法根據(jù)承載網絡QoS變化進行切換。
——承載網保護切換能力方面:PSTN網絡中傳輸設備能根據(jù)中斷、滑碼進行保護切換,保護切換能力較強,而IP網絡只能根據(jù)物理層中斷進行切換,無法根據(jù)QoS變化進行切換,導致IP網絡板卡非中斷故障容易影響軟交換業(yè)務。
——故障定位手段方面:TDM網絡中傳輸協(xié)議較簡單(主要是物理層),依靠自環(huán)等簡單維護手段就能快速定位,而IP網絡中涉及應用層等協(xié)議,快速定位軟交換還是IP承載問題較困難,造成軟交換網絡中難以快速區(qū)分軟交換還是IP承載故障。
——語音質量方面:PSTN網絡占有話路后即獨享帶寬,而IP網絡中所有用戶共享帶寬,使得基于IP承載的軟交換網絡難以保障語音可靠的帶寬。
——語音傳送的顆粒度方面:PSTN網絡中使用2M和155M的接口傳送業(yè)務,顆粒度較小,而基于IP網絡的軟交換網絡流量集中,核心設備多以GE口傳輸,業(yè)務顆粒度較大,使得一旦發(fā)生承載網故障對業(yè)務量的影響巨大。
——網絡維護指標方面:PSTN網絡中定義影響10萬用戶小時即為網絡重大故障,而IP網最高服務標準(金牌客戶)為4小時故障修復時間,使得承載網中認為較小的故障,在軟交換網絡中就提供語音業(yè)務而言將成為重大故障。
由于這些差異,相對于原有傳輸網故障對交換網的影響,IP承載網故障時對軟交換網絡的影響更大,且我們不能借用PSTN原有的一些故障處理方法和經驗來處理軟交換和承載網的關聯(lián)故障。這就需要維護部門針對軟交換承載特點,從維護作業(yè)制度和維護手段創(chuàng)新,一方面盡量降低軟交換和承載關聯(lián)故障發(fā)生的概率,另一方面提升應對軟交換和承載關聯(lián)故障處理的效率。
應對措施建議
軟交換和承載關聯(lián)性問題涉及的原因較復雜,許多技術性問題和支撐手段也不可能在短期得到解決,因此建議相關維護部門在不同的階段,根據(jù)不同的條件,采取不同的應對措施。
(一)、短期應對措施
短期應對措施的目的是降低軟交換承載故障發(fā)生的概率,縮短承載層故障發(fā)生后故障處理的時間,避免故障范圍和影響面擴大,建議采取以下措施:
——開展網絡自查,減少故障隱患;
——優(yōu)化軟交換設備和網管告警信息;
——增強承載網的透明度;
——將軟交換CE設備統(tǒng)一納入數(shù)據(jù)維護部門統(tǒng)一維護;
——對軟交換和承載網保護切換方式進行梳理,確保其保護切換的協(xié)調性;
——總結故障現(xiàn)象,優(yōu)化故障處理流程,部分故障情況下建議相關部門并行同步處理。
(二)、中期應對措施
中期應對措施的目的是對于承載網絡質量和故障能做到監(jiān)測系統(tǒng)自動發(fā)現(xiàn)、實時告警,維護人員主動處理,在大范圍用戶受影響前業(yè)務能恢復正常。主要方式有建立承載層的全程質量監(jiān)測系統(tǒng)和軟交換綜合告警系統(tǒng)。
——建立承載層的全程質量監(jiān)測系統(tǒng)針對現(xiàn)有承載網缺乏端到端服務質量監(jiān)控手段的問題,建議通過部署探頭的方式,建設承載層的全程質量監(jiān)測系統(tǒng),對軟交換承載網端到端連通性及服務質量進行實時監(jiān)測。
——建立軟交換綜合告警系統(tǒng)目前現(xiàn)網軟交換和承載網通過各自的網管系統(tǒng)對設備實施管理,系統(tǒng)告警僅輸出至自身網管,在發(fā)生問題時,維護人員需要綜合查看多個系統(tǒng)后進行故障關聯(lián)分析判斷,影響故障處理速度。針對該問題,建議建設軟交換綜合告警系統(tǒng),將軟交換設備和承載網設備以及信令監(jiān)控、承載監(jiān)控等輔助系統(tǒng)的告警予以集中呈現(xiàn),并將實現(xiàn)軟交換和承載網故障關聯(lián),在網絡發(fā)生問題時能將故障點快速呈現(xiàn),引導維護人員及時處理。
(三)、遠期應對措施
遠期應對措施的目的是對于網絡故障承載層設備能自動發(fā)現(xiàn)、實時告警、自動切換,將影響面降到最小。主要措施有:
——在軟交換業(yè)務全程質量監(jiān)測系統(tǒng)的基礎上,增加對設備切換控制功能,使其能夠通過檢測結果,控制軟交換系統(tǒng)和承載網設備的切換。
——要求承載網設備廠商根據(jù)所承載的實時性業(yè)務(如語音、傳真、視頻、IPTV等)的特點改進設備,提供流量監(jiān)測、流量控制、網絡指標監(jiān)視、告警通知、路由自動切換等方面的功能。
分組網的承載方式增加了軟交換網絡維護的難度,但我們也不能由于這些維護上的困難否定軟交換網絡的應用成果,目前維護部門可通過故障處理方法的完善和維護經驗積累減少故障發(fā)生的概率,提高故障處理效率。但最終要解決承載網故障對軟交換業(yè)務的影響,還需要不斷完善軟交換系統(tǒng),使其能感知承載網故障和服務質量的變化,從而在發(fā)生承載網故障時能快速切換,減少對業(yè)務的影響。