中國聯(lián)通沈陽分公司 翟玉杰
在通信系統(tǒng)的運行維護中,我們經(jīng)常會涉及到網(wǎng)絡設(shè)備的可靠性問題,尤其是電源設(shè)備的可靠性問題比較突出,如:某某基站開關(guān)電源總出問題,基站電源環(huán)境監(jiān)控總有上傳告警等等,然而我們的運維力量總是有限的,基站分布畢竟較廣,如果基站電源設(shè)備的故障率高,就不可避免地發(fā)生顧東顧不了西、無法及時處理現(xiàn)象,移動網(wǎng)絡的信譽和經(jīng)濟效益勢必受到嚴重影響。交換局電源設(shè)備對通信網(wǎng)絡的影響更是一刻千金。要保證全網(wǎng)通信的可靠性就必須在電源設(shè)備的設(shè)計、選購、驗收、維護中要緊緊圍繞可靠性這一關(guān)鍵課題,樹立可靠性是通信網(wǎng)絡生命線的思想,時刻牢記可靠性是質(zhì)量的更高要求和綜合體現(xiàn),為提高系統(tǒng)可靠性而做好各項專業(yè)工作。
一、減少設(shè)備的早期失效
瞬時失效率λ(t)是單位時間內(nèi)設(shè)備的失效數(shù)占該時間段開始時正常工作設(shè)備總數(shù)的比值。它反映的是設(shè)備發(fā)生失效的相對速率即故障瞬時強度。一般電子設(shè)備的失效率λ(t)都遵循浴盆曲線規(guī)律,如圖1所示。

圖1一般電子設(shè)備的失效率λ(t)的曲線規(guī)律
圖1中的故障率λ(t)曲線按照失效率的變化情況明顯地分為三段:早期失效期、偶然失效期、損耗失效期。
早期失效發(fā)生在設(shè)備開始工作之初,失效率λ(t)隨使用時間的增加而迅速下降,主要對應于設(shè)備的設(shè)計和制造的質(zhì)量缺陷。故障內(nèi)容可分為:不能工作、工作不穩(wěn)定、功能劣化及其它異常現(xiàn)象。具體表現(xiàn)如:開關(guān)電源模塊的交流輸入濾波電容耐壓不合格、機內(nèi)元件安裝絕緣不良等等,造成開機瞬間損壞;交流接觸器線圈發(fā)熱、信號轉(zhuǎn)接電路板輔助電源、缺少液晶顯示屏的對比度低溫補償電路、熔絲狀態(tài)檢測電路設(shè)計不合理、溫度補償電路誤差偏大等等造成設(shè)備工作一段時間后出現(xiàn)才發(fā)生故障或者誤告警。解決設(shè)備早期失效率高的關(guān)鍵在于嚴格操作規(guī)程,加強對原材料、半成品以及外購件的檢驗和質(zhì)量控制,進行工藝篩選和老化試驗,及時處理設(shè)備的質(zhì)量反饋意見,找出產(chǎn)生故障的根本原因,及時解決。處理設(shè)備出現(xiàn)的故障時不能單純更換備件、簡單解決了事,應該分析故障原因,如果是元件質(zhì)量、電路設(shè)計、軟件設(shè)計方面的問題,則必須重新確認其他設(shè)備是否也存在同樣的隱患,一般來說只要在一年內(nèi)出現(xiàn)完全相同的故障就應該引起注意,認真分析故障原因。對所購買的設(shè)備進行出廠前檢驗也有助于保證設(shè)備的可靠性,廠驗可從產(chǎn)品設(shè)計、元件篩選、工藝檢測老化試驗等多方面進行審核、驗收,尤其對于小規(guī)模企業(yè)和新產(chǎn)品防止產(chǎn)生低級錯誤非常有效。我們在訂貨中合理地確定交貨期,是保證設(shè)備可靠性的基本條件。我們一般都希望到貨越快越好,但是從投料到產(chǎn)品出廠,不僅需要經(jīng)過正常的生產(chǎn)周期以外,產(chǎn)品的最終質(zhì)量檢驗和老化處理也是必不可少的,脫離實際地縮短交貨期,必然影響產(chǎn)品可靠性。遼寧聯(lián)通三期工程的一家開關(guān)電源供應商,承諾一個月內(nèi)的交貨期,結(jié)果發(fā)生這批產(chǎn)品安裝后多數(shù)一上電就發(fā)生濾波電容爆炸,可想而知,這批產(chǎn)品出廠前肯定沒有充分進行上電老化實驗。
二、只有提高可靠性指標,才能夠減少電源設(shè)備的故障率和維護量
電源設(shè)備的早期問題經(jīng)過處理和更換后失效率λ(t)逐漸下降,趨于穩(wěn)定,進入偶然失效期階段。其特點是失效發(fā)生是隨機的,失效率近似為常數(shù),是設(shè)備的可靠工作時期,相當于設(shè)備的最佳狀態(tài)期,所以把設(shè)備的使用壽命主要取決于這一階段的時間。我們假設(shè)設(shè)備失效率λ(t)在這一階段為常數(shù)λ,則。按照YD-T1051-2000《通信局(站)電源系統(tǒng)總技術(shù)要求》對高頻開關(guān)電源的平均失效間隔時間(MTBF)應≤5×104h的規(guī)定, ,MTBF=1×105小時 和MTBF=5×104小時的設(shè)備在不同時間段內(nèi)的相對故障發(fā)生的概率計算如表1所示。

可見MTBF=1×105小時和MTBF=5×104小時的瞬時故障率相差一倍,即我們的維護量相差一倍,所以選購設(shè)備時應以MTBF為主要質(zhì)量考核指標。
我們把設(shè)備的不失效頻率定義為:可靠度,它是某一時刻正常工作的設(shè)備數(shù)量與設(shè)備總數(shù)的比值因為在偶然失效期階段λ(t)=λ(常數(shù)),電源設(shè)備的壽命一般遵循指數(shù)分布,即:
我們把MTBF=1×105小時和MTBF=5×104小時的設(shè)備在不同時間段內(nèi)的可靠度計算如表2所示。

從表2中不難看出設(shè)備的可靠性隨著運行時間的增加,呈指數(shù)降低。在設(shè)備運行的中后期,MTBF對設(shè)備的可靠性影響較大。無論對單臺設(shè)備還是整批設(shè)備的運行可靠性我們應該參考上表,越到設(shè)備運行后期越應加強設(shè)備維護檢查,做到及時發(fā)現(xiàn)故障,及時解決故障,采取人工方式盡量提高設(shè)備的可靠性。
損失失效期出現(xiàn)在產(chǎn)品的使用后期,其特點是失效率隨時間的增加而上升,耗損失效是由于設(shè)備中的某些元件已經(jīng)老化,過度的磨損、疲勞、壽命衰竭,因而失效率上升。
三、選用優(yōu)質(zhì)產(chǎn)品,加強檢驗,提高設(shè)備的可靠性
電源設(shè)備與許多現(xiàn)代工業(yè)產(chǎn)品一樣,都是由成千上萬種元件、器件組成的,有的甚至還包括軟件,只要其中一個元件,一個環(huán)節(jié)出現(xiàn)問題,就可能影響整個設(shè)備工作,設(shè)備的使用條件和環(huán)境也千變?nèi)f化,在設(shè)備的工作過程中,能否保持設(shè)備原有的性能而不發(fā)生故障,即工作可靠、經(jīng)久耐用,這就是對設(shè)備質(zhì)量進一步要求而提出的可靠性問題。可靠性管理是不同于生產(chǎn)質(zhì)量管理,我們往往只注意比較產(chǎn)品的性能、外觀、工藝質(zhì)量等等,沒有明確提出可靠性的指標,這樣可能造成巨大的潛在損失。比如一臺名牌的電視機可以正常使用十年以上,而一臺普通雜牌電視機使用兩年以后就出現(xiàn)故障,修來修去,耗工費時,其成本不知不覺地加大。可靠性相差懸殊,其價格和成本也明顯不同,可靠性的提高必然伴隨著設(shè)備成本的提高,一些國際知名的企業(yè)都在不惜重金聘用可靠性工程師,在產(chǎn)品的可靠性改進中不斷增加投入,所以在市場競爭中,其產(chǎn)品的可靠性發(fā)揮著巨大威力。國內(nèi)一些小的開關(guān)電源生產(chǎn)廠為了爭奪市場,價格非常誘人,服務態(tài)度更是以用戶為上帝,但是其產(chǎn)品卻經(jīng)常發(fā)生通訊故障、誤報警、二次下電誤動作等等,甚至整批產(chǎn)品一上電就短路,這樣的可靠性實在令人擔心。
要提高設(shè)備的可靠性必須在開發(fā)、設(shè)計、生產(chǎn)、使用、維護各個階段,即產(chǎn)品壽命周期的全過程中進行控制和管理。初級設(shè)計階段,就要求保證設(shè)備在給定的時間內(nèi)以預期的成功概率進行正常工作,采取冗余、減額、熱、穩(wěn)定等設(shè)計方案。選用電阻、電容、二極管、VMOS功率管等電子元件時應考慮這些產(chǎn)品的性能在環(huán)境溫度、老化程度、電壓波動等各種外界條件影響下保持不變,選用滿足上述要求的型號,并且在耐壓、功率等參數(shù)的選擇上預留安全裕量。在元件質(zhì)量檢測方面應加強可靠性老化篩選,在設(shè)備組裝完成后應結(jié)合產(chǎn)品質(zhì)量檢驗進行環(huán)境、市電條件的老化篩選和抽樣壽命試驗。還必須根據(jù)設(shè)備現(xiàn)場的故障反饋,找出影響設(shè)備可靠性的原因和隱患,加以根本解決。設(shè)備的可靠性直接影響著企業(yè)的聲譽和經(jīng)濟效益,體現(xiàn)著企業(yè)的技術(shù)、生產(chǎn)、質(zhì)量、服務的綜合素質(zhì)。所以應該選擇信譽高、規(guī)模大的企業(yè)產(chǎn)品。另外設(shè)備的可靠性不是在設(shè)備購買使用后才能得出結(jié)論,根據(jù)YD/T282-2000《通信設(shè)備可靠性通用試驗方法》,設(shè)備在出廠前可以根據(jù)訂貨合同進行可靠性驗證。可以選擇各種環(huán)境條件下的定時截尾實驗,進行失效率和無故障時間的驗收實驗。
四、優(yōu)化電源系統(tǒng)的可靠性設(shè)計
組成設(shè)備的各單元的可靠性從功能上可以分為串聯(lián)系統(tǒng)、并聯(lián)系統(tǒng)、備用冗余系統(tǒng)和串并聯(lián)系統(tǒng)。
1.串聯(lián)系統(tǒng)的可靠性小于任一組件的可靠性
串聯(lián)系統(tǒng)比較常見,如開關(guān)電源的交流單元、整流模塊、直流單元就組成了串聯(lián)可靠性系統(tǒng),如圖2所示。

系統(tǒng)總的可靠度為:
=R1(t)·R2(t)···Rn-1(t)·Rn(t)
由于串聯(lián)系統(tǒng)的任何一個部分的可靠度R(t)都小于100%,即小于1,所以串聯(lián)的部分越多,系統(tǒng)的總可靠度越小,所以減少系統(tǒng)串聯(lián)成部分可以提高設(shè)備的可靠性,即結(jié)構(gòu)簡化就是可靠。

2.并聯(lián)冗余系統(tǒng)的可靠性大于任一組件的可靠性
當一種設(shè)備的可靠性指標可能無法滿足系統(tǒng)的要求時,我們可以采取并聯(lián)系統(tǒng)、備用冗余系統(tǒng)來增加系統(tǒng)的可靠性。
并聯(lián)系統(tǒng)即設(shè)備并機熱備份系統(tǒng),其結(jié)構(gòu)模型如圖3。
系統(tǒng)的總可靠度為:
=1-(1-R2)·(1-R2)···(1-Rn-1)·(1-Rn)
可見并聯(lián)系統(tǒng)越多,系統(tǒng)的總可靠度越大,而且統(tǒng)的總可靠度大于任何一個分系統(tǒng)的可靠度。
由于開關(guān)電源整流模塊、UPS的內(nèi)部串聯(lián)組分較多,而且包含功率元件,如果采取單一工作方式,可靠性必然較低,我們采取N+1并聯(lián)工作方式就很好地解決了這個問題。開關(guān)電源整流模塊N+1并聯(lián)工作就是把以最佳工作電流并聯(lián)運行的整流模塊數(shù)量再加上一個相同的冗余模塊;UPS的N+1并聯(lián)工作一般是采取二臺相同UPS并聯(lián)工作,平時每臺UPS各負擔50%的負荷容量,總負荷容量一般小于一臺UPS的最大容量。
3.備用系統(tǒng)關(guān)鍵在于可靠切換
備用系統(tǒng)如圖4,由完全獨立的分系統(tǒng)并聯(lián)組成,平時只有一個分系統(tǒng)工作,其余不參加工作,處于備用狀態(tài),當一個分系統(tǒng)發(fā)生故障時,需要用切換開關(guān)轉(zhuǎn)換到其它分系統(tǒng)上去,保證系統(tǒng)正常輸出。如交換局的交流保證供電系統(tǒng)由二路市電和固定式柴油發(fā)電機組成,平時我們只使用其中一路市電,當在用市電發(fā)生故障時,首先應切換到另一路市電,二路市電都發(fā)生故障時,則必須啟動自備柴油發(fā)電機供電。這種系統(tǒng)中的備用分系統(tǒng)的可靠性最高,但是由于轉(zhuǎn)換開關(guān)與備用設(shè)備是串聯(lián)系統(tǒng),所以轉(zhuǎn)換開關(guān)直接影響系統(tǒng)的可靠性。如能解決故障檢測和切投轉(zhuǎn)換這個可靠性瓶頸,那么備用冗余系統(tǒng)的總可靠性將比并聯(lián)系統(tǒng)高很多。
轉(zhuǎn)換開關(guān)有自動和手動兩種工作方式,受各種外界因素的影響,我們往往采用手動切投轉(zhuǎn)換。因此設(shè)立可靠的故障報警裝置、實行先進運維管理方法對于提高系統(tǒng)的可靠性都是必不可少的。
五、提高設(shè)備的使用和環(huán)境可靠性
由于經(jīng)濟和產(chǎn)品本身的原因,設(shè)備的可靠性無法滿足要求時,我們可以選擇并機系統(tǒng)如:UPS、整流模塊等;備用冗余系統(tǒng)的可靠性最高,但是必須保證可靠的切投轉(zhuǎn)換,除了上述的方法外,制定科學的運行維護規(guī)程、加強技術(shù)培訓、提高使用的可靠性;加強施工和配套設(shè)備管理,提高環(huán)境的可靠性都有助于提高設(shè)備的可靠性。
1.使用可靠性就是能夠保證設(shè)備使用壽命的合理的安裝和操作維護方法,杜絕操作失誤。例如基站空調(diào)的安裝方式和使用方法,基站空調(diào)的主要作用是夏季制冷,考慮冬季氣溫較低我們東北地區(qū)一般選用熱泵式空調(diào),室外機如果安裝在向陽的地方,那么夏季制冷時室外機的散熱效果就不如安裝在北側(cè)的室外機,造成冷凝器溫度高,內(nèi)壓大,勢必增加壓縮機的負荷,縮短空調(diào)的壽命。如果兩臺基站空調(diào)采取自動備份式工作,即:平時一臺空調(diào)工作,一臺空調(diào)備用,當基站室溫升高超過設(shè)定標準時,兩臺空調(diào)一起工作,既能分擔負荷,又能避免工作的空調(diào)發(fā)生故障時,造成基站室內(nèi)溫度驟升。及時檢查維護設(shè)備也非常重要,常規(guī)項目如:檢查軸承、加潤滑油、定期更換易損件和材料等。
2.提高環(huán)境可靠性就是加強市電和環(huán)境管理,就是當市電的變化范圍超標或諧波超標時,必須配套交流凈化穩(wěn)壓器。據(jù)有關(guān)資料顯示:當環(huán)境溫度升高10℃時,電子計算機的可靠性下降25%,因此保證設(shè)備環(huán)境溫度、濕度、潔凈度都在允許范圍內(nèi),是保證設(shè)備可靠性和壽命的必要條件。
可靠性貫穿于設(shè)備的設(shè)計、選購、驗收、維護等各個環(huán)節(jié)中,我們只有一絲不茍地重視每一個環(huán)節(jié)的可靠性,才能保證整個通訊系統(tǒng)的可靠性,才能建立通訊企業(yè)生存和長期發(fā)展的基礎(chǔ)。