吳代超
(廣州哈里斯通信有限公司,廣州,510665)
摘要:通過對HARRIS交換機啟動信息的分析,介紹交換機初始化時各階段的標志及可能出現的非正常表現,確定故障點并分析故障產生的可能原因。
關鍵詞:HARRIS交換機、XCPU、HCSU、啟動信息、初始化、故障定位
WU Dai-chao
(Guangzhou HARRIS Telecommunications Co.,Ltd.,Guangzhou 510665,China)
Abstract:This paper concentrated on HARRIS PBX’s reboot process .By analyzing reboot information, you can get the marks of IPL phases and identify abnormal state. At the same time, you will find out faults which frequently occur and reasons attached.
Key words:HARRIS PBX、XCPU、HCSU、 Reboot information、IPL、Fault locating
一、 引言
在設備調試與維修過程中,我們都會面對交換機的啟動過程,在此過程中, 交換機會將啟動信息以文本的方式輸送出來,分析這些信息有助于我們了解交換機的啟動進程,及時發現問題,迅速判斷故障所在,縮短處理故障的時間。在下面的敘述中,我們以XCPU為例進行說明。
二、 交換機的啟動涉及哪些方面
交換機能否正常啟動,涉及到供電電壓(交換機通過二次電源將-48V分成+/-5V,+/-12V四個電壓)、公共控制背板(包括其上的各種連接電纜)、公共控制板(包括XCPU、HCSU、RMU、TTU、CTU、TSU和SSU)、接插件的接觸狀況、系統軟件及OCR配制等,在冗余系統中,還要考慮到冗余層的相互影響。
三、 XCPU和HCSU的指示燈
在特殊情況下,如XCPU的S1口損壞或其它條件限制,我們無法從S1口了解到交換機的啟動進程,這時候,我們可以借助于XCPU和HCSU的指示燈來確定交換機的啟動進程。在下面我們會結合啟動進程標注出指示燈點亮的順序。
四、 如何迅速判斷交換機是否正常
在HARRIS交換機中,其指示燈顏色的設置采用三種顏色,綠色為正常色,紅色為故障色,黃色為標注色。
正常情況下,從交換機的前面面板觀察,不應有紅燈亮,正常燈亮情況如表一,如果有與下面所示不同的地方,就應檢查原因。
表一:XCPU指示燈說明
|
標注 |
顏色 |
名稱 |
含義 |
|
DS2 |
綠 |
HDD(硬盤) |
亮時,表示硬盤正在工作 |
|
DS3 |
黃 |
STANDBY(備用) |
表示系統處于備用狀態 |
|
DS4 |
綠 |
ACTIVE(主用) |
表示系統處于主用狀態 |
|
DS5 |
紅 |
FAULT(錯誤) |
XCPU自檢失敗 |
表二:HCSU指示燈說明
|
標注 |
顏色 |
名稱 |
含義 |
|
DS1 |
綠 |
ACT |
HCSU板已激活 |
|
DS2 |
綠 |
INT |
初始化完成,開始裝載軟件 |
|
DS3 |
黃 |
SR5 |
|
|
DS4 |
黃 |
SR4 |
|
|
DS5 |
黃 |
SR3 |
|
|
DS6 |
黃 |
SR2 |
|
|
DS7 |
黃 |
SR1 |
|
|
DS8 |
黃 |
SR0 |
|
|
DS9 |
紅 |
CR ALM(失。 |
處于啟動狀態 |
|
DS10 |
綠 |
MEMORY |
內存測試通過 |
|
DS11 |
綠 |
SPT |
軟件裝載完成 |
|
DS12 |
紅 |
AUDIT |
自檢失敗 |
表三:工作時HARRIS指示燈說明
|
公共控制板類型 |
ACTIVE層燈亮情況 |
STANDBY層燈亮情況 |
不正常時,指示燈情況 |
|
XCPU |
ACTIVE燈亮 |
STANDBY燈亮 |
|
|
HCSU |
DS1、DS2、DS10和DS11四盞綠燈亮;DS4、DS5、DS6、DS7、DS8五盞黃燈亮 |
DS1、DS2、DS10和DS11四盞綠燈亮;DS5、DS6、DS7、DS8四盞黃燈亮 |
HCSU板的DS9紅燈亮,表明HCSU板所在層不正常。 |
|
TTU |
DS1、DS2、DS5和DS6四盞綠燈亮 |
DS2、DS5和DS6三盞綠燈亮 |
|
|
RMU |
無燈亮 |
無燈亮 |
RMU板有紅燈亮,但電話正常,表明備用層不正常 |
表四:XCPU的S1口管腳功能說明
|
S1管腳編號 |
說明 |
|
1、7、8、9 |
Spare |
|
2 |
Receive Data(必接) |
|
3 |
Transmit Data(必接) |
|
4 |
Data Terminal Ready(可不接) |
|
5 |
Signal Ground(必接) |
|
6 |
Data Set Ready(可不接) |

五、 如何捕捉啟動信息
XCPU的S1口是一個九針的UART標準的串行接口(說明見表四),它是對交換機系統進行緊急維護的接口(可設置XCPU的DSW2-2開關為“ON”,啟動XON/XOFF協議,則在信息輸出過程中,可以用CTRL-S暫停信息輸出,用CTRL-Q繼續信息輸出)。啟動時,啟動信息會從此口輸出,可以在此口接計算機或串行打印機將有關信息捕捉下來,連線方式如圖一。
六、 交換機啟動進程、常見問題及可能原因
A、初始化(IPL)
交換機是通信技術與計算機技術的結合,所以其啟動過程與計算機有相似之處,另外,HARRIS交換機應用程序的文件格式是專用的,故存在一個由標準的DOS啟動方式轉換為HARRIS啟動方式的過程。加電初始化就是完成上述兩個過程。在XCPU中,完成這個過程的信息是不會從S1口輸出的。而到了ICPU,這些信息可以從S1口看到。
如果加電后,XCPU的指示燈不亮、機架電源指示燈不亮或系統靜止不動,則應考慮供電問題。常見的有電壓偏低或負載能力不足。
HARRIS的機架電源將輸入的-48V電壓轉換為+5V、-5.2V、+12V和-12V四個電壓,而且要求其電壓偏差不超過2%,否則會導致系統不能啟動或不定期自動復位。如果懷疑電源負載能力不夠,可以將一對或多對TSU/SSU板撥出,以減輕負載。不過,有一點要注意的是,如果系統空載,則HARRIS電源不會啟動。
另外,XCPU本身的問題也會引起加電初始化失敗。這里需引起注意的是,XCPU安裝時,必須用力推到位,使之與背板接觸良好。
B、Module Integrity Test(MIT)和System Integrity Test(SIT)
在完成加電初始化后,系統會使用常駐在XCPU中的測試程序對公共控制系統的電路板進行測試,以確定各個硬件功能塊的運作是否正常,能否裝載HARRIS的應用軟件包。 這個測試叫Module Integrity Test(MIT)和System Integrity Test(SIT)。其中,MIT對公共控制系統的每塊電路板進行功能測試,SIT對各電路板的相互通信能力進行測試.
(下面是啟動信息,如果在XCPU加電大約一分鐘后,仍不能從S1口收到下面的顯示信息,應判斷是否S1口、終端或兩者之間的連線存在故障)
MIT> RESET
MIT> DRAM EN
MIT> ROM
MIT> RAM (注:以上步驟出錯,為XCPU問題)
MIT> PIT
MIT> 486 Processor
MIT> 100 MHZ (注:CPU的主頻)
MIT> PIC (注:此階段出錯,可能為XCPU或TTU問題,或者+/-12V電壓不正常)
MIT> VERSION XCPU PROM 18:20:11 V9802A03 09/01/98
。ㄗⅲ哼@里的V9802A03是指XCPU的專用操作系統版本,此版本與系統軟件的版本相對應,每套系統軟件配備一張“DATA PROM”盤,用這張盤可以對XCPU的操作系統進行更新。一般高版本的專用轉換程序兼容低版本的系統軟件。如果PROM的版本與系統軟件不匹配,在重裝軟件時會顯示”OS ERROR”表示操作系統不匹配。另外,在冗余系統中,應保證操作系統的一致性,否則會導致意想不到的問題)
MIT> PVAM MODE (注:此處出錯,由XCPU引起)
SIT> Start
SIT> Local Memory Test (注:此處出錯,為XCPU問題)
SIT> Redundant Memory Test (注:HCSU的DS10亮,此處測試RMU板的內存)
SIT> Nonvolatile Memory Test
SIT> Real Time Clock Test
SIT> Fault History (注:HCSU出錯,會導致此階段出錯)
VSU Reset Register contents=1
INT=FF CODE=0000 TIME=05/23/02 00:01:16 ADDR=0000:0000:00000000
INT=FF CODE=0000 TIME=05/23/02 00:01:16 ADDR=0000:0000:00000000
SIT> BOOT START (注:HCSU的DS8燈亮,XCPU的硬盤讀寫燈或軟驅工作燈開始閃亮)
SIT> Bootstrap from device :F3: .. using file MPU.000: 02/28/02 09:08:21
............................... (注:HCSU的DS7燈亮)
。ㄗⅲ合到y是從硬盤還是從軟盤讀取引導程序,可以通過XCPU前面面板的第三個開關進行設置。在這里常風的故障有:系統提示硬盤或軟驅未準備好,導致無法讀取,可能的原因有XCPU壞或軟盤插錯;如果在讀取過程中,出現“e”代替“.”,則表示引導程序有錯)
SIT> BOOT COMPL
SIT> EXIT Entering Kernel via initial TSS (注:HCSU的DS6燈亮)
Time Stamp: 05/23/02 09:29:28
***IPL FSIDE > Model number: SanDisk SDP3B-256
FSIDE > Firmware revision: vdd 1.00
v3.0***
C、裝載HARRIS的系統文件及數據庫文件
在這個過程中,可能會兩種異常情況:
a、出現文件讀寫出錯的提示,出錯的文件可能是系統文件,也可能是數據庫文件。有些出錯的文件并不會影響系統的正常啟動,這時系統會忽略所出現的錯誤,繼續前進,有些文件出錯,會立即引起系統重新復位。如果是系統文件出錯,只能從軟盤中重新裝載系統軟件;如果是數據庫文件出錯,又不影響正常啟動的情況下。可以在系統啟動完成后,再將備份的數據庫拷貝回去。
b、裝載過程中系統出現不正常的長時間停頓,然后系統重啟動,出現這種情況,是系統硬件有故障引起的。需檢查HCSU、TTU或冗余系統。
重要提示:在上面,我們提到備份數據庫,每個用戶的數據庫都是不相同的,就如在計算機中一樣,定期備份數據庫并做好標識是一個良好的習慣(不然的話,出問題時,誰都沒辦法幫你)。另外,在HARRIS交換機中,系統設置兩個相互獨立的數據庫,在實際調試中,我們可以充分利用閑置的數據庫,作為另一個數據庫的在線備份,或是數據調試過程中,恢復舊數據庫的快捷途徑。
(下面是啟動信息)
************************************************************************
* Harris Call Processing Task Loading IPL Command File *
* For multi-processor systems *
************************************************************************
(注:以下開始從硬盤中將文件調入內存,主用層HCSU的DS4燈亮,RMU板的紅燈滅,XCPU的硬盤工作燈閃爍,如果硬盤工作燈常亮不閃,是不正常現象。)
Task #16: SLT_______ 02/28/02 10:59:28
M:\G260005\support\slt\src\slt.bld loaded from file :tk:slt.nsy
tss:1400 tcb:1408 ldt:1410 entry:1410:200:07590
sys_mbx_capacity:3 tel_mbx_capacity:0 GLOBAL REDUNDANT
Active Database file extension is .DBB;1 (注:數據庫B被激活)
MH-INFORMATION, 000006a4: LAN A - IO: 280 IRQ: 3 Memory Mode
MH-INFORMATION, 000006ae: LAN A failure detected
MH-INFORMATION, 000006c2: LAN B - IO: 2c0 IRQ: 5 Memory Mode
MH-INFORMATION, 000006cc: LAN B operational
(注:顯示網卡A和網卡B的地址、中斷,并對)網卡的工作狀況進行測試,這里記錄的信息告訴我們,網卡A退出服務,網卡B工作正常)
Task #17: SPOOL_____ 02/28/02 11:02:26
M:\G260005\support\spool\src\spool.bld loaded from file :TK:SPOOL.NSY
tss:13A0 tcb:13A8 ldt:13B0 entry:13B0:200:03070
sys_mbx_capacity:14 tel_mbx_capacity:0 GLOBAL REDUNDANT
D、激活任務
到這一步,系統根據已調到內存中的文件激活用戶的任務,在激活任務的過程中,涉及到系統內存的大量占用,所以,在這里易出現的故障是內存資源不足(包括XCPU的內存或RMU板的內存),這一般在系統軟件升級或OCR升級時出現。HARRIS交換機的OCR相當于一把軟件鎖,由其控制軟件能否被使用,為避免出錯,其設計成只能往上升不能往下降,OCR控制的軟件一旦開放,在激活數據庫后,系統就會給其分配內存資源,而不論其是否被使用,所以不合理的OCR的配置,不但增加了系統運行的負擔,而且為以后的升級埋下了隱患。
(下面是啟動信息)
Ram disk device is <>
Waiting for goahead from Active Side
Enable RAP
Enable CAP
Enable TIS
Enable CAP timer
E、注冊有效性檢查
在24版以上軟件,軟件每次重新安裝后,要求在臨時注冊15天內進行正式注冊。否則會導致系統的重新復位,并在重新啟動后,會在最后停滯不前,不能激活用戶的部分任務。
(下面是啟動信息)
CRG - from :DB:MANUAL.DB;1, :CF:CRG.DBB;1
Enable Ndirt (HCSU的DS11燈亮)
Enable SMS
Enabling network controls
No network controls
Initializing devices for CDR
(下面是啟動過程完成信息)
*********************************************************************
* IPL complete -- Call Processing w/ Editor Database MPU *
*********************************************************************
至此啟動完成,HCSU的DS9指示燈熄滅,DS5燈和DS1燈點亮,系統處于正常狀態。
七、 結束語
HARRIS交換機的啟動過程隨著使用的機型、CPU、OCR的配制以及軟件版本的不同而在細節上有所區別,但整個結構是相同的,而且產生啟動中斷的原因并不局限于上述已介紹的這些,這還需我們不斷地去發現、去總結。
作者簡介:吳代超,男、1969年6月、湖南平江人、工程師,長期從事售后服務管理、HARRIS設備的維護及技術咨詢。主持和參與多個電力數字程控交換機組網和電力調度網的安裝、調試工作。