SUN 하드웨어 점검방법

2010.05.12 02:38

조인상 조회 수:13514

원문 : http://www.ischo.net -- 조인상 // 시스템 엔지니어

Writer : http://www.ischo.net -- ischo // System Engineer in Replubic Of Korea

+++++++++++++++++++++++++++++++++++++++++++++++++++++++

 

본문 : http://www.ischo.net -- 조인상 //시스템 엔지니어

+++++++++++++++++++++++++++++++++++++++++++++++++++++++


Hardware Diagnostics for SunTM Systems:

A Toolkit for System Administrators



시스템을 좀더 쉽고 명확하게 관리하기 위해 System Administrator를 위한 하드웨어 진단법을 5단계로 분류하여 설명을 합니다.

OpenBootTM commands(Power on Self Test(POST) program)는 시스템 보드에 있는 LEDs의 상태로 Sun MicrosystemsTM server, desktop products 와 연관된 하드웨어 문제를 진단할수 있고 low-level 진단법을 이용하여 시스템과 추가한 디바이스의 상태를 확인 할수 있읍니다. 한 예로 당신은 시스템의 디바이스를 알아볼수 있고, 동작 여부를 확인 할수 있고 또한 시스템의 구성 정보를 알수 도 있읍니다.

다음 테이블은 여기서 설명할 부 주제에 관한 설명입니다.:

OpenBoot Prom (OBP) Diagnostic Commands and Tools OBP command는 시스템 구성 정보를 알아볼수 있고, 시스템에 붙여진 디바이스를 테스트 할수 있고, 네트워크 연결을 모니터링하고, 그밖에 더많은 일을 할수 있는 명령어 들이다.
OBDiag 시스템이 실행 될때 테스트가 어떻게 이루어지는지 보여주고, 메인 보드, 인터페이스, 디스크 디라이브, 테입 디바이스의 진단을 수행 한다.
Power On Self Test (POST) POST가 어떻게 초기화하고, 구성되어지고, 시스템을 테스트 하는지 설명하고, POST의 출력결과, 시스템 보드, 파워 서플라이의 LEDs를 의미를 다룬다.
System Board and Power Supply LED Status Tables 시스템 보드, 파워 서플라이의 LED 상태의 의미와 Ultra Enterprise server 제품들의 시스템 보드, 파워 서플라이 LED 상태의 interpret의 정보를 다룬다.
Solaris Operating Environment Diagnostic Commands 이장에서는 시스템 구성 정보와, Field Replaceable Units (FRU)가 실패일때, 하드웨어 교정 정보, 패치의 설치 정보와 관련되 명령어에 대해서 다룬다.



 

OBP DIAGNOSTIC COMMANDS AND TOOLS

OBP는 시스템에 설치된 디바이스를 위한 강력한 low-level interface입니다..( OBP는 또한 ok prompt로 잘 알려져 있다.) 간단한 OBP 명령어를 배우는 동안 당신은 이더넷 어드레스 같은 자세한 시스템 구성과, CPU, bus speed, memory 초기화등을 알수 있고 OBP를 사용하는 동안 당신은 또한 default boot device같은 system parameter 값을 설정하거나 알아 볼수 있고, 네트워크 인터페이스, SCSI, SBUS 디바이스를 테스트 할수 있읍니다..

다음 표는 OpenBoot version 3.x 에 사용되는 명령어의 설명이다. 사용하기 위해서는 OBP ok prompt에서 간단히 입력하고 Return을 눌르면 된다.

 

banner 시스템 파워가 들어 오면 banner가 출력 된다. banner는 CPU speed, OBP revision, system memory, ethernet address, hostid를 보여준다.
devalias alias path 새로운 device alias를 설정한다.alias는 새로운 alias 이름이고 path는 device의 물리적 경로이다. 만약 devalias를 인수 없이 사용하면 모든 시스템 디바이스 aliases를 출력한다.
.enet-addr 이더넷 어드레스를 출력한다.
led-off/led-on 시스템 led를 on/off 시킨다.
nvalias name path 디바이스를위한 새로운 alias를 생성한다. name은 alias의 이름이다. path는 device의 물리적 경로이다.
Note - non-volatile memory(NVRAM) 에 새로운 alias를 저장시키기 위해서 reset-all 또는 nvstore 명령을 실행시킨다.

nvunaliasname path 사용자가 만든 alias를 지운다. name은 alias의 이름이고 path는 디바이스의 물리적인 경로이다.
Note - non-volatile memory(NVRAM) 에 새로운 alias를 저장시키기 위해서 reset-alll 또는nvstore 명령을 실행시킨다.

nvstore temporary buffer의 목록을 NVRAM에 복사하거나 제거한다.
power-off/power-on 시스템 파워를 on/off시킨다.
printenv 모든 설정 환경을 화면에 출력 시켜 준다.
probe-fcal-all Fiber Channel로 정의된 모든 장치 디바이스를 출력해 준다.
probe-sbus SBUS 슬롯에 설치된 도든 디바이스를 출력해 준다.
Note - 이 명령어는 SBUS 슬롯을 가지고 있는 시스템에서만 적용된다.
probe-scsi SCSI 버스에 설치된 모든 장비를 출력해 준다.
probe-scsi-all SCSI 버스들에 설치된 모든 장비들을 출력해 준다.
set-default parameter parameter에 입력된 값을 기본값으로 설정해 준다.
set-defaults 모든 설정 값들을 초기값으로 설정한다.
setenv parameter value parameter에 값을 설정해 준다.
Note - 설정한 값을 저장하기 위해서는 reset-all명령을 사용한다.
show-devs 시스템에 구성된 모든 다바이스를 출력한다.
show-disks disk controller의 물리적 디바이스 경로를 출력한다.
show-displays frame buffer를 위한 물리적 디바이스 경로를 출력한다.
show-nets network interface를 위한 물리적 디바이스 경로를 출력한다.
show-post-results 전원이 들어오고 POST가 완료가 되었다면 ok prompt상에서 POST의 결과를 출력해 준다.
show-sbus SBUS 슬롯에 설치된 모든 디바이스를 추력해 준다. probe-sbus와 비슷하다.
show-tapes tape controllers를 위한 물리적 디바이스 경로를 출력한다.
.speed CPU와 bus 속도를 출력한다.


OBDIAG

OBDiag는 대화식으로 아래의 Sun 시스템의 실행시 테스트와 OBP level에서의 디바이스를 자체진단 하는 기능을 제공합니다.

Sun Enterprise 420R Server
Sun Enterprise 220R Server
Sun Ultra Enterprise 450 Server
Sun Ultra Enterprise 250 Server
Sun Ultra 80
Sun Ultra 60
Sun Ultra 30
Sun Ultra 10
Sun Ultra 5
OBDiag은 키보드와 시스템의 앞쪽 LEDs를 사용하여 테스트 결과를 표시한다. interpret 결과는 아래의 표 'System board and Power Supply LED Status Tables'을 참고하기 바랍니다.

OBDiag는 또한 진단과 에러 메세지를 시스템 console 창에 출력합니다.. OBDiag에 관해 좀더 알고 싶으면 http://docs.sun.com을 방문하세요.

OBDiag 테스트는 메인보드 만이 아닌 아래와 같은 다른 인터페이스 장비들도 포함합니다. :

PCI
SCSI
Ethernet
Serial
Parallel
Keyboard/mouse
NVRAM
Audio
Video
How To Run OBDiag
OBDiag를 실행시키기 위해서는 간단히 Open Boot ok prompt에서 obdiag를 입력하면 됩니다.

시스템에 power-on시킬때 자동으로 OBDiag를 실행하게 설정할수 있고 설정 방법은 아래와 같이 3가지 방법을 제공합니다.

OBDiag를 실행시키기 위한 설정을 다음과 같이 한다.
ok setenv diag-switch? true

시스템에 power가 들어오는 순간 stop-d를 동시에 누른다.
Ultra Enterprise servers는 시스템에 파워를 넣을때 스위치 키를 diagnostics position에 맞춘다.
POWER ON SELF TEST (POST)
POST 는 각각의 시스템 보드의 firmware(PROM)에 존재하는 프로그램이고 이것은 initialize, configure, 시스템 보드의 테스트에 사용 됩니다. POST의 출력은 시리얼 포트 A에 터미널 디바이스를 연결을 하면 볼수 있읍니다.(Ultra Enterprise server, POST의 출력 결과는 시스템 보드나 클럭 보드의 시리얼 포트 A에 터미널 디바이슬 연결하여 출력값을 볼수 있다.) Ultra Enterprise server의 각각의 시스템 보드의 LEDs의 상태는 POST의 테스트 상태를 나타낸다. 한 예로 만약 시스템 보드가 POST 테스트에서 실패하면 LED는 황색으로 표시된다.

POST의 출력 결과를 실시간으로 보고 싶으면 시리얼 포트 A에 터미널 디바이스를 연결하면 볼수 있다. 만약 이것이 불가능 하다면 POST의 테스트가 끝난 후에 OBP 명령인 show-post-results으로 결과를 볼수 있다.

How To Run POST 
시스템의 시리얼 포트 A에 터미널 장비를 연결한다.

OBP 진단을 하기위해 아래와 같이 설절을 한다.
ok setenv diag-switch? true

원하는 테스트 level을 설정한다.
OBP는 두개의 테스트 level인 max와 min을 제공 한다. max는 모든 테스트를 할수 있고 min은 몇가지만을 테스트 한다. 원하는 OBP 값을 diag-level 명령으로 설정하면 된다.(max 또는 min)

ok setenv diag-level max

만약 디스크로 부팅을 원한다면 OBP 값을 diag-device로 설정한다.
ok setenv diag-device disk

시스템은 기본적으로 diag-device 값은 net 이다.
자동으로 부팅이 되지 않게 하기위해서는 아래와 같이 한다.

ok setenv auto-boot? false
지금 까지 설정을 저장하기 위해서 다음과 같이 한다.
 
ok reset-all
Power cycle the system
시스템의 파워가 켜지면 POST는 실행이 된다. 그리고 POST의 출력 결과는 시리얼 포트 A에 연결한 터미널 장비에 출력 된다. POST가 완료된 후에 OBP 명령인 show-post-result를 이용하여 결과를 출력하여 볼수 있다.

SYSTEM BOARD AND POWER SUPPLY LED STATUS TABLES
이장은 Ultra Enterprise Server 제품들의 시스템 보드와 파워 서플라이의 설치시 LED 상태의 이해를 도와주기 위한 장이다.

Ultra Enterprise Server Front Panel and Clock Board LED Status
 

Power LED Service LED Cycling LED Condition
off off off no power
off on off failure mode
off off on failure mode
off on on failure mode
on off off hung in POST/OBP or OS
on off on hung in OS
on on off hung in POST/OBP
hung in OS/failed component
on on on hung in POST/OBP
hung in OS/failed component
on off flashing OS running normally
on on flashing OS running with failed component
on flashing off slow flash = POST
fast flash=OBP
on flashing on OS or OBP error


Notes:


 

LED Name Location Note
Power LED Left 이 LED는 항상 불이 켜져 있어야 한다. 만약 세게의 LED가 불이 꺼져있다면 power에 이상이 생긴 것이다. 만약 다른 LED와 다르면 문제가 생긴것을 나타낸다.
Service LED Middle 이 LED는 불이 꺼져있는 상태가 정상이다. 만약 켜져 있다면 각각의 보드의 이상 이무로 각각의 LED를 체크해야 한다. 이 LED는 OS에 관계되는 문제와는 상관이 없다.
Cycling LED Right 이 LED는 반짝이는 상태가 정상이다.


Ultra Enterprise CPU/Memory, I/O, and Disk Board LED Status

 

Power LED Service LED Cycling LED Condition
off off off board no power
off on off low power mode - unpluggable
off off on failure mode
off on on failure mode
on off off hung in POST/OBP of OS
on off on hung in OS
on on off hung in POST/OBP
hung in OS and failed component on board
on on on hung in POST/OBP
hung in OS/failed component on board
on off flashing OS running normally
on on flashing OS running normally/failed component on board
on flashing off slow flash = POST
fast flash = OBP
on flashing on OS or OBP error
Notes: Low Power Mode - 만약 보드의 LEDs가 off-on-off이면 이것은 보드가 low power mode이을 의미한다. Low Power Mode는 POST의 실패 때문에 보드가 장애가 있을때나 보드가 단지 끼워져만 있을때 일어난다. Low power mode는 단지 시스템이 실행돼는 동안 아마도 당신이 보드를 제거 했을때 나타나는 상태이다. Disk Boards - Ultra Enterprise server에 설치된 디스크 보드에 황색 LED가 나타나면 이것은 Ultra Enterprise server가 Solaris 2.6 5/98 또는 그 상위의 OS가 작동하는 것을 의미한다.


Power Supply LED Status

LEDs는 파워 서플라이 또는 fan failure 같은 에러 상태를 나타내는데 사용된다.파워 서플라이는 hot-pluggable이 된다. 그러나 만약 파워의 부족함을 발견되면 Solaris Operating Environment는 시스템을 종료한다. 일반적으로 시스템은 각각의 시스템 보드를 위해 파워 서플라이를 가지는 구조로 되어 있다. 

Green LED Yellow LED Condition
off off No AC input or keyswitch is turned off
on off normal operation
on on Fan failure or one or more voltages out of specification
off on One or more DC outputs failed, or voltages out of specification, or system in low power state


 
SOLARIS OPERATING ENVIRONMENT DIAGNOSTIC COMMANDS

다음 테이블의 OS 명령어는 시스템 구성, Field Replaceable Units (FRU)가 실패 일때, 하드웨어 진단 정보, 패치의 설치 등의 정보를 출력하는데 사용된다.

 

/usr/platform/sun4u/sbin/prtdiag -v 시스템 구성, 진단 정보, Field Replaceable Units (FRU)의 fail list를 출력한다.
/usr/bin/showrev [-p] 현재 하드웨어와 소프트웨어의 진단을 출력한다. -p 옵션을 사용하면 설치된 패치정보를 출력한다.
/usr/sbin/prtconf 시스템 구성 정보를 출력한다.
/usr/sbin/psrinfo -v clock speed를 포함한 CPU 정보를 출력한다.
서버에 요청 중입니다. 잠시만 기다려 주십시오...