IBM Ess800 storage 관련

2010.05.11 10:58

조인상 조회 수:13872

원문 : http://www.ischo.net -- 조인상 // 시스템 엔지니어

Writer : http://www.ischo.net -- ischo // System Engineer in Replubic Of Korea

+++++++++++++++++++++++++++++++++++++++++++++++++++++++

 

본문 : http://www.ischo.net -- 조인상 //시스템 엔지니어

+++++++++++++++++++++++++++++++++++++++++++++++++++++++


1. 장애 발생

AIX 5.1 P650 장비에 Ess 800 연결되어 있었는데 errpt 로 보면

E3276AF2  1209145405 U H hdisk3        판별되지 않는 오류
E3276AF2  1209145405 U H hdisk7        판별되지 않는 오류
E3276AF2  1209145405 U H hdisk3        판별되지 않는 오류
E3276AF2  1209145405 U H hdisk7        판별되지 않는 오류
E3276AF2  1209145405 U H hdisk7        판별되지 않는 오류

실시간 으로 계속적으로 발생.

그래서 datapath query device 조회 결과

[root@tax /home/ebs]# datapath query device

Total Devices : 2


DEV#:  0  DEVICE NAME: vpath0  TYPE: 2105800        POLICY:    Optimized
SERIAL: 50027639
==========================================================================
Path#      Adapter/Hard Disk          State    Mode    Select    Errors
    0          fscsi0/hdisk2          OPEN  NORMAL  31685434          0
    1          fscsi0/hdisk3          DEAD  NORMAL  29818433      1623
    2          fscsi1/hdisk4          OPEN  NORMAL  31271196          0
    3          fscsi1/hdisk5          OPEN  NORMAL  31266625          0

DEV#:  1  DEVICE NAME: vpath1  TYPE: 2105800        POLICY:    Optimized
SERIAL: 30027639
==========================================================================
Path#      Adapter/Hard Disk          State    Mode    Select    Errors
    0          fscsi0/hdisk6          OPEN  NORMAL    5633738          0
    1          fscsi0/hdisk7          DEAD  NORMAL    5280470        974
    2          fscsi1/hdisk8          OPEN  NORMAL    5496844          0
    3          fscsi1/hdisk9          OPEN  NORMAL    5494830          0

위에서 보듯이 1이 stat dead로 표시 되어 있어음.

생각해볼수 있는 장애

Switch 문제, Ess800 연결되는 카드 문제, 아니면 프로그램 오류

Switch는 다른 장비에서 확인결과 문제가 없었고 Swtchi도 링크도 정상적이어서 문제없는 것으로 판단
Ess800 연결 부분은 장비의 LED 확인결과 8개 모두 같은 구성으로 불이 들어와 있어서 문제 없는 것으로 판단
마지막으로 Sdd프로그램 문제로 인식하고 아래 명령어로 확인

[root@tax /home/ebs]# datapath query adapter

Active Adapters :2

Adpt#    Adapter Name  State    Mode    Select    Errors  Paths  Active
    0          fscsi0  DEGRAD  ACTIVE  72746452      2746      4      3
    1          fscsi1  NORMAL  ACTIVE  73992393          0      4      4

위에서 보듯이 scsi0의 adapter0의 path는 4개인데 Active3개 보이는 것을 볼수 있다
아래 명령어는 이것을 다시 Active로 만들어 볼수 있는 명령어 이다.

[root@tax /home/ebs]# datapath set adapter 0 online

Success: set adapter 0 to online

Adpt#    Adapter Name  State    Mode    Select    Errors  Paths  Active
    0          fscsi0  NORMAL  ACTIVE  72747884      2750      4      4


위에서 보듯이 Active4로 변경이 되었다. 이래서 일단 프로그램 문제로 판단을 하고 프로그램 sdd 프로그램을 업그레이드 하기로 했다

그뒤 다시

[root@tax /home/ebs]# datapath query adapter

Active Adapters :2

Adpt#    Adapter Name  State    Mode    Select    Errors  Paths  Active
    0          fscsi0  DEGRAD  ACTIVE  72815528      2794      4      2
    1          fscsi1  NORMAL  ACTIVE  74075151          0      4      4

명령어로 확인결과 0이 DEGRAD로 변하고 Acitve 2개로 되어 있었고

[root@tax /home/ebs]# datapath query device

Total Devices : 2


DEV#:  0  DEVICE NAME: vpath0  TYPE: 2105800        POLICY:    Optimized
SERIAL: 50027639
==========================================================================
Path#      Adapter/Hard Disk          State    Mode    Select    Errors
    0          fscsi0/hdisk2          OPEN  NORMAL  31992506          0
    1          fscsi0/hdisk3          DEAD  NORMAL  29904368      1760
    2          fscsi1/hdisk4          OPEN  NORMAL  31541635          0
    3          fscsi1/hdisk5          OPEN  NORMAL  31537679          0

DEV#:  1  DEVICE NAME: vpath1  TYPE: 2105800        POLICY:    Optimized
SERIAL: 30027639
==========================================================================
Path#      Adapter/Hard Disk          State    Mode    Select    Errors
    0          fscsi0/hdisk6          OPEN  NORMAL    5639850          0
    1          fscsi0/hdisk7          DEAD  NORMAL    5280995      1034
    2          fscsi1/hdisk8          OPEN  NORMAL    5500915          0
    3          fscsi1/hdisk9          OPEN  NORMAL    5498926          0

위에서 보듯이 datapath query device로 확인 했을때는 똑같은 상태로 보인다.

그리고 errpt확인 결과

[root@tax /home/ebs]# errpt
식별자    시간 소인  T C 자원 이름      설명
E3276AF2  1209151405 U H hdisk7        판별되지 않는 오류
E3276AF2  1209151405 U H hdisk7        판별되지 않는 오류
E3276AF2  1209151405 U H hdisk7        판별되지 않는 오류
E3276AF2  1209151405 U H hdisk7        판별되지 않는 오류
E3276AF2  1209151405 U H hdisk7        판별되지 않는 오류
A7212C7B  1209151405 P H hdisk3        장치 액세스 오류
E3276AF2  1209151405 U H hdisk3        판별되지 않는 오류
E3276AF2  1209151405 U H hdisk3        판별되지 않는 오류
E3276AF2  1209151405 U H hdisk3        판별되지 않는 오류

같이 똑같이 에러가 생기고 있다. 즉 datapath set adapter 0 online 명령어를 주었을때는 잠시 Active 되지만
얼마있지 않아서 다시 위 처럼 상태가 변한다.
번호 제목 글쓴이 날짜 조회 수
공지 [공지] 게시자료 열람자유. 불펌금지입니다. 조인상 2010.12.07 108552
» IBM Ess800 storage 관련 조인상 2010.05.11 13872
30 패시브 커넥터(시리얼) 제작법(IBM p시리즈,AIX용) file 조인상 2010.05.11 13748
29 C 컴파일러 라이센스 입력방법 조인상 2010.05.09 13730
28 로그인 다수 실패해서 로그인이 안될때 조인상 2010.05.11 13718
27 JFS2 파일시스템 수퍼블록이 훼손 되었을 경우 조인상 2010.05.11 13687
26 AIX Essentials - Asynchronous I/O 조인상 2011.12.02 13591
25 AMS - active_memory_sharing 구축방법 file 조인상 2010.05.11 13245
24 Compiling Apache or gcc/g++ for AIX 조인상 2010.05.11 13209
23 p5 F/W level 확인 방법 조인상 2010.05.11 13041
22 설치시 CAPP/EAL4+ 옵션에 대하여 조인상 2010.05.11 12960
21 미러링된 디스크중 하나의 상태가 none으로 나타날때. 조인상 2010.05.11 12938
20 IBM Power System - Cod(Capacity On Demand) file 조인상 2012.04.26 12876
19 POWER7 Strategy and Technology 조인상 2012.04.26 12861
18 OS 변경 후 이전 유저 환경 유지시키려면.. 조인상 2010.05.11 12370
17 APM_oracle연동하기 조인상 2010.05.11 5904
16 IBM Blade Education WorkBook secret 조인상 2010.11.02 1
15 AIX 6 VM관련 OS parameter secret 조인상 2010.08.26 1
14 000-104 information secret 조인상 2010.06.02 1
13 히다찌 어레이 aix 커스텀 패치 파일 secret 조인상 2010.05.11 1
12 hmc advanced topics secret 조인상 2010.05.11 1
서버에 요청 중입니다. 잠시만 기다려 주십시오...