CS/Linux

[Linux] RAID 문제 발생 시

kyoulho 2024. 10. 1. 18:55

RAID를 사용하여 데이터의 안정성과 성능을 높였지만, 가끔은 RAID 배열에 문제가 발생할 수 있다. 이럴 때 시스템은 응급 복구 모드로 부팅될 수 있으며, 빠른 조치가 필요하다.

 

응급 복구 모드

응급 복구 모드(Emergency Mode)는 시스템 부팅 중 심각한 문제가 발생했을 때 최소한의 셸 환경을 제공하여 문제를 진단하고 복구할 수 있게 해준다. 이 모드에서는 파일 시스템이 읽기 전용으로 마운트되며, 네트워크 등 대부분의 서비스가 비활성화되어 있다.


문제 진단하기

먼저, 어떤 RAID 배열에 문제가 발생했는지 확인해야 한다.

df 명령어로 파일 시스템 확인

df 명령어는 디스크 공간 사용량과 마운트된 파일 시스템을 보여준다.

df -h
  • 결과 분석: 마운트되지 않은 파일 시스템이나 접근할 수 없는 디스크를 확인한다.

mdadm 명령어로 RAID 상태 확인

mdadm 명령어를 사용하여 RAID 배열의 상태를 자세히 확인할 수 있다.

sudo mdadm --detail /dev/md0
  • /dev/md0 대신 문제가 발생한 RAID 장치 이름을 사용한다.
  • 상태 확인 포인트:
    • State: active, degraded, inactive 등의 상태를 확인한다.
    • Devices: 정상적인 디스크와 고장난 디스크를 식별한다.

또는 모든 RAID 배열의 상태를 확인하려면:

cat /proc/mdstat


RAID 배열 중지하기

문제가 있는 RAID 배열을 중지하여 시스템 부팅에 영향을 주지 않도록 한다.

sudo mdadm --stop /dev/md0
  • /dev/md0는 중지할 RAID 장치 이름이다.
  • 주의사항: RAID 배열을 중지하면 해당 장치에 접근할 수 없으므로, 데이터 손실 위험이 있으니 반드시 필요할 때만 수행한다.


RAID 장치 제거하기

/etc/fstab 파일은 시스템 부팅 시 자동으로 마운트할 파일 시스템 정보를 담고 있다. 문제가 있는 RAID 장치가 여기에 포함되어 있으면 부팅 과정에서 에러가 발생할 수 있다.

sudo vi /etc/fstab
  • 문제를 일으키는 RAID 장치에 대한 행을 찾아 주석 처리하거나 해당 행을 삭제한다.
- UUID=xxxx-xxxx-xxxx-xxxx /mnt/raid ext4 defaults 0 0
+ #UUID=xxxx-xxxx-xxxx-xxxx /mnt/raid ext4 defaults 0 0


시스템 재부팅 및 확인

RAID 장치를 중지하고 /etc/fstab에서 제거했으므로, 이제 시스템을 재부팅하여 정상적으로 부팅되는지 확인한다.

sudo reboot
  • 재부팅 후 시스템이 정상적으로 부팅되면 문제의 원인이 RAID 배열에 있었음을 확인할 수 있다.


RAID 복구 또는 재구성

시스템이 정상적으로 부팅되었으므로, 이제 RAID 배열을 복구하거나 재구성할 수 있다.

디스크 상태 확인

문제가 발생한 디스크의 상태를 확인하고, 필요하다면 교체한다.

sudo fdisk -l

RAID 배열 복구

  • 고장난 디스크를 교체한 후 RAID 배열에 새 디스크를 추가하여 복구한다.
sudo mdadm --add /dev/md0 /dev/sdb1
  • 자세한 복구 방법은 RAID 레벨과 상황에 따라 다르므로, 이전에 설정한 RAID 방식에 맞춰 진행한다.

mdadm.conf/etc/fstab 업데이트

  • RAID 배열이 정상적으로 복구되었으면 mdadm.conf/etc/fstab 파일을 업데이트하여 시스템 재부팅 시 RAID 배열이 자동으로 활성화되고 마운트되도록 설정한다.
sudo mdadm --detail --scan | sudo tee /etc/mdadm.conf
  • /etc/mdadm.conf 파일에서 name 키-값을 제거한다.
  • /etc/fstab 파일에 RAID 장치에 대한 마운트 정보를 다시 추가한다.
728x90

'CS > Linux' 카테고리의 다른 글

[Linux] 쿼터(Quota)  (1) 2024.10.03
[Linux] LVM(Logical Volume Manager)  (0) 2024.10.02
[Linux] /dev와 파티션 이해하기  (2) 2024.10.01
[Linux] RAID 설정하는 방법  (0) 2024.10.01
[Linux] 하드웨어 디스크 추가하는 방법  (0) 2024.10.01