본문 바로가기
Old Posts/Linux

[Linux] smartctl 명령을 이용한 디스크 점검

by A6K 2021. 5. 19.

smartctl 명령어는 SMART(Self-Monitoring, Analysis, and Reporting Technology) 기능으로 하드디스크를 점검하는 도구다. 리눅스와 윈도우에서 사용가능하다.

smart 설치 - 윈도우

윈도우용 smartctl 설치파일은 smartmontools.org/wiki/Download 페이지에서 다운로드할 수 있다. 페이지에 들어가서 Install the Windows package 섹션을 보면 NSIS-installer 링크를 확인할 수 있다.

here 버튼을 누르면 https://sourceforge.net/projects/smartmontools/files/ 링크가 열린다. Download Lastest Version 버튼을 클릭해서 다운로드하고 설치해주면 된다.

smartctl 설치 - 리눅스

리눅스도 윈도우처럼 smartmontools.org/wiki/Download 페이지에서 다운로드 할 수 있다. 터미널 환경에 익숙하지 않다면 윈도우처럼 리눅스용 설치 파일을 다운로드해서 설치하자.

터미널 사용자라면 좀 더 쉽게 패키지 관리자로도 설치할 수 있다.

yum install smartmonthools

smartctl 명령어 사용법

smartctl [옵션] [디바이스이름]

smartctl 명령어를 통해 디바이스의 작동시간, 부팅횟수, 온도, 배드카운터, CRC 에러 등 하드디스크나 SSD의 다양한 정보들을 확인할 수 있다.

smartctl -a /dev/sda

기본적으로 모든 정보를 확인할 경우 -a 옵션(all)을 많이 사용한다.

smartctl -H /dev/sda

디바이스의 간단한 상태를 확인할 때는 -H 옵션(health)을 사용한다.

smartctl -i /dev/sda

디바이스의 간단한 정보를 확인할 때는 -i 옵션(info)을 사용한다.

smartctl -s on /dev/sda

명령어 사용 중 smart 기능이 잠겨있어 정보가 일부 나오지 않을 때에는 -s on 옵션(—smart=VALUE)을 넣어줘야 할 수 있다.

smartctl 명령어의 주요 속성값

smartctl 명령으로 확인할 수 있는 디바이스의 주요 속성값은 다음과 같다. 붉은색으로 표시된 값은 정상적인 디스크라면 반드시 0을 가지고 있어야 하는 항목이다.

Raw_Read_Error_Rate

디스크 표면으로부터 데이터를 읽는 과정에서 문제가 발생한 경우(주로 물리적인 충격에서 유발됨). 정상값은 0.

Spin_Up_Time

플래터 회전이 제로 rpm에서 최대 rpm까지 도달하는데 걸리는 평균 시간

Start_Stop_Count

플래터가 회전하고 정지한 횟수

Reallocated_Sector_Ct

섹터에 문제가 생겨서 스페어 영역으로 섹터가 이동한 경우다. 정상적인 경우 0으로 찍혀야한다. 0이 아닌 값이 조회되는 경우 디스크 교체를 검토해야한다.

Seek_Error_Rate

탐색 오류율. 정상적인 경우는 0

Power_On_Hours

하드디스크에 전원이 인가된 시간

Spin_Retry_Count

최대 RPM에 도달하기 위해 회전을 시도하는 횟수. 정상적인 디스크라면 1번에 끝나야 함

Power_Cycle_Count

전원 On/Off 횟수

Power_Off_retract_Count

헤드가 parking 위치로 이동한 횟수

Load_Cycle_Count

헤드가 플래터 위로 진입(Load)한 회수

Temperature_Celsius

하드디스크의 온도

Reallocated_Event_Count

스페어 영역으로 대체된 섹터에서 데이터를 읽은 횟수

Hardware ecc recovered

ECC 오류 검출로 인해 복구된 횟수

Current_Pending_Sector

불안정적인 섹터로 스페어 영역 섹터 remap을 준비하거나 읽는 과정에 문제가 생긴 섹터. 0이 아닌 값이라면 디스크 교체를 검토

Offline_Uncorrectable

읽기, 쓰기에 문제가 생긴 섹터. 즉 디스크 표면이 손상된 케이스. 디스크 교체가 필요하다.

UDMA_CRC_Error_Count

하드디스크 인터페이스를 통해 데이터 전송과정에 발생한 CRC 오류 횟수. 케이블 이슈로인해 발생되므로 케이블 교체가 필요할 수 있음

Multi_Zone_Error_Rate

섹터에 쓰기 과정에서 발생한 에러가 검출된 횟수

대부분 하드디스크는 장비에 문제를 일으키기전 이상 동작을 보인다. 미리미리 확인해서 디스크 교체를 하도록하자.

댓글