Microsoft MVP성태의 닷넷 이야기
Linux: 41. 리눅스 환경에서 디스크 용량 부족 시 원인 분석 방법 [링크 복사], [링크+제목 복사]
조회: 1913
글쓴 사람
정성태 (techsharer at outlook.com)
홈페이지
첨부 파일
 

리눅스 환경에서 디스크 용량 부족 시 원인 분석 방법

리알못이라, 같은 처지의 분들에게 도움이 될 수 있도록 기록을 남깁니다. ^^

우선, 디스크 용량이 부족해서 응용 프로그램들이 오류가 발생하는 상황이었습니다. 그렇다면 이제 할 일은, 도대체 어떤 응용 프로그램에서 디스크 용량을 과다하게 사용하는지 알아내야 합니다. 제 경우 기존의 윈도우 환경이라면, spacesniffer를 곧잘 사용하는데요,

디스크의 폴더별 사용량을 한눈에 보여주는 SpaceSniffer 유틸리티 소개
; https://www.sysnet.pe.kr/1/0/993

리눅스 Guy들은 다음과 같은 명령어를 터미널 화면에서 입력한다고 합니다.

# du -m -d 1 | sort -n -r
676907  .
435643  ./var
118590  ./docker-data
64358   ./home
3914    ./lib
...[생략]...
0       ./proc
0       ./dev

그런데, 저 -m 옵션이 "block-size=1M"라고 하는데요, 그렇다면 ./var가 430GB라는 건가요? 암튼 좀 용량 계산이 직관적이지 않습니다. 와중에 다른 동료가 -h 옵션으로 하라고 해서 돌려보니 이번엔 약간 다릅니다.

# du -h -d 1 2>/dev/null  | sort -n -r
957M    ./boot
116G    ./docker-data
...[생략]...
2.1T    .
1.8T    ./var
1.3G    ./run
0       ./sys
0       ./proc
0       ./dev

아하... ./var가 430GB가 아니라 1.8T였군요. (도대체 어떻게 계산하면 1.8T가 435643으로 나올까요? ^^;)

어쨌든 결과가 잘 나왔지만 이젠 sort의 옵션이 무색하게 되었습니다. 게다가, du에 준 "-d 1" 옵션의 효과가 "depth = 1"입니다. 즉, 저렇게 나왔으면 이제 다시 의심이 되는 "1.8T"의 "/var" 디렉터리로 내려가 추가로 명령을 내려야 합니다.

# du -h -d 1 2>/dev/null
20K     ./tmp
...[생략]...
1.8T    ./lib
1.8T    .

역시나 lib로 내려가 작업을 반복하면,

# du -h -d 1 2>/dev/null
...[생략]...
1.8T    ./docker
...[생략]...
1.8T    .

범인이 대충 나왔습니다. docker의 overlay2 디렉터리가 원인이었습니다.

# du -h -d 1 2>/dev/null
64M     ./image
...[생략]...
199G    ./containers
4.0K    ./runtimes
1.6T    ./overlay2
...[생략]...
20K     ./builder
1.8T    .




회사의 주요 업무가 서비스를 만드는 것이고, 그걸로 docker를 사용한다면 아마도 운영환경을 세심하게 살피는 담당자가 있을 것이므로 이런 문제가 거의 발생하지 않았을 것입니다. 반면, ^^ 우리 회사처럼 docker를 단순히 테스트 환경으로 사용하는 경우라면, 개발자들이 너도나도 생성한 컨테이너는 어느 순간 관리가 안 되는 지경에 이릅니다.

그리고 이렇게 disk full 사태가 발생하는데요. ^^ 원인이 docker라는 것을 알았으니, 이제 docker의 자체 명령어로 실행 중인 컨테이너당 어느 정도의 디스크를 점유하고 있는지 확인하면 됩니다.

# docker ps --format "{{.ID}}\t{{.Names}}\t{{.Size}}" -s
75c0ab7da32d    problem_diag_container 653.47GB (virtual 687.6GB)
...[생략]...

다행히 저렇게 결과가 나왔으면 이제 해당 컨테이너를 생성한 담당자에게 이 사실을 알리고 조치를 취하면 됩니다. ^^

참고로, 이 외에도 docker system df 명령어도 기억해 둘 만합니다.

# docker system df
TYPE                TOTAL               ACTIVE              SIZE                RECLAIMABLE
Images              79                  19                  32.23GB             1.974GB (6%)
Containers          83                  33                  830.4GB             0B (0%)
Local Volumes       36                  32                  3.004GB             550.3MB (18%)
Build Cache         0                   0                   0B                  0B

그리고 윈도우 사용자라면 전체적인 디스크 사용량을 탐색기의 "This PC" 레벨에서 확인할 텐데요, 리눅스라면 df 명령어로 유사하게 확인을 합니다.

$ df -h
Filesystem                         Size  Used Avail Use% Mounted on
udev                                63G     0   63G   0% /dev
tmpfs                               13G  1.3G   12G  11% /run
/dev/mapper/ubuntu--vg-ubuntu--lv  1.7T  563G 1019G  36% /
tmpfs                               63G     0   63G   0% /dev/shm
tmpfs                              5.0M     0  5.0M   0% /run/lock
tmpfs                               63G     0   63G   0% /sys/fs/cgroup
...[생략]...

복잡한 구성이 아니라면, 대개의 경우 "Mounted on"이 "/"로 되어 있는 값을 확인하면 됩니다. 위의 경우에는 1.7T 용량의 하드 디스크가 이제 1T 정도의 남은 용량이 있는 것입니다. 만약 디스크가 부족한 상황이라면 "Use%"의 값이 "100%"를 찍고 있을 것입니다.




[이 글에 대해서 여러분들과 의견을 공유하고 싶습니다. 틀리거나 미흡한 부분 또는 의문 사항이 있으시면 언제든 댓글 남겨주십시오.]







[최초 등록일: ]
[최종 수정일: 7/14/2021]

Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
by SeongTae Jeong, mailto:techsharer at outlook.com

비밀번호

댓글 작성자
 




1  2  3  4  5  6  7  8  9  10  [11]  12  13  14  15  ...
NoWriterDateCnt.TitleFile(s)
12843정성태10/3/20211406스크립트: 29. 파이썬 - fork 시 기존 클라이언트 소켓 및 스레드의 동작파일 다운로드1
12842정성태10/1/20214482오류 유형: 763. 파이썬 오류 - AttributeError: type object '...' has no attribute '...'
12841정성태10/1/20211449스크립트: 28. 모든 파이썬 프로세스에 올라오는 특별한 파일 - sitecustomize.py
12840정성태9/30/20212016.NET Framework: 1119. Entity Framework의 Join 사용 시 다중 칼럼에 대한 OR 조건 쿼리파일 다운로드1
12839정성태9/15/20211994.NET Framework: 1118. C# 10 - (17) 제네릭 타입의 특성 적용파일 다운로드1
12838정성태9/13/20211914.NET Framework: 1117. C# - Task에 전달한 Action, Func 유형에 따라 달라지는 async/await 비동기 처리 [2]파일 다운로드1
12837정성태9/11/20211445VC++: 151. Golang - fmt.Errorf, errors.Is, errors.As 설명
12836정성태9/10/20211337Linux: 45. 리눅스 - 실행 중인 다른 프로그램의 출력을 확인하는 방법
12835정성태9/7/20211596.NET Framework: 1116. C# 10 - (16) CallerArgumentExpression 특성 추가 [1]파일 다운로드1
12834정성태9/7/20211409오류 유형: 762. Visual Studio 2019 Build Tools - 'C:\Program' is not recognized as an internal or external command, operable program or batch file.
12833정성태9/6/20211474VC++: 150. Golang - TCP client/server echo 예제 코드파일 다운로드1
12832정성태9/6/20211324VC++: 149. Golang - 인터페이스 포인터가 의미 있을까요?
12831정성태9/6/20211148VC++: 148. Golang - 채널에 따른 다중 작업 처리파일 다운로드1
12830정성태9/6/20211219오류 유형: 761. Internet Explorer에서 파일 다운로드 시 "Your current security settings do not allow this file to be downloaded." 오류
12829정성태9/5/20211777.NET Framework: 1115. C# 10 - (15) 구조체 타입에 기본 생성자 정의 가능파일 다운로드1
12828정성태9/4/20211480.NET Framework: 1114. C# 10 - (14) 단일 파일 내에 적용되는 namespace 선언파일 다운로드1
12827정성태9/4/20212653스크립트: 27. 파이썬 - 웹 페이지 데이터 수집을 위한 scrapy Crawler 사용법 요약
12826정성태9/3/20211923.NET Framework: 1113. C# 10 - (13) 문자열 보간 성능 개선파일 다운로드1
12825정성태9/3/20211347개발 환경 구성: 603. GoLand - WSL 환경과 연동
12824정성태9/2/20215244오류 유형: 760. 파이썬 tensorflow - Dst tensor is not initialized. 오류 메시지
12823정성태9/2/20211453스크립트: 26. 파이썬 - PyCharm을 이용한 fork 디버그 방법
12822정성태9/1/20212954오류 유형: 759. 파이썬 tensorflow - ValueError: Shapes (...) and (...) are incompatible [2]
12821정성태9/1/20211338.NET Framework: 1112. C# - .NET 6부터 공개된 ISpanFormattable 사용법
12820정성태9/1/20211175VC++: 147. Golang - try/catch에 대응하는 panic/recover파일 다운로드1
12819정성태8/31/20211434.NET Framework: 1111. C# - FormattableString 타입
12818정성태8/31/20211401Windows: 198. 윈도우 - 작업 관리자에서 (tensorflow 등으로 인한) GPU 연산 부하 보는 방법
1  2  3  4  5  6  7  8  9  10  [11]  12  13  14  15  ...