지난 번 ESXTOP 내용 설명에 이어 사용법에 대한 포스팅을 하려고합니다.
설명에 대한 포스팅은 아래의 링크에서 확인 가능합니다.
[Broadcom]VMware ESXTOP(1)-설명
ESXTOP이란?ESXi Host 의 CUP, Memory, disk, network 사용률과 트래픽 정보 수집을 통한 성능 모니터링 도구 리프레쉬 타임 변경s 기본 리프레쉬 타임: 5초 메뉴 변경c = cpum = memoryn = networki = interruptsd = disk a
bettery.tistory.com
esxtop을 통해 관리자는 CPU , 디스크 공간, 메모리 및 네트워크 리소스 사용량을 모니터링 도구
네트워크
- Used-by / Team-PNIC : VM이 실제로 사용중인 물리적 NIC에 대한 정보를 제공
- % DRPTX, % DRPRX : 삭제 된 패키지 전송 / 삭제 된 패키지가 수신
0보다 큰 값은 높은 네트워크 사용률을 나타냄 (임계값 : 1)
메모리
- 마지막 1, 5 및 15 분 동안의 평균 메모리 초과 커밋
- 메모리 상태
HIHG : 사용 가능한 충분한 여유 메모리 (일반 TPS주기)
CLEAR : <100 %의 minFree : ESXi가 적극적으로 TPS를 호출하여 페이지 축소
SOFT : <64 %의 minFree : 호스트가 BALLOON 드라이버 + TPS로 메모리를 회수
HARD : <32 %의 minFree : 호스트가 스왑 시작, 압축 + TPS / 더 이상 BALLOONING 없음
LOW : <16 % 미만의 minFree : ESXi가 VM에서 더 많은 RAM을 할당하지 못하도록 차단
minFree 계산 방법 : minFree는 호스트 메모리 구성에 따라 다릅니다.
처음 28GB RAM의 경우 minFree = 899MB + 나머지 RAM과 비교하여 1 %입니다.
예를 들면, 100GB RAM이있는 호스트 : 899MB + 720MB (72GB RAM의 1 %) = minFree 1619MB
- MCTLSZ : ESXi 호스트가 ballon 드라이버에 의해 회수하는 게스트 물리 메모리 (MB)의 양. 메모리 오버 커밋이 이유 (임계값 : 1)
- SWCUR : VMKernel에 의해 교체 된 메모리 (MB). 가능한 원인 : 메모리 초과 커밋. (임계값 : 1)
- SWR / s, SWW / s : ESXi 호스트가 스왑 메모리에서 쓰거나 읽는 속도입니다. 가능한 원인 : 메모리 초과 커밋. (임계값 : 1)
- CACHEUSD : ESXi 호스트에 의해 압축 된 메모리 (MB) (임계값 : 1)
- ZIP/s : 0보다 큰 값은 호스트가 메모리를 적극적으로 압축하고 있음을 나타냄 (임계값 : 1)
- UNZIP/s : 0보다 큰 값은 호스트가 압축 메모리에 액세스하고 있음을 나타냅니
- 다. 이유 : 메모리 초과 커밋 (임계값 : 1)
CPU
- 마지막 1, 5 및 15 분 동안의 CPU로드 평균
- % USED : VM에서 사용하는 CPU 코어주기. 높은 값은 ESXi 호스트에서 성능 문제를 일으키는 VM의 지표
- % SYS : 시스템이 인터럽트를 처리하고 다른 시스템 활동을 수행하는 데 소비 한 시간의 백분율. (임계값 : 10)
가능한 원인 : 높은 I / O VM으로 인한 것일 수 있습니다.
- % VMWAIT : VM이 계속하기 전에 일부 VMkernel 활동이 완료되기를 기다리는 시간의 백분율 (예 : I / O). (임계값 : 100)
유휴 시간이 아닌 % SWPWT 및 “blocked”을 포함합니다 (% WAIT와 동일).
가능한 원인 : 스토리지 성능 문제, VM 구성에서 장치에 대한 대기 시간
예. USB 장치, serial pass-through device or parallel pass-through device
- % RDY : VM 예약을 기다리는 시간의 백분율입니다. 5 %에서 10 % 사이의 값을 기록하면 주의 (임계값 : 10)
가능한 원인 : 너무 많은 vCPU, 너무 많은 vSMP VM 또는 CPU 제한 설정 (% MLMTD 확인)
참고 : vCPU가 여러개 인 SMP VM의 경우 ESXTOP은 모든 vCPU에 대해 % rdy를 누적하여 더 높은 값을 얻습니다.
각 전용 vCPU의 값을 보려면 "e"를 눌러 CPU 통계를 확장 / 롤업하고 분석하려는 VM의 GID ("v"를 통해 확인)를 삽입하십시오.
- % CSTP :이 값은 vSMP 가상 시스템을 사용하는 경우에 유용합니다. (임계값 : 3)
VM을 실행할 준비가 완료된 상태에서 소비 한 시간의 백분율을 표시합니다.
값이> 3이면 관련 VM에서 vCPU 수를 줄입니다.
- % MLMTD : CPU 제한 설정으로 인해 vCPU 실행 준비가 예약되지 않은 시간의 백분율을 표시하는 카운터. (임계값 : 1)
더 나은 성능을 위해 한계를 제거하십시오.
- % SWPWT : 스왑 된 페이지가 디스크에서 읽을 때까지 VM이 대기해야하는 시간을 나타내는 카운터입니다. (임계값 : 5)
메모리 오버 커밋이 원인 일 수 있습니다. % SWPWT가> 5 인 경우주의하십시오!
디스크
- DAVG : 장치 드라이버 수준의 대기 시간 저장소 성능 문제 표시 (임계값 : 25)
- KAVG : VMKernel로 인한 대기 시간 (임계값 : 3)
가능한 원인 : 대기열 (잘못된 대기열 크기 매개 변수 또는 잘못된 장애 조치 정책)
- GAVG : GAVG = DAVG + KAVG. (임계값 : 25)
- ABRTS/s : 초당 명령이 중단됨
만약 스토리지 시스템이 60 초 이내에 응답하지 않으면 Windows 운영 체제가 있는 VM이 중단을 발행합니다. (임계값 : 1)
- Resets/s : 초당 재설정 된 명령 수 (임계값 : 1)
NUMA
- NMN : VM이있는 Numa 노드
- NRMEM : 원격 노드에있는 VM 메모리 (MB)
- NLMEM : 로컬 노드에있는 VM 메모리 (MB)
- N%L : 로컬 NUMA 노드에있는 VM 메모리의 백분율입니다. 이 값이 80 % 미만이면 VM에 성능 문제가 발생합니다. (임계값 : 80미만)