
안녕하세요, IT를 공부하고 기록하는 밍사원입니다.
오늘은 vSAN의 고급 구성 중 하나인 Stretched Cluster에 대해 다뤄보려고 합니다. 단일 데이터센터 장애에도 서비스가 중단 없이 운영될 수 있도록 설계된 아키텍처인데요, 개념이 많고 설정 포인트도 다양해서 1편과 2편으로 나누어 정리했습니다.
1편에서는 Stretched Cluster의 개념, 동작 원리, Witness Appliance, 네트워크 요구사항을 다루고, 2편에서는 장애 도메인, SPBM 정책, HA/DRS 설정, 구성 절차, 트러블슈팅까지 이어서 설명드릴게요!
📌 2편 링크는 발행 후 여기에 추가할 예정입니다.
1. 개요
기업 IT 환경에서 단일 데이터센터 장애는 비즈니스에 치명적인 영향을 줄 수 있습니다.
vSAN Stretched Cluster는 단일 vSAN 클러스터를 두 개의 물리적 사이트로 확장하여, 한 사이트 전체가 장애가 나더라도 서비스가 중단 없이 지속될 수 있도록 설계된 고가용성 스토리지 아키텍처입니다.
별도의 재해복구(DR) 솔루션 없이도 사이트 수준의 장애 허용(Site-level Fault Tolerance) 을 구현할 수 있어, 엔터프라이즈 환경에서 주목받는 구성입니다.
📌 참고:
본 글은 Broadcom 공식 TechDocs (vSAN 8.0 Planning and Deployment Guide — Stretched Cluster 섹션) 및 VMware 공식 vSAN Stretched Cluster Guide를 기반으로 작성되었습니다.
공식 문서 바로가기 →
What Are vSAN Stretched Clusters
VMware vSAN 8.0 CHANGE VERSION 8.0 7.0 9.0 window.versionDropdown = JSON.parse(""); --> English Deutsch Français Español Italiano 日本語 한국어 繁體中文 简体中文
techdocs.broadcom.com
2. vSAN Stretched Cluster란?
vSAN Stretched Cluster는 하나의 vSAN 클러스터를 Preferred Site(기본 사이트) 와 Secondary Site(보조 사이트) 두 개의 데이터 사이트로 분리하고, 제3의 위치에 Witness Host(감시 호스트) 를 두는 구성입니다.
vSAN Stretched Cluster의 데이터 보호 원리
VM 오브젝트가 생성되면 vSAN은 다음과 같이 데이터를 배치합니다.
- Preferred Site: 데이터 복사본 1개 전체 저장
- Secondary Site: 데이터 복사본 1개 전체 저장 (미러링)
- Witness Site: 어느 사이트가 유효한지 결정하는 Witness 컴포넌트(메타데이터)만 저장
두 사이트 간 네트워크 연결이 끊어지면, Witness Host가 타이브레이커(Tiebreaker) 역할을 하여 쿼럼을 형성하는 사이트를 결정합니다.
💡 핵심:
한 번에 하나의 링크 장애(사이트 간 연결 단절, 또는 한 사이트와 Witness 간 연결 단절)만 허용되며, 장애 발생 시 vSAN은 자동으로 정상 사이트로 전환됩니다.
3. Preferred Site vs Secondary Site
두 사이트 모두 정상 운영 시에는 Active-Active로 동작합니다.
단, 두 사이트 간 네트워크 연결이 단절되는 경우, Preferred Site가 우선적으로 계속 운영됩니다.
| Preferred Site | 사이트 간 네트워크 단절 시 우선 운영되는 사이트. 일반적으로 주 업무 사이트로 지정 |
| Secondary Site | 보조 사이트. Preferred Site가 완전히 격리된 경우 Witness와 쿼럼을 형성하여 운영 가능 |
⚠️ 주의:
Preferred Site가 항상 살아남는 것은 아닙니다. Preferred Site가 Secondary Site와 Witness 모두로부터 격리된 경우, Witness는 Secondary Site와 쿼럼을 형성하여 Secondary Site가 운영을 계속합니다. vSAN은 최대 데이터 가용성을 보장하는 방향으로 동작합니다.
4. Witness Host — 역할과 배포 방식
4-1. Witness Host의 역할
Witness Host는 실제 VM 데이터(고객 데이터)를 저장하지 않습니다.
오직 vSAN 오브젝트의 메타데이터(크기, UUID 등)와 Witness 컴포넌트만 보유하며, 두 사이트가 네트워크 단절 시 쿼럼 결정 역할(타이브레이커)을 수행합니다.
Witness Host 핵심 제약사항:
- 반드시 두 데이터 사이트와 물리적으로 독립된 제3의 위치에 배치
- 두 데이터 사이트와 어떠한 물리적 리소스도 공유 불가
- VM 실행 불가 (Witness 컴포넌트만 포함 가능)
- 클러스터 내 ESXi 호스트와 동일한 버전의 ESXi 실행 필수
4-2. Witness Appliance 크기 선택
Witness Host로는 물리적 ESXi 호스트 대신 Witness Appliance(OVA 형태의 가상 어플라이언스) 를 사용할 수 있습니다.
| Tiny | 최대 750개 컴포넌트 | VM 10개 이하 소규모 환경 |
| Medium | 최대 21,833개 컴포넌트 | 중규모 환경 (VM 500개 수준) |
💡 Tip:
OSA용과 ESA용 Witness Appliance가 별도로 제공됩니다. 구성하는 클러스터 유형(OSA/ESA)에 맞는 Appliance를 반드시 사용해야 합니다.
4-3. Witness Appliance 공유(Cross-Hosting) 제한
하나의 Witness Appliance를 여러 Stretched Cluster에서 공유하는 Cross-Hosting은 해당 클러스터들이 4개의 지리적 위치에서 운영될 때만 지원됩니다.
두 개의 위치에서만 운영되는 경우 Cross-Hosting은 지원되지 않습니다.
5. 네트워크 요구사항 — 가장 중요한 설계 포인트
vSAN Stretched Cluster에서 네트워크 설계는 성패를 결정하는 핵심 요소입니다.
5-1. 데이터 사이트 간 (Site-to-Site) 요구사항
| 최소 대역폭 | 10Gbps 이상 권장 |
| 최대 지연시간 (RTT) | 5ms 미만 |
⚠️ 사이트 간 쓰기는 동기식(Synchronous) 으로 처리됩니다. ISL 지연시간이 VM 쓰기 지연시간에 직접 영향을 주므로, 지연시간 관리가 매우 중요합니다.
5-2. 데이터 사이트 → Witness 사이트 요구사항
| 1개 (2-Node 구성) | 500ms 이하 |
| 2~10개 | 200ms 이하 |
| 11~15개 | 100ms 이하 |
대역폭: 약 2Mbps per 1,000 vSAN 컴포넌트
5-3. VMkernel 네트워크 구성
| Management (vmk0) | 3개 사이트 모두 |
| vSphere vMotion | 두 데이터 사이트 |
| vSAN 데이터 트래픽 | 3개 사이트 모두 |
- vSAN 네트워크는 일반 인프라 트래픽과 전용 네트워크로 분리 강력 권장
- L3 라우팅 환경에서는 Static Route 구성 필수
- MTU는 세 사이트 모두 동일하게 맞춰야 함
📌 마치며
1편에서는 vSAN Stretched Cluster의 핵심 개념인 Preferred/Secondary Site 역할, Witness Appliance 구성 방식, 그리고 네트워크 요구사항까지 살펴봤습니다.
2편에서는 장애 도메인 구성, SPBM 정책 설정, vSphere HA/DRS 권장 설정, 실제 구성 절차, 그리고 자주 발생하는 트러블슈팅까지 이어서 정리할게요!
🔗 2편 링크
궁금한 점은 댓글로 남겨주세요 😊
📌 참고 자료
'Broadcom|VMware > vSAN' 카테고리의 다른 글
| vSAN Stretched Cluster 완벽 가이드 2편 — 장애 도메인, SPBM, 구성 절차 총정리 (0) | 2026.06.09 |
|---|