고객과의 대화에서 고객이 재해 복구(DR) 및 BCP(비즈니스 연속성 계획)에서 Amazon WorkSpace를 어떻게 사용할 수 있는지에 대한 질문을 자주 받습니다. Amazon WorkSpaces 서비스의 설계 옵션은 무엇이며, 다른 서비스는 무엇으로 계획해야 하는지 질문합니다. 이는 최종 사용자가 Amazon WorkSpace를 기본 데스크톱으로 실행할 때 특히 중요합니다. 이 블로그 게시물은 자주 묻는 다음과 같은 주제를 다룹니다.
- Amazon WorkSpace 서비스의 기본 기능
- 인프라 고려 사항
- 사용자 환경
- DR 배포 모델
- DR 계획 검증
고객과의 대화에서 가장 중요한 부분은 고객이 DR 계획을 구성하는 요소, DR 계획을 실행하기 전의 시간 및 DR 실행을 완료하는 데 걸리는 시간 등을 정의하는 것입니다. 예를 들어, 고객이 BCP 및 DR을 구축해야 하는 경우 자연 재해로 인해 직원의 일부가 집으로 돌아가 계속 근무해야 하는 시나리오를 다룰 계획입니다. 그들은 4시간 이내에 DR 계획을 실행해야 했습니다. 이 시나리오에서는 고객이 WorkSpace도 이러한 재난을 견딜 수 있도록 보장해야 합니다.
Amazon WorkSpace에 대한 Fault Tolerance 및 가용성을 즉시 사용할 수 있습니다.
기본적으로 AWS 클라우드 인프라는 리전 및 가용 영역에 구축되어 있으므로 모든 레벨이 설정되어 있는지 확인한 다음 그림을 토대로 구축해 보겠습니다. AWS 리전은 지연 시간이 짧고 처리량이 높으며 중복성이 높은 네트워킹으로 연결된 물리적으로 분리된 여러 개의 가용 영역을 제공합니다. 가용 영역은 AWS 고객에게 애플리케이션 및 데이터베이스를 설계 및 운영할 수 있는 효과적인 방법을 제공하여 기존 단일 데이터 센터 인프라 또는 다중 데이터센터 인프라보다 가용성이 높고 내결함성이 높으며 확장성이 뛰어납니다.
Amazon WorkSpace를 배포하면 각 WorkSpace가 VPC(Amazon Virtual Private Cloud) 및 AWS 디렉터리 서비스 구성과 연결됩니다. 모든 AWS 디렉터리 서비스 서비스를 사용하려면 두 개의 서브넷이 필요합니다. 각각 다른 가용 영역에 배치해야 합니다. 복잡하고 가용성이 높은 디렉토리 토폴로지를 직접 작성할 필요는 없습니다. 이는 각 디렉토리가 여러 가용 영역에 걸쳐 배포되고 모니터링이 실패하는 도메인 컨트롤러를 자동으로 검색하여 대체하기 때문입니다.
WorkSpace를 프로비저닝하는 각 사용자는 AWS 디렉토리 서비스에 있어야 합니다. 여기서는 Simple Active Directory, AWS에서 관리되는 Microsoft Active Directory 또는 Active Directory 커넥터를 사용하는 옵션입니다.
WorkSpace 환경은 AWS 계정의 두 AZ(Availability Zone)에 걸쳐 배포됩니다. 각 AZ로의 배포는 라운드 로빈에서 발생하여 각 AZ로의 균등 분할을 유지합니다.
배치된 각 WorkSpace에 대해 두 개의 Amazon EBS 볼륨이 있습니다. 아마존 EBS 볼륨은 가용성과 신뢰성이 뛰어나도록 설계되었습니다. 추가 비용 없이 Amazon EBS 볼륨 데이터는 가용 영역의 여러 서버에 걸쳐 복제됩니다. 이렇게 하면 단일 구성 요소의 오류로 인한 데이터 손실을 방지할 수 있습니다.
두 EBS 볼륨은 WorkSpace 내의 System and User 드라이브로 최종 사용자에게 표시됩니다. WorkSpace 인스턴스가 처음 실행될 때 시스템 및 사용자 EBS 볼륨은 해당 WorkSpace의 번들 템플릿으로 사용된 원래 기본 이미지로부터 생성됩니다.
그런 다음 사용자는 추가 응용 프로그램을 설치하고(적절한 사용 권한이 있는 것으로 가정하고), 사용자 프로필을 사용자 정의하고, 문서와 파일을 추가하여 이러한 볼륨의 스토리지를 사용자 정의할 수 있습니다.
이제 시스템 및 사용자 EBS 볼륨 모두 12시간마다 자동으로 스냅샷이 생성되며(EBS 스냅샷 사용) 사용자와 관리자가 WorkSpace를 마지막으로 알려진 양호한 구성으로 롤백할 수 있는 쉬운 경로를 제공합니다. 이러한 EBS 스냅샷은 Amazon Simple Storage Service(S3)에 저장되며, 이 스냅샷은 전체 AZ의 손실로부터 보호하기 위해 최소 3개의 가용 영역에 걸쳐 복제됩니다.
이제 WorkSpace 인스턴스와 해당 EBS Volumes가 Single-AZ에 배포됨을 알게 되었으므로 주요 아키텍처 구성 요소(WorkSpace 배포를 지원하기 위해)가 여러 Availability Zone에 걸쳐 구축되며, EBS Volumes를 12시간마다 자동으로 스냅샷을 생성합니다. AZ 충돌 이벤트 중에 어떤 일이 발생합니까?
AWS는 고객이 여기에서 무엇을 해야하는지, 그리고 합당한 결정하도록 선택을 고객에게 제공합니다. 두 가지 옵션이 있습니다.
1) AZ가 정상 작동으로 돌아올 때까지 기다립니다(WorkSpace의 절반은 기간 동안 영향을 받을 수 있으므로 아무것도 하지 마십시오).
2) BCP 계획을 실행하고 조치를 취하여 영향을 받는 WorkSpace의 “재구축”을 수행할 수 있습니다. 이렇게 하면 각 사용자에 대해 새 WorkSpace 인스턴스가 시작되고 이미지로부터 시스템 볼륨과 최신 EBS 스냅샷(최대 12시간)에서 사용자 볼륨이 생성됩니다. 스냅샷 후 저장된 새 문서 또는 파일은 손실됩니다) — 이 새 WorkSpace 인스턴스는 Healthy AZ로 실행됩니다.
AWS의 표준 Amazon WorkSpace Architecture 다이어그램은 다음과 같습니다.
이 문제를 해결하고 커버 아래를 자세히 살펴보면 기본 인프라는 여러 가용 영역에 걸쳐 구축되었습니다(다중 가용 영역에 유의하십시오).
추가 인프라 고려 사항
인프라 구축 및 원하는 DR 복구 목표에 따라 다음 사항도 고려할 수 있습니다.
1) Active Directory 도메인 컨트롤러 배치
2) RADIUS 서버 배치(MFA를 사용하는 경우) 선택
3) 보조 인프라 서비스(DNS, 애플리케이션 구축, 패치 관리, A/V 관리 등) 지원
4) 파일 공유, 데이터베이스 및 이메일 서버와 같은 애플리케이션 인프라 지원
AWS 모범 사례는 AWS에서 관리 서비스 오퍼링(해당하는 경우) 또는 EC2 인스턴스(가능한 경우 백엔드 지연 시간이 가장 낮음)로 호스팅하고 여러 가용 영역에서 복제하도록 하는 것입니다.
온 프레미스에서 도메인 컨트롤러 및 기타 지원 인프라를 실행하고 AWS Direct Connect를 사용하여 프라이빗 VPC와 온 프레미스 네트워크를 함께 연결하려는 고객이 있습니다. 이러한 유형의 배포의 경우 고객은 네트워크 경로에서 단일 장애 지점을 제거하기 위해 여기에서 네트워크 구성을 자세히 살펴볼 것을 권장합니다. AWS는 고객에게 추가 탄력성을 제공하기 위해 아키텍처 패턴을 확립했습니다. 항상 다른 AWS Direct Connect 현재 상태 (액티브 / 액티브 방식으로 사용할 수 있음)에 연결된 두 번째 중복 Direct Connect 인 장애 조치 IPSecVPN을 권장합니다. 한 걸음 더 나아가 고객은 고객 측의 여러 데이터 센터에서 끝나는 여러 개의 Direct Connect를 사용하여 탄력성을 높일 수도 있습니다.
WorkSpace 사용자 환경
이제 기본 Amazon WorkSpace 인프라와 Amazon WorkSpace 배포를 지원하는 인프라에 대해 살펴보았습니다. 사용자의 작업 환경에 대해 자세히 살펴보겠습니다.
지금까지 설명한 Amazon WorkSpace 솔루션 외부에서는 사용자의 사용자 프로필과 문서가 EBS Volume에 저장되며, EBS Volume은 12시간마다 볼륨 레벨 스냅샷을 생성합니다. 즉, 문서 및 저장소의 복구 시점 목표(RPO)가 12시간이라는 뜻입니다. 파일은 WorkSpace에도 존재합니다. 즉, 사용자는 해당 WorkSpace에 로그인해야 해당 파일에 액세스할 수 있습니다.
고객은 복구 및 복원 시간을 줄이기위한 추가 조치를 구현하여 WorkSpaces 솔루션 오퍼링을 확장 할 수 있습니다. 로밍 사용자 프로필 또는 사용자 프로필 동기화 (표준 Windows 기술 또는 타사 솔루션을 EC2의 파일 공유에 사용하는 것이 그러한 예 중 하나입니다. Amazon FSx는 WorkSpaces (완전히 관리되는 Windows 파일 스토리지 서비스)와 함께 다른 옵션으로도 사용할 수 있습니다. LiquidWare ProfileUnity와 같은 일부 APN 파트너는 AWS Marketplace에 솔루션을 보유하고 있습니다.
Amazon WorkDocs를 활용하여 WorkDocs 드라이브를 사용하여 사용자 문서를 동기화할 수 있습니다. 편리한 사용자 액세스를 위해 로컬 드라이브 문자를 매핑합니다.
이러한 추가 오버레이 서비스는 최종 사용자가 클라우드 기반 서비스에 문서를 저장하고 동기화할 수 있는 기능을 제공함으로써 위험 프로필을 줄이는 데 도움이 되며, 문서 공유와 협업의 추가 이점을 제공합니다.
여기까지 왔다면 다음 단계는 어떻게 되나요?
DR을 위해 작업한 고객과의 계약 내용을 요약하면 다음과 같습니다.
1) 예산이 빠듯한 고객이라면 단일 지역(다중 가용 영역) 구축에 머무르는 것이 좋습니다.
2) 더 높은 재보증, 더 높은 복구 지점, 그리고 복구 시간 목표를 가지고 있는 고객에게, 다른 AWS 지역에 파일럿 라이트 배포는 좋은 가격 균형입니다.
3) 복구 시점과 복구 시간 목표가 매우 낮은 고객에게 다른 AWS 지역에 핫 스탠바이 구축이 가장 적합한 경로일 수 있습니다. 그러나 이 배포에는 비용이 많이 들 수 있습니다.
파일럿 라이트 배포
대체 AWS 리전에 파일럿 라이트를 배치하면 AWS 지역 수준 이벤트를 충족할 수 있습니다. 따라서 단일 AWS 지역에 대한 의존도가 감소합니다(보안 및 데이터 주권을 충분히 고려하고 탐구해야 함). 그러나 이는 Pilot Light 솔루션을 즉시 호스팅하고 대체 AWS 리전에 데이터를 복제하는 데 있어 비용에 영향을 미칩니다.
이를 위해서는 지원 인프라와 보조 인프라가 이미 대상 AWS 리전에서 실행되고 기본 영역(Active Directory 도메인 컨트롤러, DNS, 파일 공유, 패치 및 애플리케이션 배포 서버의 전체 복제본 포함)으로 복제되어야 합니다. 이러한 기능을 실행하는 데는 분명 약간의 비용이 소요되지만 페일오버의 필수 요소가 될 것입니다.
WorkSpace에 파일럿 라이트 배포의 경우 DR 절차를 실행할 때 WorkSpace를 배포하는 것이 좋습니다(파일럿 라이트 비트). 실시간 DR을 수행하기 전에 사용자 환경에서 테스트하고 이해하는 중요한 점은 배포에 시간이 걸린다는 것입니다. WorkSpace를 배포하는 속도와 수에 따라 여기서 API 제한이 실행될 수 있습니다. 대부분의 시간이 활성화된 각 WorkSpace에서 Active Directory에 가입하고 그룹 정책을 적용하며 패치 및 애플리케이션 다운로드 등에 소요됩니다.
WorkSpace 인스턴스가 시작 프로세스를 완료하고 사용 가능해지면 사용자는 WorkSpace 클라이언트에서 등록 코드를 변경하여 새 AWS 리전 및 AWS 디렉토리 서비스를 가리켜야 합니다.
핫 스탠바이 배포
툴 벨트에 있는 또 다른 옵션은 WorkSpace의 핫 스탠바이 배치입니다. 이 개념은 파일럿 라이트 배포를 기반으로 합니다. 차이점은 WorkSpaces 를 사전 출시하여 즉시 사용할 수 있도록 준비했다는 것입니다.
DR을 실행하면 사용자는 WorkSpaces 클라이언트에서 등록 코드를 변경하여 새로운 AWS 리전 및 AWS 디렉토리 서비스를 가리켜 야합니다.
다른 AWS 리전에 WorkSpace를 완전히 구축하면 비용이 많이 들 수 있지만, AutoStop 인스턴스(WorkSpace 인스턴스에 시간 단위로 지불)를 사용할 경우 비용은 최대한 최소화되지만 필요할 때 신속하게 준비됩니다.
구현을 위한 DR 및 BCP 계획 검증
가용 영역 수준 이벤트를 시뮬레이션 할 수는 없지만 복구 전략을 테스트하고 증명할 수 있습니다. 단일 영역 DR 시나리오의 경우 하나 이상의 WorkSpace 인스턴스에서 WorkSpace Rebuild 작업을 수행하는 것만큼 간단할 수 있습니다. 이렇게 하면 S3의 최신 스냅샷(최대 12시간)의 사용자 볼륨과 원래 번들 이미지의 시스템 볼륨이 포함된 새 기본 인스턴스가 시작됩니다.
WorkSpace 인스턴스에 할당된 개인 IP 주소를 검토하고 서브넷 가용 영역 배포 및 매핑과 다시 연결하여 WorkSpace 인스턴스가 시작한 가용 영역을 검증할 수 있습니다.
또한 이 테스트를 통해 로밍 프로파일, 파일 동기화 기능, 패치 및 애플리케이션 배포 기술과 같은 사용자 환경에 사용하는 다른 오버레이 기능이나 서비스를 검증하고 테스트할 수 있습니다.
마무리
이 게시물이 Amazon WorkSpaces가 다중 가용 영역 구축에서 즉시 사용할 수 있도록 설계되는 방법을 설명하고 복구 준비 상태를 테스트하는 데 도움이 되는 개괄적인 방법을 제공했으면 합니다.
빌드업웍스에서 AWS 무료 컨설팅을 진행합니다.
AWS에 대하여 궁금하신 내용이 있으시거나, 도입을 검토 중이시라면 편하게 신청해주세요.
본 문서는 Business Continuity and Disaster Recovery with Amazon WorkSpaces 내용에 기반하여 작성 되었습니다.
© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.