계획된 유지관리작업 외에 VM서버가 관리자가 모르게 리붓 될 수 있는 경우의 수가 있네요.
Azure의 일종의 자동복구 메커니즘이죠
문제가 길어지는 경우 데이터 유실문제, VM 부팅실패 등 서비스중단에 이를 수 있으니
사전에 자동으로 북구해주는 기술입니다.
-
물리 호스트서버가 특정시간동안 응답하지않은 경우
-
가상 디스크 연결이 120초 이상 영향을 받을 때? (연결이 되지 않을때인지 워딩이 좀 애매함)
-
스토리지 IO제한을 지속적으로 초과할 때, VM 일시적으로 종료 될 수 있음
https://docs.microsoft.com/ko-kr/azure/virtual-machines/troubleshooting/understand-vm-reboot
호스트 서버 오류
VM은 Azure 데이터 센터 내에서 실행되는 실제 서버에서 호스트됩니다. 물리적 서버는 다른 Azure 구성 요소 외에도 호스트 에이전트를 호출하는 에이전트를 실행합니다. 실제 서버에서 이러한 Azure 소프트웨어 구성 요소가 응답하지 않는 경우 모니터링 시스템은 호스트 서버를 재부팅하도록 트리거하여복구를 시도합니다. VM은 일반적으로 5분 내에 다시 사용할 수 있게 되고 이전과 동일한 호스트에서 실시간으로 계속됩니다.
서버 오류는 일반적으로 하드 디스크 또는 반도체 드라이브의 오류와 같은 하드웨어 오류로 인해 발생합니다. Azure는 이러한 상황을 지속적으로 모니터링하고 기본 버그를 식별하며 완화가 구현되고 테스트된 후에 공개합니다.
일부 호스트 서버 오류가 해당 서버에만 발생하기 때문에 VM을 다른 호스트 서버에 수동으로 다시 배포하여 반복되는 VM 재부팅 상황을 개선할 수 있습니다. VM의 세부 정보 페이지에서 다시 배포 옵션을사용하거나 Azure Portal에서 VM을 중지하고 다시 시작하여 이 작업을 트리거할 수 있습니다.
Storage 관련 강제 종료
Azure의 VM은 Azure Storage 인프라에서 호스팅되는 운영 체제 및 데이터 스토리지에 대한 가상 디스크를 사용합니다. VM 및 연결된 가상 디스크 간의 사용 가능성 또는 연결이 120초 이상 영향을 받을 때마다 Azure 플랫폼은 데이터 손상을 방지하기 위해 VM을 강제 종료합니다. 저장소 연결이 복원된 후에VM의 전원은 자동으로 다시 켜집니다.
강제 종료 기간은 5분 정도로 짧지만 훨씬 길어질 수 있습니다. 다음은 저장소 관련 강제 종료와 연결된특정 사례 중 하나입니다.
IO 제한 초과
초당 I/O 작업(IOPS)의 볼륨이 디스크의 I/O 제한을 초과하기 때문에 I/O 요청이 지속적으로 제한되는경우 VM은 일시적으로 종료될 수 있습니다. (표준 디스크 저장소는 500IOPS로 제한됩니다.) 이 문제를완화하려면 워크로드에 따라 디스크 스트라이프를 사용하거나 게스트 VM 내에서 저장소 공간을 구성합니다. 자세한 내용은 Storage 성능이 최적화되도록 Azure VM 구성을 참조하세요.
'기술(Azure 만...) > [MS]Azure기본' 카테고리의 다른 글
Azure 거버넌스 : 정책 (0) | 2019.07.19 |
---|---|
Azure 모니터링 기능 심화탐구 (0) | 2019.05.30 |
Azure 스토리지 핸들링 기본 (0) | 2019.05.15 |
ACR Azure Container Registry (0) | 2019.05.09 |
Azure Storage 일반 (0) | 2019.05.04 |