8.4. MariaDB 모니터링
Cloud Z DB는 Prometheus와 Grafana를 이용하여 Pod의 기본적인 System 모니터링 항목뿐만 아니라 Database의 상태 모니터링을 그래프로 시각화하여 사용자에게 제공하고 있습니다.
기본적인 모니터링은 CPU, Memory, Network의 System 모니터링 항목과 Connection, Thread Activity, Table Lock, QPS(Query Per Second), Replication의 Database 모니터링 항목을 제공합니다.
Advanced 모니터링 항목은 Command Counter, Select Type등과 같이 Database를 더 상세하게 모니터링 할수 있는 항목들을 제공합니다.
(참고) Cloud Z Database의 Monitoring Architecture
8.4.1 기본 모니터링 항목
서비스 목록 화면에서 모니터링 Tab 으로 이동하시면 Database의 기본적인 모니터링 항목들을 확인 할 수 있습니다.
8.4.2 Advanced 모니터링 항목
모니터링 페이지에서 오른쪽 상단의 Advanced Monitoring 버튼을 누르면 더 많은 모니터링 항목들을 확인 할 수 있습니다.
8.4.2.1.전체 모니터링 항목 설명
Advanced Monitoring의 전체 항목에 대한 설명은 아래의 "Cloud Z DB Advanced Monitoring" 을 클릭하시면 확인할 수 있습니다.
8.5. MariaDB 백업
8.5.1. 백업 설정
서비스 목록 화면에서 백업 Tab으로 이동하면, 백업 설정을 할 수 있습니다. 백업 설정을 On/Off 하고, 보관 주기 및 백업 시간을 수정 할 수 있습니다.
백업된 파일은 각 Cluster의 Object Storage에 저장됩니다.
설정 항목
- 백업설정 : 백업기능 사용여부 (ON / OFF)
- 보관기간 : Object Storage 에서 백업파일 보관기간
- 전체백업 수행주기 : 매일 또는 매주 특정 요일을 선택하여 전체백업이 수행되는 날을 지정
- 전체백업시간 : 일단위 전체 백업 수행시간
- 증분백업 : 증분 백업의 실행 주기 ( 1, 2, 6, 12, 24 시간)
- 수행모드: 백업 수행되는 속도 조절 여부 (정상모드 / 저속모드)
- 정상모드: 일반적인 백업 수행 모드 입니다.
- 저속모드: DB 서비스 영향을 최소화한 백업 수행 모드 입니다.
8.5.2. 백업 유형
제공되는 백업유형은 아래와 같습니다.
구분 | 백업유형 | 세부설명 |
---|---|---|
예약백업 | 전체백업 |
|
증분백업 |
전체 백업시간수행 시간과 겹치는 시간에는 증분백업이 수행되지 않습니다. | |
즉시백업 | 전체백업 |
|
덤프백업 |
DB 설정에 따라서 오류가 발생할 수 있습니다. |
8.5.3. 복원기능
성공적으로 수행된 전체백업과 증분백업에 대해서는 백업된 시점으로 복원하는 기능을 제공합니다.
복원하는 기능은 서비스 중단이 발생합니다. 기능 사용에 참고하시기 바랍니다.
8.5.3.1. 복원 선택
백업 Tab에서 원하는 시점의 백업 목록을 확인한 후 복원 버튼을 클릭합니다.
8.5.3.2. 시점 확인 및 Credential 확인
복원이 되는 시점을 한번 더 확인 후 진행을 원하시면 Credential을 입력하고 복원 버튼을 클릭합니다.
8.5.3.3. 이벤트 확인
복원에 대한 결과는 아래와 같이 이벤트 Tab에서 확인이 가능합니다.
8.5.4. 백업디스크 추가 / 삭제
백업 파일을 저장하기 위한 백업디스크 추가입니다.
백업 디스크는 데이터 저장 공간의 1.5배 크기로 추가시 자동으로 할당됩니다.
백업 디스크에 대한 자세한 설명은 다음 FAQ로 확인할 수 있습니다.
FAQ - 백업 디스크를 꼭 사용하여야 하나요?
8.5.4.1. 백업디스크 추가 선택
백업 Tab에서 백업디스크 추가 버튼을 클릭합니다.
8.5.4.2. 백업디스크 용량 확인 및 Credential 입력
자동으로 할당되는 백업디스크의 용량을 확인하고 DB가 재기동 가능 여부를 판단하여 Credential을 입력하고 저장 버튼을 클릭 합니다.
8.5.4.3. 백업디스크 확인
백업디스크 추가에 대한 결과는 이벤트 Tab, 서비스 정보, 서비스 Resource Overview에서 확인할 수 있습니다.
- 이벤트 Tab
- 서비스 정보 - Resource
Cluster 모드일 경우 Slave에 표시가 되며, Master 하나일 경우에는 Master에 표시됩니다. - 서비스 Resource Overview
8.5.4.4. 백업디스크 삭제
만약 백업디스크를 삭제하고 싶은 경우 백업디스크 추가와 같이 백업디스크 제거 버튼을 클릭하여 삭제할 수 있습니다.
8.5.5. 백업 스케줄링 목록
메인화면 좌측에 관리 Tab에 백업스케쥴링 목록에서는 생성된 DB의 백업 스케쥴과 백업 정보를 확인할 수 있습니다.
해당 메뉴에서 직접 백업 설정 관련해서 수정이 가능합니다.
위 화면에서 백업스케쥴을 클릭하면 아래와 같은 화면이 뜨게 됩니다.
자세한 설명은 아래의 URL에서 확인할 수 있습니다.
8.6. MariaDB 삭제
더 이상 사용하지 않는 DB가 있다면, 서비스 상세 화면 우측 상단에 휴지통 버튼을 클릭하여 삭제할 수 있습니다.
단, 한번 삭제된 Database의 복구는 불가능하니 신중히 삭제해야 합니다.
Credential을 입력한 후 삭제 버튼을 클릭합니다.
8.7. High Availability 구성
Failover를 이용하여 Master/Slave 로 구성된 DB 서비스가 운영중 시스템 장애로 인해 Master 인스턴스가 사용 불가 한 경우
시스템 서비스 다운타임을 최소화하기 위해 Slave 인스턴스를 Master 로 승격시켜 서비스를 정상화 시킬 수 있습니다.
이를 통해 High Availability를 가질 수 있습니다.
Failover를 하는 방법은 수동 / Auto로 나뉘며 아래에 각각 설명되어 있습니다.
8.7.1. 수동 failover
Failover를 하기 위한 방법은 다음과 같습니다.
8.7.1.1. Failover 버튼 활성화
서비스 정보 Tab에 Master 노드가 다운된 경우 Failover 버튼이 활성화 됩니다.
8.7.1.2. 수동 Failover 수행
버튼을 클릭하면 Failover 팝업창이 뜨며 Credential 입력 후 Master DB로 설정된 서비스 L/B가 Slave DB 로 서비스 될 수 있도록 전환됩니다.
8.7.1.3. 수동 Failover 확인
서비스 L/B 가 정상으로 전환 된 경우 Failover 확인 팝업창이 뜨며 Master DB 의 Service L/B 컬럼 값이 master → slave 로 변경된 값으로 확인 할 수 있습니다.
8.7.2. Auto failover
기본값 설정에서 Auto Failover 가 On 으로 설정 된 경우 Master/Slave 로 구성된 DB 인스턴스의 서비스 정보 Tab에 Failover 설정 항목이 활성화 됩니다.
또한, 최초 설정시 서비스가 재기동 되며, 이후 설정 변경시에는 재기동 없이 Auto Failover의 On/Off가 적용 가능합니다.
Auto Failover 기능은 HA Manager 를 통해 Master DB의 health를 5초 주기로 체크합니다.
만약 Master DB 다운으로 health 체크 5회 실패시 자동으로 서비스를 Slave DB 로 전환해 줍니다.
수동 Failover 처럼 서비스가 전환되는 형식이며 한번 전환된 DB 서비스는 Master DB 를 복구하기 전까지 서비스를 원복 할 수 없습니다. (Master/Slave 데이터 불일치)
Auto Failover의 방법은 다음과 같습니다.
8.7.2.1. 기본값 설정 확인
Auto Failover를 하기 위해서는 기본값 설정의 Auto Failover 설정 UI가 On 상태여야 하며, 확인 시 OFF되어 있다면 On으로 변경해주시기 바랍니다.
8.7.2.2. Auto Failover: On
Auto Failover를 적용하려는 서비스의 서비스 정보 페이지로 들어와서 Failover 설정 항목이 활성화 되었는지 확인합니다.
Auto Failover 기능을 적용하기 위해 On 상태로 변경합니다.
8.7.2.3. Auto Failover 적용
다음과 같은 알림창이 나오면 Auto Failover 적용을 위해 확인을 클릭합니다.
확인 후 생성된 알림창에 Credential을 입력하고 적용합니다.
적용이 되면 다음과 같은 알림창을 확인할 수 있습니다.
Auto Failover 최초 적용시 서비스가 재기동됩니다.
8.7.2.4. Auto Failover 확인
Auto Failover는 서비스 정보의 Failover 항목에서 적용을 확인할 수 있습니다.
8.7.3. Failback
Auto Failover 또는 수동 Failover 기능을 사용한 경우에 Failback 설정 항목이 활성화 됩니다.
Failback 기능은 Slave DB 로 부터 데이터를 백업 후 복원하는 방식으로 수행 됩니다.
Failback 기능 활용시에 서비스 다운타임이 발생합니다.
Failback 방법은 다음과 같습니다.
8.7.3.1. Failback 클릭
Failover 후 활성화된 Failback 버튼을 클릭합니다.
8.7.3.2. Failback 수행
Failback을 확인하기 위해서 Credential을 입력하고 변경 버튼을 누릅니다.
다음과 같은 Failback 수행 팝업이 뜨며 Failback이 진행됩니다. 이때 일정시간의 서비스 다운타임이 발생합니다.
8.7.3.3. Failback 확인
Failback 수행에 대한 결과는 아래와 같이 이벤트 Tab에서 확인이 가능합니다.