Overview
Project에 관한 권한을 가진 사용자는 해당 Project의 Container에 대한 정보들을 확인할 수 있습니다.
Monitoring에 접근하는 방법
콘솔에서 Monitoring Menu 선택
화면에서 Project의 Container에 대한 여러 정보들을 확인할 수 있습니다.
추가적으로 상세한 정보들을 확인하고 싶을 때는 화면 우측 상단의 “Advanced Monitoring“ 버튼을 클릭해서 Grafana에 접근할 수 있습니다.
Grafana에서 Project에 관한 권한을 가진 사용자는 해당 Project의 Container Dashboards에 대한 권한 만을 가지고 있습니다.
Grafana URL에 직접 접근
웹페이지의 주소창에 Grafana Domain URL를 입력한 후 Cloud Z CP의 계정으로 login
URL 예시 : https://{Realm name}-monitoring.{Realm name}.cloudzcp.net/
Org 변경하는 방법
Grafana 좌측 하단의 아이콘을 클릭하면 접속한 계정에 대한 정보 및 관련 메뉴들이 표시됩니다.
이 중 “Current Org” 메뉴를 선택하면 Org를 변경할 수 있습니다.
Switch Organization 팝업창에서 현재의 Org는 “Current” 버튼으로 표시됩니다.
변경하고자 하는 Org의 “Switch to” 버튼을 클릭하면 해당 Org가 현재의 Org로 변경 됩니다.
Dashboard 로 이동
1. 상단의 Home 메뉴를 선택하세요.
2. 최근에 선택했던 Dashboard(Recent)와 기본제공 Folder(1개) 가 보입니다.
3. 기본제공 Folder를 선택하면 Folder 에 속해 있는 Dashboard 들이 펼쳐집니다.
4. Dashboard 선택하면 각종 Panel 로 구성되어 있는 화면을 만날 수 있습니다.
5. 우측 상단에서 검색 기간과 재검색 주기를 설정할 수 있습니다.
시계 아이콘과 함께 있는 시간 부분(default : Last 1 hour)에 마우스를 가져가시면 현재의 검색 기간이 표시됩니다.
시간 부분에 마우스를 클릭하면 아래와 같은 검색기간을 설정할 수 있는 팝업창이 표시됩니다.
절대적인 범위(Absolute time range)로 설정하실 수도 있고, 상대적인 범위(Relative time ranges)로 설정하실 수도 있습니다.
시간 부분 우측에는 재검색 주기를 선택할 수 있는 부분이 있습니다.
무한루프 도는 듯한 아이콘과 함께 있는 시간 부분(default : 10s)에 마우스를 클릭하시면 검색기간의 Metric 정보를 자동으로 재검색하는 주기를 지정할 수 있습니다.
제일 상단에는 재검색을 중지할 수 있는 Off이고, 5초부터 하루까지 선택할 수 있습니다.
원하는 주기를 선택하면 재검색 주기가 지정됩니다.
Cloud Z CP console 화면에서의 Dashboard
해당 Project의 Container에 대한 정보들을 확인할 수 있습니다.
Panel | Description |
---|---|
Deployment | 선택된 Cluster와 Namepsace의 Available / Unavailabe 상태의 Deployment들의 개수 |
ReplicaSets | 선택된 Cluster와 Namepsace의 Ready / NotReady 상태의 ReplicaSet들의 개수 |
StatefulSets | 선택된 Cluster와 Namepsace의 Ready / NotReady 상태의 Statefulset들의 개수 |
Pod Status | 선택된 Cluster와 Namepsace의 Pod들의 상태(Failed / Pending / Running / Succeeded)에 따른 Pod 개수 |
CPU Usage | 선택된 Cluster와 Namepsace의 Container의 CPU 사용량 |
Memory Usage | 선택된 Cluster와 Namepsace의 Container의 Memory 사용량 |
Ingress controller requests | 선택된 Cluster와 Namepsace의 Ingress controller의 request들의 양 |
Volume Usage | 선택된 Cluster와 Namepsace의 PVC(Persistent Volume Claim) 사용량 |
Filesystem Read/Write | 선택된 Cluster와 Namepsace의 Filesystem Read/Write 사용량 |
Network TX/RX | 선택된 Cluster와 Namepsace의 Network TX/RX 사용량 |
Grafana 기본 제공 Dashboard
Cloud Z CP 에서 기본으로 제공하는 Dashboard 에 대하여 설명합니다.
참고 Document : https://grafana.com/docs/grafana/v7.5/dashboards/
Container Dashboards
Kubernetes : CronJob
CronJob에 대한 정보들(Schedule, active, age 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
SCHEDULE | 스케줄 요구된 CronJob의 개수 |
SUSPEND | 일시 중지된 CronJob의 개수 |
ACTIVE | 활성화되어 있는 CronJob의 개수 |
LAST SCHEDULE | 마지막으로 CronJob 스케쥴이 실행 된 시간 |
NEXT SCHEDULE | 다음 실행예정인 CronJob 스케쥴 시간 |
AGE | 현재로부터 가장 오래 전에 생성된 CronJob의 지금까지의 기간 |
Jobs | cronjob들의 정보 |
Kubernetes : DaemonSet
DaemonSet에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
DESIRED | 스케줄이 요구된 DaemonSet의 개수 |
CURRENT | 현재 스케줄 된 DaemonSet의 개수 |
READY | 현재 동작하고 준비된 DaemonSet의 개수 |
UPDATED | 업데이트 된 DaemonSet의 개수 |
AVAILABLE | 현재 동작하고 사용중인 DaemonSet의 개수 |
AGE | 현재로부터 가장 오래 전에 생성된 DaemonSet의 지금까지의 기간 |
Total CPU | Daemonset으로 생성된 Container들에서 사용된 CPU 합계(Core) |
CPU Usage | Daemonset으로 생성된 Container들의 CPU 사용량 |
Total Memory | Daemonset으로 생성된 Container들에서 사용된 Memory 합계(MiB) |
Memory Usage | Daemonset으로 생성된 Container들의 Memory 사용량 |
Replicas Status | Daemonset의 Replica들의 상태 (Ready / Available / Unavailable / Misscheduled / Scheduled) |
Total Network | Daemonset으로 생성된 Container들에서 사용된 Network의 합계(MBps) |
Total Filesystem Read/Write | Daemonset으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 |
Filesystem Read/Write | Daemonset으로 생성된 Container들의 Filesystem Read/Write 사용량 |
Total Network TX/RX | Daemonset으로 생성된 Container들의 Network TX/RX 사용량 총합 |
Network TX/RX | Daemonset으로 생성된 Container들의 Network TX/RX 사용량 |
Pod Info | Daemonset pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Kubernetes : Deployment
Deployment에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
DESIRED | 스케줄 요구된 Deployment Replica의 개수 |
UPDATED | 업데이트 된 Deployment Replica의 개수 |
AVAILABLE | 현재 동작하고 사용중인 Deployment Replica의 개수 |
AGE | 현재로부터 가장 오래 전에 생성된 Deployment의 지금까지의 기간 |
Metadata Generation | Metadata로 생성된 Deployment의 개수 |
Observed Generation | Observed로 생성된 Deployment의 개수 |
Total CPU | Deployment로 생성된 Container들에서 사용된 CPU 합계(Core) |
CPU Usage | Deployment으로 생성된 Container들의 CPU 사용량 |
Total Memory | Deployment으로 생성된 Container들에서 사용된 Memory 합계(MiB) |
Memory Usage | Deployment으로 생성된 Container들의 Memory 사용량 |
Spec | Deployment의 Replica 개수와 Paused된 개수 |
Replicas Status | Deployment의 Replica들의 상태 (Ready / Available / Unavailable / Misscheduled / Scheduled) |
Total Network | Deployment으로 생성된 Container들에서 사용된 Network의 합계(MBps) |
Total Filesystem Read/Write | Deployment으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 |
Filesystem Read/Write | Deployment으로 생성된 Container들의 Filesystem Read/Write 사용량 |
Total Network TX/RX | Deployment으로 생성된 Container들의 Network TX/RX 사용량 총합 |
Network TX/RX | Deployment으로 생성된 Container들의 Network TX/RX 사용량 |
Pod Info | Deployment으로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Status Condition | Deployment으로 생성된 pod들의 상태 |
Events | Deployment들의 event 정보 |
Pod Events | Deployment pod들의 event 정보 |
Kubernetes : Job
Job에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
PARALLELISM | “Parallelism” 상태인 Job의 개수 |
COMPLETIONS | “Completion” 상태인 Job의 개수 |
FAILED | Failed된 Job의 개수 |
COMPLETE | Complete된 Job의 개수 |
DURATION | Job이 시작되고 나서 completion 상태가 될 때까지의 기간 |
AGE | 현재로부터 가장 오래 전에 생성된 Job의 지금까지의 기간 |
Total CPU | Job으로 생성된 Container들에서 사용된 CPU 합계(Core) |
CPU Usage | Job으로 생성된 Container들의 CPU 사용량 |
Total Memory | Job으로 생성된 Container들에서 사용된 Memory 합계(MiB) |
Memory Usage | Job으로 생성된 Container들의 Memory 사용량 |
Status | Job의 상태 (Active / Failed / Succeeded) |
Total Network | Job으로 생성된 Container들에서 사용된 Network 합계(MBps) |
Total Filesystem Read/Write | Job으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 |
Filesystem Read/Write | Job으로 생성된 Container들의 Filesystem Read/Write 사용량 |
Total Network TX/RX | Job으로 생성된 Container들의 Network TX/RX 사용량 총합 |
Network TX/RX | Job으로 생성된 Container들의 Network TX/RX 사용량 |
Pod Info | Job으로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Kubernetes : Pod
Pod에 대한 요약 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
READY | Pod의 Container상태가 Ready/정상인 개수 |
STATUS | Pod의 상태 |
RESTARTS | 재시작된 Pod의 총합 |
AGE | 현재로부터 가장 오래 전에 생성된 Pod의 지금까지의 기간 |
Start time | 현재로부터 가장 오래 전에 생성된 Pod의 생성 일자 및 시간 |
Kind | Pod의 종류 |
Total CPU | Pod으로 생성된 Container들에서 사용된 CPU 합계(Core) |
CPU Usage | Pod으로 생성된 Container들의 CPU 사용량 |
Total Memory | Pod으로 생성된 Container들에서 사용된 Memory 합계(MiB) |
Memory Usage | Pod으로 생성된 Container들의 Memory 사용량 |
Status | Pod의 상태 (Failed / Pending / Running / Succeeded) |
Ready | Ready상태인 Pod의 Container |
Restarts | Restarts상태인 Pod의 Container |
Last Terminated Reason | Pod이 마지막으로 종료된 이유 |
Waiting Reason | Pod이 Waiting상태인 이유 |
Terminated Reason | Pod이 종료된 이유 |
Total Volume | Pod과 연결된 PVC(Persistent Volume Claim) 용량의 합계 |
Volume | Pod과 연결된 PVC(Persistent Volume Claim) 용량 |
Total Network TX/RX | Pod으로 생성된 Container들의 Network TX/RX 사용량 총합 |
Network TX/RX | Pod으로 생성된 Container들의 Network TX/RX 사용량 |
Total Filesystem Read/Write | Pod으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 |
Filesystem Read/Write | Pod으로 생성된 Container들의 Filesystem Read/Write 사용량 |
Pod Info | Pod들의 정보 |
Container Info | Container들의 정보 |
Kubernetes : Pod Overview
Pod에 대한 요약 정보들(Pod의 status, restart count, pod에서 사용된 CPU/Memory/Network/Volume/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
Not running pod | 동작하지 않는 pod의 개수 총합 |
Abnormally waiting container during last selected range | 비정상적으로 “waiting” 상태였던 Container의 정보 및 waiting 횟수와 이유 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Abnormally terminated container during last selected range | 비정상적으로 “terminated” 상태였던 Container의 정보 및 waiting 횟수와 이유 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Last abnormally terminated container | 마지막이 “terminated” 상태였던 Container의 정보 및 이유 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
CPU Usage | Pod으로 생성된 Container에서 사용된 CPU 사용량 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Memory Usage | Pod으로 생성된 Container에서 사용된 Memory 사용량 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Volume Usage | Pod으로 생성된 Container에서 사용된 PVC(Persistent Volume Claim) 사용량 |
Kubernetes : ReplicaSet
ReplicaSet에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
DESIRED | 스케줄 요구된 ReplicaSet의 개수 |
UPDATED | 업데이트 된 ReplicaSet의 개수 |
AVAILABLE | 현재 동작하고 사용중인 ReplicaSet의 개수 |
AGE | 현재로부터 가장 오래 전에 생성된 ReplicaSet의 지금까지의 기간 |
Metadata Generation | Metadata로 생성된 ReplicaSet의 개수 |
Observed Generation | Observed로 생성된 ReplicaSet의 개수 |
Total CPU | ReplicaSet으로 생성된 Container들에서 사용된 CPU 합계(Core) |
CPU Usage | ReplicaSet으로 생성된 Container들의 CPU 사용량 |
Total Memory | ReplicaSet으로 생성된 Container들에서 사용된 Memory 합계(MiB) |
Memory Usage | ReplicaSet으로 생성된 Container들의 Memory 사용량 |
Replicas Status | ReplicaSet의 Replica들의 상태 (Ready / Fully_labedled / Unavailable ) |
Total Network | ReplicaSet으로 생성된 Container들에서 사용된 Network 합계(MBps) |
Total Filesystem Read/Write | ReplicaSet으로 생성된 Container들의 Filesystem Read/Write 사용량 총합 |
Filesystem Read/Write | ReplicaSet으로 생성된 Container들의 Filesystem Read/Write 사용량 |
Total Network TX/RX | ReplicaSet으로 생성된 Container들의 Network TX/RX 사용량 총합 |
Network TX/RX | ReplicaSet으로 생성된 Container들의 Network TX/RX 사용량 |
Pod Info | ReplicaSet으로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Events | ReplicaSet들의 event 정보 |
Pod Events | ReplicaSet으로 생성된 pod들의 event 정보 |
Kubernetes : StatefulSet
StatefulSets에 대한 정보들(Replicas, CPU/Memory/Network/Filesystem 등)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
DESIRED | 스케줄 요구된 Statefulset Replica의 개수 |
REPLICAS | Statefulset Replica의 개수 |
CURRENT | 현재 Statefulset Replica의 개수 |
READY | 준비된 Statefulset Replica의 개수 |
UPDATED | 업데이트 된 Statefulset Replica의 개수 |
AGE | 현재로부터 가장 오래 전에 생성된 statefulset Replica의 지금까지의 기간 |
Total CPU | Statefulset Replica로 생성된 Container들에서 사용된 CPU 합계(Core) |
CPU Usage | Statefulset Replica로 생성된 Container들의 CPU 사용량 |
Total Memory | Statefulset Replica로 생성된 Container들에서 사용된 Memory 합계(MiB) |
Memory Usage | Statefulset Replica로 생성된 Container들의 Memory 사용량 |
Replicas Status | Statefulset Replica의 Replica들의 상태 (Total / Current / Ready / Updated ) |
Total Network | Statefulset Replica로 생성된 Container들에서 사용된 Network의 합계(MBps) |
Total Filesystem Read/Write | Statefulset Replica로 생성된 Container들의 Filesystem Read/Write 사용량 총합 |
Filesystem Read/Write | Statefulset Replica로 생성된 Container들의 Filesystem Read/Write 사용량 |
Total Network TX/RX | Statefulset Replica로 생성된 Container들의 Network TX/RX 사용량 총합 |
Network TX/RX | Statefulset Replica로 생성된 Container들의 Network TX/RX 사용량 |
Pod Info | Statefulset Replica로 생성된 pod들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Pod”으로 이동 |
Kubernetes : Workloads
Workloads에 대한 정보들(Deployments, ReplicaSets, StatefulSets, DaemonSets, Jobs, CronJobs)을 표시하는 Dashboard입니다.
Panel | Description |
---|---|
Deployment | Available / Unavailabe 상태의 Deployment들의 개수 |
ReplicaSets | Ready / NotReady 상태의 ReplicaSet들의 개수 |
StatefulSets | Ready / NotReady 상태의 Statefulset들의 개수 |
DaemonSets | Available / Unavailabe 상태의 DaemonSet들의 개수 |
Jobs | Succeded / Active / Failed 상태의 Job들의 개수 |
CronJobs | Suspend가 True / False 상태인 CronJob들의 개수 |
Deployments | Deployment들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Deployment”으로 이동 |
ReplicaSets | ReplicaSet들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: ReplicaSet”으로 이동 |
StatefulSets | Statefulset들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: StatefulSet”으로 이동 |
DaemonSets | DaemonSet들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: DaemonSet”으로 이동 |
CronJobs | CronJob들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: CronJob”으로 이동 |
Jobs | Job들의 정보 정보에 있는 항목 클릭 시 “Container Dashboards / Kubernetes: Job”으로 이동 |