각 팀에는 Team Admin과 Team User 역할이 존재하며, Team Admin이 팀 내의 모든 설정 권한을 가집니다.
역할 별 권한에 대한 자세한 내용은 아래와 같습니다.
권한 | Team admin | Team member |
---|---|---|
Team member 추가/삭제 | √ | |
모든 Team member 프로필에 접근과 관리 | √ | |
팀의 Routing Rules 생성/변경/삭제 | √ | |
팀의 Escalations 생성/변경/삭제 | √ | |
팀의 Schedules 생성/변경/삭제 | √ | |
팀의 Integrations 생성/변경/삭제 | √ | |
팀의 Dashboard 접근 | √ | √ |
팀의 Escalations, Schedules, Integrations 접근 | √ | √ |
팀의 모든 Alert 접근 | √ | √ |
Members
팀의 멤버를 추가하면 기본 Escalation rule에 의한 알림 수신 대상자가 됩니다.
서비스 장애 시 효과적인 인지를 위해 각 팀의 멤버는 최소 2명 이상 초대해 주시기 바랍니다.
On-call
Routing Rules 설정하기
생성된 Alert의 내용, 태그 등으로 필터링하여 특정 조건일 때 어떤 방식의 알림 체계를 사용할 지 설정합니다.
예를 들면, Manual Alert 라는 Tag가 포함된 Alert는 팀원 전체에게 발생 즉시 전파한다 라는 식의 설정이 가능합니다. 특별한 필터링 조건이 필요 없을 경우에는 따로 설정하지 않아도 됩니다.
- 화면 좌측의 메뉴 중 Teams에서 자신의 Team을 선택합니다.(자신이 소속된 Team만 표시됩니다.)
- Add routing rule을 클릭하고 Rule을 설정한 뒤 Add를 클릭합니다.
- 특이 사항이 없는 경우, 팀 별로 하나의 On-Call 스케줄과 Escalation Policy를 갖게 됩니다.
※. Routing Rule 설정 방법 동영상 가이드 보기
Escalation Policies 설정하기
위 Routing Rules에서 선택할 수 있는 전파 규칙을 설정합니다. 시간에 따라 누가 어떤 순서로 알림을 수신할 것인지 설정할 수 있습니다.
Escalation Policy는 여러 개 생성이 가능하며, 경우에 따라 다양한 Escalation을 사용할 수 있습니다.
- 화면 좌측의 메뉴 중 Teams에서 자신의 Team을 선택합니다.(자신이 소속된 Team만 표시됩니다.)
- Add escalation을 클릭하고 Rule을 설정한 뒤 Add를 클릭합니다.
- 예시
- 장애 발생 즉시 팀의 Random 멤버에게 연락한다.
- 인지되지 못하면, 장애 발생 2분 후에 팀의 Random 멤버에게 연락한다.
- 인지되지 못하면, 장애 발생 4분 후에 해당 팀의 모든 멤버에게 연락한다.
- 인지되지 못하면, 장애 발생 6분 후에 해당 팀의 모든 멤버와 직책자에게 연락한다.
- 이미 설정해 놓은 Escalation은 Edit을 클릭하여 수정할 수 있습니다.
※. Escalation Policy 설정 방법 동영상 가이드 보기
On-call schedules 설정하기
Member별로 Alert를 전담하여 받을 시간, 날짜 등을 설정합니다. 시간 또는 날짜 별로 전담 인력이 있을 경우, On-call로 설정하여 사용하면 됩니다.
설정한 On-call schedule은 Routing Rules에서 이 스케줄을 사용하도록 설정하여야 유효합니다.
- 화면 좌측의 메뉴 중 Teams에서 자신의 Team을 선택합니다.(자신이 소속된 Team만 표시됩니다.)
- Add schedule을 클릭하고 Name과 Description을 설정한 뒤 Add를 클릭합니다.
- 생성된 On-call schedule을 설정합니다.
- Overrides에서 생성한 스케줄의 우선순위가 높습니다.
Integrations 설정하기
Integration 메뉴에서 Opsgenie와 다른 도구의 연계를 설정합니다.
Integration에는 In/Out 방향성이 있으며, 양방향이 가능한 서비스들도 있습니다.
- In : Alert를 생성하기 위한 Integration
- Out : Alert 생성 이후의 전파를 위한 Integration
- Teams 화면의 좌측 메뉴 중 Integrations에서 설정합니다.
- 우측 상단의 Add integration을 클릭한 후 연계가 필요한 서비스를 검색하여 Add를 클릭합니다.
Datadog
Datadog에서 모니터링한 결과를 입력(In) 받아 Alert를 생성할 수 있는 Integration입니다.
※ 참고 : https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-datadog/
- 검색창에 Datadog을 검색한 후 Datadog integration을 선택합니다.
- API Key를 복사해 Datadog에서 해당하는 설정에 사용합니다.
- Save Integration을 눌러 저장합니다.
Slack
발생한 Alert를 Slack으로 전파(Out)하기 위한 Integration입니다.
※ 참고 : https://docs.opsgenie.com/docs/slack-app-integration
검색창에 Slack을 검색한 후 Slack Integration을 선택합니다.
설정할 Slack 채널에 해당하는 팀을 선택한 뒤 Add to Slack을 클릭합니다.
연계할 Slack Workspace에 로그인을 하고 Opsgenie가 포스팅할 Slack 채널을 선택하고 Authorize합니다.
Alert Action 및 Filter를 설정하고 저장합니다.