Opsgenie Team별 설정하기

Print


각 팀에는 Team Admin과 Team User 역할이 존재하며, Team Admin이 팀 내의 모든 설정 권한을 가집니다.

역할 별 권한에 대한 자세한 내용은 아래와 같습니다.

권한Team adminTeam member
Team member 추가/삭제
모든 Team member 프로필에 접근과 관리
팀의 Routing Rules 생성/변경/삭제
팀의 Escalations 생성/변경/삭제
팀의 Schedules 생성/변경/삭제
팀의 Integrations 생성/변경/삭제
팀의 Dashboard 접근
팀의 Escalations, Schedules, Integrations 접근
팀의 모든 Alert 접근

Members

팀의 멤버를 추가하면 기본 Escalation rule에 의한 알림 수신 대상자가 됩니다.

서비스 장애 시 효과적인 인지를 위해 각 팀의 멤버는 최소 2명 이상 초대해 주시기 바랍니다.

On-call

Routing Rules 설정하기

생성된 Alert의 내용, 태그 등으로 필터링하여 특정 조건일 때 어떤 방식의 알림 체계를 사용할 지 설정합니다.

예를 들면, Manual Alert 라는 Tag가 포함된 Alert는 팀원 전체에게 발생 즉시 전파한다 라는 식의 설정이 가능합니다. 특별한 필터링 조건이 필요 없을 경우에는 따로 설정하지 않아도 됩니다.

  1. 화면 좌측의 메뉴 중 Teams에서 자신의 Team을 선택합니다.(자신이 소속된 Team만 표시됩니다.)
  2. Add routing rule을 클릭하고 Rule을 설정한 뒤 Add를 클릭합니다.
    1. 특이 사항이 없는 경우, 팀 별로 하나의 On-Call 스케줄과 Escalation Policy를 갖게 됩니다.

※. Routing Rule 설정 방법 동영상 가이드 보기

Escalation Policies 설정하기

위 Routing Rules에서 선택할 수 있는 전파 규칙을 설정합니다. 시간에 따라 누가 어떤 순서로 알림을 수신할 것인지 설정할 수 있습니다.

Escalation Policy는 여러 개 생성이 가능하며, 경우에 따라 다양한 Escalation을 사용할 수 있습니다.

  1. 화면 좌측의 메뉴 중 Teams에서 자신의 Team을 선택합니다.(자신이 소속된 Team만 표시됩니다.)
  2. Add escalation을 클릭하고 Rule을 설정한 뒤 Add를 클릭합니다.
    1. 예시
      1. 장애 발생 즉시 팀의 Random 멤버에게 연락한다.
      2. 인지되지 못하면, 장애 발생 2분 후에 팀의 Random 멤버에게 연락한다.
      3. 인지되지 못하면, 장애 발생 4분 후에 해당 팀의 모든 멤버에게 연락한다.
      4. 인지되지 못하면, 장애 발생 6분 후에 해당 팀의 모든 멤버와 직책자에게 연락한다.
    2. 이미 설정해 놓은 Escalation은 Edit을 클릭하여 수정할 수 있습니다.

※. Escalation Policy 설정 방법 동영상 가이드 보기


On-call schedules 설정하기

Member별로 Alert를 전담하여 받을 시간, 날짜 등을 설정합니다. 시간 또는 날짜 별로 전담 인력이 있을 경우, On-call로 설정하여 사용하면 됩니다.

설정한 On-call schedule은 Routing Rules에서 이 스케줄을 사용하도록 설정하여야 유효합니다.

  1. 화면 좌측의 메뉴 중 Teams에서 자신의 Team을 선택합니다.(자신이 소속된 Team만 표시됩니다.)
  2. Add schedule을 클릭하고 Name과 Description을 설정한 뒤 Add를 클릭합니다.
  3. 생성된 On-call schedule을 설정합니다.
    1. Overrides에서 생성한 스케줄의 우선순위가 높습니다.

Integrations 설정하기

Integration 메뉴에서 Opsgenie와 다른 도구의 연계를 설정합니다.

Integration에는 In/Out 방향성이 있으며, 양방향이 가능한 서비스들도 있습니다.

  • In : Alert를 생성하기 위한 Integration
  • Out : Alert 생성 이후의 전파를 위한 Integration
  1. Teams 화면의 좌측 메뉴 중 Integrations에서 설정합니다.
  2. 우측 상단의 Add integration을 클릭한 후 연계가 필요한 서비스를 검색하여 Add를 클릭합니다.

Datadog

Datadog에서 모니터링한 결과를 입력(In) 받아 Alert를 생성할 수 있는 Integration입니다.

※ 참고 : https://support.atlassian.com/opsgenie/docs/integrate-opsgenie-with-datadog/

  1. 검색창에 Datadog을 검색한 후 Datadog integration을 선택합니다.
  2. API Key를 복사해 Datadog에서 해당하는 설정에 사용합니다.
  3. Save Integration을 눌러 저장합니다.

Slack

발생한 Alert를 Slack으로 전파(Out)하기 위한 Integration입니다.

※ 참고 : https://docs.opsgenie.com/docs/slack-app-integration

  1. 검색창에 Slack을 검색한 후 Slack Integration을 선택합니다.

  2. 설정할 Slack 채널에 해당하는 팀을 선택한 뒤 Add to Slack을 클릭합니다.

  3. 연계할 Slack Workspace에 로그인을 하고 Opsgenie가 포스팅할 Slack 채널을 선택하고 Authorize합니다.

  4. Alert Action 및 Filter를 설정하고 저장합니다.

이 답변이 유용합니까? 아니오

Send feedback
도움이 되어드리지 못해 죄송합니다. 아티클 개선을 위해 의견을 제공해 주시기 바랍니다.