Alert 환경 구성 가이드
pre-requisites
1. dashboard folder
2. alert rule
2.1. query setting
2.2 alert evaluation behavior
2.3 add details for alert
2.4 add custom labels
3. contact point
3.1 slack webhook setting
3.2 contact point setting
3.3 connection test
4. notification policies
5. alert test
pre-requisites
loki set up
slack app set up
1. dashboard folder
현재는 gitlab project name으로 convention을 가져간다
2. alert rule
2.1 query setting ( 보완 필요 )
A, B 모두 세팅 해야한다
explorer에서 조회할 때 처럼 하면 에러가 난다
2.2 alert evaluation behaior
Pending
상태는 Grafana에서 경보 규칙이 설정된 조건을 만족했으나, 아직 설정된 대기 시간(For
시간)이 지나지 않아 확정된 경보(Firing
상태)로 전환되지 않은 상태를 의미한다. 이는 경보가 발생하려는 초기 단계에서 볼 수 있는 상태이다. 예를 들어 'For 2m'으로 설정되어 있다면, 조건이 충족되고 난 후 2분간의 대기 시간 동안Pending
상태가 유지된다조건이 지속적으로 충족되는 동안
Pending
상태가 유지되고, 설정된 대기 시간이 지난 후에Firing
상태로 바뀌게 된다. 이 과정은 설정한 조건과 대기 시간을 확인하는데 중요한 부분이다. 예를 들어,Evaluate
조건이 매분 마다 평가되고,For
조건이 2분이라면, 이 두 조건이 지속적으로 충족되는지 2분 동안 확인하는 것따라서,
Pending
상태가 보이다가 갑자기Firing
으로 바뀌는 것은 정상적인 동작이다. 이는 Grafana가 설정된 조건과 대기 시간을 정상적으로 처리하고 있음을 의미한다
2.3 add details for alert
rule name
현재는 prj-rule
naming 으로 정했다
folder
1번
에서 만든 folder를 고른다
group
현재는
prj-group
으로 정했다
summary, description은 마음대로 설정
2.4 add custom labels
이후에 설정할 notification policy에서 custom label 값인 project에 따라 contact point가 달라지게 설정할 것
기본적으로는
severity:warning 을 설정해야 알림이 가는 것 같다
3. contact point
3.1 slack webhook setting
3.2 contact point setting
name
현재는
prj-contact-point
로 정했다
contact point type
slack
Recipient, Token은 필요 없다
webhook URL만 설정한 걸 넣어주면 된다
3.3 connection test
test를 해보면 알림이 해당 채널로 온다
4. notification policies
add matcher
2.4 에서 설정한 alert rule label을 입력한다
project:{alert-rule}
contact point
3 에서 설정한 contact point를 입력한다
save policy로 저장한다
5. alert test
여기에서 테스트 했던 것 처럼 alert이 오는 지 테스트를 진행한다
Last updated