alert 환경 구성 가이드
Last updated
Last updated
contact point type -> slack 선택
name
slack channel 이름
webhook URL
contact point 추가에 필요한 사전 작업 가이드 에서 생성한 webhook URL 입력
Test 버튼 클릭 후 해당 채널에 알림 왔는 지 테스트
Optional Slack settings
Mention Channel
Every channel member
채널 알림 메시지에 @channel
멘션 추가 됨
Disable resolved message
alert rule 조건이 firing → normal status가 되었을 때 resolved 되었다는 메시지가 오지 않음
Save contact point 버튼 누르고 생성
Time range 제외한 값들은 사진과 값을 모두 같게하고
Time range 값에 원하는 시간대를 UTC 기준으로 넣은 후 생성
+ Add matcher
클릭
cluster resource
cluster
dev
project resource
project
project name
Contact point
2. contact point 생성 한 것 선택 ( 선택한 슬랙 채널로 alert-rule 발동 시 알림 전송 )
Overide general timings
Group wait
30s
Group interval
1m
Repeat interval
1m
Mute timing
3. [optional] 시간대 별 알림이 필요한 경우 여기서 생성한 것을 적용하고 싶다면, 선택
cluster resource 또는 project resource 모니터할 건 지 고르기
Query 작성
project resource query
A-query
sum(rate(container_cpu_usage_seconds_total{namespace="your-namespace”}[5m])) by (namespace)
sum(avg_over_time(container_memory_working_set_bytes{namespace="your-namespace"}[10m])) / (1024^3)
필요없음
B-expression
WHEN → 정해야 함 IS ABOBE → 임계치 값 정해야 함
WHEN → 정해야 함 IS ABOBE → 임계치 값 정해야 함
cluster resource query
A-query
(1 - (avg(irate({name=~"node_cpu_seconds_total|windows_cpu_time_total",mode="idle"}[5m])))) * 100
(1 - sum({name="node_memory_MemAvailable_bytes|windows_os_physical_memory_free_bytes"}) / sum({name="node_memory_MemTotal_bytes|windows_cs_physical_memory_bytes"})) * 100
(1 - (((sum(node_filesystem_free_bytes{device!"rootfs|HarddiskVolume.+"}) OR on() vector(0)) + (sum(windows_logical_disk_free_bytes{volume!"(HarddiskVolume.+|[A-Z]:.+)"}) OR on() vector(0))) / ((sum(node_filesystem_size_bytes{device!"rootfs|HarddiskVolume.+"}) OR on() vector(0)) + (sum(windows_logical_disk_size_bytes{volume!"(HarddiskVolume.+|[A-Z]:.+)"}) OR on() vector(0))))) * 100
B-expression
WHEN → max() IS ABOBE → 65
WHEN → max() IS ABOBE → 70
WHEN → max() IS ABOBE → 70
Alert evaluation behaivor 작성
e.g 1m for 2m
1분마다 rule 작동 + 2분간 지속 시 알림
alert detail 설정
Rule name
cpu
name : cpu-max-warning-alert-rule
memory
memory-max-warning-alert-rule
disk
disk-max-warning-alert-rule
Folder
분류하기 위해 초반에 생성한 또는 이미 존재하는 folder 선택
Group
cluster
dev-node
project인 경우
project name
summary
각자 설명 추가
(중요) Custom Labels
공통
severity = warning
프로젝트 분류 위한 label 추가 ( 4. Notification policy 생성 할 때 add matcher 에 넣은 값을 같이 넣어줘야 해당 채널로 알림이 전송됨 )
cluster resource 인 경우
cluster = dev
project resource 인 경우
project = projectName
Save 클릭하여 생성