Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SpotLake 데이터 수집 모니터링 개선 #453

Open
red0sena opened this issue Nov 1, 2023 · 3 comments
Open

SpotLake 데이터 수집 모니터링 개선 #453

red0sena opened this issue Nov 1, 2023 · 3 comments

Comments

@red0sena
Copy link
Contributor

red0sena commented Nov 1, 2023

현재 SpotLake의 모니터링은 슬랙에 매일 아침 09:00에 오는 데이터 수집 개수 알림이 전부입니다.

image

이는 실시간으로 수집에 문제가 생겨도 알림이 오지않아 다음날 아침에 수집 이슈를 알게 됩니다.

이를 개선하여

  1. 실시간으로 데이터 수집이 되지 않았을 시 바로 알림
  2. Lambda, EC2에 문제가 생겼을 시 바로 알림
@red0sena
Copy link
Contributor Author

red0sena commented Nov 1, 2023

실시간으로 데이터 수집이 되지 않았을 시 바로 알림

  • 각 벤더별 Collector에서 OndemandPrice, SpotPrice, IF, SPS가 수집된 개수를 CloudWatch에 로그로 저장
  • 수집된 개수가 이전 3일간의 수집 평균보다 25%이상 낮아지면 CloudWatch Alarm으로 람다를 트리거하여 Slack으로 알람 전송
image
  • 현재 테스트 진행 중에 있으며 잘 작동함을 확인하면 실제 SpotLake에 적용해 보도록 하겠습니다.

@kmu-leeky
Copy link
Member

경환아 이해를 해보면 collector 가 수집하는 시점에 실제 수집된 갯수를 바로 CloudWatch 에 저장. 각 수집 시점 마다 (aws 는 매 10분, 나머지는 매 1시간) 3일간의 평균보다 25% 낮으면 바로 메시지 보내는거지? 즉 문제가 생기면 aws 는 매 10분마다, 나머지는 매 시간 마다 알람이 올 수 있는 상황?

@red0sena
Copy link
Contributor Author

red0sena commented Nov 2, 2023

네 맞습니다. 각 벤더별 Collector의 매 수집시마다 알람이 올 수 있습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants