[AWS RDS] Devops Guru for RDS 기능을 사용하여 데이터베이스의 이상 현상을 사전에 감지하기

 

l  Version : Devops Guru for RDS

 

이전 포스트에서 AWS Performance Insight(성능 개선 도우미) 사용하여 데이터베이스 운영에 필요한 다양한 지표 쿼리 관련 모니터링에 대해서 살펴 보았다.

l  [AWS RDS] Performance Insight DB부하의 원인 찾기 : https://sungwookkang.com/1503

 

이러한 모니터링은 데이터를 수집하고 관리자가 대시보드를 통한 정보 확인후 문제점 여부를 확인하는데 매우 도움이 된다. 하지만 조금 발전시켜 이러한 이상 현상을 사전에 탐지하고 진단 결과를 알려준다면 조금 빠르게 사전 대응이 가능하지 않을까 생각해 있다. 물론 AWS CloudWatch 사용하여 이상 패턴 발견 SNS 등을 사용하여 알림을 보낼 수도 있지만, 알림은 단순 임계치 값에서 변경이 발생하였을 경우에만 가능 하기 때문에 아래 솔루션을 사용하면 조금 스마트한 모니터링 병목 구간에 대한 진단이 가능하다.

 

Amazon DevOps Guru for RDS 기계 학습(ML) 기반으로 하는 서비스로 모든 AWS RDS 엔진에서 사용할 있으며 이를 통해 애플리케이션의 운영 성능 가용성을 쉽게 개선할 있다.

l  Amazon DevOps Guru for RDS : https://aws.amazon.com/ko/devops-guru/features/devops-guru-for-rds/

 

서비스는 ML 사용하여 호스트 리소스의 과도한 사용, 데이터베이스 병목 현상 또는 SQL 쿼리의 오작동과 같은 광범위한 성능 관련 데이터베이스 문제를 자동으로 식별하고 분석한다. 또한 발견한 문제를 수정하기 위한 가이드라인을 제공한다. 이상 현상이 감지되면 콘솔에서 결과를 확인할 있을 뿐만 아니라 Amazon Event Bridge또는 Amazon SNS 사용하여 알림을 보낼 있다.

 

 

 DevOps Guru for RDS 사용하기 위해서는 Amazon Console에서 RDS 성능 개선 도우미(Performance Insight) 활성화 DevOps Guru 콘솔로 이동하여 활성화 한다.

 

RDS DevOps Guru 데이터베이스 로드(DB Load) 성능 메트릭에서 이상 감지를 사용하여 문제를 감지한다. DB 로드는 AAS(Average Active Sessions) 단위로 측정된다. DB 로드는 데이터베이스의 활동 수준을 측정하므로 DB 부하가 높으면 성능 문제가 발생할 있다. 메트릭은 가상 CPU(vCPU) 수와 비교할 있으며, DB 부하가 수보다 높으면 문제가 발생할 있다.

 

아래 그림은 DevOps Guru for RDS리포트 결과로, 그래프는 AAS에서 대부분이 테이블 또는 CPU 대한 액세스를 기다리고 있음을 보여준다. 대기 이벤트는 현재 실행 중인 SQL 기다리고 있는 상태로 가장 일반적인 이유는 CPU 기다리거나 읽기 또는 쓰기를 기다리거나 잠긴 리소스를 기다리는 상태이다. Top SQL 차원은 DB 로드에 가장 많이 기여하는 쿼리를 보여준다.

 

DevOps Guru for RDS 분석 페이지에서는 문제의 원인과 해결을 위한 가지 권장 사항도 보여주는데 메트릭에서의 이상 징후는 높은 로드 대기 이벤트와 CPU 용량 초과라는 가지 문제가 감지되었다. 그리고 아래와 같은 분석결과는 나타내었다.

l  IO CPU 대기 유형에 대한 27개의 AAS 있는 고부하 대기 이벤트를 있으며 전체 DB 로드의 99%이다.

l  실행 중인 작업이 6 프로세스를 초과했음을 알려준다. 데이터베이스에는 2개의 vCPU 있으며 권장되는 실행 프로세스 수는 최대 4(vCPU 2)여야 한다.

 

다른 예외에서 그래프는 대기 이벤트의 로드가 높았고 하나의 SQL 쿼리에 추가 조사가 필요한 것으로 나타났다. SQL 다이제스트 ID 클릭하면 정확한 SQL 쿼리를 수도 있다. 예를 들어 대기 이벤트 wait/io/table/sql/handler 또는 문제 해결 문서 보기 링크에서 대기 이벤트를 클릭하면 자세한 정보를 많이 얻을 있다.

 

 

외에도 데이터베이스 분석을 보려면 Insight 페이지로 이동하여 분석 정보를 확인할 있다.

 

 

 

[참고자료]

-          Amazon DevOps Guru for RDS : https://aws.amazon.com/ko/devops-guru/features/devops-guru-for-rds/

-          Amazon DevOps Guru for RDS to Detect, Diagnose, and Resolve Amazon Aurora-Related Issues using ML : https://aws.amazon.com/ko/blogs/aws/new-amazon-devops-guru-for-rds-to-detect-diagnose-and-resolve-amazon-aurora-related-issues-using-ml/

 

 

 

 

2022-04-25 / Sungwook Kang / http://sungwookkang.com

 

 

AWS, RDS, Performance Insight, 성능 개선 도우미, DB 모니터링, 쿼리 모니터링, DB 성능 개선, DevOps Guru for RDS, 사전탐지, 장애방지, 장애대응

[AWS RDS] Performance Insight DB부하의 원인 찾기

 

l  Version : Performance Insight

 

AWS RDS 데이터베이스를 사용할 , 데이터베이스 인스턴스의 성능 지표 로그를 CloudWatch에서 수집하여 여러 성능 지표에 대한 모니터링을 진행할 있다. 하지만 슬로우 쿼리, 대기정보, 세션별 쿼리 실행 데이터베이스를 운영하기 위해 조금 자세한 정보를 확인하려면 RDS 성능 개선 도우미(Performance Insight) 사용할 있다.

 

성능 개선 도우미를 사용하려면 DB 인스턴스 또는 다중 AZ DB 클러스터에서 활성화 해야한다. 필요에 따라 활성/비활성이 가능하며, 상태 변경 재부팅 또는 장애조치가 발생하지 않는다. 성능 개선 도우미를 사용하면 에이전트가 실행되는데 이때 약간의 오버헤드가 발생하기 때문에 DB 로드가 높은 경우 수집 빈도를 조절하여 사용할 있도록 한다.

 

성능 개선 도우미는 콘솔에서 쉽게 설정이 가능하며 AWS CLI RDS API 통해서도 설정이 가능하다.

 

성능 개선 도우미의 활성화에 대한 자세한 내용은 아래 공식 문서를 참고 한다.

l  성능 개선 도우미 설정 해제 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.Enabling.html

 

성능 개선 도우미에 액세스 하려면 IAM(Identity and Access Management) 적절한 권한이 있어야 한다. IAM 대한 정책은 아래 문서를 참고한다.

l  Performance Insights 대한 액세스 정책 구성 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.access-control.html

 

성능 개선 도우미의 대시 보드는 기본적으로 마지막 1시간 동안 수집된 데이터를 표시한다.

 

대시보드는 아래와 같이 부분으로 나눌 있다.

l  카운터 지표 : 특정 성능 카운터 지표의 데이터를 표시

l  DB 부하 차트 : DB 부하와 DB 인스턴스 용량을 비교하여 최대 vCPU 선으로 표시

l  상위 항목(Top Item) : DB 로드에 기여하는 상이 차원을 표시

 

부분에 대한 자세한 내용은 아래 링크를 참고한다.

l  성능 개선 도우미 대시보드 개요 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.UsingDashboard.Components.html

 

대시보드 화면의 데이터베이스 로드(Database load) 차트에서는 병목 현상에 대한 정보를 확인할 있다. 어떤 데이터베이스 로그가 최대 CPU(Max CPU) 선을 상회하는지 확인할 있고 어떤 작업이 DB 부하를 차지하는지 보여준다. 아래 그림에서는 로그 파일 동기화 대기 시간이 대부분의 DB 부하를 차지한다. 그리고 LGWR all worker groups 대기 시간도 높다. TOP SQL 차트는 로그 파일 동기화 대기의 원인에 사용된 SQL 구문인 COMMIT 문을 보여준다.

 

TOP SQL 에서는 데이터베이스 로드에 영향을 미치는 상위 SQL 쿼리가 표시된다. TOP SQL 탭에서는  SQL 통계(SQL Statistics) 대기별 로드(AAS), SQL 정보, 환경설정 정보 등을 확인할 있다.

 

SQL 통계 (SQL Statistics) SQL 쿼리에 대한 성능 관련 지표이다. 초당 실행 횟수 초당 처리된 행을 표시한다.

 

 

대기 시간별 로드(Load by waits AAS) 상위 로드 항목과 연결된 데이터베이스 로드의 비율을 나타낸다. 예를 들어 DB 로드 차트를 대기 상태별로 그룹화 있다. 쿼리가 영향을 미치는 대기 상태의 정도를 크기, 세그먼트 컬러 코드로 표시한다.

 

 

SQL 정보에서는 TOP SQL 실행된 쿼리와 SQL ID, Support Digest ID등을 확인할 있다.

 

환경설정에서는 수집되는 항목을 설정 있다.

 

 

위에서 나열한 항목의 자세한 내용은 아래 공식 문서를 참고 한다.

l  상위 SQL(Top SQL) 개요 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.UsingDashboard.Components.AvgActiveSessions.TopLoadItemsTable.TopSQL.html

 

 

기본적으로 TOP SQL 테이블의 행에는 SQL 문에 대해 500 byte SQL 텍스트가 표시된다. SQL 문이 500byte 이상인 경우 성능 개선 도우미 대시보드에서 해당문을 열어 많은 텍스트를 있다. 경우 최대 4KB까지 표시된다. 또한 쿼리를 다운로드 있다. TOP SQL 텍스트에 대한 자세한 내용은 아래 문서를 참고 한다.

l  SQL 문의 텍스트 액세스 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.UsingDashboard.SQLTextSize.html

 

 

성능 개선 도우미를 사용할 있는 RDS 엔진 버전은 지속적으로 업데이트 되므로 항상 최신의 정보를 확인할 있도록 아래 링크의 공식 문서를 참고한다. 현재 Aurora 서버리스는 성능 개선 도우미를 지원하지 않는다.

l  Amazon RDS DB 엔진의 성능 개선 도우미 지원 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.Overview.Engines.html

 

성능개선 도우미는 대부분의 리전에서 사용 가능하며, 아래 링크를 참고한다.

l  AWS성능 개선 도우미를 위한 리전 지원 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.Overview.Regions.html

 

 

 

[참고자료]

l  성능 개선 도우미 설정 해제 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.Enabling.html

l  Performance Insights 대한 액세스 정책 구성 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.access-control.html

l  성능 개선 도우미 대시보드 개요 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.UsingDashboard.Components.html

l  SQL 문의 텍스트 액세스 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.UsingDashboard.SQLTextSize.html

l  Amazon RDS DB 엔진의 성능 개선 도우미 지원 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.Overview.Engines.html

l  Amazon RDS DB 엔진의 성능 개선 도우미 지원 : https://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/USER_PerfInsights.Overview.Engines.html

 

 

2022-04-24 / Sungwook Kang / http://sungwookkang.com

 

 

AWS, RDS, Performance Insight, 성능 개선 도우미, DB 모니터링, 쿼리 모니터링, DB 성능 개선

[AWS CloudWatch] CloudWatch 활용한 SQL Server RDS 데드락 모니터링

 

l  Version : AWS CloudWatch, RDS for SQL Server

 

SQL Server 운영할 , 여러 성능 지표 모니터링은 필수이다. 하나가 데드락 모니터링이다. AWS RDS for SQL Server 환경에서 데드락 발생시 CloudWatch 활용하면 특별한 서드파티 모니터링 도구가 없어도 발생 즉시 알림을 받을 있다.

 

이번 포스트는 AWS 공식 블로그 내용을 요약한 것으로 자세한 내용은 원문을 참고한다.

l  Monitor deadlocks in Amazon RDS for SQL Server and set notifications using Amazon CloudWatch : https://aws.amazon.com/blogs/database/monitor-deadlocks-in-amazon-rds-for-sql-server-and-set-notifications-using-amazon-cloudwatch/

 

데드락 발생시 아래와 같은 이벤트 로그를 확인할 있다. 로그는 온프레미스 SQL Server 또는 클라우드 환경에서의 SQL Server 모두 동일하다. 데드락이 발생하면 현재 실행중인 프로세스들은 모두 대기하게 되므로, SQL Server 현재 데드락에 관련된 프로세스 하나를 강제로 종료시켜 문제를 해결한다. 그리고 아래와 같은 오류 로그를 기록한다.

Msg 1205, Level 13, State 51, Line 3
Transaction (Process ID xx) was deadlocked on {xxx} resources with another process
and has been chosen as the deadlock victim. Rerun the transaction

 

AWS RDS 사용하면 데드락을 모니터링 하고 이벤트가 발생하는 즉시 Amazon SNS(Simple Notification Service) 알림을 보낼 있다. 이렇게 알림 시스템을 구성할 경우 데드락 발생에 대한 알림을 자동화하고 데드락 예방을 위한 조치를 취하는데 도움이 된다. 아래는 데드락 발생시 알림을 보내는 아키텍처이지만 데드락 뿐만 아니라 다양한 오류 로그 사용자 정의 이벤트를 모니터링 있다.

1.        SQL Server RDS 대한 데드락 모니터링 감지를 활성화

2.        SQL Server 오류 로그를 CloudWatch 게시

3.        교착 상태 이벤트를 시뮬레이션

4.        필터 패턴과 CloudWatch 경보를 생성

5.        Amazon RDS 성능 개선 도우미를 사용하여 솔루션을 모니터링

 

데드락 모니터링을 활성화 하기 위해서는 파라메터 그룹에서 데드락 이벤트인 1204, 1222 선택하고 값을 1 설정한다. 파라메터 그룹 수정 적용을 위해서는 RDS 인스턴스를 재시작 해야 한다.

 

CloudWatch 오류 로그를 모니터링 있도록 Log exports에서 Error log항목을 선택한다. 변경 사항을 적용하려면 RDS DB 인스턴스 재시작이 필요하다.

 

설정이 완료되고 나면 CloudWatch 콘솔에서 로그가 기록되는 것을 확인할 있다. 로그 그룹은 /aws/rds/instance/<Your-RDS-Instance-Name>/error 형식으로 그룹화 되어 있다.

 

Metric filter 탭에서 데드락에 대한 이벤트를 입력한다. 이때 통계에서 최소를 선택하고 0 보다 경우 알림이 발생하도록 설정한다. (데드락은 1건만 있어도 알림을 받아야 한다.)

 

알림이 발생했을 수신할 이메일을 입력하여 SNS 주제를 생성하고 나면 실제 데드락 발생시 메일로 해당 알림을 받을 있다.

 

 

이번 포스트에서는 CloudWatch 사용하여 SQL Server RDS에서 발생하는 데드락에 대해서만 모니터링 하였지만, 실제 SQL Server 오류 로그에는 매우 다양한 이벤트 로그가 기록된다. 데드락 외에도 운영에 필요한 로그를 모니터링 하여 알림을 받을 있도록 한다.

 

l  SQL Server DBA 체크리스트 : https://blog.naver.com/jevida/221018122813

 

 

[참고자료]

l  Monitor deadlocks in Amazon RDS for SQL Server and set notifications using Amazon CloudWatch : https://aws.amazon.com/blogs/database/monitor-deadlocks-in-amazon-rds-for-sql-server-and-set-notifications-using-amazon-cloudwatch/

 

 

 

2022-04-12 / Sungwook Kang / http://sungwookkang.com

 

 

AWS SQL RDS, CloudWatch, 오류로그, 이벤트 로그, 장애알림, DB 모니터링

소규모 IT 관리자분들께 권해 드립니다. 현재 운영하는 시스템의 성능을 실시간으로 모니터링하고 문제가 발생하였을때, 이메일 또는 메신져 등으로 알림을 받을 수 있습니다. 웹사이트 모니터링도 가능합니다. 무료로 3대까지 등록해서 사용할 수 있으니, 많은 도움이 되었으면 좋겠습니다.

WENSYDATA : http://wensydata.com 

 

WENSY

 

wensydata.com

 

Getting Started

Overview

WENSY APM Light weight 소프트웨어로 설치형 성능 모니터링 프로그램입니다. Agent 호스트 서버에서 다양한 메트릭의 성능데이터를 수집하고 통합하여 API 사용하여 WENSY Analysis System 으로 데이터를  전달합니다. WENSY Analysis System Rule base 알고리즘을 사용하여 시스템의 이상 유무를 판단하고, 만약 시스템에 문제가 있을시 메일, 또는 메신져 등으로 사용자에게 경고를 알립니다. 또한 대시보드에서 실시간 모니터링 상태를 다양한 차트 데이터로 확인할 있습니다.

 

·       Inquiry : info@wensydata.com

 

 

Start

WENSY 사용하기 위해서는 회원가입이 필요 합니다. (http://apm.wensydata.com)

 

Installation

Agent 호스트 서버에 직접 설치하며, Windows 플랫폼에서 실행 됩니다. (Download: http://www.wensydata.com/files/wensy.zip)

 

·       .Net Framework 4.0 Later

·       Windows Server 2008 Later

·       IIS Server 7.0 Later (Web 서버 모니터 요구사항)

·       SQL Server 2005 Later (SQL 서버 모니터링 요구사항)

 

Configuration

WENSY Agent 기본 구성 파일은  WensyConfig.xml 입니다. Agent 실행하는데 필요한 API 키를 입력 합니다. 설정 파일을 문서 편집툴을 사용하여 사용하여 아래 예제처럼 발급 받은 <PRODUCT_KEY> 등록 합니다. <PRODUCT_KEY> 발급은 WENSY 대시보드의 SETTING페이지에서 호스트 서버 등록 발급 받을 있습니다.

<PRODUCT_KEY>Your Product Key</PRODUCT_KEY>

 

Run Agent

WENSY Agent 콘솔 모드로 동작 됩니다. 관리자 모드의 콘솔을 실행하여 Wensy.exe 파일이 있는  경로로 이동하여 실행 합니다. Agent 실행 콘솔 창이 닫히지 않도록 주의 합니다. (콘솔을 실행 하는 계정이 Log off 되지 않도록 주의 합니다.) 아래 그림과 같이 SUCCESS 항목이 표시되면 정상적인 실행 상태 입니다.

 

Dashboard

대시보드는 수집된 데이터를 분석하여 호스트 서버의 상태를 실시간으로 보여주며,  수집된 메트릭을 다양한 방법으로 표현 합니다. 또한 데이터 분석 결과를 대시보드에서 확인할 있으며,  모니터링에 필요한 다양한 설정 페이지를 제공합니다.

 

WENSY

사용자가 등록한 전체 호스트 서버의 상태 정보를 쉽게 확인할 있도록, 호스트명, 서버 타입, 메트릭이 수집된 시간, 현재 서버의 상태를 4가지 컬러[Red (Critical), Orange (Warning), Yellow Green (Information), Green(Normal)] 표시 합니다.

 

대시보드에서 호스트 서버를 클릭하면 다양한 성능 데이터를 실시간 차트로 확인 가능합니다. 현재 시간 기준으로 , 30 데이터와, -1, -7일의 데이터를 교차해서 표현 합니다.

 

ALERT MESSAGE

Agent에서 수집된 호스트의 성능 데이터를 분석하여 시스템에 이상이 있을 경우 해당 항목과 성능값을 표시합니다.

 

ANALYZE

Agent부터 수집된 호스트 서버의 성능 데이터를 분석하여 다양한 그래프로 리포트를 제공 합니다.

 

Performance Summary

Agent에서 수집된 성능 데이터 기본적인 필수 정보를 차트로 표현 합니다. 검색하려는 서버와 시간대를 입력하면 해당 시간대의 성능 데이터를 표시합니다.

 

Performance Detail

Agent에서 수집된 성능 데이터 전체 메트릭 정보를 차트로 표현 합니다. 검색하려는 서버와 시간대를 입력하면 해당 시간대의 성능 데이터를 표시합니다. Detail 페이지에서는 수백개 이상의 차트가 표시되므로 데이터 로딩에 오래 걸릴수 있으며, 데이터 조회기간을 최대한 작은 구간으로 사용하는것을 권장 합니다.

 

SQL Slow Query

호스트의 서버 타입이 SQL인경우, SQL Setting페이지에서 [SQL Slowquery] 항목에 [Enabled] 되어 있을 경우, 슬로우 쿼리가 수집되어 표시 됩니다.

 

SQL Dead Lock

호스트의 서버 타입이 SQL인경우, SQL Setting페이지에서 [SQL Deadlock] 항목에 [Enabled] 되어 있을 경우, 데드락이 발생한 경우 데드락이 발생한 쿼리 다양한 상태 정보가 수집되어 표시 됩니다.

 

SETTING

WENSY 사용하는데 필요한 각종 설정 페이지입니다. 모니터링 서버 등록, 모니터링 사이트 등록,  각종 Rule 설정, Alert 설정 등을 제공합니다.

Server Setting

모니터링 하려는 호스트 서버를 등록하고, 서버 타입을 정의 합니다. 서버 타입에 따라 수집되는 데이터의 종류가 다르게 동작 합니다. 서버 등록 발급된 [PRODUCT_KEY] WENSY Agent 실행하는데 필요 합니다.

 

 

·       Display Name : 대시보드에 표시할 서버 이름

·       Display Group : 대시보드에서 표시할 그룹 이름

·       Server Type :  MS SQL경우 SQL 선택, Windows 모니터링시 Windows 선택

 

 

WebSite Setting

모니터링 하려는 웹사이트  URL 입력 합니다. WENSY 서버에서 등록된 URL 확인하여 응답이 없는 URL 대해서 사용자에게 이메일 또는 메신져로 알림을 발송합니다.

 

System Alert

시스템에서 발생하는 각종 알림을 받을 사용자 방법을 등록 합니다. 시스템 장애 발생시 동일한 알림이 지속적으로 전송 되는 거을 방지 하기 위해 Alert 옵션을 설정 있습니다.

·       최근 5 동안(Duration) 3(Alert Count) 이상의 동일한 알림이 발생 하였을 경우, 60 동안(Alert Interval) 동일한 알림 발송을 금지 합니다. , 해당 서비스가 정상 상태로 되었을때 정상 알림은 시간에 관계없이 발송 됩니다.

·       Alert 발송은 Email Slack 메신져 알림을 지원하고 있으며, Slack 경우 사용자의 Slack webhook URL 등록하면 됩니다. (Slack webhook URL : https://get.slack.help/hc/en-us/articles/115005265063-Incoming-WebHooks-for-Slack)

 

 

WebSite Alert

등록된 Web Site 모니터링하여 발생하는 알림을 받을 사용자 방법을 등록 합니다. Web Site 장애 발생시 동일한 알림이 지속적으로 전송 되는 것을 방지 하기 위해 Alert 옵션을 설정 있습니다.

·       최근 5 동안(Duration) 3(Alert Count) 이상의 동일한 알림이 발생 하였을 경우, 60 동안(Alert Interval) 동일한 알림 발송을 금지 합니다. , 해당 서비스가 정상 상태로 되었을때 정상 알림은 시간에 관계없이 발송 됩니다.

·       Alert 발송은 Email Slack 메신져 알림을 지원하고 있으며, Slack 경우 사용자의 Slack webhook URL 등록하면 됩니다. (Slack webhook URL : https://get.slack.help/hc/en-us/articles/115005265063-Incoming-WebHooks-for-Slack)

 

 

Rule Setting

Rule Setting 수집된 성능 데이터에서 특정 항목의 성능 수치가 Rule 정의된 임계치 보다 높을때 이메일 또는 메신저 등으로 알림을 발송하기 위한 기준입니다.

 

(1)    Initialize Rule WENSY에서 제공하는 값으로 초기화 합니다.

(2)    Rule 적용할 항목 임계치를 설정 합니다.

·       PObject Name : 수집된 성능의 Object Name

·       Counter name : 수집된 성능의 Counter Name

·       Instance Name : 수집된 성능의 Instance Name.

ü  특정 인스턴스 수집 : 인스턴스명 입력 (Ex : _Total)

ü  전체 인스턴스 수집 : * 입력

ü  인스턴스가 없는 항목 경우 : 빈칸

 

·       Threshold : 알림을 발생할 기준 값을 설정합니다.

·       Operator : 규칙을 설정합니다.

ü  <,  <=, >=, > : 수집된 성능값이 Threshold 설정된 값보다 크거나 작을때 알림을 발생합니다.

ü  <%, <=%, >=%, >% : % 문자가 있을 경우 이전에 수집된 값을 기준으로 Threshold 값으로 백분율하여 알림을 발송할 기준 값으로 사용합니다. (Ex : 20, >=%  CPU사용률이 20%이상 급등하면 알림을 발송 합니다.)

·       Duration (/Sec) :  임계치 조건에 대한 성능값이 일정시간이상 지속되었을때 알림을 발송합니다.

·       Alert Level : 해당 알림의 위험 수준을 정의 합니다.

·       Mobile Alert : 이메일 또는 메진져로 알림을 받을 것인지 정의합니다.

·       Enable : 해당 알림을 사용할지를 정의 합니다.

 

SQL Setting

SQL Setting 등록된 서버의 타입이 SQL  경우에만 작동합니다. 항목에 따른 SQL 서비스를 확인하고, 문제가 발생하였을때 메일 또는 메신져로 알림을 발송합니다. 알림 설정은 [System Alert Center]에서 가능합니다.

 

·       SQL Status : SQL Server 정상적으로 응답할 있는 상태인지 모니터링 합니다. 10 이상 무응답시 알림을 발송합니다.

·       SQL Server Agent : SQL Server Agent Job 실패시 알림을 발송합니다.

·       SQL Server Objects : Table, SP, View 오브젝트 생성(수정) 알림을 발송합니다.

·       Linked Servers : Linked Server 연결상태를 모니터링 합니다.

·       SQL Slowquery : 설정된 (Second) 이상 느린 쿼리가 있을 경우 해당 쿼리 정보를 수집 합니다.

·       SQL Deadlock : SQL Server에서 데드락 모니터링을 실행하여, 데드락 발생히 해당 정보를 수집 합니다.

·       Availability Group : SQL Server AlwaysOn 구성시 Failover 모니터링 하여, Role 변경되었을때 알림을 발송합니다.

·       SQL Job Object Check : SQL Server Job Agent 새로운 Job 등록, 삭제, 수정되었을때 알림을 발송 합니다.

 

 

Monitoring Setting

Monitoring Setting 호스트에서 수집할 Metric 정의 합니다. Metric 정보는 Windows Performance Counter 사용합니다. 현재 서버의 타입에 따라 특화된 Metric 기본 설정 되어 있습니다.

 

User

모니터링 사용자를 등록, 삭제 있습니다. 같은 그룹내에 사용자를 추가하려면 반드시 페이지에서 사용자를 추가해야 합니다. (주의 : 일반적인 회원 가입을 통할경우, 다른 그룹으로 분류되어 모니터링에 추가할 없습니다.)

 

System Manager

호스트 서버의 모니터링 사용자를 지정합니다. 호스트에 할당된 사용자만 해당 서버를 모니터링 있습니다.

 

 

'WENSY Monitoring' 카테고리의 다른 글

WENSY MONITORING  (0) 2019.07.26

+ Recent posts