Statistics 2

통계정보와 실제 데이터 분포 확인하기

통계정보와 실제 데이터 분포 확인하기 Version : SQL Server 2005, 2008, 2008R2, 2012, 2014, 2016 통계(Statistics)는 검색 조건이 주어질 때 해당 컬럼으로 구성되는 인덱스를 사용할지 여부를 옵티마이저가 판단의 근거로 활용되는 자료이다. 통계는 데이터가 있는 컬럼에 대해 인덱스가 만들어질 때 이 컬럼 값의 히스토그램 및 관련정보를 이용하여 만들어진다. 통계 : http://sqlmvp.kr/140165557766 통계의 경우 데이터가 변경됨에 따라 그 정보도 업데이트되는데 일정 비율이상 데이터가 변경될 업데이트 된다. 간혹 특정 시점에서 쿼리가 느린 경우가 발생하는데 통계정보와 실제 데이터의 분포가 다를 경우 옵티마이저가 잘못된 판단을 하여 최적화된 플랜..

범위(Range)와 사분위수(Quartile)

범위(Range)와 사분위수(Quartile) 평균은 데이터의 중심이 어디쯤에 있는지 알려 주지만 데이터가 어떤 식으로 변화하는지에 대해서는 알려주지 않는다. 점수가 평균을 중심으로 어떻게 분포되어 있는지 살펴봄으로써 데이터를 구분할 수 있다. 아래 3개의 도표는 모두 동일한 평균값과 중앙값, 최빈값을 가지고 있지만 데이터분포는 다르다. 점수 7 8 9 10 11 12 13 도수 1 1 2 2 2 1 1 점수 7 9 10 11 13 도수 1 2 4 2 1 점수 3 6 7 10 11 13 30 도수 2 1 2 3 1 1 1 이러한 경우 범위를 계산하여 구분할 수 있다. 범위(Range)는 데이터가 얼마나 많은 숫자 값을 포함하고 있는지를 알려준다. 범위를 찾으려면 데이터 집합에서 가장 큰 수에서 가장 작은..