분포의 형태 (왜도, 첨도)

2022. 5. 15. 11:29Mathematics/Statistics

    목차
반응형

분포의 형태

    모집단이 중심위치 기준으로 대칭(symmetric)이라고 가정

    분석방법의 적절성은 가정한 조건을 자료가 얼마나 만족하고지에 영향을 받음

    자료의 분포 형태에 대한 측도

      자료가 모집단의 가정을 만족하는지에 확인

       , 모집단과 자료의 형태가 얼마나 유사한지에 대한 내용

 

왜도 (skewness)

ž   자료가 대칭적으로 분포되었는지 아닌지에 대한 측도

이를 수치적으로 표현하는 방법을 (역시) 피어슨이 제안

(xi – xbar)^3: 평균보다 작으면 음수, 크면 양수

3승을 하기에 평균(직선) 부근에 큰 영향이 없으며, 좌/우로 멀어질수록 큰 영향이 생긴다. 

평균에서 멀어질수록 큰 음수나 양수가 된다. 

즉, 대칭인 경우 0에 가까운 값이 되며, +인 경우 좌측에 값이 많게 된다. 

 

첨도 (kurtosis)

양쪽 꼬리의 두터운 정도이다.

양쪽 꼬리가 짧다면 중간이 크며, 양쪽 꼬리가 길다면 중간이 뽀족하다. 

 

피어슨이 제안한 수식은 다음과 같다. 

 

Ø  (xi – xbar)^4: 평균에서 멀어질수록 큰 값

Ø  분포의 중심보다는 꼬리부분이 얼마나 두터운지에 따라 영향을 많이 받음

 

꼬리가 길다는 것은 데이터에 이상점(outlier)가 있을수 있다는 것

 

 

왜도와 첨도를 통해 '정규분포'를 띄고 있는지 아닌지를 확인할 수 있다. 

이는 '정규성 검정' 방법 중 하나이다.

예를들어 왜도는 0이나 첨도가 3이면 정규분포가 아닐 수 있다. 

즉, 다양한 분석 방법은 정규분포를 가정하고 있으므로 이런 분석 방법을 적용할 수 없음을 의미한다.

 

 

 

 

 

 

 

 

반응형

'Mathematics > Statistics' 카테고리의 다른 글

표준편차와 분산(variance)의 의미  (0) 2023.09.05
확률이란? probability  (0) 2022.05.15
모분산, 표본분산  (0) 2022.05.15
통계학 ?  (0) 2022.05.15
조건부 확률  (0) 2022.03.29