2022. 5. 15. 11:29ㆍMathematics/Statistics
- 목차
분포의 형태
모집단이 중심위치 기준으로 대칭(symmetric)이라고 가정
분석방법의 적절성은 가정한 조건을 자료가 얼마나 만족하고지에 영향을 받음
자료의 분포 형태에 대한 측도
자료가 모집단의 가정을 만족하는지에 확인
즉, 모집단과 자료의 형태가 얼마나 유사한지에 대한 내용
왜도 (skewness)
자료가 대칭적으로 분포되었는지 아닌지에 대한 측도
이를 수치적으로 표현하는 방법을 (역시) 피어슨이 제안
(xi – xbar)^3: 평균보다 작으면 음수, 크면 양수
3승을 하기에 평균(직선) 부근에 큰 영향이 없으며, 좌/우로 멀어질수록 큰 영향이 생긴다.
평균에서 멀어질수록 큰 음수나 양수가 된다.
즉, 대칭인 경우 0에 가까운 값이 되며, +인 경우 좌측에 값이 많게 된다.
첨도 (kurtosis)
양쪽 꼬리의 두터운 정도이다.
양쪽 꼬리가 짧다면 중간이 크며, 양쪽 꼬리가 길다면 중간이 뽀족하다.
피어슨이 제안한 수식은 다음과 같다.
Ø (xi – xbar)^4: 평균에서 멀어질수록 큰 값
Ø 분포의 중심보다는 꼬리부분이 얼마나 두터운지에 따라 영향을 많이 받음
꼬리가 길다는 것은 데이터에 이상점(outlier)가 있을수 있다는 것
왜도와 첨도를 통해 '정규분포'를 띄고 있는지 아닌지를 확인할 수 있다.
이는 '정규성 검정' 방법 중 하나이다.
예를들어 왜도는 0이나 첨도가 3이면 정규분포가 아닐 수 있다.
즉, 다양한 분석 방법은 정규분포를 가정하고 있으므로 이런 분석 방법을 적용할 수 없음을 의미한다.
'Mathematics > Statistics' 카테고리의 다른 글
표준편차와 분산(variance)의 의미 (0) | 2023.09.05 |
---|---|
확률이란? probability (0) | 2022.05.15 |
모분산, 표본분산 (0) | 2022.05.15 |
통계학 ? (0) | 2022.05.15 |
조건부 확률 (0) | 2022.03.29 |