2022. 5. 15. 11:05ㆍMathematics/Statistics
- 목차
통계학
모집단의 특성을 파악하기 위해 일부의 ‘표본’을 수집하고 이를 정리, 요약, 분석하여 표본의 특성을 파악한다.
이 표본의 특성을 통해 모집단의 특성을 추론하는 것이다.
특정한 요인이 광합성에 미치는 영향을 실험해보고자 한다면,
어떤 종에 대해 실험을 하고자 할 때 세상의 모든 식물들을 표본화 해서 실험할 수는 없음.
대신 그 종의 식물체 중 대표적인 몇몇을 표본으로 삼아서 실험하게 됨
궁극적으로 관심이 있는 것은 모집단이라는 종의 전체 식물체이지만, 이 모든 개체들로 실험하는 것이 불가능하기에 비교적 적은 표본만을 추출하여 그 표본을 대상으로 일차적인 실험과 관찰을 하는 것.
- 모집단(population):
- 모집단은 통계적인 연구에 있어서 관심 대상이 되는 모든 개체 집단
- 표본(sample):
- 모집단의 일부로서, 표본으로부터 일차적으로 자료가 얻어지고 이를 분석하여 유용한 정보가 얻어진다.
- 표본 추출 시에는 항상 추출된 표본이 모집단을 '대표'할 수 있는지를 파악해야 한다.
- 모수 (parameter)
- 모집단으로부터 얻어진 (통계적) 수치
- 통계량(statistics)
- 표본으로부터 얻어진 (통계적) 수치
위 용어를 살펴보면 알수 있듯이 '통계학'에서 하고자 하는 것은 '통계량'을 바탕으로 '모수'를 추정하고 싶은 것이다.
이 추정이 맞는지 안 맞는지를 '가설'을 세우고 '검증'(P-value등의 유의 수준을 통한 검증)하는 것이다.
1948년 Dewey vs. Truman
- Gallup은 Dewey의 승리를 예측하나 Truman이 실제로 이김
- 이후 표본선정 방식을 개선함
할당추출법 -> 확률추출법 (이후 나은 예측 성능을 보여줌)
모집단 -> 표본 -> (통계적 추론을 통해) 모집단 II 를 도출
통계학의 전 과정을 보여주는 사례
“500원 동전 천 번 돌리기”
- 학이 나올 확률이 70% 라고 가정
- 1000번 돌림
- 이 중 679번이 학이 나옴
- 학이 나올 가능성이 70% 정도 된다는 것이 얼추 맞다고 주장
통계학적 관점에서 살펴보면,
1) 연구 대상 (가설, 문제, 주제) 설정
A. “500원짜리 동전을 돌렸을 시 학이 나올 확률이 70% 정도”
2) 1000번 돌리는 실험
A. 실험을 통해 자료 수집
3) 1000번중 679번 나옴
A. 자료를 정리, 요약, 분석하여 자료의 특성을 파악
4) 학이 나올 가능서이 70%정도 된다.
A. 자료의 특성을 이용하여 “연구대상”에 대해 추론
통계학의 이용
기술통계학(descriptive statistics)
- 표본정보에 대해 자료의 수집, 정리, 분석, 서술하는 방법
- 실험이나 관찰 혹은 조사를 통해 얻은 자료들을 이용하여 평균이나 표준편차 같은 정보들을 얻는 과정
- 기술통계학 결과를 가지고 모집단의 특성에 대해 파악하고 보편적인 일반원리를 끌어냄
- 이때 추리 통계학이 사용됨
추리통계학
- 표본에서 얻은 정보(기술통계학 결과)로 모집단의 성질에 대해 추론 하는 것
통계학에서의 '실험'
여러 독립변수 중 한가지 독립변수를 변화시키면서 특정한 종속변수의 변화를 관찰하는 것이다.
단 하나의 독립변수만 존재할 것이라고 섲불리 결론을 내려서는 안된다.
개체와 용적의 온도 관계에 대해 알아보고자 할 때,
여기서의 독립변수는 '온도'가 될 수 있다.
실험자의 의도대로 변경시키거나 조정할 수 있는 변수이다.
종속변수는 '기체의 부피'가 될 수 있다.
이는 실험자의 의도로 변경되지 않는 변수이다.
'Mathematics > Statistics' 카테고리의 다른 글
표준편차와 분산(variance)의 의미 (0) | 2023.09.05 |
---|---|
확률이란? probability (0) | 2022.05.15 |
분포의 형태 (왜도, 첨도) (0) | 2022.05.15 |
모분산, 표본분산 (0) | 2022.05.15 |
조건부 확률 (0) | 2022.03.29 |