통계학 ?

2022. 5. 15. 11:05Mathematics/Statistics

    목차
반응형

통계학

모집단의 특성을 파악하기 위해 일부의 표본을 수집하고 이를 정리, 요약, 분석하여 표본의 특성을 파악한다.

이 표본의 특성을 통해 모집단의 특성을 추론하는 것이다.

 

특정한 요인이 광합성에 미치는 영향을 실험해보고자 한다면,

어떤 종에 대해 실험을 하고자 할 때 세상의 모든 식물들을 표본화 해서 실험할 수는 없음.

대신 그 종의 식물체 중 대표적인 몇몇을 표본으로 삼아서 실험하게 됨

 

궁극적으로 관심이 있는 것은 모집단이라는 종의 전체 식물체이지만, 이 모든 개체들로 실험하는 것이 불가능하기에 비교적 적은 표본만을 추출하여 그 표본을 대상으로 일차적인 실험과 관찰을 하는 것.

 

 

  • 모집단(population):
    • 모집단은 통계적인 연구에 있어서 관심 대상이 되는 모든 개체 집단
  • 표본(sample):
    • 모집단의 일부로서, 표본으로부터 일차적으로 자료가 얻어지고 이를 분석하여 유용한 정보가 얻어진다.
    • 표본 추출 시에는 항상 추출된 표본이 모집단을 '대표'할 수 있는지를 파악해야 한다. 
  • 모수 (parameter)
    • 모집단으로부터 얻어진 (통계적) 수치
  • 통계량(statistics)
    • 표본으로부터 얻어진 (통계적) 수치

 

위 용어를 살펴보면 알수 있듯이 '통계학'에서 하고자 하는 것은 '통계량'을 바탕으로 '모수'를 추정하고 싶은 것이다. 

이 추정이 맞는지 안 맞는지를 '가설'을 세우고 '검증'(P-value등의 유의 수준을 통한 검증)하는 것이다. 

 

 

1948Dewey vs. Truman

-       GallupDewey의 승리를 예측하나 Truman이 실제로 이김

-       이후 표본선정 방식을 개선함

            할당추출법 -> 확률추출법 (이후 나은 예측 성능을 보여줌)

 

모집단 -> 표본 -> (통계적 추론을 통해) 모집단 II 를 도출

 

 

통계학의 전 과정을 보여주는 사례

“500원 동전 천 번 돌리기

-       학이 나올 확률이 70% 라고 가정

-       1000번 돌림

-       이 중 679번이 학이 나옴

-       학이 나올 가능성이 70% 정도 된다는 것이 얼추 맞다고 주장 

 

통계학적 관점에서 살펴보면,

    1)     연구 대상 (가설, 문제, 주제) 설정

        A.     “500원짜리 동전을 돌렸을 시 학이 나올 확률이 70% 정도

    2)     1000번 돌리는 실험

        A.     실험을 통해 자료 수집

    3)     1000번중 679번 나옴

        A.     자료를 정리, 요약, 분석하여 자료의 특성을 파악

    4)     학이 나올 가능서이 70%정도 된다.

        A.     자료의 특성을 이용하여 연구대상에 대해 추론

 

 

통계학의 이용

기술통계학(descriptive statistics)

  • 표본정보에 대해 자료의 수집, 정리, 분석, 서술하는 방법
  • 실험이나 관찰 혹은 조사를 통해 얻은 자료들을 이용하여 평균이나 표준편차 같은 정보들을 얻는 과정
  • 기술통계학 결과를 가지고 모집단의 특성에 대해 파악하고 보편적인 일반원리를 끌어냄
  • 이때 추리 통계학이 사용됨

 

추리통계학

  • 표본에서 얻은 정보(기술통계학 결과)로 모집단의 성질에 대해 추론 하는 것

 

통계학에서의 '실험'

여러 독립변수 중 한가지 독립변수를 변화시키면서 특정한 종속변수의 변화를 관찰하는 것이다. 

단 하나의 독립변수만 존재할 것이라고 섲불리 결론을 내려서는 안된다. 

 

개체와 용적의 온도 관계에 대해 알아보고자 할 때, 

여기서의 독립변수는 '온도'가 될 수 있다. 

실험자의 의도대로 변경시키거나 조정할 수 있는 변수이다. 

 

종속변수는 '기체의 부피'가 될 수 있다. 

이는 실험자의 의도로 변경되지 않는 변수이다. 

 

 

반응형

'Mathematics > Statistics' 카테고리의 다른 글

표준편차와 분산(variance)의 의미  (0) 2023.09.05
확률이란? probability  (0) 2022.05.15
분포의 형태 (왜도, 첨도)  (0) 2022.05.15
모분산, 표본분산  (0) 2022.05.15
조건부 확률  (0) 2022.03.29