Mathematics/Statistics(6)
-
표준편차와 분산(variance)의 의미
분산의 통계적 의미 변동성 파악 분산이 큼: 데이터 값들이 평균에서 멀리 퍼져 있음 데이터가 다양한 범위와 패턴을 지니고 있음을 의미 또한 데이터의 예측 불확실성이 높다는 것을 암시 (예측 정확성이 낮아질 수 있음) 이상치가 있을 수 있음을 의미 분산이 작음: 데이터 값들이 평균에서 가까이 모여 있음 이를 통해 데이터의 산포를 짐작할 수 있음 표준편차는 분산에 sqrt를 씌운 것 즉, 원래의 값의 단위로 되돌린 것임 단위가 원래의 단위로 돌아갔기에 데이터의 변동성을 좀 더 직관적으로 파악할 수 있음 즉, 해석이 더 용이함
2023.09.05 -
확률이란? probability
발생 가능한 모든 사건들 중 특정 사건이 발생할 비율이 확률이다. 예를들어 주사위를 던질때 1부터 6까지의 수가 발생할 확률이 (즉, 주사위가 조작되지 않았다고 할 때) 공평하다고 하자. 이때 1부터 6까지 각각의 사건들이 발생할 확률은 전체 공간을 6 등분한 것 분의 1이 된다. 즉, 1/6의 확률로 각각의 사건이 발생한다. 이렇듯 전체 사건 공간에서 특정 사건이 발생할 %가 바로 '확률'이다. 표본공간 확률실험에서 발생 가능한 모든 결과들의 집합 사건 표본공간 내에서의 관심 부분집합 ex. 홀수가 나오는 경우 {1, 3, 5} 베르누이 시행 각 실험에서 발생 가능한 결과는 2가지 (성공 혹은 실패) 각 실험은 독립적으로 시행 가능 모든 실험에서 결과의 확률은 항상 동일 ex. 10개 제품 중 3개가 ..
2022.05.15 -
분포의 형태 (왜도, 첨도)
분포의 형태 모집단이 중심위치 기준으로 대칭(symmetric)이라고 가정 분석방법의 적절성은 가정한 조건을 자료가 얼마나 만족하고지에 영향을 받음 자료의 분포 형태에 대한 측도 자료가 모집단의 가정을 만족하는지에 확인 즉, 모집단과 자료의 형태가 얼마나 유사한지에 대한 내용 왜도 (skewness) 자료가 대칭적으로 분포되었는지 아닌지에 대한 측도 이를 수치적으로 표현하는 방법을 (역시) 피어슨이 제안 (xi – xbar)^3: 평균보다 작으면 음수, 크면 양수 3승을 하기에 평균(직선) 부근에 큰 영향이 없으며, 좌/우로 멀어질수록 큰 영향이 생긴다. 평균에서 멀어질수록 큰 음수나 양수가 된다. 즉, 대칭인 경우 0에 가까운 값이 되며, +인 경우 좌측에 값이 많게 된다. 첨도 (kurtosis)..
2022.05.15 -
모분산, 표본분산
모분산 모분산은 말그대로 모수의 분산 통계 수치이다. 다음과 같이 간단하게 구할 수 있다. 표본분산 표본 즉, sample들의 분산이다. Xbar는 표본의 평균이며, 분모를 보면 -1이 추가되어 있다. 이는 '자유도'를 반영한 것으로 모집단의 통계치와 비교해 한쪽으로 치우치는 것을 막기위해 n에 -1을 한다. 기대값은, 표본평균 정의 적용 다음을 대입 표본분산이 불편추정량이 되도록 정의하려면, 표본평균 편차의 제곱을 n – 1로 나눈 값으로 정의해야 함
2022.05.15 -
통계학 ?
통계학 모집단의 특성을 파악하기 위해 일부의 ‘표본’을 수집하고 이를 정리, 요약, 분석하여 표본의 특성을 파악한다. 이 표본의 특성을 통해 모집단의 특성을 추론하는 것이다. 특정한 요인이 광합성에 미치는 영향을 실험해보고자 한다면, 어떤 종에 대해 실험을 하고자 할 때 세상의 모든 식물들을 표본화 해서 실험할 수는 없음. 대신 그 종의 식물체 중 대표적인 몇몇을 표본으로 삼아서 실험하게 됨 궁극적으로 관심이 있는 것은 모집단이라는 종의 전체 식물체이지만, 이 모든 개체들로 실험하는 것이 불가능하기에 비교적 적은 표본만을 추출하여 그 표본을 대상으로 일차적인 실험과 관찰을 하는 것. 모집단(population): 모집단은 통계적인 연구에 있어서 관심 대상이 되는 모든 개체 집단 표본(sample): 모집..
2022.05.15 -
조건부 확률
조건부 확률 확률의 sample space가 조건으로 줄어듦 동전 두 개를 던질 시 두 동전 모두 앞면일 사건의 확률 1. 표본 공간을 찾음 Ω = {HH, TH, HT, TT} 2. 여기서 둘 다 앞면일 사건의 개수의 portion을 구함 P({HH}) = 1/4 전체 표본 공간에서 HH가 차지하는 '면적'은 (portion은) 1/4 즉, 25% 한 동전이 앞면이 나온 후 두 번째 동전이 앞면일 확률 1. 2회 동전 던지기의 표본 공간에서 한 동전이 앞면이 나오는 표본들 Ω’ = {HH, TH, HT} 표본공간이 줄어듦 둘 다 앞면일 표본은 'HH' 뿐이며, 이것의 확률은 위 줄어든 표본 공간에서는 1/3임 P({HH}) = 1/3 조건부 확률 식 P(B|A) = P(A∩B)/P(A) , P(A) >..
2022.03.29