본문 바로가기

R 통계

[R] 표본과 추론

모집단에서 추출한 표본집단의 표본평균과 분산은 다음을 따른다

  모집단(N) 표본집단(n)
평균
분산

 

 

이때 표본의 수가 충분히 크다면 중심극한정리에 의해 표본평균의 분포가 정규분포와 가까워진다고 가정할 수 있다.


추정

표본으로부터 통계량의 값을 구하여 그 값을 근거로 모집단의 모수값을 추론하는 것

 

신뢰구간

 

  • 추정량의 분포를 기반으로 모수값이 포함되리라 예상되는 구간
  • (L, U)의 형식 
신뢰구간
   P(L<모평균(mu)<U) = 100 x (1-alpha)%
95% 신뢰구간
   P(L<모평균(mu)<U) = 100 x (1-0.05)% = 95% = 0.95

 


Z검정

표본평균을 바탕으로 모평균이 가설에 부합하는지 검정하는 방법

모집단의 평균이 특정한값(모평균)과 다르다고 가정하는 상황에서 표본평균을 이용하여 그 가설을 검증하는 방법

 

모집단 분산/표준편차를 아는경우

  • 표본평균의 표본분포는 정규분포를 따른다고 가정
  • Z검정 사용

모집단 표준편차를 모르는데, 표본의 크기가 30<n일 때

  • 표본의 크기가 크다면 모집단이 정규분포를 따른다고 가정
  • 모집단 표준편차 대신 표본의 표준편차를 사용
  • Z검정 사용

모집단 표준편차를 모르는데 표본의 크기가 n <30일 때

  • 표본의 크기가 작을 떄는 표본집단이 t분포를 따른다고 가정
  • Z검정 대신 t검정 실시

 

<사용법>
t.test(x, alternative, mu, conf.level)       ## x - 표본데이터 
                                             ## alternative - 단측 검정의 경우 "greater" 또는 "less" / 양측검정의 경우 "two.sided"
                                             ## mu - 모집단의 평균
                                             ## conf.level - 유의수준
ex)t.test(data, alternative = "greater", mu = 100, conf.level = 0.95)