모집단에서 추출한 표본집단의 표본평균과 분산은 다음을 따른다
모집단(N) | 표본집단(n) | |
평균 | ![]() |
![]() |
분산 | ![]() |
![]() |
이때 표본의 수가 충분히 크다면 중심극한정리에 의해 표본평균의 분포가 정규분포와 가까워진다고 가정할 수 있다.

추정
표본으로부터 통계량의 값을 구하여 그 값을 근거로 모집단의 모수값을 추론하는 것
신뢰구간
- 추정량의 분포를 기반으로 모수값이 포함되리라 예상되는 구간
- (L, U)의 형식
신뢰구간
P(L<모평균(mu)<U) = 100 x (1-alpha)%
95% 신뢰구간
P(L<모평균(mu)<U) = 100 x (1-0.05)% = 95% = 0.95
Z검정
표본평균을 바탕으로 모평균이 가설에 부합하는지 검정하는 방법
모집단의 평균이 특정한값(모평균)과 다르다고 가정하는 상황에서 표본평균을 이용하여 그 가설을 검증하는 방법
모집단 분산/표준편차를 아는경우
- 표본평균의 표본분포는 정규분포를 따른다고 가정
- Z검정 사용

모집단 표준편차를 모르는데, 표본의 크기가 30<n일 때
- 표본의 크기가 크다면 모집단이 정규분포를 따른다고 가정
- 모집단 표준편차 대신 표본의 표준편차를 사용
- Z검정 사용

모집단 표준편차를 모르는데 표본의 크기가 n <30일 때
- 표본의 크기가 작을 떄는 표본집단이 t분포를 따른다고 가정
- Z검정 대신 t검정 실시

<사용법>
t.test(x, alternative, mu, conf.level) ## x - 표본데이터
## alternative - 단측 검정의 경우 "greater" 또는 "less" / 양측검정의 경우 "two.sided"
## mu - 모집단의 평균
## conf.level - 유의수준
ex)t.test(data, alternative = "greater", mu = 100, conf.level = 0.95)
'R 통계' 카테고리의 다른 글
[R] 독립된 세 집단 이상의 모평균 비교 (1) | 2024.10.19 |
---|---|
[R] 독립된 두 집단의 모평균 비교 (0) | 2024.10.19 |
[R] 기본함수 - aggregate() (0) | 2024.10.15 |
[R] dataframe과 열의 차이 (1) | 2024.10.15 |
[R] 데이터 전처리 -결측치 제거 (0) | 2024.10.15 |