추정 ( 개념, 점 추정과 구간 추정과 신뢰구간, 허용 오차와 표본 크기 ) 본문
************************************************************************************************************
INDEX
< 추정 >
** 관련 용어와 개념
** 점 추정
** 구간 추정 , 신뢰구간
** 표본의 크기 결정
************************************************************************************************************
< 추정 >
* 추정 , estimation : 모집단의 모수를 모를 경우 표본으로 추출된 통계량을 모집단의 근사값으로 사용하는 것
* 추정량 , estimator : 표본 평균으로 모평균을 추정할 때 표본 평균을 모평균에 대한 추정량이라고 함
** 추정 방법의 종류
** 점 추정( point estimation )
> 모수를 하나의 특정값으로 추정하는 방법
* 점 추정의 대표적인 성질
> 일치성(Consistency) : 표본의 크기가 모집단의 크기에 근접해야 함
표본이 크기가 크면 클수록(모집단에 가까울수록) 추정량의 오차가 작아진다
> 추정량과 불편추정량이 같지 않다면 편의(biased)가 있다고 한다
** 구간 추정 ( interval estimation )
> 모수가 포함될 수 있는 구간을 추정하는 방법
* 신뢰 구간 ( confidence level ) : 추정한 신뢰구간 안에 모수가 포함될 확률
> 신뢰 수준은 100 *(1-a알파)%로 계산하며, 알파는 오차 수준이다
> 신뢰 수준이 95%라는 것은 구간 추정된 값의 오차가 발생할 확률이 5%라는 것을 의미함
> 이러한 오차를 유의 수준 ( significant level ) 이라고 하며, p =0.05라고 한다.
* 신뢰 구간의 표현 : 신뢰 하한 ~ 신뢰 상한으로 표현한다
신뢰수준 95% 이면 유의 수준 p 는 0.05 이며, 이때
단측이 아닌 양측 검정일 경우, 구간 표현에서는 표본평균+-( 알파/2 )*표본표준편차/n 를 사용한다.
* 모평균의 구간 추정 ( 식과 파라미터들의 의미를 풀이하면서 이해하면 잘 이해된다 )
> 모집단의 분산을 아는 경우 ( 왼쪽 )
다음 처럼 신뢰구간과 Z분포에 대한 식을 풀이해서 유도할 수 있다.
> 모집단의 분산을 모르는 경우. ( 모집단을 모르기 때문에 t분포를 사용 -> s )
1. 모집단의 분산을 모르고 n < 30 인 경우 , df는 n-1인 t분포를 사용
2. 모집단의 분산을 모르지만 n > 30 일 경우, 표준정규분포로 유도 ( but 모표준편차 대신 표본표준편차 사용 )
** 표본의 크기 결정
* 허용 오차 , permissible error : 추정한 값이 틀려도 허용할 수 있는 오차
> 정규 분포의 신뢰구간을 통해 허용 오차를 계산
> 표본집단의 통계량으로부터 의도하는 신뢰 구간안에 모평균을 구간 추정하고 싶을 경우, 허용오차와 유의 수준에 따른 적절한 표본 수를 선정할 수 있다는 말이다. 좋은 결과를 얻기 위해서는 필수인 작업, 표본 추출전에 선행되어야 하는 작업일 것이다.
'BF 2024 > 통계' 카테고리의 다른 글
상관관계 (0) | 2022.02.15 |
---|---|
가설검정 (0) | 2022.02.15 |
모집단과 표본 분포 (0) | 2022.02.15 |
확률 분포들 간의 관계 (0) | 2022.02.14 |
연속형 확률분포 (0) | 2022.02.14 |