1. 가설설정과 검증 (귀무가설, 대립가설, p-value, 정규분포표)

 
 

가설설정

 

 

 

추론통계의 의의

  • 통계 조사에서 조사대상이 되는 전체 집단을 모집단이라고 한다.
  • 모집단에서 뽑은 일부 자료를 표본이라고 한다.
  • 이 표본으로부터 모수와 관련된 통계량들의 값을 계산하고 이를 이용하여 모집단의 특성을 알아내는 과정을 '추론통계분석' 이라고 한다.
  • 추론 통계는 분석의 결과가 통계적으로 유의미한 지를 검증하는 역할을 한다.

 

 


 

가설 설정의 유형

  • 추론 통계에서는 귀무가설과 대립가설을 세운다.
  • 그리고 귀무가설이 기각됨을 통하여 본래 알고자하는 대립가설이 통계적으로 유의미한 것인지를 확인한다.
  • 귀무가설(영가설) : 알아보고자 하는 내용의 '반대'되는 내용의 가설이다.
  • 귀무가설이 기각하면 자연스레 알아보고자 하는 내용이 유의미해진다.
  • 대립가설(연구가설) : 알아보고자 하는 내용의 가설이다.
  • ex) 미세먼지가 중국의 영향이 있는지 연구하고 싶다.
  • 귀무가설 : 미세먼지는 중국의 영향이 없다. -> 이를 기각하면 대립가설이 통계적으로 유의미해진다.

 

 


 

귀무가설의 기각 수준

  • 보통 신뢰도 95% 수준으로 본다. 따라서 귀무가설이 채택될 가능성이 평균을 중심으로 95% 구간에 있으면 귀무가설이 채택된다.
  • 반대로 귀무가설이 채택될 가능성이 왼쪽 0.25%, 오른쪽 0.25% 구간에 속하게 되면 귀무가설은 기각되고 대립가설이 채택된다.

 

 


 

p-value

  • 이 때 사용된 기준을 유의수준이라고하고 이 경우에는 5% 즉, 0.05가 귀무가설이 기각되고 대립가설이 채택될 수 있는 기준이된다.
  • p-value가 0.05보다 크면 귀무가설을 채택하고, 0.05보다 작으면 귀무가설을 기각한다.

 

 


 

정규분포

  • 가설의 검증은 정규분포를 기반으로 한다.
  • 정규분포는 평균과 표준편차에 의해서 그래프의 모양과 위치가 결정된다.
  • 평균과 표준편차를 0과 1로 둔 것을 표준정규분포라고 한다.
  • 표준정규분포는 각기 다른 집합을 한눈에 알아보기 쉽다 ex) 토익성적과 탭스 성적 비교
In [1]:
 
 
 
 
 
x <- seq(-5,5, length = 1000)
y <- dnorm(x, mean=0 , sd = 1)
plot(x,y, type ="l", lwd = 1 )
den.norm <- function(x)dnorm(x, mean =0, sd = 2)
curve(den.norm , col = "purple", add = TRUE, lty = 2)
den.norm <- function(x)dnorm(x, mean  = 0, sd = 3)
curve(den.norm, col = "orange", add = TRUE, lty= 2)
 
 
 

댓글

Designed by JB FACTORY