본문 바로가기
대학원생활(유교과)/대학원-통계학

통계학 2 - 가설검증과 독립표본 T값 구하기 ( SPSS 사용 )

by 끼리이모 2022. 1. 22.

이번 시간에서 가설 검증과 실제로 T값 구하는 방법을 알려드리겠습니다.

 

1) 표집분포란 

  모집단에 사례수 n의 표본을 무작위로 반복 표집 하여 구한 통계치들로 이루어진 이론적인 확률분포

  평균, 표준편차, 비율, 상관계수 등 모든 표본통계량에는 표집 분표가 존재한다.

 

2) 표본분포란

 실제 관찰된 자료에 근거하여 작성된 경험적 분포 <-> 이론적으로 도출(표집 분포)

 원점수로 구성 <-> 표본 통계치로 구성 (표집 분포)

 

3) 표준오차란

 모집단 표준편차를 사례수의 제곱근으로 나눈 값과 같다. 표준오차는 모집단의 표준 편차에 비례한다.

 또 표준오차는 표본의 사례수 n이 증가함에 따라 감소하므로 표본크기가 클수록 표본 평균은 모집단 평균에 근접하다.

 


가장 중요한 가설 검증 이 가설 검증에서 교수님이 강조한 가설 검증은 영가설과 대립가설이였다.

영가설은 통계 수업 내내 나오고 영가설의 기준으로 결괏값이 유의하다 유의하지 않다를 판단하는 가장 중요하다.

 

유의 확률이 0.05보다 같거나 작으면 영가설을 기각한다.

위에 표에 적은 말만 기억하면 됩니다.  대부분의 논문에 유의 값을 볼 때 기준이 0.05로써 0.05보다 작거나 같으면 

어떠한 것은 영향이 있다는 이야기입니다.  영가설이 기각되면 대립 가설이 됩니다.

 

영가설은  ≤=≥와 같은 부호를 포함하다.

대립 가설은 >,≠, <와 같은 등호를 포함하지 않는다. 

 

 

가설 검증의 기초개념 

(1) 표집 분포 : 가설 검증에 영가설 기가 여부를 결정하기 위해 사용하는 이론적 확률 분포 (Z분포, t분포, F분포, X² 분포)

(2) 검증 통계량 : 가설 검증에서 영가설 기각 여부를 결정하기 위한 통례량(Z, t, X², F 등) - 추리 통계의 핵심

(3) 기각역 :  영사설을 기각할 수 있는 표절 분포 영역을 가리킨다. (유의 수준 (α) 혹은 임계치에 따라 결정)

(4) 비기 각역 :  영가설을 기각할 수 없는 표집 분포의 영역을 말한다.

(5) 임계치 : 표집 분포에 기각 역과 비기 각역을 구분하는 검증 통계량의 값을 뜻한다. 기각 값이라고 한다.

               (검증 형태, 표집 분포의 종류(Z분포, t분포, F분포, X² 분포), 유의 수준(α) , 자유도에 따라 결과)

(6) 유의 수준 :  영가설이 참일 때 영가설을 기각 확률, 즉 제1종 오류를 범할 확률로 흔히α라고 한다.

(7) p(유의 확률) : 표집 분포에서 표본에서 구한 검증 통계량의 값과 같거나 더 극단적인 값을 얻을 확률 

                    양방 검증:p는 표본에서 구한 것보다 절댓값이 같거나 더 큰 검증 통계량의 값을 표 지분 폰에 얻을 확률

                    좌측 검증:p는 표본에서 구한 것보다 더 작은 검증통계량의 값을 관찰할 확률

                    우측 검증:p는 표본에서 구한 것보다 더 큰은 검증 통계량의 값을 관찰할 확률

 

 

p 해석
p<.01 통계적으로 매우 유의하다
영가설을 부정하는 강력한 증거로 간주된다.
.01<p<.05 통계적으로 유의하다
영가설을 부정하는 적절한 증거로 간주된다.
p>.05 통계적으로 유의하지 않다.
영가설을 기각 할 수있는 증거로 불충분하다.

독립 표본 T검정(양방 검증) 예시 1

 

 

자료를 입력합니다. 변수에 교수학습 방법 2가지 (1 = 토론식 , 2 = 강의식)과 성적 입력합니다. 

아래의 변수 보기 클릭합니다.

*이름 :  1셀 강의방법 (집단 변수)  / 2셀 성적 (검정 변수) 

*레이블 값 : 설명 아무거나 적어도 됩니다. (내가 알기 위해서 보조 설명 기능)

*값 :  기준값 : 1 , 레이블 : 토론 -> 추가 / 기준값 : 2 레이블 : 강의 -> 추가 입력 후 확인 

 

 

분석- 평균 비교 - 독립 표본 T검정 클릭 

강의방법  :  집단 변수 /  성적 :  검정 변수

집단 변수에 강의방법 클릭 후 집단 정의 클릭  후  데이터에 일력 한 기준 값을  1 :  토론  /  2 :  강의식 넣어줍니다.

붙어 넣기를 클릭하면 명령문이 나옵니다. 

( 명령문은 켜 둔 상태로 작업을 할 경우 아래에 계속 추가 추가됩니다. )

전체 선택 후 초록색 세모 아이콘 클릭 


T-TEST GROUPS=강의방법(1 2)
  /MISSING=ANALYSIS
  /VARIABLES=성적
  /ES DISPLAY(TRUE)
  /CRITERIA=CI(. 95).

 

그러면 SPSS로 분석한 결과가 다음과 같이 나옵니다.

 

분석 결과표 중에 독릭표본 검정을 보고 가설검정을 합니다.

 

위에 결과표를 보면서 해석을 하면 

1. 통계적 가설 진술 

두 집단의 평균은 같아 /  두집읜 평균은 다르다

2. SPSS 통계 입력 후 결과 확인

3. 영가설기각 여부 결정 : 검증 통계량의 값 t=+4.632으로 임계치(+2.101)더 크므로 영가설에 기각한다.(t분포표 참고)

                                  검증통계량의 유의 확률 .000으로 p: .05보다 작기 때문에 영가설에 기각한다. 

4. 결론 도출 : 토론식 수업 집단과 강의식 수업 진담의 동기는 통계적으로 의한 차이가 있다. 

다음장에서는 두 종속 표본을 이용한 종속 표본 T검증에 대해서 알아보겠습니다.