카이제곱검정 예제

테스트 통계값을 자유도 =(r-1) (c-1)와 (chi_{alpha}2)의 임계값과 비교하고(chi^2 chi_{alpha}^2)인 경우 null 가설을 거부합니다. 이 예에서는 공립학교에서 성교육을 가르치는 근본주의와 견해 사이에 연관성이 있다. 근본주의자의 17.2%가 성교육 교육에 반대하고 있지만, 진보주의자의 6.5%만이 반대하고 있다. p-값은 이러한 변수가 서로 독립적이지 않으며 범주형 변수 간에 통계적으로 유의한 관계가 있음을 나타냅니다. 이러한 가정이 유지되는 경우, 우리의 θ2 테스트 통계는 θ2 분포를 따릅니다. 그것은 우리에게 θ2 = 23.57을 찾는 확률을 알려주는이 분포입니다. 두 범주형 변수의 독립성 테스트 방법을 기억하십니까? 이 테스트는 독립성의 카이 스퀘어 테스트를 사용하여 수행됩니다. 카이 스퀘어 테스트는 당신에게 p 값을 줄 것이다. p-값은 테스트 결과가 중요한지 아닌지를 알려줍니다. 카이 스퀘어 테스트를 수행하고 p-값을 얻으려면 두 가지 정보가 필요합니다: 카이 스퀘어 가설 테스트가 있는 경우 적합합니다: 카이 스퀘어 독립 테스트의 null 가설은 두 개의 범주형 변수가 일부에서 독립적이라는 것입니다. 인구. 이제 결혼 여부와 교육은 우리의 샘플에서 독립적이지 않습니다. 그러나, 우리는 이것이 우리의 전체 인구를 위해 보유한다는 것을 단정할 수 없습니다.

기본적인 문제는 샘플이 일반적으로 인구와 다르다는 것입니다. 결혼 여부와 교육이 우리 인구에서 완벽하게 독립적이라면, 우리는 여전히 단지 우연히 우리의 샘플에서 어떤 관계를 볼 수 있습니다. 그러나 큰 샘플에서 강한 관계는 매우 드물기 때문에 null 가설을 반박합니다. 이 경우 변수가 결국 인구에서 독립적이지 않다는 결론을 내릴 것입니다. 그래서 정확히 얼마나 강한이 의존 -또는 연결 – 우리의 샘플에서? 그리고 변수가 전체 인구에서 (완벽하게) 독립적 인 경우 그것을 찾는 확률 -또는 중요성 수준은 무엇입니까? 관찰 및 예상 주파수가 다른 한, 우리의 데이터는 독립에서 더 많이 벗어난다. 그래서 그들은 얼마나 다른가? 먼저, 각 관찰된 주파수에서 각 예상 주파수를 빼서 잔류가 발생합니다. 즉, $$rij = oij – eij$$ 우리의 예를 들어, 이것은 (5 * 4 =) 20 잔차의 결과. 더 큰(절대) 잔차는 데이터와 null 가설 사이의 더 큰 회속성을 나타냅니다.

기본적으로 모든 잔차와 단일 숫자를 합산합니다: θ2(“chi-square”을 발음) 테스트 통계. 안녕하세요, 저는이 기사가 매우 유용하다고 생각합니다. 나는 테이블이 2 × 7이고, 몇 셀이 5 미만의 주파수를 포함하는 경우 한 가지를 명확히할 필요가, 우리는이 테스트를 사용할 수 있습니까? 이전 예제가 실제로 매번 두 개의 무작위 표본인 4단계: 실행할 변수를 선택한다고 가정해 보십시오(즉, chi 사각형 테스트를 사용하여 비교할 두 변수 선택).

カテゴリー: 未分類   パーマリンク

コメントは受け付けていません。