İstatistik derslerini tablet üzerinden çalışmanız şiddetle tavsiye olunur.

Ki-Kare Testi

Bu bölümde istatistikte Ki-Kare dağılımına ve Ki-Kare testinin kullanımına değinilecektir.

Ki-Kare Dağılımı
Ki-Kare Testi
Ki-Kare Uygunluk Testi
Ki-Kare Bağımsızlık Testi
Ki-Kare Homojenlik Testi
SPSS'te Ki-Kare Testi

Yunan alfabesinde χ ile gösterilen ki harfi istatistikte sadece χ2 (Ki-Kare) dağılımında kullanılan özel bir semboldür. Yunan alfabesindeki büyük Χ (ki) harfinin küçük yazımıdır. Yabancı kaynaklarda adı sıklıkla chi (çi) olarak okunsa da dilimize doğru bir telaffuzla geçmiştir. ki olarak okunmaktadır.


Ki-Kare Dağılımı

Normal dağıldığı varsayılan bir anakütleden 30'un altında birimden oluşan örnekleme oluşturmak istersek 3 farklı dağılım kullanabiliriz:

Ki-Kare bu dağılımlar içerisinde örneklem verilerinin anakütle parametreleri ile farklılığın olup olmadığı durumlarda kullanılmaktadır.

\[ \chi^2 = { {N_S}^2 \over \sigma^2 } = { { {(X_1 - \bar X)}^2 + {(X_2 - \bar X)}^2 + ... + {(X_n - \bar X)}^2 } \over { \sigma^2 } } \]

Formülden de görüleceği üzere anakütle standart sapması Ki-Kare dağılımında kritik bir rol oynamaktadır.

\[ f(x) = { 1 \over { 2^{n} \Gamma(n) } }^{ x^{n-1} e^{-x/2} } , n > 0 \]

olasılık yoğunluk fonksiyonudur. n burada r/2'yi belirtmektedir. r aynı zamanda rank'in (derecenin) kısaltması olan serbestlik derecesidir. Yunan alfabesinde Γ (büyük gamma) harfinin sembolüdür.

x ≈ Γ(n,β) dağılımında n = r/2 ve β = 2 alınırsa Gamma dağılımı, r serbestlik dereceli Ki-Kare dağılımına dönüşür.

ki-kare dağılımı

Ki-Kare dağılımı aslında bir Gamma dağılımıdır. 4 serbestlik derecesinde görseldekine benzer bir grafik oluşacaktır.

ki-kare dağılımı

Serbestlik derecesi arttıkça χ2 dağılımının grafiği görseldeki gibi değişecektir.


Ki-Kare Testi

Normal dağılım sergileyen bir anakütleyi analiz ederken parametrik testlerden faydalanırız. Fakat örneklem hacmi azaldıkça (30'un altına düştükçe) seçtiğimiz örneklem normal dağılım sergilemeyebilir. Bu gibi durumlarda parametrik olmayan (nonparametrik)1 testler kullanabiliriz. Nonparametik testlerin avantajı anakütle hakkında hiçbir şey bilinmediği durumlarda kullanılabilmesidir. Ki-Kare testi de nonparametrik bir testtir.

Ki-Kare testinin üç farklı kullanımı vardır:

Tüm testlerde aşağıdaki formülü kullanacağız.

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \]

Oi: Gözlenen Değerler (Observed Values)
Ei: Beklenen Değerler (Expected Values)
k: Serbestlik Derecesi

ki-kare tablosu

Ki-Kare testlerinde ki-kare değerini (kritik değeri) bulmak için Ki-Kare tablosunu kullanacağız. Sütunlarda α anlamlılık düzeyleri yer alırken satır başlıklarında serbestlik dereceleri yer almaktadır.

Ki-Kare Tablosu (PDF)

Ki-Kare tablosunu PDF formatında indirmek için yukarıdaki bağlantıyı kullanabilirsiniz. Biçim değişikliği yapmak isterseniz Ki-Kare Tablosu (Excel) çalışma kitabını indirebilirsiniz.


ki-kare kabul ve ret bölgeleri

Hesaplanan Ki-Kare değeri kritik değerin altında ise kabul bölgesinde olacaktır. H0 hipotezini kabul edip H1 hipotezini reddedeceğiz. Tersi durumda H0 hipotezi reddedilecektir.

Kabul bölgesi daha önceki hipotez testlerinde olduğu gibi H0 hipotezinin kabul edileceği bölgedir. Benzer şekilde ret bölgesi H0 hipotezinin reddedileceği bölge olacaktır.


Ki-Kare Uygunluk Testi

Örneklem istatistiklerinin anakütle parametreleri olan ortalama (μ), standart sapma (σ) gibi değerler ile uyumlu olup olmadığını test etmek için kullanılır.

Örnek 1: Yetişkin bir insanın haftalık uyku süreleri aşağıdaki şekilde ölçülmüştür:

Gün
Uyku Süresi (Saat)
1. Gün
8.4
2. Gün
7.8
3. Gün
8.2
4. Gün
6.3
5. Gün
7.7
6. Gün
10.4
7. Gün
9.5
Toplam (Σ)
58.3

Uyku sürelerinin günlere göre farklılık gösterip göstermediğine %5 anlamlılık düzeyinde karar veriniz.


İlk olarak hipotezimizi oluşturalım:

H0: Uyku süresi günlere göre farklılık göstermemektedir.
H1: Uyku süresi günlere göre farklılık göstermektedir.

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \]

Formülümüz yukarıdaki gibidir. Tablomuzu formüle göre oluşturalım:

Gün
Oi
Ei
(Oi - Ei)2
1. Gün
8.4
8.33
0.0049
2. Gün
7.8
8.33
0.2809
3. Gün
8.2
8.33
0.0169
4. Gün
6.3
8.33
4.1209
5. Gün
7.7
8.33
0.3969
6. Gün
10.4
8.33
4.2849
7. Gün
9.5
8.33
1.3689
Toplam (Σ)
58.3
10.4743

Oi: Gözlenen Değerler (Observed Values)
Ei: Beklenen Değerler (Expected Values)
k: Serbestlik Derecesi

olduğunu tekrar hatırlayalım. Ei beklenen değerini gözlenen değerlerin ortalaması (58.3/7 gün = 8.33) ile bulduk.

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \] \[ {\chi}^2 = { 10.4743 \over 8.33 } \] \[ {\chi}^2 = 1.2574 \]

Hesaplanan χ2 değerini 1.2574 bulduk.

ki-kare testi örneği

k serbestlik değeri 7 gün - 1'den 6'dır. Tabloda %5 güven düzeyinde 6 serbestlik derecesine denk gelen Ki-Kare değeri 12.59'dur.

ki-kare testi örneği

χHesaplanan < χ0.05;6 = 1.2574 < 12.59 olduğu için H0 hipotezi kabul edilir. Uyku süreleri %95 güven düzeyinde günlere göre farklılık göstermemektedir.


Örnek 2: Bir banka şubesine hafta içi gelen müşteri sayıları aşağıdaki gibidir:

Gün
Müşteri Sayısı
1. Gün
124
2. Gün
112
3. Gün
118
4. Gün
148
5. Gün
134
Toplam (Σ)
636

Gelen müşteri sayılarının günlere göre farklılık gösterip göstermediğine %5 anlamlılık düzeyinde karar veriniz.


Hipotezimizi oluşturalım:

H0: Müşteri sayısı günlere göre farklılık göstermemektedir.
H1: Müşteri sayısı günlere göre farklılık göstermektedir.

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \]

Aynı formülü kullanacağız. Tablomuzu bu formüle göre oluşturalım:

Gün
Oi
Ei
(Oi - Ei)2
1. Gün
124
127.2
10.24
2. Gün
112
127.2
231.04
3. Gün
118
127.2
84.64
4. Gün
148
127.2
432.64
5. Gün
134
127.2
46.24
Toplam (Σ)
636
804.80
\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \] \[ {\chi}^2 = { 804.80 \over 127.2 } \] \[ {\chi}^2 = 6.3270 \]

Hesaplanan Ki-Kare değerini 6.3270 bulduk.

ki-kare testi örneği

Örnekte 5 gün kullanılmıştır. Serbestlik derecesi k = 5 gün - 1'den 4'tür. Tablomuzda %5 anlamlılık düzeyinde serbestlik derecesi 4'e karşılık gelen Ki-Kare değeri 9.49'dur.

ki-kare testi örneği

Hesaplanan Ki-Kare değeri 6.3270, kritik değer olan 9.49'dan küçük olduğu için H0 hipotezi kabul edilir. Müşteri sayısı günlere göre farklılık göstermemektedir.


Ki-Kare Bağımsızlık Testi

İki veya daha fazla değişken grubu arasında ilişki bulunup bulunmadığını sınayan Ki-Kare testidir. Akademik tezlerde en çok bu test kullanılmaktadır.

Beklenen değerler grup ortalamasına göre bulunmaktadır. Serbestlik derecesi k ise farklı bir metodla hesaplanır. 2'ye 2 değişken kullanıldıysa serbestlik derecesi (2-1)(2-1) = 1'dir.

4'e 3 değişken kullanıldıysa serbestlik derecesi (4-1)(3-1) = 6'dır. Birazdan değineceğiz.


Örnek 3: Elektronik sigara kullanımı için 100 birey seçilmiş ve cinsiyetlerine göre aşağıdaki tabloda ayrılmıştır:

ki-kare testi örneği

Cinsiyete göre elektronik sigara kullanımında fark olup olmadığını %5 anlamlılık düzeyinde test ediniz.


Tabloya dikkat edilirse kadınlar erkeklere göre çok daha az elektronik sigara tüketmektedir. Bunu istatistiksel olarak kanıtlayacağız.

Hipotezimizi oluşturalım:

H0: Elektronik sigara kullanımı cinsiyete göre farkılılık göstermemektedir.
H1: Elektronik sigara kullanımı cinsiyete göre farkılılık göstermektedir.

Toplam değerlerini tablomuza ekleyelim:

ki-kare testi örneği

Beklenen Değer (Kadın-Evet) = 50*53/100 = 26.50
Beklenen Değer (Kadın-Hayır) = 50*47/100 = 23.50
Beklenen Değer (Erkek-Evet) = 50*53/100 = 26.50
Beklenen Değer (Erkek-Hayır) = 50*47/100 = 23.50

Bu değerleri hesaplarken her değişkene ait toplam değerlerini kullanıyoruz. Örneğin; Beklenen Değer (Kadın-Evet)'de kadınların toplamı 50 ile evet diyenlerin toplamı 53'ü çarpıyoruz ve örneklem hacmine bölüyoruz.

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \] \[ {\chi}^2 = { { (14 - 26.50)^2 } \over 26.50 } + { { (36 - 23.50)^2 } \over 23.50 } + { { (39 - 26.50)^2 } \over 26.50 } + { { (11 - 23.50)^2 } \over 23.50 } \] \[ {\chi}^2 = 5.8962 + 6.6489 + 5.8962 + 6.6489 \] \[ {\chi}^2 = 25.09 \]

Hesaplanan Ki-Kare değerini 25.09 bulduk.

ki-kare testi örneği

Kadın ve erkek olmak üzere 2 farklı değişken vardır. Aynı zamanda evet ve hayır olmak üzere 2 farklı yanıt verilmiştir. Serbestlik derecesi k'yı (2-1)(2-1) çarpımı ile 1 buluruz. Tablomuzda %5 anlamlılık düzeyine ve 1 serbestlik derecesine karşılık gelen kritik değer 3.84'tür.

ki-kare testi örneği

Hesaplanan Ki-Kare değeri 25.09, kritik değer olan 3.84'ün çok ilerisinde olduğu için grafiğe bile sığmamıştır. 25.09'un ret bölgesinde olmasından dolayı H0 hipotezi reddedilir ve H1 hipotezi kabul edilir. Elektronik sigara kullanımında kadın ve erkekler arasında ciddi bir fark vardır.


Örnek 4: 310 bireyin süt, peynir ve yoğurt ürünleri üreten dört farklı markayı tercih etme istatistikleri tablodaki gibidir:

ki-kare testi örneği

Ürün seçiminde markalara göre farklılık olup olmadığını %5 anlamlılık düzeyinde test ediniz.


Dikkat edilirse peynirde B, yoğurtta C markası baskın gelmiştir. İstatistiksel olarak bunu test edeceğiz.

Hipotezimizi kuralım:

H0: Ürün seçiminde markalara göre farklılık bulunmamaktadır.
H1: Ürün seçiminde markalara göre farklılık bulunmaktadır.

Toplam değerlerini tablomuza ekleyelim:

ki-kare testi örneği

Beklenen Değer (Süt-A Markası) = 102*60/310 = 19.74
Beklenen Değer (Süt-B Markası) = 102*105/310 = 35.55
Beklenen Değer (Süt-C Markası) = 102*97/310 = 31.92
Beklenen Değer (Süt-D Markası) = 102*48/310 = 15.79

Beklenen Değer (Peynir-A Markası) = 103*60/310 = 19.94
Beklenen Değer (Peynir-B Markası) = 103*105/310 = 34.89
Beklenen Değer (Peynir-C Markası) = 103*97/310 = 32.23
Beklenen Değer (Peynir-D Markası) = 103*48/310 = 15.95

Beklenen Değer (Yoğurt-A Markası) = 105*60/310 = 20.32
Beklenen Değer (Yoğurt-B Markası) = 105*105/310 = 35.56
Beklenen Değer (Yoğurt-C Markası) = 105*97/310 = 32.85
Beklenen Değer (Yoğurt-D Markası) = 105*48/310 = 16.26

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \] \[ {\chi}^2 = { { (26 - 19.74)^2 } \over 19.74 } + { { (24 - 35.55)^2 } \over 35.55 } + ... + { { (48 - 32.85)^2 } \over 32.85 } + { { (9 - 16.26)^2 } \over 16.26 } \] \[ {\chi}^2 = 1.9852 + 3.7525 + ... + 5.8962 + 6.6489 \] \[ {\chi}^2 = 40.55 \]

Hesaplanan Ki-Kare değerini 40.55 bulduk.

ki-kare testi örneği

Süt, peynir ve yoğurt olmak üzere 3 ürün vardır. A, B, C, D olmak üzere 4 marka vardır. Serbestlik derecesi (3-1)(4-1) çarpımıyla 6 bulunur. Tablomuzda %5 anlamlılık düzeyi ve serbestlik derecesi 6'nın kesiştiği hücre 12.59'dur.

ki-kare testi örneği

Hesaplanan Ki-Kare değeri olan 40.55, kritik değer olan 12.59 değerinin çok ötesinde olduğu için H0 hipotezi reddedilir ve H1 hipotezi kabul edilir. Ürün seçiminde markalara göre farklılık bulunmaktadır.


Ki-Kare Homojenlik Testi

Birbirinden bağımsız seçilen iki veya daha fazla örneklemin aynı anakütleden seçilip seçilmediğini test etmek için kullanılır.


Örnek 5: 593 hasta üzerinde 296'sı I. Grup'ta, 297'si II. Grup'ta olmak üzere 4 farklı ilaç test edilmiş, ilaçların etki düzeyleri kayıt altına alınmıştır.

ki-kare testi örneği

İlaç etki düzeylerinin iki grup arasında farklı olup olmadığını %5 anlamlılık düzeyinde test ediniz.


Öncelikle hipotezimizi kuralım:

H0: İlaç etki düzeyleri iki grup arasında farklı değildir.
H1: İlaç etki düzeyleri iki grup arasında farklıdır.

Tablomuza toplamları ekleyelim:

ki-kare testi örneği

Beklenen Değer (A ilacı-I. Grup) = 149*296/593 = 74.37
Beklenen Değer (A ilacı-II. Grup) = 149*297/593 = 74.63

Beklenen Değer (B ilacı-I. Grup) = 143*296/593 = 71.38
Beklenen Değer (B ilacı-II. Grup) = 143*297/593 = 71.62

Beklenen Değer (C ilacı-I. Grup) = 170*296/593 = 84.86
Beklenen Değer (C ilacı-II. Grup) = 170*297/593 = 85.14

Beklenen Değer (D ilacı-I. Grup) = 131*296/593 = 65.39
Beklenen Değer (D ilacı-II. Grup) = 131*297/593 = 65.61

\[ {\chi}^2 = \displaystyle \sum_{i=1}^n { { (O_i - E_i)^2 } \over { E_i } } \] \[ {\chi}^2 = { { (74 - 74.37)^2 } \over 74.37 } + { { (75 - 74.63)^2 } \over 74.63 } + ... + { { (66 - 65.39)^2 } \over 65.39 } + { { (65 - 65.61)^2 } \over 65.61 } \] \[ {\chi}^2 = 0.0018 + 0.0018 + ... + 0.0057 + 0.0057 \] \[ {\chi}^2 = 0.0432 \]

Hesaplanan Ki-Kare değerini 0.0432 bulduk.

ki-kare testi örneği

4 farklı ilaç ve 2 farklı grup vardır. Serbestlik derecesi (4-1)(2-1)'in çarpımıyla 3 bulunur. Ki-Kare tablosunda serbestlik derecesi 3'ün %5 anlamlılık düzeyindeki değeri 7.81'dir.

ki-kare testi örneği

Hesaplanan 0.0432 Ki-Kare değeri kritik değer olan 7.81'in altında olduğu için H0 hipotezi kabul edilir. İlaç etki düzeyleri iki grup arasında farklı değildir.



SPSS'te Ki-Kare Testi

SPSS'te Ki-Kare testi hesaplaması oldukça kolaydır.2 Bilmemiz gereken en önemli nokta significance value anlamlılık değeridir.

Örnek 1'deki verileri kullanalım:

Gün
Uyku Süresi (Saat)
1. Gün
8.4
2. Gün
7.8
3. Gün
8.2
4. Gün
6.3
5. Gün
7.7
6. Gün
10.4
7. Gün
9.5

Uyku sürelerinin günlere göre farklılık gösterip göstermediğine %5 anlamlılık düzeyinde karar veriniz.


Hipotezimizi kuralım:

H0: Uyku süresi günlere göre farklılık göstermemektedir.
H1: Uyku süresi günlere göre farklılık göstermektedir.

spss'te ki-kare testi örneği

Verilerimizi SPSS'te yazalım. Dikkat ederseniz gün ve süre değişkenlerinin sütun başlık simgeleri birbirinden farklı.

Ki-Kare Testi (zip)

Dilerseniz bu veri setinin SPSS dosyasını yukarıdaki bağlantıdan indirebilirsiniz.


spss'te ki-kare testi örneği

Öncelikle sayfanın altındaki Variable View sekmesine tıklıyoruz. gün değişkeni bu örnekte sayısal (nümerik) bir değişken değildir. Metinsel (nominal) bir değişkendir. Bu yüzden measure'ını (ölçüsünü) Nominal seçmeliyiz. süre değişkeni ise sayısal bir değişkendir. Bu nedenle ölçüsü Scale kalmalıdır.


spss'te ki-kare testi örneği

İkinci olarak gün değişkeni için Values menüsüne tıklıyoruz ve her bir günü değer olarak atıyoruz.


spss'te ki-kare testi örneği

Menüden Data > Weight Cases... yolunu izliyoruz.


spss'te ki-kare testi örneği

Süreyi ağırlıklandırıyoruz. Bunu yapmadığımız takdirde sonuçlarımız hatalı olacaktır.


spss'te ki-kare testi örneği

Her şey hazır. Artık analize geçelim. Menüden Analyze > Nonparametric Tests > Legacy Dialogs > Chi-square... yolunu izliyoruz.


spss'te ki-kare testi örneği

gün değişkenini Test Variable List alanına aktarıyoruz ve OK'a tıklıyoruz.


spss'te ki-kare testi örneği

Output (çıktı) penceresi açılacaktır. Asymp. Sig. (Asymptotic Significance) değeri 0.967 bulunmuştur. Tekrar hatırlayalım:

Asymp. Sig. değeri olan 0.967, 0.05'ten büyük olduğu için H0 hipotezi kabul edilir. Uyku süresi günlere göre farklılık göstermemektedir.


1 Non İngilizce'de nan okunur. nonparametric
2 IBM SPSS Statistics | version 27.0.1.0
<<< Önceki Konu
Sonraki Konu >>>