İstatistik derslerini tablet üzerinden çalışmanız şiddetle tavsiye olunur.

Örnekleme Teorisi

Bu bölümde örneklem kavramına ve örnekleme teorisine değineceğiz.

Örnekleme Kavramları
Örnekleme Yöntemleri

Artık İleri İstatistik konularına geçmiş bulunmaktayız. İleri istatistikte betimsel istatistikten ziyade çıkarımsal istatistik kullanılır ve anakütlenin parametrelerini tahmin etmeye öncelik verir. Örnekleme teorisi ise tüm ileri istatistik konularının temelidir. Bu nedenle bu bölümü iyi seviyede anlamanız istatistik eğitiminizin geleceği açısından büyük önem arz etmektedir.


Örnekleme Kavramları

Temel Kavramlar bölümünde anakütle ve örneklem kavramlarına değinilmişti. Bölümde de belirtildiği üzere anakütlenin ortalama, standart sapma gibi parametrelerini tahmin etmesi çoğu zaman çok zor ve zahmetlidir. Örneğin; ülkede seçim anketi yapmak istediğimizde ~90 milyon insanın olduğu bir anakütlede yaş gibi kriterleri göz önünde bulundurup seçime katılacak insan sayısını belirlemek ve her biri için anket yapmak neredeyse imkânsızdır. Bu tür bir ölçüm sadece nüfus sayımında geçerli olup sadece demografik bilgileri edinmek temel amaçtır. Sadece betimsel istatistik uygulanır. Çıkarımsal istatistikte ise amaç geleceği tahmin etmektedir.

Seçim anketleri bu nedenle sadece birkaç bin kişi ile yapılır ve tüm ülkenin seçim sonuçları tahmin edilmeye çalışılır. Tüm ülke nüfusundan belirli sayıda kişinin seçilmesi işlemine örnekleme denir. Şimdi çok fazla detaya girmeden bu kavramları sırasıyla öğrenelim:

Veri Birimi (Data Point): Araştırma yapılacak kitlenin her bir elemanına veri birimi denir. Bir ülkede nüfus sayımı yapılacaksa her bir vatandaş veri birimidir. Anakütledeki veri birimi sayısı N, örneklemdeki birim sayısı ise n notasyonu ile gösterilir. Veri birimi kısaca birim olarak adlandırılır.

anakütle ve örneklem

Anakütle (Population): Araştırma yapılacak kitlenin tamamına anakütle denir. Nüfus sayımında anakütle tüm ülke vatandaşlarıdır. Eğer araştırma sadece A üniversitesi ile yapılacaksa A üniversitesindeki tüm öğrenciler anakütledir. Araştırma ülkedeki tüm üniversiteler için yapılacaksa tüm üniversite öğrencileri anakütleyi oluşturur. Anakütle kimi kaynaklarda anakitle, yığın, popülasyon, evren olarak da adlandırılır.

Örneklem (Sample): Anakütleden belirli sayıda veri birimi kümesi seçme işlemine örnekleme (sampling), her bir veri kümesine ise örneklem (sample) denir. Örneğin; bir üniversite 42 farklı bölümden oluşuyor olsun. 42 bölümden sadece 4 bölüm seçilip üniversitedeki tüm bölümlerinin ortalaması, standart sapması gibi parametreleri tahmin edilmek isteniyorsa 4 bölüm seçme işlemine örnekleme, seçilen 4 bölüme de örneklem denir.

Daha önce de belirtildiği gibi örnekleme anakütlenin parametrelerini tahmin etmede büyük bir maliyet ve zaman avantajı sağlar. Örnekleme yanlış uygulandığında sonuçlar da yanıltıcı olacaktır. Örneğin; işletme fakültesinde bir araştırma yapılmak isteniyorsa örneklem seçimi mühendislik fakültesinde yapılmamalıdır.

Parametre ve İstatistik: Anakütlenin ortalama (μ)1, standart sapma (σ)2 gibi ölçülerinin her biri parametre (parameter) olarak adlandırılır. Anakütlenin parametrelerini tahmin etmeye yarayan örneklem ortalaması (x̄)3, standart sapma (s) ise istatistik (statistic) olarak adlandırılır. Bir anakütlenin birden fazla istatistiği (örneklem ortalaması ve standart sapması) olabilir.

Karıştırılmaması gereken bir nokta ise istatistik bilimi İngilizce'de statistics, örneklem istatistiği ise statistic olarak adlandırılmasıdır. Statistics ve statistic birbirinden farklı kavramlardır. Fakat dilimizde istatistik için aynı kelime kullanılmaktadır.


Örnekleme Yöntemleri

İstatistikde örnekleme belirli yöntemler dahilinde yapılır. Bu nedenle örnekleme yapılacak anakütlenin özellikleri iyi bilinmeli ve örnekleme yöntemi buna göre tercih edilmelidir. Yöntemler olasılığa dayalı ve olasılığa dayalı olmayan şeklinde ikiye ayrılmaktadır:

Olasılığa Dayalı Örnekleme Yöntemleri

Olasılığa Dayalı Olmayan Örnekleme Yöntemleri

Olasılığa dayalı örnekleme yöntemleri rassal örnekleme olarak da adlandırılır.


rastgele örnekleme

Rastgele Örnekleme

En çok tercih edilen yöntemlerden biridir. N sayıdaki bir anakütleden rastgele ve bağımsız şekilde n tane veri birimi seçilir.

\[ C(N,n) = { N! \over (N-n)! n!} \]

Kombinasyon formülü yardımıyla seçim NCn kadar yapılabilir. Örneğin; 120 birimden oluşan anakütleden 10 birimlik bir örnekleme yapılacaksa

\[ C(120,10) = { 120! \over (120-10)! 10!} = 116,068,178,638,776 \]

sonucuna ulaşılabilir. Anakütle ve örneklem birim sayısı küçük olmasına rağmen sadece 120 birimden 10 birim seçmek istediğimizde bile yaklaşık 116 trilyon kadar farklı seçim işlemi yapabiliriz.

Rastgele örnekleme araştırmadaki veri birimleri sadece homojen (türdeş) olduğu zaman kullanılır.


tabakalı örnekleme

Tabakalı Örnekleme

Anakütledeki birimler homojen değilse, diğer bir ifade ile heterojen (ayrışık) ise tabakalı örnekleme yöntemi kullanılmalıdır.

Örneğin; 6000 kadın ve 4000 erkek öğrenciden oluşan bir üniversitede kadın ve erkeklerin harcama alışkanlıkları analiz edilmek isteniyorsa rastgele örnekleme yöntemi kullanılmamalıdır. 100 öğrencilik örneklem seçiminde rastgele örnekleme yöntemi kulanılırsa 10 kadın ve 90 erkek seçimi gibi yanlış bir seçim yapılabilir. Bu nedenle tabakalı örnekleme tercih edilmelidir. Örneklem kümesi rastgele seçilen 60 kadın ve 40 erkek öğrenciden oluşmalıdır. Bu örnekleme yöntemine tabakalı örnekleme denir ve anakütle parametrelerinin tahmininde çok daha anlamlı sonuçlar verecektir.


Küme Örneklemesi

Çoğunlukla coğrafi alanlardaki araştırmalarda kullanılır. Örneğin; 2023 yılı verilerine göre İstanbul şehri 39 ilçe ve 964 mahalleden oluşmaktadır. Öncelikle ilçeler baz alınıp 39 farklı küme oluşturulur. Her bir kümeden 2-3 kadar mahalle seçilir ve her bir mahalleden de nüfus yoğunluğuna göre belirli sayıda veri birimi seçilir. Yapılan bu işleme küme örneklemesi denir.

İstatistikte en sık kullanılan yöntemlerden biridir. Genellikle seçim anketlerinde ya da belirli bir coğrafi alandaki parametrelere ulaşmak için kullanılır.


Sistematik Örnekleme

Eğer anakütle birimleri homojense rastgele örneklemeye benzer şekilde sistematik örnekleme kullanılabilir.

Sistematik örneklemede anakütle birimleri doğal sıralanmalıdır. Örneğin; 1000 birimden oluşan bir anakütleden 10 ve katları birimler seçilebilir. Bu tür bir seçimde 1., 11., 21. ... 981. ve 991. birimler seçilecek ve toplamda da 100 birimlik bir örnekleme oluşturulacaktır. Bu yönteme sistematik örnekleme denir.

Diğer bir örnek 200 birimden oluşan bir anakütleden 4 ve katları sayıda birim seçilebilir. Öncelikle anakütle birimleri sıralanır ve 1., 5., 9., 13. ... 193., 197. birimlerden oluşan örnekleme seçilir. Toplamda 50 birimden oluşan örneklem kümesi oluşturulur.


kolay örnekleme

Kolay Örnekleme

Olasılığa dayalı olmayan örnekleme yöntemlerinden ilkidir. İnternet anketleri kolay örneklemeye en iyi örneklerden biridir. Bir web sitesinin ziyaretçi sayıları için bir araştırma yapılmak isteniyorsa bu sitede ileride ne kadar ziyaretçi olacağı belirsizdir. Yani anakütle sayısı aslında bilinmemektedir. Bu nedenle anket yapılır ve kullanıcılardan alınan tüm anketler tamamlandıktan sonra örneklem büyüklüğü oluşur. Maliyetinin düşük olması ve anakütle birim sayısının belirlenemediği durumlarda tercih edilebilecek yöntemlerden biridir.


Güdümlü Örnekleme

Araştırmacı anakütlenin birim sayısını bilmiyorsa fakat anakütlenin belirli özelliklerine sahip birimler üzerinde araştırma yapacaksa güdümlü örnekleme yöntemini kullanabilir. Örneğin; bir dizinin yayınlanmasından sonra beğenilip beğenilmeme istatistiklerini öğrenmek isteyen bir araştırmacı anket sorularını sadece diziyi izleyenler için yapacaktır. Diziyi izlemeyenler araştırmaya dahil edilmeyecektir. Bu şekilde araştırmacı örneklemini kasıtlı olarak belirlediği birimler ile oluşturacaktır. Güdümlü örnekleme yöntemi kasti örnekleme olarak da adlandırılmaktadır.


Kota Örneklemesi

Tabakalı örneklemeye benzer fakat olasılıklı bir seçim işlemi yapılmaz. Öncelikle anakütle anakütle yaş, cinsiyet gibi farklı kotalara ayrılır ve bu kotalardan belirli sayıda birim seçilerek örneklem kümesi oluşturulur.


kartopu örneklemesi

Kartopu Örneklemesi

Birinden "Arkadaşım tezi için bir araştırma yapıyor. Göndereceğim adresteki anketi doldurur musun?" dediğini duymuşsunuzdur. İşte bu tür örnekleme yöntemine kartopu örneklemesi denir. Örneklem birimleri anakütleden rastgele seçilmez. Bir anakütle biriminin çevresindeki insanlar tarafından oluşturulur. Uygulamada kolay ve hızlı olması nedeniyle tercih edilebilecek yöntemlerden biridir. Fakat araştırma bir birim ve çevresi ile sınırlı olacağı için anakütle parametreleri doğru tahmin edilemeyebilir. Örneğin; örneklem için seçilen kişi ve arkadaşlarının gelir durumu yüksekse ve harcama-gelir üzerine bir araştırma yapılıyorsa araştırmanın sonucu pek de anlamlı olmayacaktır.

Sıra Sizde

Uygulama: Bir hastanede kanser hastaları ve kanser hastası olmayanlar üzerinde araştırma yapılmak isteniyor. Hangi örnekleme yönteminin kullanılması en uygundur?

A) Rastgele Örnekleme
B) Kartopu Örneklemesi
C) Tabakalı Örnekleme
D) Güdümlü Örnekleme

Yanıtı Göster

Öncelikle hastanedeki kanser hastalarının sayısı öğrenilmeli, ardından kanser hastaları ve kanser olmayan hasta sayısı oranından örnekleme kümesi oluşturulmalıdır. Bu nedenle tabakalı örnekleme yöntemi kullanılmalıdır. Yanıt C'dir.


Uygulama: Sokaktan geçen insanlar ile yapılan bir anket çalışması hangi örnekleme yöntemine örnektir?

A) Güdümlü Örnekleme
B) Kolay Örnekleme
C) Rastgele Örnekleme
D) Kartopu Örneklemesi

Yanıtı Göster

Sokaktan geçen insanlarla yapılan anketler kolay örneklemeye birer örnektir. Bu tür anketlerde anakütle birim sayısı bilinmemektedir. Ankete katılanların sayısı kadar örnekleme büyüklüğü oluşturulur. Yanıt B'dir.


Uygulama: Ülkemizdeki iller için yapılacak bir araştırmada her ilden rastgele 4 ilçe seçilmiştir ve her bir ilçeden nüfus yoğunluğuna göre belirli sayıda vatandaş ile anket yapılmıştır. Hangi örnekleme yöntemi kullanılmıştır?

A) Küme Örneklemesi
B) Sistematik Örnekleme
C) Kota Örneklemesi
D) Tabakalı Örnekleme

Yanıtı Göster

Belirli bir coğrafi alanla ilgili araştırma yapılmak istendiğinde coğrafi alanın kümelere ayrılıp her bir kümeden belirli sayıda örnek veri birimi seçilmesi işlemine küme örneklesi denir. Yanıt A'dır.


1 Mü okunur.
2 Sigma okunur. Yunan alfabesinde Σ'nın küçük hâlidir.
3 X üzeri bar ya da X üzeri çizgi okunur.
<<< Önceki Konu
Sonraki Konu >>>