İstatistik derslerini tablet üzerinden çalışmanız şiddetle tavsiye olunur.
Merkezî Eğilim Ölçüleri
Veri kümesinin ortasını belirlemeye yönelik ölçülerin tümüne merkezî eğilim ölçüsü (measure of central tendency) denir. Adından da anlaşılacağı üzere amaç, veri setinin ne yöne doğru eğilim gösterdiğini tespit etmektir. Bu eğilimi tespit etmek içinse ortalamalar kullanılmaktadır.
Ortalama denilince birçoğumuzun aklına aritmetik ortalama gelmektedir. Fakat istatistikte geometrik ve harmonik ortalama, mod, medyan gibi kimi durumlarda daha anlamlı sonuçlar veren ortalamalar da bulunmaktadır.
Duyarlı ortalamalar serideki aykırı değerlerden etkilenirken duyarlı olmayan ortalamalar etkilenmemektedir.
Aritmetik Ortalama (Arithmetic Mean), en bilinen ve en çok kullanılan ortalama türüdür. Seriyi oluşturan tüm değerlerin toplanıp gözlem sayısına bölünmesi ile bulunur.
Uygulama: Bir sınıftaki tüm öğrencilerin boy uzunlukları tabloda listelenmiştir.
Boy Uzunluğu
Öğrenci Sayısı
150 – 159 cm
4
160 – 169 cm
12
170 – 179 cm
36
180 – 189 cm
8
190 – 200 cm
2
Toplam (Σ)
62
Boy uzunluklarının aritmetik ortalamasını bulunuz.
Boy Uzunluğu
mi
Öğrenci Sayısı (fi)
mifi
150 – 159 cm
155 cm
4
620
160 – 169 cm
165 cm
12
1980
170 – 179 cm
175 cm
36
6300
180 – 189 cm
185 cm
8
1480
190 – 200 cm
195 cm
2
390
Toplam (Σ)
62
10770
mi sınıf orta sayısını belirtmektedir. (150 + 160) / 2 = 155 cm
Sınıf aralıklarında son değer aralığa dahil, başlangıç değeri dahil değildir. 160 – 170 cm aralığı gerçekte 160’dan değil 160.0000…001’den başlamaktadır. 170.000…000’da bitmektedir.
Geometrik Ortalama (Geometric Mean), serinin gözlem değerlerine eşit dereceden ortalamasıdır. Aykırı değerlerden1 daha az etkilenmesi sebebiyle aritmetik ortalamadan daha anlamlıdır. Buna rağmen seride sıfır ya da negatif değer olması durumunda kullanılamamaktadır.
Antilog alırken hesap makinemizde 10Log Geo Ort işlemini yapabiliriz. Diğer bir ifade ile 10 üzeri (Logaritmik Geometrik Ortalama) işlemini yapmaktayız. (102.43 = 267.14)
Seri 84 ve 1486 olmak üzere iki aykırı değer (outlier) içermektedir. Aritmetik ortalama 356’dır ve geometrik ortalama 267 bulunmuştur. Verilerin çoğunluğu 244 ve 254 arasında dağılırken aritmetik ortalama (356) seriyi istatistiksel olarak anlamlı temsil etmemektedir. Geometrik ortalama nispeten daha anlamlıdır.
Uygulama: Anket sorularına verilen cevapların puan tablosu aşağıdaki gibidir.
Bileşik faiz formülünün temeli geometrik ortalamaya dayanmaktadır.
Yıl
Anapara
Faiz Oranı
Faiz Geliri
1
1000
%10
100
2
1100
%20
220
3
1320
%15
198
3. yılın sonunda Anapara + Faiz Geliri = 1320 + 198 = 1518 TL’dir. Sonuç olarak yatırımcı 1000 TL ile açtığı mevduat hesabından vade sonunda %51.8 getiri elde etmiştir.
\[ \text{Geo Ort} = \sqrt[n]{X_1X_2...X_n} \]
Geometrik ortalamayı yukarıdaki gibi ifade etmiştik. Formül aynı zamanda
Dikkat edilirse geometrik ortalama ve bileşik faiz formülü birbirine çok benzemektedir. Bu sebeple bileşik faize aynı zamanda faiz oranlarının geometrik ortalaması diyebiliriz.
Yatırımcı 1000 TL anaparasını 3 yıl boyunca sırasıyla %10, %15 ve %20 faiz oranlarından bileşik faize yatırmak yerine %14.93 sabit oranı ile bileşik faize yatırırsa vade sonunda aynı getiriyi elde edecektir. (%51.8)
Harmonik Ortalama
Harmonik Ortalama (Harmonic Mean), değişkenlerden birinin sabit, diğerinin sabit olmadığı durumlarda kullanılan, genellikle hız, fiyat ve verimlilik hesaplamalarında tercih edilen ortalama türüdür. Aykırı değerlerden en az etkilenen duyarlı ortalamadır. Hesaplanabilmesi için seride sıfır ve negatif değer olmamalıdır.
Diyelim ki A ve B noktası arasındaki mesafe 240 km olsun. Araç A ve B noktasına toplamda 3 kere gitmekte ve 240 * 3 = 720 km yol yapmaktadır. Toplam mesafeyi 720/55.38 = 13 saatte tamamlamaktadır.
Yolda geçen süreyi tek tek hesapladığımızda 240/40 = 6 saat, 240/60 = 4 saat, 240/80 = 3 saat
6 + 4 + 3 = 13 saat sonucuna varırız. Bu şekilde harmonik ortalamanın sağlamasını yapabiliriz.
Yorumlaması ise şu şekildedir:
Araç aynı yolu 40, 60 ve 80 km/saat hızlarla gitmek yerine 55.38 km/saat gibi sabit bir hızla giderse aynı sürede tamamlar.
Uygulama: Bir sınıftaki tüm öğrencilerin boy uzunlukları tabloda listelenmiştir.
Kareli Ortalama (Root Mean Square, RMS, Quadratic Mean), aritmetik ortalamaya benzemekle birlikte serideki 0 ve negatif değerleri nötralize etmek için kullanılan ortalama türüdür. Diğer bir ifade ile seride 0 veya negatif değerler göz ardı edilmek isteniyorsa kareli ortalama kullanılmalıdır.
Ağırlıklı Ortalama (Weighted Mean) ya da Tartılı Aritmetik Ortalama finans alanında sıkça kullanılan duyarlı ortalamalardan biridir. Aralarındaki ilişkiden dolayı değişkenlerden biri ya da birkaçı ağırlıklandırılır, hesaplanmak istenen asıl değişkenin ortalaması bulunur. Özel durumlarda kullanılır ve diğer ortalama türlerine göre istatistiksel olarak daha anlamlıdır.
Faiz oranlarının aritmetik ortalaması 10.42’dir ve istatistiksel olarak anlamlı değildir. İşlem tutarlarının büyük çoğunluğu (%91’lik kısmı oluşturan 132 milyon TL’lik hesap) 11.10 faiz oranı ile fiyatlanmıştır. Ortalamanın 11.10’a yakın olması beklenir. Bu sebeple 11.03 ağırlıklı ortalama faiz oranı, 10.42 aritmetik ortalamasına göre istatistiksel olarak daha anlamlıdır.
Duyarlı Ortalamaların Karşılaştırılması
Uygulamada çoğunlukla aritmetik ortalama kullanılsa da aykırı değerlerin yüksek olduğu serilerde geometrik ve harmonik ortalama tercih edilebilir. Geometrik ve harmonik ortalama hesaplamalarında seride negatif ve sıfır değerlerinin bulunmamasına dikkat edilmelidir. Ağırlıklı ortalama ise stok faiz oranı gibi özel durumlarda tercih edilen, basit serilerde kullanılamayan özel bir duyarlı ortalamadır.
Tüm serilerde yukarıdaki büyüklük sıralaması geçerlidir. Harmonik ortalama aykırı değerlerden en az etkilenen duyarlı ortalama olmakla birlikte aykırı değerlerin yoğun olduğu serilerde kareli ortalama güvenirliği en az olan ortalama türüdür.
X1 = 10, 10, 11, 11, 12, 12, 480 basit serisinin duyarlı ortalamaları hesaplandığında sırasıyla
ortalamaları bulunur. 480 aykırı değeri seriden çıkarıldığında serinin aritmetik ortalaması 11 olmaktadır. Bu sebeple aykırı değerin varlığı durumunda harmonik ortalama (13) seri ortalamasını istatistiksel olarak daha anlamlı ifade ettiği sonucuna varılabilir.
Seri karşılaştırmalarında harmonik ortalama istatistiksel olarak daha anlamlı iken aykırı değerlerin varlığı kabul edildiği durumlarda aritmetik ortalamanın kullanılmasında sakınca bulunmamaktadır. Bununla birlikte aykırı değerlerin yoğun olduğu serilerde medyan gibi duyarlı olmayan ortalamalar tercih edilmektedir. Günümüzde gini katsayısının yüksek olduğu ülkelerde medyan değerleri, kişi başına milli gelir karşılaştırmalarında aritmetik ortalamaya göre daha gerçekçi sonuçlar vermektedir.2
SPSS'te Duyarlı Ortalamalar
Aritmetik Ortalama
Sadece aritmetik ortalama bulunmak isteniyorsa aşağıdaki adımlar uygulanır.3
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Analyze > Descriptive Statistics > Descriptives… yolu izlenir.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
İlgili değişken Variable(s)4 alanına taşınır. Options5’a tıklanır.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
OK'a tıklanır.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
x1 = 10, 10, 11, 11, 12, 12, 480 serisine ait aritmetik ortalamanın 78 olduğu bulunur.
Aritmetik, Geometrik ve Harmonik Ortalama
Aritmetik, geometrik ve harmonik ortalama birlikte bulunmak isteniyorsa aşağıdaki adımlar uygulanır.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Analyze > Reports > Case Summaries… yolu izlenir.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Display cases seçimi kaldırılır. (Kaldırılmadığı takdirde tüm seri değerleri rapora eklenecektir.)
Statistics…’e tıklanır.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Statistics listesinden Mean, Geometric Mean ve Harmonic Mean seçilir. Cell Statistics alanına aktarılır.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Summarize Cases penceresinde OK'a tıklanır.
Büyütmek için görselin üzerine geliniz ya da tıklayınız.
Aritmetik, geometrik ve harmonik ortalamalar görseldeki gibi bulunur.
Aritmetik ortalama ve harmonik ortalama arasındaki fark ne kadar büyükse seride aykırı değerlerin varlığından söz edilebilir. Aykırı değerleri tespit edebilmek için Summarize Cases penceresinde “Display cases” kutusu seçilmelidir.
Medyan
Medyan (Median) ya da Ortanca küçükten büyüğe sıralanmış veri dizisinin ortasındaki değeri ifade eden duyarlı olmayan ortalamadır. Aykırı değerlerin olduğu serilerde diğer ortalama türlerine göre daha güvenilirdir.
Birikimli frekans içerisinde 10. ve 11. sıraya karşılık gelen boy uzunlukları toplanır ve 2’ye bölünür. Elde edilen değer frekans serisinin medyan değeridir.
Uygulama: Sınav notları aşağıdaki tabloda gruplandırılmıştır.
Mod (Mode) seride en çok tekrar eden değerdir. Çift tepeli gruplandırılmış serilerde ve frekans serilerinde mod hesaplanamamaktadır. Gruplandırılmış serilerde gruplandırmanın daraltılması gerekmektedir.
Anakütle ve Örneklem Modu
Basit Serilerde
\[ \text{Mod} = \text{En Cok Tekrar Eden Deger} \]
Frekans Serilerinde
\[ \text{Mod} = \text{En Cok Tekrar Eden Frekans Sınıfı} \]
Seri geneli itibariyle 22 ve 28 arasında dağılmaktadır. Aritmetik ortalamanın bu iki değer arasında olması beklenir. Fakat 37.81 bulunmuştur. Bu sebeple aritmetik ortalama yerine düzeltilmiş ortalama kullanılması daha uygundur.
Beklenildiği gibi düzeltilmiş ortalama 22 - 28 arasındadır. İstatistiksel olarak seriyi aritmetik ortalamaya göre daha anlamlı temsil etmektedir.
Kırpılmış Ortalama
Kırpılmış Ortalama (trimmed mean, trimmean, truncated mean) serinin başındaki ve sonundaki belirli bir yüzdenin seriden atılarak hesaplanması ile elde edilen ortalamadır.
Seride 20 gözlem değeri vardır. %50’si (20 x %50) 10 etmektedir. Serinin başından 5 ve sonundan 5 olmak üzere toplam 10 değer atılır ve kırpılmış seri oluşturulur.
1 Aykırı değer (outlier) 2 Ortalama Gelir, Medyan Gelir ve Gini Katsayısı örneği için tıklayınız. 3 IBM SPSS Statistics | version 26.0.0.0 4 Değişken(ler) 5 Seçenekler 6 Ortalama