İstatistik derslerini tablet üzerinden çalışmanız şiddetle tavsiye olunur.

Grafikler

Bu bölümde verileri görselleştirmek için kullandığımız grafiklere değineceğiz.

Sütun Grafiği
Çubuk Grafiği
Çizgi Grafiği
Pasta Grafiği
Histogram
Dağılım Grafiği
Isı Haritası
Ağaç Haritası
Kutu Diagramı
Birleşik Grafik
Yığılmış Grafik
Güneş Işığı Grafiği
Gösterge Grafiği
3 Boyutlu Grafikler

Grafikler (chart, graph, plot, diagram) gerek istatistikte gerekse gündelik hayatta sıkça kullanılan bir veri görselleştirme yoludur. Çoğunlukla keşifsel veri analizinde (EDA)1 ve kullanıcıların, özellikle yöneticilerin, veriyi basit bir şekilde yorumlayabilmesi için tercih edilir. Microsoft Power BI gibi veri görselleştirme yazılımlarının da temelini oluşturur.

Grafik türlerine geçmeden önce grafiklerin nasıl kullanılmasını gerektiğini anlatan bir kitap önerisinde bulunayım.

storytelling with data

Eski bir Google çalışanı olan Cole Nussbaum Knaflic tarafından yazılan Storytelling with Data, grafiklerin nasıl doğru bir şekilde kullanılması gerektiği üzerine vurgu yapan bir kitap. Yanlış kullanımlarında sunum yapılan insanların veriyi yanlış yorumlayabileceğinin üzerinde uzun uzun durulmuş. İngilizceniz orta ya da ileri düzeyde ise mutlaka okumanız gereken kitaplardan biri. Kitaba Amazon adresinden ulaşabilirsiniz. e-Kitap versiyonu da bulunmaktadır.


Sütun Grafiği

sütun grafiği

En sık kullanılan grafik türüdür. Birbirinden ayrılan sütunlardan oluşur. İngilizce column chart olarak adlandırılır.

Doğru Kullanımı: Yatay eksende personel adı, şehir adı, ülke adı gibi kategorik değişkenler, dikey eksende tüketim miktarı, satış cirosu gibi sayısal değişkenler olmalıdır. Yöneticiler tam değerleri görmek istiyorsa sütunların üstünde yada içinde değer gösterimi yapılabilir.

Yanlış Kullanımı: Yatay eksende zamansal değişimler miktar gibi stok değişkenler haricinde gösterilmemelidir. Fiyat gibi oransal değişkenlerde çizgi grafiği tercih edilmelidir. Dikey eksende yüzdesel değerler olmamalıdır. Bunun yerine pasta grafiği ya da güneş ışığı grafiği kullanılmalıdır. Sütunlar ne çok kalın ne de çok ince olmalıdır.

verili sütun grafiği

Değerlerin sütunlara eklenmesi durumunda yatay eksendeki değer cetveli kaldırılmalı, grafik sadeleştirilmelidir.


Çubuk Grafiği

çubuk grafiği

Değişkenler çok fazla ise A4 kağıdına sığmayabilir. Bunun için sütun grafiğindeki eksenlerin yeri değiştirilerek oluşturulan çubuk grafikleri kullanılmalıdır. İngilizce bar chart olarak adlandırılır.

Doğru Kullanımı: Yatay eksende A4 kâğıdına sığmayacak kadar çok değişken olduğunda sütun grafiği yerine kullanılır. 15'ten fazla değişken olduğu durumda tüm kategoriler gösterilmemelidir. Bunun yerine ilk 15'inin gösterilip kalanları "Diğer" adı altında kümülatif gösterilmelidir.

Yanlış Kullanımı: Sütun grafiklerinde olduğu gibi dikey eksende zamansal değişimler nispî değişkenlerle ve yüzdesel verilerle gösterilmemelidir.


Çizgi Grafiği

çizgi grafiği

Zamansal değişimleri göstermek için en sık kullanılan grafik türüdür. TradingView gibi finansal sitelerde tercih edilir. İngilizce line chart olarak adlandırılır.

Doğru Kullanımı: Sadece zamansal değişimleri göstermek için kullanılmalıdır. Değerler fiyat gibi oransal değerler olabileceği gibi yüzdesel değerler de olabilir.

Yanlış Kullanımı: Yatay eksende personel adı, şehir adı gibi kategorik değişkenler yer almamalıdır. Bunun yerine sütun ya da çubuk grafiği tercih edilmelidir. Aynı zamanda alt ve üst değer sınırlarının yanlış belirlenmesi ciddi bir artış ya da düşüş yaşandığı yanılgısı oluşturabilir.


Pasta Grafiği

pasta grafiği

Kategorik değişkenlerin bir alandan ne kadar pay aldıklarını göstermek için kullanılır. İngilizce pie chart olarak adlandırılır.

Doğru Kullanımı: Sadece kategorik değişkenlerin bir alandan aldıkları pay gösterilmelidir. A, B ve C firmalarının sektör payları gibi. Değişkenlerin kabul edilebilir derecede fazla olması durumunda pasta grafiği yerine ağaç haritası tercih edilebilir.

Yanlış Kullanımı: Zamansal değişkenler pasta grafiği olarak kullanılmamalıdır. Bir firmanın 2020, 2021 ve 2023 yılındaki satış cirosu gibi gösterimlerde pasta grafiği yerine çizgi grafiği tercih edilmelidir. Çok fazla kategorik değişkenin olduğu durumlarda en fazla 7 kategori gösterilmelidir. En yüksek 6 kategori gösterildikten sonra diğer kategorilerin toplamı "Diğer" adıyla tek bir payda gösterilmelidir.


Histogram

histogram

Dikey eksende kişi sayısı gibi frekansın ya da olasılık yoğunluğunun, yatay eksende boy uzunluğu gibi aralıklı değerlerin yer aldığı grafik türüdür. Sütun grafiğine benzer ama aralık değerleri gösterildiği için histogramda sütunlar daima bitişiktir. Sütunların aralarında boşluklar yoktur. İngilizce adı da histogram'dır.

Doğru Kullanımı: Sadece normal dağılım hesaplamalarında kullanılmalıdır. Dikey eksende sadece frekans ya da yoğunluk olmalıdır. Yatay eksende 140 - 145 cm, 145 - 150 cm gibi aralık değerleri ya da Z değerleri yer almalıdır.

Yanlış Kullanımı: Zamansal değişimler, yüzdesel gösterimler gibi normal/standart normal dağılım dışında kullanılmamalıdır.

histogram

Standart normal dağılım grafiği halinde kullanılması durumunda histogram çizgi de grafiğe eklenebilir.


Dağılım Grafiği

dağılım grafiği

X, Y gibi iki değişken arasındaki ilişkinin yönünü göstermek amacıyla kullanılır. İngilizce adı scatter plot'tır.

Örneğin; bir eksende gelir, diğer eksende gider olabilir. Bireyin 80 TL geliri olması durumunda harcaması 100 TL'dir. 100 TL geliri olması durumunda harcaması 130 TL'dir. Grafik üzerindeki çarpı işaretleri gelir ve giderin kesiştiği noktaları belirtir. Eğimli çizilen doğru ise korelasyon doğrusu ya da regresyon doğrusu olarak adlandırılır. Bu konuya ilerleyen bölümlerde Regresyon konusunda detaylı değineceğiz.

Doğru Kullanımı: Sadece iki değişken arasındaki ilişkiyi ölçmek için kullanılmalıdır.

Yanlış Kullanımı: İki değişkenin de birimi aynı olmalıdır. Biri fiyat iken diğeri miktar olmamalıdır. İkisi de fiyat ya da ikisi de miktar olmalıdır.

negatif yönlü dağılım grafiği

Dağılım grafikleri ilk örnekte olduğu gibi pozitif yönlü olabileceği gibi negatif yönlü de olabilir. Bu durumda korelasyon doğrusu aşağı eğimli olacaktır.


Isı Haritası

ısı haritası

İki değişken arasındaki ilişkinin derecesi her bir ilişki için önemli ise ısı haritaları tercih edilir. İngilizce heatmap olarak adlandırılır.

Örnekte 1989 yılında yayınlanmaya başlayan Seinfeld dizisinin bölüm bazlı IMDB puanları ısı haritası olarak gösterilmiştir. Yüksek puanlar daha koyu renkli değerler alırken düşük puanlı bölümler açık renkli gösterilmektedir. Bu şekilde hangi bölümün iyi, hangisinin kötü olduğu sonucuna çok daha kolay ulaşılabilir.

Başka dizilerin ısı haritasını görmek isterseniz IMDB Table sitesini ziyaret edebilirsiniz.

Doğru Kullanımı: Sadece iki değişken arasındaki ilişkinin kuvvetini görsel olarak göstermek için kullanılmalıdır.

Yanlış Kullanımı: Değişkenlerin çok fazla olması durumunda kümülatif gösterimler yapılmamalıdır.


Ağaç Haritası

agaç haritası

Son yıllarda popülerleşmeye başlayan ağaç haritaları kategorik değişkenlerin pasta ya da güneş ışığı grafiklerinde gösterilemeyecek derecede fazla olması durumunda kullanılan grafiklerdir. Kategorilerin oransal büyüklüğünü verir. Microsoft Power BI gibi veri görselleştirme yazılımlarında sıklıkla kullanılır. İngilizce adı treemap'tir.

Doğru Kullanımı: Kategorilerin pasta grafiğine sığamayacak kadar çok olması durumunda kullanılmalıdır.

Yanlış Kullanımı: Çok fazla kategorik değişkenin olması durumunda tüm kategoriler ağaç haritasında gösterilmemelidir. Kümülatif olarak "Diğer" adlı yeni bir kategoride gösterilmelidir. Zamansal değişimleri göstermek için ağaç haritaları yerine çizgi grafikleri tercih edilmelidir.


Kutu Diagramı

kutu diagramı

Bir serinin medyan değeri, dağılım açıklığı, aykırı değerleri gibi özelliklerini görmek için kullanılır. Dağılım Ölçüleri konusunda detaylıca anlatılmıştır. İngilizce adı box-plot ve box & whisker'dır.

Doğru Kullanımı: Genellikle seri karşılaştırmalarında kullanılır. Serilerin birbirleri arasındaki farkı görmek için idealdir. Nokta olarak gösterilen değerler aykırı değerlerdir.2 Yatay kullanılabileceği gibi dikey de kullanılabilir.

Yanlış Kullanımı: Tek bir seri için kullanılması pek anlam ifade etmeyebilir. En az iki serinin olduğu durumda kutu diagramları yan yana konumlandırılmalı, seriler arasındaki fark gözlemlenmelidir.


Birleşik Grafik

birleşik grafik

İki grafik türünün birlikte kullanılması durumunda tercih edilir. İngilizce adı combo chart ya da combination chart'tır.

Doğru Kullanımı: Değerler arasında sabit bir değişken olmalıdır. Bu genellikle zaman olmaktadır. Örneğin; 2024 yılında satılan ürün adeti ve satış fiyatları ortalaması ay bazlı aynı grafikte gösterilebilir.

Yanlış Kullanımı: Alt ve üst değer sınırlarının yanlış belirlenmesi ciddi bir artış ya da düşüş yaşandığı yanılgısı oluşturabilir.


Yığılmış Grafik

yığılmış grafik

Sütun grafiklerine benzer. Bir döneme ait birden fazla değişenin olması durumunda dönemler arasında karşılaştırma yapmak için kullanılır. Dikey durumda adı yığılmış sütun grafiği, yatay durumda ise yığılmış çubuk grafiğidir. Benzer şekilde dikey kullanılması durumunda İngilizce adı stacked column chart, yatay kullanılması durumunda stacked bar chart'tır.

Doğru Kullanımı: Dönemler arasında kategorilerin büyüklüklerini karşılaştırmak için idealdir.

Yanlış Kullanımı: Çok fazla kategorinin aynı anda kullanılması durumunda grafiğin okunması zorlaşacaktır. Bu nedenle en büyük 4 kategori tek bir sütunda gösterilirken diğer kategoriler 5. kategori olarak "Diğer" adıyla kümülatif gösterilmelidir.


Güneş Işığı Grafiği

güneş ışığı grafiği

Pasta grafiklerine benzer. Ortaları genellikle boştur ve pasta grafiklerinden daha sade bir görünümü vardır. Son yıllarda popülerleşmeye başlamıştır. Simit grafiği olarak da adlandırılır. İngilizce adı sunburst chart'tır.

Doğru Kullanımı: Az sayıda kategori olmaması durumunda belirli bir alandaki pay dağılımlarını göstermek için kullanılmalıdır.

Yanlış Kullanımı: Çok fazla kategori olması durumunda kullanılmamalıdır. Ağaç grafikleri tercih edilmelidir. Zamansal değişimlerde güneş ışığı grafiği yerine çizgi grafikleri kullanılmalıdır.

güneş ışığı grafiği

Güneş ışığı grafiğinin farklı bir gösterimi ise birden fazla kategorinin birlikte kullanılması durumudur. Güneş parlamasına benzediği için adını buradan almaktadır.


Gösterge Grafiği

gösterge grafiği

Bir hedefe kalan oranı ve ilerleme yüzdesini göstermek amacıyla kullanılır. Son yıllarda kullanımı artmıştır. En çok Microsoft Power BI gibi veri görselleştirme uygulamalarında tercih edilir. Arabalardaki hız göstergesine benzemesi nedeniyle adına gösterge grafiği denilmektedir. İngilizce adı gauge chart'tır.

Doğru Kullanımı: Sadece hedefe kalan oran ve ilerleme yüzdesi olması durumunda kullanılmalıdır.

Yanlış Kullanımı: Birden fazla kateogori ile iç içe kulanılmamalıdır.


3 Boyutlu Grafikler

3 boyutlu grafik

80'li yıllarda fütüristik olması amacıyla üretilen grafik türüdür. İngilizce adı 3D chart'tır.

Doğru Kullanımı: Doğru kullanımı bulunmamaktadır.

Yanlış Kullanımı: Bu tür grafikler anlamsız yere kullanıcıları yorduğu için her kullanımı yanlıştır.

Grafikler hakkında bilmemiz gerekenler şimdilik bu kadar. İstatistik biliminde örümcek ağı diagramı, harita grafiği, mum grafiği gibi daha birçok grafik türü bulunmaktadır. Fakat en çok kullanılan grafik türleri bu bölümde anlatılmıştır. Daha fazlası için internet araştırmaları yapabilirsiniz.

Sıra Sizde

Uygulama: Belirli bir sektörde alınan payları göstermek için hangi grafiğin kullanılması en uygundur?

A) Çizgi Grafiği
B) Dağılım Grafiği
C) Pasta Grafiği
D) 3 Boyutlu Grafik

Yanıtı Göster
pasta grafiği

Sektörden alınan payları en iyi pasta grafiği ya da güneş ışığı grafiği gösterir. Bu nedenle yanıt C'dir.


Uygulama: Bir firmanın 2020 - 2030 yılları arasındaki hisse senedi fiyatı için hangi grafik kullanılmalıdır?

A) Pasta Grafiği
B) Çizgi Grafiği
C) Kutu Diagramı
D) 3 Boyutlu Grafik

Yanıtı Göster
çizgi grafiği

Fiyat gibi nispî değişkenlerin tarihsel değişimlerini en iyi gösteren grafikler çizgi grafikleridir. Bu nedenle yanıt B'dir.


Uygulama: İki değişken arasında ilişkinin yönünü ölçmek söz konusu olduğu zaman hangi grafik türü tercih edilir?

A) Dağılım Grafiği
B) Çizgi Grafiği
C) Kutu Diagramı
D) Çubuk Grafiği

Yanıtı Göster
dağılım grafiği

İki değişken arasındaki ilişkinin yönünü gösteren grafikler dağılım grafikleridir. Bu nedenle yanıt A'dır.


Uygulama: Seri karşılaştırmalarında sıklıkla kullanılan, aykırı değerlerin de tespit edilebildiği grafik türü nedir?

A) Çizgi Grafiği
B) Dağılım Grafiği
C) Güneş Işığı Grafiği
D) Kutu Diagramı

Yanıtı Göster
kutu diagramı

Seri karşılaştırmaları ve aykırı değerler söz konusu olduğu zaman kutu diagramı en iyi grafik türüdür. Bu nedenle yanıt D'dir.


Uygulama: Sütun grafiklerinin A4 kâğıda sığmaması durumunda tercih edilebilecek grafik türü nedir?

A) Çubuk Grafiği
B) Çizgi Grafiği
C) Yığılmış Grafik
D) Birleşik Grafik

Yanıtı Göster
çubuk grafiği

Sütun grafiklerinde kategorilerin fazla olması durumunda eksenlerin yerleri değiştirilerek oluşturulan çubuk grafikleri kullanılır. Bu nedenle yanıt A'dır.


1 EDA: Exploratory Data Analysis
2 Aykırı Değer: Outlier
<<< Önceki Konu
Sonraki Konu >>>