Veri Bilimi ve Veri Analizine Başlarken

Ana Sayfa'da veri bilimi ve veri analizin tanımı yapılmış, tarihi ve önemi anlatılmıştı. Özet geçmek gerekirse, veri bilimi ve veri analizi günümüzün önü açık en popüler uzmanlık alanlarından biridir.

Bu bölümde veri bilimi ve veri analizine başlamadan önce sahip olmamız gereken yetkinliklere değineceğiz. İleride karşılaşacağımız veri bilimi konularının önizlemesini yapacağız. Bu sebeple bu konuyu tam olarak anlamadan veri bilimi ve veri analizine başlamamanızı öneririm. Çünkü veri bilimi ve veri analizi yoğun bir çalışma ve sıkı bir disiplin gerektiren uğraşı alanıdır.

fitness logo

Veri bilimi ve veri analizini fitness salonuna benzetebiliriz. Ülkemizdeki kaynaklara göre "Fitness salonlarına senelik ücret ödeyip kayıt olan ve gitmeyen insanların yüzdesi en az %70"dir. Yabancı kaynaklara göre bu oran %85'lere kadar çıkabilmektedir. Diğer bir ifade ile insanlar kondisyon salonlarına yıllık ücret ödedikleri hâlde ilk bir ay kadar gittikten sonra devam etmemektedir. Bu durumun nedenleri "boş vakitlerinin olmaması", "kendilerini çok fazla zorlamaları", "motivasyon eksikliği", "takdir görememe, yalnız hissetme ve depresyon" olarak sıralanabilir. Saydığımız nedenler kayıt olup gitmeyenlerin mazeretleridir, ki itiraf etmeliyim ki spor salonuna kayıt olup gitmeyenlerden biri de benim. Spor salonu sahipleri de bunu bildikleri için üyelerinden aylık yerine yıllık ücret talep etmektedir.

veri analizi logo

Fitness salonları fiziksel iken veri bilimi ve veri analizi zihinseldir. İkisi bu yüzden birbirine çok benzemektedir. Fitness salonları yoğun fiziksel enerji gerektirirken veri bilimi ve veri analizi yoğun zihinsel aktivite gerektirmektedir.

Veri bilimi ve veri analizinde o kadar çok yeni şey öğreneceğiz ki birçoğumuz yarıda bırakacak. Bunu normal karşılamalıyız. Çünkü veri bilimi ve veri analizi herkesin kaldırabileceği bir alan değildir. Fakat bu alana kendinizi kaptırırsanız önünüz açıktır. Çünkü veri bilimi ve veri analizinden yola çıkıp "veri analisti", "veri bilimcisi", "veri uzmanı" gibi unvanların yanında daha farklı alanlarda uzmanlaşıp "sistem uzmanı", "veritabanı uzmanı" gibi pozisyonlarda çalışabilirsiniz.


İş İlanları

Linkedin sitesinde veri bilimi ve veri analizi üzerine açılmış iş ilanlarına aşağıdaki bağlantılardan ulaşabilirsiniz:

linkedin logo

Farklı sözcükler kullanarak daha detaylı aramalar da yapabilirsiniz. İlanlarda işverenlerin özellikle hangi yazılım teknolojilerini bilmenizi istediklerine göz atın. Veri bilimi ve veri analizinde birazdan aşağıda sayacağımız teknolojiler başlangıç aşamasında istenmektedir. Fakat iş detayına göre çok farklı bir yazılım bilmeniz de gerekebilir. Örneğin; IBM SPSS Statistics bilmenize rağmen sizden IBM SPSS Modeler adlı bir yazılım kullanmanız istenebilir. Bu sitede IBM SPSS Modeler yazılımının eğitimi olmamakla birlikte sektörde söz sahibi ücretsiz ve açık kaynaklı son teknoloji yazılımlar anlatılacaktır. Yani başlangıç için sektörün hem en çok tercih edilen teknolojilerini kullanabileceksiniz hem de iş hayatınızda size kolaylık sağlayacak birçok konuya hakim olacaksınız.


Başlamadan Önce Gereken Yetkinlikler ve Özellikler

Veri bilimi ve veri analizine başlamadan önce sahip olmamız gereken yetkinlikleri ve özellikleri aşağıda sıraladım:

İngilizce veri bilimi ve veri analizi için şart. En azından yabancı kaynaklı videoları altyazı ile izlerken anlayabilmelisiniz. Yurtdışında çalışmayacaksanız ileri (advanced) seviyede İngilizce bilmenize gerek bulunmamaktadır. Yine de stackoverflow.com gibi sitelere soru sorulabilecek ve sorulmuş soruları anlayabilecek düzeyde olmalısınız.

karekök logo

Matematik ise zorunlu. Fakat integral, türev, fonksiyon gibi ileri düzeyde bilmenize gerek bulunmamakta. Matematik özellikle istatistik alanında işimize yarayacak.

Temel ve orta düzey Excel bilmeniz veri bilimi ve veri analizi için yeterlidir. İleri düzey Excel bilmenize gerek bulunmamaktadır. Excel dersleri için YouTube kanalımı ve Excel Dersleri web sitemi ziyaret edebilirsiniz.

Bunun dışında veri bilimi ve veri analizi öğrenmeye istekli ve azimli olmalıyız. Bu istek ve azmimizi kararlılık ve disiplin ile pekiştirmeliyiz.


Başlamadan Önce Sahip Olmamız Gereken Donanımlar

Veri bilimi ve veri analizi öğrenmeye başlamadan önce sahip olmamız gereken donanımlara aşağıda değindim:

pc logo

Bilgisayar başında çok fazla vakit geçireceğimiz için kullanacağımız bilgisayarın da iyi olması kritik öneme sahiptir. Veri bilimi ve veri analizinde grafik kartı yüksek oyun bilgisayarlarından ziyade işlemci (CPU) gücü yüksek bilgisayarları tercih etmeliyiz. Çünkü milyonlarca satırdan oluşan CSV dosyalarını analiz ederken güçlü işlemcili bilgisayarlara ihtiyacımız vardır. Masaüstü mü yoksa dizüstü mü derseniz masaüstü bilgisayarlar her zaman bir adım öndedir. Masaüstü bilgisayarlar ile hem daha iyi soğutma hem de daha geniş ekranda çalışma şansına sahibiz. Fakat dizüstü bilgisayarları hemen her yere götürebilmemiz de en büyük avantajıdır. Bu sebeple dizüstü bilgisayar tercihiniz olacaksa ekran genişliği 15 inch yerine en az 17 inch olan işlemci gücü yüksek laptop'lar tercihiniz olmalı. Daha geniş ekranda çalışmak gözünüzü daha az yoracaktır.

casio fx 991ex
Casio fx-991EX

Hesap makinesini ise daha çok istatistik öğrenimimizde kullanacağız. Buna rağmen ara hesaplamalar yaparken de hesap makinesine ihtiyaç duyabiliriz. Parantezli işlem, üs ve kök alma gibi birçok fonksiyona sahip bilimsel hesap makinesi kullanmak en idealidir. Bu makineler sayesinde, yaptığımız geçmiş işlemleri de görebiliriz.

Tavsiyem Casio fx-991EX modelini kullanmanız. Bu hesap makinesi kullanabileceğiniz bilimsel hesap makineleri içerisinde performans/fiyat bakımından en iyisidir ve sizi bir ömür boyu götürecektir. Satın aldıktan sonra mutlaka ve mutlaka kullanım kılavuzunu okumalı, hatta ilerisi için saklamalısınız. Çünkü içeriği sayesinde hem hesaplamaların nasıl yapıldığını öğrenebilir hem de QR (karekod) gibi farklı özellikleri hakkında bilgi sahibi olabilirsiniz.

calces
CalcES

Fiziksel hesap makineleri pahalı geldiyse hemen hemen aynı işleve sahip CalcES gibi Android uygulamalarını kullanabilirsiniz. Piyasada Panecal gibi farklı bilimsel hesap makinesi uygulamaları olsa da CalcES aralarında en iyisidir. Gerek arayüzü gerekse gerçek hesap makineleri ile aynı işleve sahip olması sayesinde telefonlarınızdaki varsayılan hesap makinesinin yerini alacaktır. En güzeli ise CalcES'in tamamen ücretsiz olmasıdır. Temeli Casio fx-991 hesap makinesine dayanan CalcES'in Google Play link'ini buraya bırakıyorum.

Sessiz bir çalışma ortamı ise hem derslere odaklanma hem de verimliliğimiz için önemlidir. Çünkü veri bilimi ve veri analizi yoğun dikkat gerektiren bir alandır. Bu alanda SQL, Python gibi ilk defa öğreneceğimiz birçok konuyla tanışacağız. Bu sebeple çalışma ortamınızın gürültülü olmamasına, mümkünse temiz hava alan bir odada çalışmanızı öneririm. Ayrıca çalışırken müzik dinlemek sizi motive ediyorsa müzik dinleyin. Klasik müzik daha iyi odaklanmanıza yardımcı olabilir. Yabancı müzikte ise Türkçe şarkılar dinlemek yerine yabancı parçalar dinleyin. Bu sayede dikkatiniz daha az dağılacaktır.


Öğrenim Boyunca Sağlığımızı Korumak

sağlık logo

Veri bilimi ve veri analizi öğrenimi boyunca mümkün olduğunca sağlığınıza özen gösterin. Çok yağlı yiyeceklerden kaçının. Ders aralarında fındık, fıstık, ceviz gibi çerezler ile atıştırmalar yapın. Günde en az bir elma yiyin. Uyku düzeninize önem verin. 8 saat uyuyun ve uykunuzu bölecek her türlü ortamdan uzak durun. Çok fazla bilgi bombardımanına maruz kalacağınız için uyumadan önce kitap okuyun ya da müzik aleti çalmak gibi kafanızı dağıtacak farklı uğraşlar bulun. Spor yapın. Koşu, yüzme gibi ağır aktiviteler yapamıyorsanız günde en az 2 km ya da iki günde bir 3 km yürüyün. Yürümek vücut ve akıl sağlığınıza oldukça faydalıdır. Sağlığınızı göz ardı etmeyin.


Veri Bilimi ve Veri Analizinde Yol Haritası

Veri Bilimi ve Veri Analizine başlarken önce "Önce Python öğreneyim, sonra SQL öğrenirim" gibi bir yol izlemeyin. Luke Barousse gibi deneyimli veri analistlerinin tavsiyelerine kulak verin. Örneğin How I Would Learn to be a Data Analyst adlı videoda "Sıfırdan başlasaydım nereden başlardım?" sorusunun yanıtı veriliyor. Siz de veri bilimi ve veri analizine başlamadan farklı kaynaklara ait YouTube videoları izleyin. Bu işin içinden gelenlerin tavsiyelerini dinleyin. Medium makaleleri okuyun. Konusu açılmışken Medium'da veri analizi üzerine birçok güzel makale bulabilirsiniz. Link'ini buraya bırakıyorum.

Sözü uzatmadan Veri Bilimi ve Veri Analizi öğrenim sıramızı aşağıda listeliyorum:

1. Excel

excel logo

Veri Bilimi ve Veri Analizine başlamadan önce mutlaka ve mutlaka Microsoft Excel öğrenin. Daha önce de belirttiğim gibi Excel dersleri için YouTube kanalımı ve Excel Dersleri web sitemi ziyaret edebilirsiniz. Excel veri analizinin başlangıcıdır. Sadece Excel'le bile birçok faydalı veri analizi çalışması yapabilirsiniz. Örnek vermek gerekirse istatistikteki regresyon analizini Excel sayesinde çok kısa bir sürede tamamlayabilirsiniz. Basit ve sıradan gözükmesine rağmen Excel'in Power Query M dili ile karmaşık analizler yapabilirsiniz. Fakat Excel'i temel ve orta düzeyde bilmeniz yeterlidir. Çünkü veri biliminde ilerledikçe Python, SQL, Microsoft Power BI programlama dilleri ve teknolojileri işimizi görecektir.

2. İstatistik

normal dağılım

İyi bir veri analistinin istatistiği de sağlam olmalıdır. İstatistik veri bilimi ve veri analizinin temelini oluşturur. Doğru bir istatistik eğitimi almadan veri bilimi ve veri analizine başlamayın. Bu web sitesinin İstatistik bölümünde tüm hayatınız boyunca size yardımcı olacak birçok istatistik konusuna ulaşabilirsiniz.

3. SQL

sql logo

Veritabanlarından verisetlerini (dataset'leri) çekerken kullanacağımız tek dil SQL'dir. Bu sebeple iyi bir veri analisti işine yarar düzeyde SQL bilmelidir. SQL öğrenmeden veri analisti olmaya çalışmayın. Tüm konular içerisinde öğrenmesi en kolay ve en keyifli alanlardan biri SQL'dir. Eğer kendinizi sadece bu alanda geliştirmek istiyorsanız Veritabanı Uzmanı bile olabilirsiniz. Fakat biz veri bilimi ve veri analizinde SQL'i sadece işimize yarayacak düzeyde öğreneceğiz. SQL bölümünde veri bilimi ve veri analizinde kullanabileceğiniz birçok SQL konusuna erişebilirsiniz.

4. Python ve R Programlama Dilleri

python logo

Veri bilimi ve veri analizi denilince piyasada iki geçerli programlama dili vardır: Python ve R.

R, 25,000'den fazla kütüphaneye sahip sadece istatistik üzerine geliştirilmiş programlama dilidir. Python ise çok amaçlı bir programlama dili olmakla birlikte NumPy, Pandas gibi veri analizi için oluşturulmuş majör kütüphanelere sahiptir. ('NumPy', 'Pandas', 'kütüphane' gibi kavramlar şu an için pek bir anlam ifade etmeyebilir. Şimdilik bunları göz ardı edin.)

Deneyimli veri analistlerine göre Python her gün artan kütüphaneleri ve geliştirmeleri sayesinde bir zaman sonra R programlama dilini geçecektir. Bu iddialı bir önerme olsa da iki programlama dili de alanında iyidir. Fakat birçok analistin Python'u daha fazla önermesi sebebiyle biz de ilk olarak Python ile veri bilimi ve veri analizi öğrenmeye başlayacağız. Sitemizin Python bölümünde öğreniminiz kullanabileceğiniz birçok konuya ulaşabilirsiniz.

5. Microsoft Power BI ve Tableau

power bi logo

Veri görselleştirmesi denilince ilk akla gelen Microsoft Power BI ve Tableau yazılımlarıdır. Bu teknolojiler sayesinde analiz sonuçlarımızı grafikleştirebilir, dashboard'lar yardımıyla raporları kullanıcıların daha kolay anlayabileceği görsel sunumlara çevirebiliriz. Bu noktada Power BI ya da Tableau en iyi alternatiftir. Bu sayede yöneticiler raporları canlı olarak cep telefonlarından ya da tabletlerinden okuyabilecektir. İlerleyen aşamalarda sitemizde Microsoft Power BI dersleri de olacaktır.


Gerçek İş İlanları

iş ilanı örneği

Şimdi de gerçek bir iş ilanına bakalım.

İlanda da görebileceğiniz üzere Favori Gıda adlı firma Satış Analiz ve Raporlama Sorumlusu pozisyonu için SQL, MS Office (Excel) ve Microsoft Power BI bilen çalışan aramaktadır. Sitemizde tüm bu teknolojilerinin derslerini bulabilirsiniz.

iş ilanı örneği

İkinci örnekte Güzel Enerji Akaryakıt şirketi CRM Veri Analisti pozisyonu için Python, R ve SQL yazılımlarından en az birini bilen, bunun yanında SPSS ve SAS hakkında bilgi sahibi olan, ayrıca Microsoft Excel'e hakim bir çalışan aramaktadır. Python, R ve SQL'den en az biri zorunluluk iken başvuru yapacak kişinin SPSS ve SAS bilmesi şart değildir. Fakat hakkında bilgi sahibi olunmalıdır.

iş ilanı örneği

Son örneğimizde Aksigorta firması iyi derecede Microsoft Excel ve Power BI bilen çalışanlar aramaktadır. Ayrıca Python programlama dilini bilmek aday için büyük bir avantaj olacaktır.

Sonuç olarak Veri Bilimi ve Veri Analizi derslerimizi başarılı bir şekilde tamamlarsanız bu tür iş ilanlarına başvuru yapabilecek seviyeye geleceksiniz.


Eğitim Süresi

google logo

İyi bir veri bilimi ve veri analizi için en az 6 ay gereklidir. Yine de tam anlamıyla öğrenmek için en az 11 ay gerekli olduğunu belirtirim. Çünkü kavramaların yerine oturması uzun zaman alabilmektedir. Bu sitede her ne kadar Python, SQL gibi birçok konuyu öğrenecek olsak da asıl öğrenim iş hayatındaki gerçek problemleri çözmekle başlar. Bu sebeple ne kadar iyi bir eğitim alırsanız iş hayatında da o kadar başarılı olursunuz. Ayrıca bu sitedeki dersleri bitirdikten sonra Coursera sitesi üzerinden Google Data Analytics Professional Certificate'i (Google Veri Analizi Profesyonel Sertifikası'nı) alın derim. Kurs en az 6 ay sürmektedir ve CV'nize büyük katkı sağlayacaktır. Kurs sayfasındaki "Financial aid available" seçeneği ile ücretsiz de kayıt olabilirsiniz.


Başlamadan Önce Son Sözler

study logo

Çok uzun bir yazı oldu farkındayım. Fakat veri bilimi ve veri analizi çok fazla emek ve zaman isteyen bir alandır. Bu sebeple iyi bir araştırma yapmadan, yabancı videolar izlemeden, makaleler okumadan bu alanda öğrenim görmeye başlanmamalıdır.

İlk başlarda veri bilimi ve veri analizi sizi çok yoracaktır. Zihinsel olarak o kadar çok yorulacaksınız ki pes etmek istediğiniz noktalar olacak. Bu tüm deneyimli veri analistlerinin en başta yaşadığı genel bir sorundur. Kime sorarsanız sorun ilk başlarda bocaladıklarını söyleyecektir. İzleyeceğiniz birçok videoda da bunu görebilirsiniz.

Veri analistleri arasında yaygın olan "procrastination" adlı okuması zor bir tabir de vardır. "Erteleme hastalığı" olarak da bilinen procrastination, eğitim hayatımız boyunca en az bir kez de olsa karşılaştığımız "çalışmama isteği", "çalışmamak için bahane uydurmak" gibi fiillerle örneklendirilebilir. Bu sebeple veri bilimi ve veri analizinde procrastination'a mümkün olduğunca dikkat edin. Sürekli erteleme hastalığı ile boğuşursanız bu alandaki gelişiminiz de sekteye uğrayacaktır. Özetle, veri bilimi ve veri analizine başladıktan sonra kendinizi disiplin altına almaya çalışın.

Evet, tüm anlatacaklarım bu kadar. Umarım veri bilimi ve veri analizi öğreniminiz boyunca faydalı olurum. Aklınıza takılan her türlü konuda zinzinzibidi@outlook.com.tr mail adresimi kullanabilirsiniz.

Başarılar!

<<< Ana Sayfa
İstatistik >>>