Normal Dağılım Nedir?
Normal Dağılım
Verilerin normal dağılım göstermesi pek çok istatistiksel analizin ön koşuludur. Örneğin parametrik testlerin kullanılabilmesi için verilerin normal dağılması gerekmektedir. Bu nedenle herhangi bir analize başlamadan önce verilerin normalliğinin test edilmesi akıllıca bir başlangıç olacaktır. Böylece çalışmanın gidişatı konusunda bir yol haritası çıkarmak da mümkün olacaktır.
Verilerin normal dağılımı, Gauss Eğrisi nedir?
Normal dağılım bazen karşımıza Gauss Eğrisi ya da Gauss Dağılımı olarak da çıkabilir. Çok basit şekilde açıklamak gerekirse bir veri setinde medyan değerin ve ortalamanın birbirine çok yakın (idealinde eşit) olması durumudur. Yani verilerin çoğunluğu ortalama değer/medyan etrafında kümelenir ve bir tepecik oluşturur. Grafiğin simetrik olması en önemli özelliğidir.
Normal Dağılım Testleri
Verilerin normal dağılımını grafikler yoluyla veya normallik testleri ile test edebiliriz. İki yöntemin de kendi içerisinde avantajları ve dezavantajları vardır. Analitik testler de denilen normallik testleri objektiflik açısından bakıldığında oldukça avantajlıdır. Ancak örnek büyüklüğü, uç değerlerin varlığı gibi bazı etkenler nedeniyle bazen fazla hassas ya da yeteri kadar hassas olmamaları dolayısıyla hatalı sonuçlar alabiliriz. Grafikler ise bu tarz hassasiyetin talebi tam olarak karşılamadığı durumlarda faydalı olur. Uç değerleri grafik üzerinde gözle görmek testlerde bazı sonuçların neden çıktığını anlamakta fazlasıyla yardımcı olur. Bu nedenle iyi bir istatistikçi yalnızca grafiklere ya da yalnızca testlere güvenmek yerine iki aracı da birlikte kullanmayı tercih eder.
Kolmogorov-Smirnov testi ve Shapiro-Wilk normal dağılım testlerini hangi durumlarda kullanırız?
Normalliğin testi spss yazılımında yapılıyorsa özellikle iki test öne çıkar. Bu testler Kolmogorov-Smirnov ve Shapiro-Wilk testleridir. Shapiro-Wilk testi çoğunlukla tercih edilen bir normallik testidir. Bu testin istatistiksel gücü oldukça yüksektir. 50’nin üzerindeki örneklem büyüklüklerinde bu testi tercih edebiliriz. Ancak unutulmaması gereken bir nokta bu testin uç değerlere daha duyarlı olmasıdır. Yani veri setinizde uç değerler bir problemse Shapiro-Wilk testinden sağlıklı bir sonuç alamayabilirsiniz.
Peki Kolmogorov-Simirnov testini hangi durumlarda kullanabiliriz? Kolmogorov-Simirnov uç değerlere Shapiro-Wilk kadar duyarlı değildir. Verilerde tekrar sayısı az ise ve örneklem büyüklüğü 30’un üzerinde ise (güvenli alanda kalmak için 50 de baz alınabilir) bu testi tercih edebilirsiniz.
Skewness ve Kurtosis/ Çarpıklık ve Basıklık Değerleri nedir?
Çarpıklık ve basıklık ya da skewness ve kurtosis ismin de belirttiği üzere dağılım grafiğinin, normal dağılıma kıyasla ne kadar çarpık ya da ne kadar basık olduğunun bir göstergesidir. Medyan ve ortalama birbirine yaklaştıkça çarpıklık da sıfıra yaklaşır. Ortalama medyan değerden küçükse negatif, büyükse pozitif çarpıklık söz konusudur. Basıklıkta ise basıklık değeri pozitif ise eğri daha dik/sivri negatif ise daha basıktır. Dağılımın normal kabul edilebilmesi için bazı kaynaklar çarpıklık ve basıklık değerlerinin +1 ve -1 arasında bazı kaynaklar ise +3 ve -3 arasında olması gerektiğini söylemektedir. Ancak tek başına çarpıklık ve basıklık değerlerinin belirli aralıklar içerisinde değerlendirilmesi doğru olmayacaktır. İyi bir istatistikçi yalnızca bu aralıklara bağlı kalmayarak dağılım grafiklerine de dikkat edecektir. Ayrıca parametrik ve parametrik olmayan testler konusunda da açıkladığımız üzere parametrik testlerin çarpık dağılımlarda bile uygulanabildiği durumlar vardır. Bu nedenle deneyimli bir istatistikçi literatürde önerilen aralıklara dikkat ederek ama yalnızca bunlara bağlı kalmadan en doğru yorumlamayı gerçekleştirir.
Yüksek lisans ve doktora tezlerinizde istatistiksel çalışmalarınızda destek almak isterseniz bize ulaşabilirsiniz.