Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..

friends friends friends

R ile Normallik Testi

Veri analizine başlamadan önce verinizin normal dağılıma sahip olup olmadığını iki şekilde anlayabilirsiniz. 1- Grafiksel yöntemler(Histogram Grafiği vs.) 2- İstatistik yöntemler(hapiro-Wilk testi ve Kolmogorov-Smirnov testi)

R ile Normallik Testi

Resim 1: "kusursuz" Normal Olasılık Dağılımı(Histogram ile gösterimi)

Veri analizine başlamadan önce verinizin Normal Dağılıma sahip olup olmadığını yani normallik kotrolünü iki şekilde anlayabilirsiniz.

R da Normallik Testi Yöntemleri

  1. Grafiksel yöntemler dağılımın normal olup olmadığına yönelik hızlı bir fikir edinmeye yardımcı olacaktır. (Örneğin: Histogram Grafiği)
  2. İstatistiksel olarak verinin normal dağılım gösterip göstermediğine bakmak için normallik testleri uygularız. (Örneğin: Shapiro-Wilk testi ve Kolmogorov-Smirnov testi)

1- R'da Histogram Grafiği Çizimi

Örnek bir vektör içindeki verilerin(Öğrencilerin Sınav Notları) Histogram grafiğini çizdirelim:

sinav_notlari<-c(40, 52, 65, 15, 30, 100, 90, 55, 45, 74, 80, 36, 25, 65, 60, 40, 45, 78, 50, 70)
hist(sinav_notlari, breaks = "Sturges", freq = NULL, right = TRUE, col = c('#5799c6'), main="Sınav Notları | R")
R ile Normallik Testi Histogram Grafiği

Resim 2: R Histogram Grafiği Çizimi

Bu grafiğe hızlıca göz atarak normal dağılım ile ilgili belirli bir yorum yapılabilir ancak İstatistiksel olarak ayrı bir test daha yapabiliriz.

2- Shapiro-Wilk Normallik Testi

Testimizi yapalım:

sinav_notlari<-c(40, 52, 65, 15, 30, 100, 90, 55, 45, 74, 80, 36, 25, 65, 60, 40, 45, 78, 50, 70)
shapiro.test(sinav_notlari)

Hipotez:

Öncelikle Hipotezimizi yazalım:

  1. H0: Veriler Normal Dağılıma sahiptir.
  2. H1: Veriler Normal Dağılıma sahip değildir.

Yorum:

Yanılma Olasılığı: Yanılma olasılığı olarak α = 0.05 olarak seçilmiştir(p anlamlılık düzeyi %5 alınmıştır).

p-value = 0.9984 olarak hesaplanmıştı, bu değer yanılma olasılığından büyük olduğu için( 0.9984 >0.05 ), H0 Hipotezi reddedilemez. Yani α = 0.05 anlamlılık düzeyinde(95% güven seviyesinde) veriler Normal Dağılıma sahiptir diyebiliriz.

R ile Normallik Testi R da normallik testi Normal dağılım R and Normal Distribution R and Shapiro-Wilks R ile normal dağılım R ile normallik testi R ile Shapiro-Wilks Shapiro-Wilks Normallik kontrolü
0 Beğeni
Veri R-Programlama
Önceki Yazı

pd.concat nedir?

12 Ekim 2022 tarihinde yayınlandı.
Sonraki Yazı

Look Fiilinin Farklı Anlamları

12 Ekim 2022 tarihinde yayınlandı.
arrow