Makine öğrenmesinin temeli bu data setidir. 28X28 pixel, el yazısı rakamlardan oluşur. Toplamda 70.000 resim var.
Devamı...Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..
Makine öğrenmesinin temeli bu data setidir. 28X28 pixel, el yazısı rakamlardan oluşur. Toplamda 70.000 resim var.
Devamı...Confusion Matrix(Hata Matrisi): sınıflandırma problemleri için kurulan modellerin performans değerlendirmesinde kullanılabilen bir ölçüt olarak ifade edebiliriz. Confusion Matrix · Hata Matrisi · Karmaşıklık Matrisi · Karışıklık Matrisi gibi çeşitli isimlendirmeler mevcuttur.
Devamı...İngilizce olasılık anlamına gelen "probability" sözcüğünden gelen p değeri, bir araştırma örnekleminde değişkenler arasındaki fark veya ilişkinin, gerçekte bir ilişki veya fark yokken sadece şans eseri ortaya çıkmış olma olasılığıdır. Ayrıca "p-value", örneğin bir veri içinde gerekli ve gereksiz değişkenlerin tespitinde kullanılabilmektedir.
Devamı...Veriyi makine öğrenmesi algoritmalarına sokmadan önce, yani model için hazırlarken, veri üzerinde yapacağımız ön işlemlerden birisi de veri ölçekleme(feature scaling) işlemidir. Yöntemin amacı, nümerik veriler arasında farklılığın çok fazla olduğu durumlarda verileri daha dar bir aralığa sıkıştırmaktır.
Devamı...Backward Elimination-Geri Eleme, modelimizin başarısında değişkenlerin önemini anlamak, en önemli değişkenleri seçmek için yapılan bir yöntemdir. Değişkenlerin hangisinin sisteme daha fazla etkisi olduğunu anlamak için kullanılır.
Devamı...Kullandığımız modelin ne kadar sağlıklı, kullanılabilir olduğunu test etmek için veri setimizi train ve test olarak iki parçaya ayırırız.
Devamı...Makine Öğrenmesi Algoritmaları için veriyi hazır hale getirme yollarından birisi de veri birleştirme işlemidir. Bunun için Pandas kütüphanesiden DataFrame nesnesini ve concat metodunu kullanacağız.
Devamı...Makine öğrenme algoritmaları doğrudan kategorik veriler üzerinde çalışmamaktadır bu yüzden verilerimizin sayısal verilere dönüştürülmesi gerekmektedir. Makine öğrenmesi algoritmalarında kullanılan veri setlerindeki kategorik sınıflara sahip özniteliklerin, sayısal veri tipi ile ifade edilmesi için label encoding ve one-hot encoding işlemleri gerçekleştirilebilir.
Devamı...Büyük hacimli veri setlerinde kayıp ya da eksik değerlerin bulunması sıkça karşılaşılan bir durumdur. Araştırmacıların elde ettiği verilerde, bazı nedenlerden dolayı eksik yada kayıp değerler olabiliyor. Veri setinin kalitesini yükseltmek için bu tür verilerin saptanması, veri setinden silinmesi ve bir takım yöntemlerle tamamlanması gerekir.
Devamı...