Devamı...
Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..
Bir veri setinde hangi özelliklerin(kolonların) ne kadar önemli olduklarını(feature importance) anlamak için Random Forest kullanabiliriz. Aşağıda İris veri seti üzerinden bunu nasıl yaptığımızı görebilirsiniz:
Devamı...K-modes algoritması: Makine öğrenmesi kümeleme işlemlerinde tüm veriler kategorik olduğunda kullanılır. K-Modes, kategorik veriler üzerinde çalışan bir kümeleme (clustering) algoritmasıdır. Makine öğrenmesinde benzer özelliklere sahip veri gruplarını keşfetmek amacıyla kullanılır ve özellikle sayısal olmayan veriler için geliştirilmiştir. K-Means algoritmasının kategorik verilere uyarlanmış bir versiyonu olarak düşünülebilir.
Devamı...Devamı...
Temel bileşen analizi (PCA), çok değişkenli istatistiklerde bir veri madenciliği tekniğidir. Verinin bütünlüğünden ödün vermeden, veri içindeki bilgilerin çoğunu korurken, boyutsallık azaltma yoluyla yüksek boyutlu verileri düşük boyutlu verilere dönüştürür
Devamı...Derin öğrenme uygulamalarında, öğrenme işleminin sağlıklı bir şekilde sonuçlanması için hata fonksiyonunun mutlak minimum değerinin bulunması gerekmektedir. Bu işlem, optimizasyon yöntemleri kullanılarak gerçekleştirilmektedir.
Devamı...İlk olarak 1970'lerde Amerikan istatistikçi John Tukey tarafından ortaya atılan Keşifsel Veri Analizi (EDA: Exploratory Data Analysis), veri setlerini genellikle görsel yöntemlerle anlama , inceleme, özetleme ve analize hazır hale getirme işlemlerini kapsamaktadır.
Devamı...