İstatistikte veriler, bazı durumlarda Standardizasyon adı verilen bir yöntem ile ortalaması 0, standart sapması 1 olan yeni bir dağılıma sıkıştırılır. Bu dağılımdaki her değere Z-skor denir. Başka bir deyişle Z-skor, her değerin ortalamadan kaç standart sapma uzaklıkta olduğunu gösterir.
import pandas as pd
import numpy as np
import scipy.stats as stats
data = np.array([10, 12, 15, 5, 20, 2])
stats.zscore(data)
print(stats.zscore(data))
#[-0.11128298 0.22256595 0.72333935 -0.9459053 1.55796168 -1.4466787 ]
Çok boyutlu dizi için:
import pandas as pd
import numpy as np
import scipy.stats as stats
data = np.array([[10, 12, 15, 5, 20, 2],
[12, 15, 5, 8, 20, 1],
[18, 14, 13, 50, 21, 7],
[36, 99, 25, 36, 8, 23] ])
stats.zscore(data,axis=1)
print(stats.zscore(data,axis=1))
"""
[[-0.11128298 0.22256595 0.72333935 -0.9459053 1.55796168 -1.4466787 ]
[ 0.29058259 0.76608137 -0.81891457 -0.34341579 1.55857934 -1.45291295]
[-0.1799928 -0.46798128 -0.5399784 2.12391505 0.03599856 -0.97196112]
[-0.06336401 2.1140539 -0.44354809 -0.06336401 -1.03110531 -0.51267247]]
"""
EXCEL'de Z-Skor
Meraklısına EXCEL formülü:
=STANDARTLAŞTIRMA(A2;ORTALAMA($A$2:$A$7);STDSAPMA.P($A$2:$A$7))