Biorąc pod uwagę tablicę numpy 3 razy 3
a = numpy.arange(0,27,3).reshape(3,3)
# array([[ 0, 3, 6],
# [ 9, 12, 15],
# [18, 21, 24]])
Aby znormalizować wiersze dwuwymiarowej tablicy, o której myślałem
row_sums = a.sum(axis=1) # array([ 9, 36, 63])
new_matrix = numpy.zeros((3,3))
for i, (row, row_sum) in enumerate(zip(a, row_sums)):
new_matrix[i,:] = row / row_sum
Musi być lepszy sposób, prawda?
Być może dla wyjaśnienia: przez normalizację mam na myśli, że suma wpisów na wiersz musi wynosić jeden. Ale myślę, że dla większości ludzi będzie to jasne.
Odpowiedzi:
Nadawanie jest naprawdę dobre do tego:
row_sums = a.sum(axis=1) new_matrix = a / row_sums[:, numpy.newaxis]
row_sums[:, numpy.newaxis]
przekształca sumy_wierszów z bycia(3,)
w bycie(3, 1)
. Kiedy to robisza / b
,a
ib
są nadawane przeciwko sobie.Możesz dowiedzieć się więcej o nadawaniu tutaj, a nawet lepiej tutaj .
źródło
a.sum(axis=1, keepdims=True)
zachowując wymiar pojedynczej kolumny, którą można następnie transmitować bez konieczności używanianp.newaxis
.np.linalg.norm
zamiasta.sum
!row_sums.reshape(3,1)
?Scikit-learn ma funkcję normalizacji, która umożliwia stosowanie różnych normalizacji. „Zrób to sumę do 1” to norma L1, i aby to zrobić:
from sklearn.preprocessing import normalize matrix = numpy.arange(0,27,3).reshape(3,3).astype(numpy.float64) #array([[ 0., 3., 6.], # [ 9., 12., 15.], # [ 18., 21., 24.]]) normed_matrix = normalize(matrix, axis=1, norm='l1') #[[ 0. 0.33333333 0.66666667] #[ 0.25 0.33333333 0.41666667] #[ 0.28571429 0.33333333 0.38095238]]
Teraz twoje wiersze będą sumowane do 1.
źródło
Myślę, że to powinno działać,
a = numpy.arange(0,27.,3).reshape(3,3) a /= a.sum(axis=1)[:,numpy.newaxis]
źródło
W przypadku, gdy próbujesz znormalizować każdy wiersz w taki sposób, aby jego wielkość wynosiła jeden (tj. Długość jednostki wiersza wynosi jeden lub suma kwadratów każdego elementu w wierszu wynosi jeden):
import numpy as np a = np.arange(0,27,3).reshape(3,3) result = a / np.linalg.norm(a, axis=-1)[:, np.newaxis] # array([[ 0. , 0.4472136 , 0.89442719], # [ 0.42426407, 0.56568542, 0.70710678], # [ 0.49153915, 0.57346234, 0.65538554]])
Weryfikacja:
np.sum( result**2, axis=-1 ) # array([ 1., 1., 1.])
źródło
Myślę, że można znormalizować sumę elementów wiersz na 1 przez to:
new_matrix = a / a.sum(axis=1, keepdims=1)
. I normalizację kolumny można wykonać za pomocąnew_matrix = a / a.sum(axis=0, keepdims=1)
. Mam nadzieję, że to może pomóc.źródło
Możesz użyć wbudowanej funkcji numpy:
np.linalg.norm(a, axis = 1, keepdims = True)
źródło
wydaje się, że to też działa
def normalizeRows(M): row_sums = M.sum(axis=1) return M / row_sums
źródło
Możesz również użyć transpozycji macierzy:
źródło
Lub używając funkcji lambda, takiej jak
>>> vec = np.arange(0,27,3).reshape(3,3) >>> import numpy as np >>> norm_vec = map(lambda row: row/np.linalg.norm(row), vec)
każdy wektor vec będzie miał normę jednostkową.
źródło
Oto jeszcze jeden możliwy sposób użycia
reshape
:a_norm = (a/a.sum(axis=1).reshape(-1,1)).round(3) print(a_norm)
Lub też używanie
None
działa:a_norm = (a/a.sum(axis=1)[:,None]).round(3) print(a_norm)
Wyjście :
array([[0. , 0.333, 0.667], [0.25 , 0.333, 0.417], [0.286, 0.333, 0.381]])
źródło
normed_matrix = normalize(input_data, axis=1, norm='l1') print(normed_matrix)
gdzie dane_wejściowe to nazwa tablicy 2D
źródło