Jestem zagubiony w normalizacji, czy ktoś mógłby mnie poprowadzić, proszę.
Mam wartości minimalne i maksymalne, powiedzmy odpowiednio -23,89 i 7,54990767.
Jeśli otrzymam wartość 5,6878, jak mogę skalować tę wartość w skali od 0 do 1.
normalization
Angelo
źródło
źródło
Odpowiedzi:
Jeśli chcesz znormalizować swoje dane, możesz to zrobić, sugerując i po prostu obliczyć:
gdzie i to teraz twoje znormalizowane dane. Jako dowód koncepcji (choć o to nie prosiłeś), oto kod i towarzyszący mu wykres ilustrujący ten punkt:x=(x1,...,xn) zi ith
R
źródło
illustrate the point
(poprawnej) odpowiedzi?Ogólny wzór jednej linii liniowo przeskalowania wartości danych Obserwując min i max do nowego dowolnego zakresu min' do max” jest
źródło
a
ib
stałych, a następnie po prostu zastosowałeśnewvalue = a * value + b
.a = (max'-min')/(max-min)
ib = max - a * max
b = max' - a * max
Lubb = min' - (a * min)
u = -1 + 2.*(u - min(u))./(max(u) - min(u));
.Oto moja implementacja PHP do normalizacji:
Ale kiedy budowałem własne sztuczne sieci neuronowe, musiałem przekształcić znormalizowane dane wyjściowe z powrotem do oryginalnych danych, aby uzyskać dobry odczyt na wykresie.
W normalizacji wykorzystuje się następującą formułę:
źródło
Dzielenie przez zero
Należy pamiętać, że
max - min
może to być zero. W takim przypadku nie chcesz wykonywać tego podziału.Tak się dzieje, gdy wszystkie wartości na liście, które próbujesz znormalizować, są takie same. Aby znormalizować taką listę, każdy element byłby
1 / length
.Przykład:
źródło
normalize([12, 20, 10])
wyjścia[0.2, 1.0, 0.0]
, czyli takie same, jakie można uzyskać(val - min) / (max - min)
.odpowiedź jest prawidłowa, ale mam sugestię, co jeśli dane treningowe napotkają pewną liczbę poza zakresem? możesz użyć techniki zgniatania. nigdy nie wyjdzie poza zasięg. raczej niż to
polecam użyć tego
z takim zgniataniem w min i maks. zasięgu
a wielkość oczekiwanej luki poza zakresem jest wprost proporcjonalna do stopnia pewności, że wartości będą poza zakresem.
Aby uzyskać więcej informacji, możesz google: wyciskanie numerów spoza zakresu i zajrzyj do książki przygotowywania danych „Dorian Pyle”
źródło
Spróbuj tego. Jest to zgodne ze skalą funkcji
źródło