Co oznacza „normalizacja” i jak sprawdzić, czy próbka lub rozkład są znormalizowane?

18

Mam pytanie, w którym prosi się o sprawdzenie, czy rozkład jednolity ( Unjafaorm(za,b) ) jest znormalizowany.

  1. Po pierwsze, co to znaczy znormalizować dowolny rozkład?
  2. I po drugie, jak przejść do sprawdzenia, czy rozkład jest znormalizowany?

Rozumiem, obliczając otrzymujemy znormalizowane dane , ale tutaj prosi się o sprawdzenie, czy rozkład jest znormalizowany, czy nie.

Xmeansd
Ada
źródło
3
To, co oznacza znormalizowanie rozkładu, nie jest takie proste (i zwykle nie jest to normalizacja rozkładu, ale zmienna losowa). Na przykład, w przypadku jednolitego, niektórzy ludzie mogą oznaczać „liniowo przeskalowane tak, aby uzyskać standardowy mundur” (tj aby = 0 i b = 1 ) ... podczas gdy inna osoba może oznaczać „liniowo przeskalowane tak aby uzyskać średnią 0 i sd 1 ”. Jeśli chodzi o mundur, zwykle zakładam, że pierwszy, ale jak widać z odpowiedzi poniżej, inni ludzie mogą uznać to za coś innego. Najlepszą opcją jest poproszenie osoby posługującej się tym terminem, aby była mniej dwuznaczna. a=0b=1
Glen_b -Reinstate Monica
1
Bardziej konwencjonalne terminy są standaryzowane (w celu osiągnięcia średniej zero i SD jednego) i znormalizowane (w celu dostosowania zakresu do przedziału lub zmiany skali normy wektorowej na 1 ). Zatem ponowne ekspresji X ( X - średnia ) / S D jest standaryzacja podczas mnożenia gęstości f o stały C do - C, F ( x ) d x =[0,1]1X(X-oznaczać)/S.refado jestnormalizacją, ponieważf ( x ) d x jestnormą L 1 dla f . -dofa(x)rex=1fa(x)rexL.1fa
whuber
Zapytany również na math.SE.
Dilip Sarwate,
1
Proszę nie przesyłać pocztą , @Ada. To jest niezgodne z polityką SE. Jeśli opublikujesz pytanie na 1 stronie, a następnie uważasz, że powinieneś je zamieścić na innym, oflaguj swoje pytanie i poproś moderatorów o migrację.
gung - Przywróć Monikę

Odpowiedzi:

33

Niestety, terminy są używane w różny sposób w różnych polach przez różne osoby w tym samym polu itp., Więc nie jestem pewien, jak dobrze można na nie odpowiedzieć tutaj. Powinieneś upewnić się, że znasz definicję, której Twój instruktor / podręcznik używa do „znormalizowanego”. Oto jednak niektóre popularne definicje:

Wyśrodkowany: znormalizowanych: X - średni

X-mmizan
znormalizowany:X-min(X)
X-oznaczaćsd
Normalizacjaw tym sensie przeskalowuje dane do interwału jednostkowego. Standaryzacjazamienia twoje dane w wynikiZ, jak zauważa @Jeff. Acentrowaniesprawia, że ​​średnia twoich danych wynosi0.
X-min(X)max(X)-min(X)
z0

Warto tutaj uznać, że wszystkie trzy są transformacjami liniowymi ; jako takie nie zmieniają kształtu twojej dystrybucji . Oznacza to, że czasami ludzie nazywają -score transformacji „normalizacji” i wierzą, ze względu Z stowarzyszenia -Wyniki z rozkładu normalnego, który to uczynił swoje dane rozkład normalny. To nie jest tak (jak zauważa @Jeff i jak można to stwierdzić, rysując swoje dane przed i po). Jeśli jesteś zainteresowany, możesz zmienić kształt swoich danych , na przykład za pomocą rodziny transformacji Box-Cox . zz

Jeśli chodzi o sposób weryfikacji tych przekształceń, zależy to od tego, co dokładnie to oznacza. Jeśli chcą po prostu sprawdzić, czy kod działa poprawnie, możesz sprawdzić środki, SD, minimum i maksima.

gung - Przywróć Monikę
źródło
1
Widziałem znormalizowane używane do sugerowania znormalizowanego lub sugerowania dopasowania do standardowego rozkładu normalnego, tj. , więc z trzech znormalizowanych jest najprawdopodobniej źle zrozumiany. Komentarz Ady dotyczący zastosowania stałej normalizującej do funkcji prawdopodobieństwa jest kolejną możliwą interpretacją. Φ-1(fa(X))
Henry
4

Korzystając ze wzoru podanego dla każdego wyniku w próbie, konwertujesz je wszystkie na z-score .

01

Celem tego jest umieszczenie wszystkiego w jednostkach względem odchylenia standardowego próbki. Może to być przydatne do różnych celów, takich jak porównanie dwóch różnych zestawów danych, które zostały ocenione przy użyciu różnych jednostek (być może centymetrów i cali).

Ważne jest, aby nie mylić tego z pytaniem, czy rozkład jest normalny , tj. Czy jest zbliżony do rozkładu Gaussa .

Jeff
źródło
więc aby sprawdzić, czy rozkład Uniform został znormalizowany, czy równoważne byłoby powiedzenie E (X) = 0 i Var (X) = 1, gdzie X ~ Uniform (a, b)?
2
dane nie muszą nawet pochodzić z jednolitego rozkładu, mogą pochodzić z dowolnego rozkładu. jest to również prawdą tylko przy użyciu podanej formuły; dane mogą być znormalizowane w inny sposób niż za pomocą Z-score. na przykład, wyniki IQ są znormalizowane z wynikiem 100 i odchyleniem standardowym wynoszącym 15.
Jeff
1

Po konsultacji z TA zadano pytanie, czy

-fa(x)rex=1

gdzie fa(x) w tym przypadku jest gęstością munduru (a, b).

Ada
źródło
2
Stosowaną terminologią jest to, że funkcja gęstości prawdopodobieństwa rozkładu jest znormalizowana. Ponieważ odzwierciedla to fakt aksjomatyczny, że całkowite prawdopodobieństwo musi być równe1, pytanie, czy jakakolwiek dystrybucja jest znormalizowana (w tym sensie) zawsze ma tę samą banalną odpowiedź: oczywiście.
whuber
Właśnie to jesteśmy proszeni o weryfikację. f (x) tak naprawdę nie musi być pdf i może to być dowolna funkcja nieujemna. Dla każdej nieujemnej funkcji, której powyższe nie spełnia, zawsze możemy pomnożyć przez stałą normalizującą
Ada
1
Nie zawsze. Na przykład pozwólfa(x)=mi-x, funkcja nieujemna zdefiniowana na wszystkich liczbach rzeczywistych: nie ma stałej normalizującej. Ale kiedy powiedziano ci, tak jak w pytaniu, że „taki a taki jest plik PDF dla takiej a takiej dystrybucji”, nie ma nic do zweryfikowania: z definicji integruje się z jednością.
whuber
To prawda, że ​​nie jest to żadna nieujemna funkcja, w której możemy sprawić, że spełnia powyższy warunek, nawet jeśli pomnożymy ją przez stałą normalizującą.
Ada,