Próbuję zrozumieć bardzo podstawową koncepcję odchylenia standardowego.
Ze wzoru
Nie rozumiem, dlaczego powinniśmy zmniejszyć o połowę populację „N”, tj. Dlaczego chcemy wziąć kiedy tego nie zrobiliśmy ? Czy to nie wypacza populacji, którą rozważamy?
To nie powinna być formuła
źródło
Pierwszą rzeczą do zrozumienia jest to, że odchylenie standardowe (std) różni się od średniego odchylenia bezwzględnego . Te dwa definiują różne właściwości matematyczne dotyczące danych.
W przeciwieństwie do średniego odchylenia bezwzględnego, odchylenie standardowe (std) waży więcej do wartości, które są dalekie od średniej, co odbywa się poprzez podniesienie do kwadratu wartości różnicy.
Np. Dla następujących czterech punktów danych:
średnie bezwzględne odchylenie (aad) , oraz=16/4=4.0
Odchylenie standardowe (standardowe) =80/4−−−−√=2–√0=4.47
W danych są dwa punkty oddalone od średniej o 6, a dwa punkty oddalone od średniej o 2. Odchylenie 4,47 ma więc większy sens niż 4.
Ponieważ całkowita obserwacja jest zawsze , do obliczenia standardu nie nurkujemy przez , zamiast tego dzielimy całkowitą wariancję przez i bierzemy pierwiastek kwadratowy, aby doprowadzić ją do tej samej jednostki, co oryginalne dane.N N−−√ N
źródło
@Mahesh Subramaniya - To jest po prostu matematyka . Kiedy mamy oryginalną wartość jaka/b=(−)d . Możemy uzyskać tę samą wartość za pomocą tych dwóch równańa2╱b=c i c╱b−−−−√=d .
Np. Po prostu zrób to−5╱2 = −2.5 . Ale chcemy tylko wartości, a nie minus.
Teraz,−52╱2=12.5 . I ,12.5╱2−−−−−−√=2.5
źródło