Istotne statystycznie vs. niezależne / zależne

9

Jaka jest różnica między posiadaniem czegoś istotnego statystycznie (np. Różnica między dwiema próbkami) a stwierdzeniem, czy grupa liczb jest niezależna lub zależna.

Elpezmuerto
źródło

Odpowiedzi:

9

Istotność w teście niezależnym dla próbek oznacza po prostu, że prawdopodobieństwo (jeśli zerowe były prawdziwe) próbkowania średniej różnicy tak ekstremalnej, jak średnia różnica, z której rzeczywiście pobrałeś próbkę, jest mniejsza niż 0,05.

Jest to całkowicie niezwiązane z zależnymi / niezależnymi. „Zależny” oznacza, że ​​rozkład niektórych indywidualnych obserwacji jest związany z rozkładem innych, na przykład A) są to te same osoby, które przeprowadzają ten sam test drugi raz, B) ludzie w każdej grupie są dopasowani do jakiejś zmiennej przedtestowej, C) osoby w dwóch grupach są spokrewnione (tj. Rodzina). „Niezależny” oznacza, że ​​nie ma takiego połączenia.

Brian
źródło
1
Należy również zauważyć, że p = 0,05 jest nieco arbitralnym progiem. Jeśli uważasz, że 1:20 jest zbyt dużą szansą na fałszywie pozytywny wynik, twoje p powinno być niższe.
naught101
9

Po co zatrzymywać się na t-testy?

Można pomyśleć, że dwie zmienne są nieskorelowane jako dwa wektory ortogonalne, dokładnie tak jak x i y osie w dwuwymiarowym kartezjańskim układzie współrzędnych.

Gdy którykolwiek z dwóch wektorów, powiedzmy x i yjest skorelowany z drugim, będzie pewna część x, która może być rzutowana na y i odwrotnie. Mając to na uwadze, dość łatwo to zauważyć, ponieważ,

x,y=xycos(θ)x,yxy=cos(θ)=r

Gdzie jest współczynnikiem korelacji Pearsona, a jest iloczynem wewnętrznym argumentów. Kiedy się tego nauczyłem, byłem całkowicie oszołomiony tym, jak geometrycznie prosty jest pomysł korelacji. I to zdecydowanie nie jest jedyny sposób pomiaru korelacji między dwiema (lub więcej) zmiennymi.r,

Testowanie istotności to inna gra w piłkę. Często chcemy wiedzieć, o ile dwie (lub więcej) grupy różnią się w zależności od zmiennej wynikowej w wyniku pewnych manipulacji przeprowadzonych na tych grupach. Jak powiedział Brian, chcesz wiedzieć, czy dwie grupy pochodzą z tego samego rozkładu, dlatego obliczasz prawdopodobieństwo próbkowania średniej różnicy (skalowanej przez standardowy błąd średniej) uzyskanej z eksperymentu, biorąc pod uwagę hipotezę zerową (nie ma znaczącej różnicy w środkach) jest prawdą. W badaniach behawioralnych (i często gdzie indziej), jeśli prawdopodobieństwo to jest mniejsze niż 0,05, możesz dojść do wniosku, że różnica między dwoma (lub więcej) średnimi jest prawdopodobnie spowodowana twoją manipulacją.

EDYCJA : Dilip Sarwate wskazał, że dwie nieskorelowane zmienne mogą być statystycznie zależne, więc wyjąłem pierwszą część. Dziękuję za to.

Phillip Cloud
źródło
Wow, moje tło matematyczne jest znacznie bardziej zaawansowane niż moje statystyki. Uważam, że to naprawdę intuicyjny sposób zrozumienia r Pearsona. Ta odpowiedź jest bardzo pomocna, dzięki!
naught101
Zwłaszcza koncepcja, że ​​kowariancja jest tylko produktem wewnętrznym!
naught101
2
-1 dla „Można pomyśleć o dwóch zmiennych niezależnych (czasami nazywanych również nieskorelowanymi)” Niezależność nie jest tym samym, co bycie nieskorelowanym; nieskorelowane zmienne losowe mogą być bardzo zależne.
Dilip Sarwate
OK, dziękuję za naprawienie problemu. Cofam swój głos oddolny.
Dilip Sarwate