Jak mogę sprawdzić, czy średnia (np. Ciśnienie krwi) podgrupy (np. Tych, którzy zmarli) różni się od całej grupy (np. Wszystkich, którzy mieli chorobę, w tym tych, którzy zmarli)?
Oczywiście pierwsza z nich jest podgrupą drugiej.
Jakiego testu hipotez powinienem użyć?
hypothesis-testing
group-differences
użytkownik1061210
źródło
źródło
Odpowiedzi:
Jak zauważa Michael, porównując podgrupę z ogólną grupą, badacze zwykle porównują podgrupę z podzbiorem całej grupy, która nie obejmuje podgrupy.
Pomyśl o tym w ten sposób.
Jeśli jest proporcją, która umarła, a jest proporcją, która nie umarła, ip 1 - p
gdzieoznacza ogólną średnią, jest średnią tych, którzy zginęli, a jest średnią tych, którzy jeszcze żyją. NastępnieX¯. X¯d X¯a
Załóżmy, że . Stąd .Xd¯≠Xa¯ X.¯≠pXd¯+(1−p)Xd¯=Xd¯
Załóżmy, że . Stąd , a następnie i od , a następnie .X.¯≠Xd¯ Xd¯≠pXd¯+(1−p)Xa¯ (1−p)Xd¯≠(1−p)Xa¯ (1−p)≠0 Xd¯≠Xa¯
To samo można zrobić w przypadku nierówności.
Dlatego badacze zazwyczaj testują różnicę między podgrupą a podzbiorem całej grupy, która nie obejmuje podgrupy. To powoduje, że podgrupa różni się od całej grupy. Umożliwia także stosowanie konwencjonalnych metod, takich jak niezależny test t grup.
źródło
Sposobem na przetestowanie tutaj jest porównanie tych, którzy mieli chorobę i zmarli, z tymi, którzy mieli chorobę i nie umarli. Możesz zastosować test dwóch próbek t lub test sumy rang Wilcoxona, jeśli nie można założyć normalności.
źródło
To, co musisz zrobić, to przetestować proporcje populacji (duża próbka). Statystyki dotyczące proporcji populacji często mają wielkość próby, która jest duża (n => 30), dlatego normalny rozkład aproksymacji i powiązane statystyki są wykorzystywane do ustalenia testu, czy proporcja próby (ciśnienie krwi zmarłych) = proporcja populacji (wszyscy który miał chorobę, w tym tych, którzy zmarli).
Oznacza to, że gdy wielkość próbki jest większa lub równa 30, możemy użyć statystyki z-score do porównania proporcji próbki do proporcji populacji przy użyciu wartości p-odchylenia standardowego próbki, aby oszacować odchylenie standardowe próbki, p jeśli nie jest znany.
Rozkład próbki P (proporcja) jest w przybliżeniu normalny ze średnią lub oczekiwaną wartością, E (P) = p-hat i błąd standardowy, sigma (r) = sqrt (p * q / n).
Oto prawdopodobne pytania testowe, jakie można postawić przy porównywaniu dwóch proporcji:
H0: p-hat = p vs H1: p-hat nie jest równy p
H0: p-hat = p vs H1: p-hat> p
H0: p-hat = p vs H1: p-hat <p
Statystyki używane do testowania dużej próby wynoszą:
Statystyka testu jest związana ze standardowym rozkładem normalnym:
Statystyka wyniku Z dla proporcji
p-hat-p / sqrt (pq / n)
, gdzie p = oszacowanie proporcji, q = 1-p i jest proporcją populacji.
Średnia proporcji to:
np / n = p-hat = x / n
Odchylenie standardowe:
= sqrt (npq / n) = sqrt (pq / n)
Zasady decyzyjne:
Test górnego ogona (): (H0: kapelusz P> = P)
Zaakceptuj H0, jeśli Z <= Z (1-alfa)
Odrzucić H0, jeśli Z> Z (1-alfa)
Test kończyn dolnych (Ha: P-hat <= P):
Zaakceptuj H0, jeśli Z> = Z (1-alfa)
Odrzucić H0, jeśli Z
Test dwustronny (Ha: kapelusz P nie jest równy P):
Zaakceptuj H0, jeśli Z (alfa / 2) <= Z <= Z (1-alfa / 2)
Odrzucić H0, jeśli Z <Z (alfa / 2) lub jeśli Z> Z (1-alfa / 2)
źródło