Test U Manna-Whitneya: przedział ufności dla wielkości efektu

13

Według Fritza, Morrisa i Richlera (2011; patrz poniżej) można obliczyć jako wielkość efektu dla testu U Manna-Whitneya przy użyciu wzoru Jest to wygodne ja, jak melduję również przy innych okazjach. Chciałbym zgłosić przedział ufności dla oprócz miary wielkości efektu.r = zr rr

r=zN
rr

Oto moje pytania :

  • Czy mogę obliczyć przedziały ufności dla r jak dla r Pearsona, chociaż jest on stosowany jako miara wielkości efektu w teście nieparametrycznym?
  • Jakie przedziały ufności należy zgłaszać w przypadku testów jednostronnych czy dwustronnych?

Edytuj dotyczące drugiego pytania: „Jakie przedziały ufności należy zgłaszać w przypadku testów jednostronnych czy dwustronnych?”

Znalazłem więcej informacji, że IMHO może odpowiedzieć na to pytanie. „Podczas gdy dwustronne limity ufności tworzą przedział ufności, ich jednostronne odpowiedniki są określane jako dolne lub górne granice ufności.” ( http://en.wikipedia.org/wiki/Confidence_interval ). Na podstawie tych informacji dochodzę do wniosku, że nie jest głównym problemem, czy test istotności (np. Test ) był jedno- lub dwustronny, ale jakie informacje są zainteresowane w odniesieniu do CI dla wielkości efektu. Mój wniosek (popraw mnie, jeśli się nie zgadzasz):t

  • dwustronny CI zainteresowany górnymi i dolnymi granicami (w konsekwencji możliwe jest, że dwustronny CI pociąga za sobą 0, chociaż jednostronny test istotności wynosił p <0,05, szczególnie w przypadku, gdy wartość była bliska .05.)
  • jednostronny „CI” zainteresowany tylko górną lub dolną granicą (ze względu na teoretyczne rozumowanie); jednak niekoniecznie jest to główna kwestia interesująca po przetestowaniu ukierunkowanej hipotezy. Dwustronny CI jest idealnie odpowiedni, jeśli skupia się na możliwym zakresie wielkości efektu. Dobrze?

Zobacz poniżej fragment tekstu Fritza, Morrisa i Richlera (2011) na temat oszacowania wielkości efektu w teście Manna-Whitneya z artykułu, o którym mowa powyżej.

„Większość opisanych tutaj oszacowań wielkości efektu zakłada, że ​​dane mają rozkład normalny. Jednak niektóre dane nie spełniają wymagań testów parametrycznych, na przykład dane w skali porządkowej, ale nie przedziałowej. Dla takich danych badacze zazwyczaj zwracają się do nieparametrycznych testów statystycznych, takich jak Manna-Whitneya oraz testu Wilcoxon. Znaczenie tych badań jest zazwyczaj oceniana poprzez dostosowanie rozkładów statystyk testowych do dystrybucji kiedy Przykładowe rozmiary nie są zbyt małe, a statystyczny pakiety, takie jak SPSS, które prowadzą te badania zgłosić odpowiedni wartość oprócz wartości dla lub ;z U T z z r r r 2 η 2 z r = zzzUTzmożna również obliczyć ręcznie (np. Siegel i Castellan, 1988). Wartość można wykorzystać do obliczenia wielkości efektu, na przykład zaproponowane przez Cohena (1988); Wytyczne Cohena dla r są takie, że duży efekt to 0,5, średni efekt to 0,3, a mały efekt to 1 (Coolican, 2009, s. 395). Łatwo jest obliczyć , lub z tych wartości , ponieważ i zrrr2η2z r2

r=zN
r2orη2=z2N
Te oszacowania wielkości efektu pozostają niezależne od wielkości próbki, pomimo obecności N we wzorach. Wynika to z faktu, że z jest wrażliwe na wielkość próbki; dzielenie przez funkcję N usuwa efekt wielkości próby z oszacowanej wielkości efektu wynikowego. ”(s. 12)
szary
źródło
Papier jest dostępny tutaj za darmo .
asac

Odpowiedzi:

9

Jednym wyborem rozmiaru efektu dla testu U Manna-Whitneya jest rozmiar efektu wspólnego języka. W przypadku U Manna-Whitneya jest to odsetek par próbek, który potwierdza ustaloną hipotezę.

Drugim wyborem jest korelacja rang; ponieważ korelacja rang mieści się w zakresie od -1 do +1, ma właściwości podobne do r Pearsona. Ponadto dzięki prostej formule różnicy korelacja rang jest różnicą między rozmiarem efektu wspólnego języka a jego dopełnieniem, co sprzyja interpretacji. Na przykład, jeśli istnieje 100 par próbek, a 70 par próbek popiera hipotezę, wówczas rozmiar efektu wspólnego języka wynosi 70%, a korelacja rang wynosi r = .70 = .30 = .40. Jasne omówienie wielkości efektu wspólnego języka i czterech formuł do obliczenia korelacji rang jest podane przez Kerby w czasopiśmie Innovative Teaching: Kerby (2014) Innovative Teaching

Nawiasem mówiąc, chociaż w artykule o tym nie wspomina, jestem całkiem pewien, że Somers d i korelacja rang dla Manna-Whitneya są równoważne.

DSK
źródło
1
Czy masz na myśli „Na przykład, jeśli istnieje 100 możliwych par”? Test U Manna-Whitneya jest przeznaczony dla niesparowanych danych, więc frazowanie jest dwuznaczne - możesz wyjaśnić czytelnikom, jakie są możliwe pary.
Gung - Przywróć Monikę
1
Dzięki za komentarz i szansę na wyjaśnienie. Odniosłem się do par próbek . Jeśli w próbce doświadczalnej znajduje się 10 obserwacji, a w próbce kontrolnej jest 10 obserwacji, wówczas istnieje 10 * 10 = 100 par próbek . Według Roberta Grissoma wielkość efektu próby jest obiektywnym estymatorem wielkości efektu populacji. Zatem jeśli korelacja rang dla próbki wynosi r = 0,40, jest to obiektywny estymator wielkości efektu populacji.
DSK
Podejrzewałem, że o to ci chodziło, @DSK. Myślę, że to wyjaśnienie pomoże ludziom. Możesz to zmienić w swojej odpowiedzi. Witamy w CV.
Gung - Przywróć Monikę
8

Twój link prowadzi mnie do możliwości zakupu artykułu.

cHmiscrcorr.censcDxyDxy=2×(c12)

Frank Harrell
źródło
Dziękuję za zgłoszenie tego do mojego powiadomienia (link). W swoim pytaniu wstawiłem teraz fragment testu Manna-Whitneya.
szary,
Bardzo dziękuję za odpowiedź. Czy masz pod ręką link do interpretacji indeksu c i D Somersa? Byłbym szczególnie zainteresowany tym, czy to ostatnie można interpretować porównywalnie z r. Mam dwie próbki, aw drugiej próbce (większy N i rozkład normalny) zgłaszam r. Myślę, że ułatwiłoby to porównanie wyników, gdyby zastosowane środki były podobne - oczywiście w miarę możliwości. Dlatego interesowała mnie formuła wspomniana przez Fritza i in. (2011). Więc CI dla ich r nie może być obliczony jak dla r Pearsona, zakładam? Wielkie dzięki jeszcze raz!
szary,
zDxyYDc
Wielkie dzięki za odpowiedź. Szukałem więcej informacji na temat interpretacji Somer's, ale jak dotąd nie odniosłem zbytniego sukcesu. Czy d Somer'a można rozumieć podobnie do współczynnika korelacji Pearsona, np. Czy podniesienie go do kwadratu daje współczynnik determinacji? Byłbym bardzo szczęśliwy, gdyby znaleźć miarę wielkości efektu, którą można interpretować podobnie do r, jeśli taka istnieje.
szary,
Znalazłem więcej informacji na temat wzoru r = Z / √ (N): Rosenthal (1991) pisze, że „możemy z powodzeniem oszacować wielkość efektu r na podstawie samego poziomu ap, o ile znamy wielkość badania (N). Przekształcamy otrzymany p do jego standardowego równoważnika odchylenia normalnego, używając tabeli wartości Z ”.
szary