Jaka intuicja kryje się za wymiennymi próbkami pod hipotezą zerową?

15

Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym i jednym założeniu, gdy przy użyciu tego rodzaju testu zakłada się zamienność próbek w ramach hipotezy zerowej. Warto również zauważyć, że tego rodzaju podejście można również zastosować, gdy istnieją więcej niż dwie próbki, na przykład zaimplementowane w coinpakiecie R.

Czy możesz zilustrować to założenie jakimś językiem figuratywnym lub intuicyjną koncepcją w prostym języku angielskim? Byłoby to bardzo przydatne, aby wyjaśnić tę pomijaną kwestię wśród niestatystów takich jak ja.

Uwaga:
Bardzo pomocne byłoby wspomnienie przypadku, w którym zastosowanie testu permutacji nie zachowuje się lub jest nieważne przy tym samym założeniu.

Aktualizacja:
Załóżmy, że mam losowo 50 zebranych pacjentów z lokalnej kliniki w mojej dzielnicy. Zostali losowo przydzieleni do otrzymanego leku lub placebo w stosunku 1: 1. Wszystkie zostały zmierzone dla paramertera 1 Par1w V1 (poziom wyjściowy), V2 (3 miesiące później) i V3 (1 rok później). Wszystkie 50 osobników można podzielić na 2 grupy na podstawie cechy A; Dodatni = 20 i A ujemny = 30. Można je również podzielić na kolejne 2 grupy na podstawie cechy B; B dodatnie = 15 i B ujemne = 35.
Teraz mam wartości Par1od wszystkich badanych podczas wszystkich wizyt. Czy przy założeniu wymienności mogę dokonać porównania między poziomami Par1stosowania testu permutacyjnego, gdybym:
- Porównał pacjentów z lekiem z tymi otrzymującymi placebo w V2?
- Czy porównać przedmioty z cechą A z tymi, które mają cechę B w V2?
- Porównać osoby z cechą A w V2 z osobami z cechą A w V3?
- W jakiej sytuacji to porównanie byłoby nieważne i naruszałoby założenie wymienności?

doktorat
źródło
4
Załóżmy, że miałem każdą obserwację na osobnym arkuszu luźnego papieru, a gdy podałem ci stos, poślizgnąłem się, a arkusze wyleciały we wszystkie strony, gdy opadły na podłogę. Szkoda by było, gdyby to zniszczyło ważność testu, który miałeś nadzieję wykonać na tych danych. Jeśli twoje spostrzeżenia są wymienne, a na tej podstawie przeprowadzasz test, pocieszasz mnie i mówisz, żebym się nie martwił, pomagając mi zbierać papiery z podłogi. Jeśli nie, a gromadzenie danych było szczególnie drogie, być może będę musiał uciekać przez całe życie.
kardynał
2
Z drugiej strony kolejność ma znaczenie dla takich danych, jak dane szeregów czasowych (ogólnie), a testy powinny zasadniczo przestrzegać tej kolejności w odpowiedni sposób.
kardynał
@cardinal, podczas gdy twoja intuicyjna historia nakreśliła żywy obraz tego założenia, ale wciąż jestem zdezorientowany, jak ocenić, czy upadłe cenne dokumenty można wymienić, czy nie. Jeśli to możliwe, możesz ubiegać się o kolejny komentarz!
doktorat

Odpowiedzi:

7

fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1)itp.). Jeśli tak nie jest, liczenie permutacji nie jest prawidłowym sposobem testowania hipotezy zerowej, ponieważ każda permutacja będzie miała inną wagę (prawdopodobieństwo / gęstość). Testy permutacyjne zależą od każdego przypisania danego zestawu wartości liczbowych do zmiennych o tej samej gęstości / prawdopodobieństwie.

fa(x1=1,x2)=2),X3)=3 ...XN.=N.)fa(x1=N.,x2)=N.-1,X3)=N.-2 ...XN.=1)


źródło
+1, chociaż wymienność jest dobrze wyjaśniona, ale wciąż natknąłem się, próbując zastosować metaforę słoików na studium w ręku. (zobacz aktualizację pytania). Biorąc pod uwagę czas trwania wizyt i podgrupowanie na podstawie funkcji, jak mogę ocenić, czy porównanie tych wartości byłoby wymienne, czy nie?
doktorat
@doctorate: wygląda na to, że stratyfikujesz swoje grupy według czynników, które są istotne dla wyniku Par1, prawda? Tak długo, jak używasz permutacji w obrębie określonego kwadrantu A / B, zakładam, że twoi badani są wymienni. Twój pierwszy test, który obejmie wszystkie funkcje, będzie musiał zostać poddany dalszemu przetwarzaniu, zanim będziesz mógł skorzystać z testu polegającego na wymienności. w szczególności należy obliczyć efekt leczenia i skorygować mylące skutki funkcji A i B - w przeciwnym razie rozmiar goupu wpłynie na ogólne wyniki (paradoks
1
@doctorate: Zdałem sobie sprawę, że mój powyższy komentarz mógł być w pewnym sensie ukośny, co chcesz: słoiki w twoim przypadku byłyby parami cech, tj. (A +, B +), (A-, B +), (A +, B -), (B-, A-) w sumie 4 „słoiki”. Czy to pomaga uczynić go bardziej konkretnym?
Tks, ale co myli nie-statystyków takich jak ja, to jak można ocenić, czy założenie to zostało spełnione, czy nie? często są testy sprawdzające założenia, np. dla normalności istnieje test Shapiro-Wilka. Ale zastanawiam się, jaki test zbadałby wymienność? w przeciwnym razie byłaby to bardzo trudna lub niejasna definicja, a dwóch statystyk może nie zgodzić się na tę lub inną podgrupę. Jak wspomniałeś, w kwadrancie A / B nie ma problemu, ale w przypadku Drug / Placebo wykazałeś pewne obawy. Czy istnieje jakikolwiek test kwasowy dla tego założenia?
doktorat
2
Jeśli chodzi o wymienność, nie ma „testu” na wymienność. W przeciwieństwie do niezależności (która jest testowalna), zamienność jest raczej założeniem modelowania, w którym gdybyś wziął powtarzalne próbki, takie jak ta, którą pobrałeś, okazałoby się, że każda permutacja występuje dokładnie w tym samym ułamku czasu. Masz tylko 1 próbkę, więc nie możesz jej „przetestować”.