Powiedzmy, że mamy podane poniżej statystyki
gender mean sd n
f 1.666667 0.5773503 3
m 4.500000 0.5773503 4
W jaki sposób przeprowadzasz dwupróbkowy test t (aby sprawdzić, czy istnieje znacząca różnica między średnimi mężczyzn i kobiet w niektórych zmiennych) przy użyciu takich statystyk, a nie rzeczywistych danych?
Nie mogłem znaleźć nigdzie w Internecie, jak to zrobić. Większość samouczków, a nawet podręcznik dotyczy testu z samym zestawem danych.
?pt
) - patrz zwłaszczapt()
- masz wszystkie informacje, których potrzebujesz, aby zrobić to sam. Nauczysz się wiele o statystykach i R. Jeśli to zrobisz.tsum.test
funkcję w pakiecie BSDA , która implementuje test t (dwie próbki; Welch lub równość wariancji, a także jedna próbka) z dostarczonych danych podsumowujących. Zasadniczo działa jak test t w wanilii R, ale w podsumowaniu.tsum.test()
odBSDA library
jak stwierdził @Nick Cox. Robi dokładnie to samo, co napisał @macro w liniach kodu. Gdyby zadać pytanie, jakie jest rozumienie obliczeń tła dla obliczenia statystyki testu t w R, Marco byłby bardziej odpowiednią odpowiedzią. Pamiętaj, że nie próbuję nikogo urazić, tylko stwierdzając moją osobistą opinię związaną z moim doświadczeniem zawodowym. I @marco to porządne kodowanie :)Odpowiedzi:
Możesz napisać własną funkcję na podstawie tego, co wiemy o mechanice testu z dwoma próbkamit . Na przykład spełni to zadanie:
źródło
t.test
została odrzucona, więc oto kod do potwierdzenia:(tt2 <- t.test2(mean(x1), mean(x2), sd(x1), sd(x2), length(x1), length(x2))); (tt <- t.test(x1, x2)); tt$statistic == tt2[["t"]]; tt$p.value == tt2[["p-value"]]
Po prostu obliczasz to ręcznie:
Oczekiwana różnica wynosi prawdopodobnie zero.
Jeśli chcesz wartość p, po prostu użyj
pt()
funkcji:Tak więc, łącząc kod razem:
Zakłada to jednakowe wariancje, co jest oczywiste, ponieważ mają one takie samo odchylenie standardowe.
źródło
R
”? Jaki jest rozkład statystyki testowej (tj. Jak przejść od tego do wartości )?Możesz wykonać obliczenia na podstawie wzoru w książce (na stronie internetowej) lub wygenerować losowe dane o określonych właściwościach (patrz
mvrnorm
funkcja wMASS
pakiecie) i użyćt.test
funkcji regularnej na danych symulowanych.źródło
mvrnorm
funkcji wMASS
pakiecie (musisz ustawić argument empiryczny na PRAWDA).Pytanie dotyczy R, ale problem może pojawić się w każdym innym oprogramowaniu statystycznym. Na przykład Stata ma różne tak zwane polecenia natychmiastowe, które umożliwiają obliczenia na podstawie samych statystyk podsumowujących. Zobacz http://www.stata.com/manuals13/rttest.pdf dla konkretnego przypadku
ttesti
polecenia, które ma zastosowanie tutaj.źródło