W ramach projektu dotyczącego ekologii moja grupa laboratoryjna dodała ocet do 4 zbiorników zawierających równe objętości wody w stawie, 1 kontrolę bez elodei (rośliny wodnej) i 3 zabiegi z taką samą ilością elodei w każdym. Celem dodania octu było obniżenie pH. Hipoteza była taka, że zbiorniki z elodeą szybciej wróciłyby do normalnego pH. Tak było w istocie. Mierzyliśmy pH każdego zbiornika codziennie przez około dwa tygodnie. Wszystkie zbiorniki ostatecznie powróciły do swojego naturalnego pH, ale czas, który to zajęło, był znacznie krótszy dla zbiorników z elodeą.
Kiedy powiedzieliśmy naszemu profesorowi o naszym projekcie eksperymentalnym, powiedział, że nie ma testu statystycznego, który można by przeprowadzić na danych w celu porównania kontroli z leczeniem. Ponieważ ponieważ nie było powtórzenia dla kontroli (użyliśmy tylko jednego zbiornika kontrolnego), nie możemy obliczyć wariancji, więc nie możemy porównać średnich próbek z kontroli i leczenia. Więc moje pytanie brzmi: czy to prawda? Zdecydowanie rozumiem, o co mu chodzi. Na przykład, jeśli wziąłeś wysokość jednego mężczyzny i jednej kobiety, nie możesz wyciągać wniosków na temat ich populacji. Ale wykonaliśmy 3 zabiegi, a wariancja była niewielka. Rozsądne wydaje się założenie, że wariancja byłaby podobna w kontroli?
Aktualizacja:
Dziękuję za doskonałą odpowiedź. Dostaliśmy więcej wody i elodei z mokradeł i zdecydowaliśmy, że ponownie przeprowadzimy eksperyment z mniejszymi zbiornikami, ale tym razem z 5 kontrolami i 5 zabiegami. Zamierzaliśmy połączyć to z naszymi oryginalnymi danymi, ale początkowe pH zbiorników było na tyle różne, że rozważenie nowego eksperymentu z tej samej populacji, co eksperyment pierwotny, nie wydaje się uzasadnione.
Zastanawialiśmy się nad dodaniem różnych ilości elodei i próbą skorelowania prędkości remediacji pH (mierzonej jako czas, który upłynął do powrotu wartości pH do pierwotnej wartości) z ilością elodei, ale zdecydowaliśmy, że nie jest to konieczne. Naszym celem jest jedynie wykazanie, że elodea robi pozytywną różnicę, a nie skonstruowanie pewnego rodzaju modelu predykcyjnego dla dokładnie tego, jak pH reaguje na różne ilości elodei. Interesujące byłoby określenie optymalnej ilości elodei, ale to prawdopodobnie tylko maksymalna ilość, która może przetrwać. Próba dopasowania krzywej regresji do danych nie byłaby szczególnie pouczająca z powodu różnych skomplikowanych zmian, które zachodzą w społeczności przy dodawaniu dużej ilości. Elodea umiera, rozkłada się, nowe organizmy zaczynają dominować i tak dalej.
źródło
Odpowiedzi:
Zwróć uwagę na pytanie Gunga; to ma znaczenie. Zakładam, że leczenie było takie samo dla każdego zbiornika w grupie leczenia.
Jeśli możesz argumentować, że wariancja byłaby równa dla dwóch grup (co i tak zazwyczaj zakładasz dla dwóch próbnych testów t), możesz wykonać test. Po prostu nie możesz sprawdzić tego założenia, bez względu na to, jak bardzo może być ono naruszone.
Obawy wyrażone w tej odpowiedzi na powiązane pytanie są jeszcze bardziej adekwatne do twojej sytuacji, ale niewiele możesz na to poradzić.
[Pytasz, czy rozsądne jest założenie, że wariancje są równe. Nie możemy ci odpowiedzieć na to pytanie, trzeba przekonać ekspertów merytorycznych (tj. Ekologów), że było to uzasadnione założenie. Czy istnieją inne badania, w których takie poziomy mierzono zarówno pod względem leczenia, jak i kontroli? Inne, w których przeprowadzono podobne testy (szczególnie testy t lub anova - założę się, że można znaleźć lepszy precedens) lub przyjęto podobne założenia? Jakieś ogólne uzasadnienie, które możesz zastosować?]
Jeśli jest średnią próbki dla leczenia, a jest średnią kontroli, a oba pochodzą z rozkładów normalnych z wariancją , to będzie oznaczać i wariancję niezależnie od tego, czy jedna z wartości to 1.x¯ y¯ σ2) x¯- y¯ μx- μy σ2)( 1 / nx+ 1 / ny) n
Więc kiedy wynosi 1,ny
(gdzie jest standardowym odchyleniem obliczonym z zabiegów) zostanie podzielone na (z stopniami swobody) poniżej zera.sx t nx- 1
Można zauważyć, że przy najlepszym dostępnym oszacowaniu , zastosowanym dla , jest to dokładnie tak, jak zwykła formuła testu dwóch prób z ustawionym na 1.σ sx sp ny
Edytować:
Oto symulowana krzywa mocy dla tego testu. Wielkość próbki przy wartości zerowej wynosiła 10000, w pozostałych punktach wynosiła 1000. Jak widać, współczynnik odrzucania przy wartości zerowej wynosi 0,05, a krzywa mocy, choć wymaga dużej różnicy w populacji, ma przyzwoitą moc, ma odpowiedni kształt. Oznacza to, że ten test działa tak, jak powinien.
(Zakończ edycję)
Jednak przy tak małych próbkach będzie to nieco wrażliwe na założenia dystrybucyjne.
Jeśli jesteś przygotowany na różne założenia lub chcesz sprawdzić równość niektórych innych populacji, niektóre testy mogą być nadal możliwe.
Więc nie wszystko stracone ... ale tam, gdzie to możliwe, ogólnie lepiej jest mieć przynajmniej trochę replikacji w obu grupach.
źródło
t.test(x=c(4.5,4.8,4.6),y=5.2, var.equal=TRUE)
- wygląda na to, że działa zarówno w R2.15.2, jak i R3.0.0 (tylko dwie wersje, które mam pod ręką).