Biorąc pod uwagę następującą konfigurację eksperymentalną:
Od pacjenta pobiera się wiele próbek, a każda próbka jest traktowana na wiele sposobów (w tym leczenie kontrolne). Najbardziej interesująca jest różnica między kontrolą a każdym leczeniem.
Mogę wymyślić dwa proste modele tych danych. Gdy próbka , leczenie , leczenie 0 jest kontrolą, niech będzie danymi, będzie odniesienia dla próbki , będzie różnicą dla leczenia . Pierwszy model uwzględnia zarówno kontrolę, jak i różnicę:
Podczas gdy drugi model patrzy tylko na różnicę. Jeśli precalculate wcześniej następnie
Moje pytanie brzmi: jakie są podstawowe różnice między tymi dwoma konfiguracjami? W szczególności, jeśli poziomy same w sobie są pozbawione znaczenia, a liczy się tylko różnica, to czy pierwszy model robi zbyt wiele i może ma słabą moc?
źródło
Odpowiedzi:
są prawdopodobnie skorelowane w drugim modelu, ale nie pierwszy.ϵij
W pierwszym, terminy te reprezentują błąd pomiaru i odchylenia od modelu addytywnego. Z należytą starannością - na przykład poprzez losową sekwencję pomiarów - błędy te można uniezależnić, gdy model jest dokładny. Skąd
(Zauważ, że jest to sprzeczne z ostatnim równaniem w pytaniu, ponieważ błędne jest założenie, że Takie postępowanie zmusiłoby nas do przyznania, że są zmiennymi losowymi, a nie parametrami, przynajmniej raz potwierdzimy możliwość błędu pomiaru dla kontroli. Prowadziłoby to do tych samych wniosków poniżej).ϵi0=0 γi
Dla , to implikujej,k≠0 j≠k
Korelacja może być znaczna. W przypadku błędów id, podobne obliczenia pokazują, że wynosi 0,5. O ile nie używasz procedur, które jawnie i poprawnie obsługują tę korelację, faworyzuj pierwszy model nad drugim.
źródło