Różnica w środkach a średnia różnica

Badając dwie niezależne próbki, powiedziano nam, że patrzymy na „różnicę dwóch średnich”. Oznacza to, że bierzemy średnią z populacji 1 ( ) i odejmujemy od niej średnią z populacji 2 ( ). Nasza „różnica dwóch średnich” to ( - ). $\bar y_1$ $\bar y_2$ $\bar y_1$ $\bar y_2$

Badając sparowane próbki, powiedziano nam, że patrzymy na „średnią różnicę”, . Oblicza się to, biorąc różnicę między każdą parą, a następnie biorąc średnią wszystkich tych różnic. $\bar d$

Moje pytanie brzmi: czy otrzymamy to samo ( - ) w porównaniu do jego jeśli obliczymy je z dwóch kolumn danych, a za pierwszym razem uznamy to za dwie niezależne próbki, a za drugim razem uznamy za sparowane dane? Bawiłem się dwiema kolumnami danych i wydaje się, że wartości są takie same! Czy w takim przypadku można powiedzieć, że różne nazwy są używane tylko z przyczyn nieilościowych? $\bar y_1$ $\bar y_2$ $\bar d$

paired-comparisons paired-data mean użytkownik84756
źródło

Pomyśl o tym w ten sposób: jak obliczysz przy niesparowanych danych?

\bar{d}

$\bar d$

shadowtalker

@ssdecontrol Zwłaszcza jeśli rozmiary próbek są różne.

Alexis,

Odpowiedzi:

(Zakładam, że masz na myśli „próbka”, a nie „populacja” w pierwszym akapicie).

Równoważność łatwo wykazać matematycznie. Zacznij od dwóch próbek o równej wielkości: i . Następnie zdefiniuj $\{x_1,\dots,x_n\}$ $\{y_1,\dots,y_n\}$

\begin{aligned} \bar{x} & = \frac{1}{n} \sum_{ja = 1}^{n} x_{ja} \\ \bar{y} & = \frac{1}{n} \sum_{ja = 1}^{n} y_{ja} \\ \bar{re} & = \frac{1}{n} \sum_{ja = 1}^{n} x_{ja} - y_{ja} \end{aligned}

$\begin{align} \bar x &= \frac{1}{n} \sum_{i=1}^n x_i \\ \bar y &= \frac{1}{n} \sum_{i=1}^n y_i \\ \bar d &= \frac{1}{n} \sum_{i=1}^n x_i - y_i \end{align}$

Następnie masz:

\begin{aligned} \bar{x} - \bar{y} & = (\frac{1}{n} \sum_{ja = 1}^{n} x_{ja}) - (\frac{1}{n} \sum_{ja = 1}^{n} y_{ja}) \\ = \frac{1}{n} (\sum_{ja = 1}^{n} x_{ja} - \sum_{ja = 1}^{n} y_{ja}) \\ = \frac{1}{n} ((x_{1} + \dots + x_{n}) - (y_{1} + \dots + y_{n})) \\ = \frac{1}{n} (x_{1} + \dots + x_{n} - y_{1} - \dots - y_{n}) \\ = \frac{1}{n} (x_{1} - y_{1} + \dots + x_{n} - y_{n}) \\ = \frac{1}{n} ((x_{1} - y_{1}) + \dots + (x_{n} - y_{n})) \\ = \frac{1}{n} \sum_{ja = 1}^{n} x_{ja} - y_{ja} \\ = \bar{re} . \end{aligned}

$\begin{align} \bar x - \bar y &= \left( \frac{1}{n} \sum_{i=1}^n x_i \right) - \left( \frac{1}{n} \sum_{i=1}^n y_i \right) \\ &= \frac{1}{n} \left( \sum_{i=1}^n x_i - \sum_{i=1}^n y_i \right) \\ &= \frac{1}{n} \left( \left( x_1 + \dots + x_n \right) - \left( y_1 + \dots + y_n \right) \right) \\ &= \frac{1}{n} \left( x_1 + \dots + x_n - y_1 - \dots - y_n \right) \\ &= \frac{1}{n} \left( x_1 - y_1 + \dots + x_n - y_n \right) \\ &= \frac{1}{n} \left( \left( x_1 - y_1 \right) + \dots + \left( x_n - y_n \right) \right) \\ &= \frac{1}{n} \sum_{i = 1}^n x_i - y_i \\ &= \bar d. \end{align}$

Shadowtalker
źródło

Ale dwa przedziały ufności obliczone dla „różnicy średnich” i „średniej różnicy” będą różne, prawda? Można to zobaczyć, patrząc na

A = [1, 2, 3, 4, 5, . . .]

$A = [1, 2, 3, 4, 5, ...]$ i

B = [. . ., 5, 4, 3, 2, 1]

$B = [..., 5, 4, 3, 2, 1]$ . Sparowana „średnia różnica” będzie inna dla

A - A

$A - A$ (czyli wszystko zero) w porównaniu z

A - B

$A - B$ (co nie jest równe zeru); kolejność elementów nie wpływa na różnicę średnich.

włókien

Nie mogę już edytować mojego poprzedniego postu. The 3rd zdanie powinno zaczynać „Sekwencja sparowanych«oznaczają różnice»...”

BERS

@bers co robi

A - A

$A-A$ mieć z tym wspólnego?

shadowtalker,

Założyć

C = A

$C=A$ . Następnie

A - C

$A-C$ i

A - B

$A-B$ to dwie różne sekwencje. Przedział ufności dla średniej sparowanej różnicy z pewnością będzie różny w obu przypadkach. Ale różnica średnich, a więc i przedział ufności, będzie zarówno indentyczna

A - C

$A-C$ i

A - B

$A-B$ . A może się mylę?

włókien

@bers Myślę, że jesteś zdezorientowany, ale jestem zdezorientowany co do tego, co Cię myli.

shadowtalker,

rozkład średniej różnicy powinien być węższy niż rozkład różnicy średnich. Zobacz to na prostym przykładzie: średnia w próbce 1: 1 10 100 1000 średnia w próbce 2: 2 11 102 1000 różnica średnich wynosi 1 1 2 0 (w przeciwieństwie do samych próbek) ma mały standard.

Vlad
źródło