Związek między wariancją a odległościami par w obrębie zmiennej

20

Proszę udowodnić, że jeśli mamy dwie zmienne (równa wielkość próby) i Y, a wariancja w X jest większa niż w Y , wówczas suma kwadratowych różnic (tj. Kwadratowych odległości euklidesowych) między punktami danych w X jest również większa niż że w Y .XYXYXY

ttnphns
źródło
1
Wyjaśnij: Czy kiedy mówisz wariancję , masz na myśli wariancję próbki ? Kiedy mówisz suma różnic kwadratowych , masz na myśli ? i,j(xixj)2
kardynał
9
Zakładając powyższe: uważnie rozliczając elementy w perspektywie długoterminowej. Wyobrażam sobie, że możesz wypełnić (małe luki). Wynik jest trywialny.
i,j(xixj)2=ij((xix¯)(xjx¯))2=2ni=1n(xix¯)2,
kardynał
2
Istnieje również sposób na wykonanie tego „bez” żadnych obliczeń, biorąc pod uwagę fakt, że jeśli i X 2 są identyczne z F (z dobrze zdefiniowaną wariancją), to E ( X 1 - X 2 ) 2 = 2 V a r ( X 1 ) . Wymaga to jednak nieco mocniejszego zrozumienia koncepcji prawdopodobieństwa. X1X2FE(X1X2)2=2Var(X1)
kardynał
1
W przypadku pokrewnego pytania wykorzystałem wizualizację tego, co się tutaj dzieje, w odpowiedzi na stronie stats.stackexchange.com/a/18200 : różnice kwadratowe to obszary kwadratów.
whuber
1
@whuber: Bardzo miło. Jakoś po drodze tęskniłem za twoją odpowiedzią.
kardynał

Odpowiedzi:

5

Uwaga: wystarczy podać „oficjalną” odpowiedź, aby uzupełnić rozwiązania nakreślone w komentarzach

  1. Żadne z , Var ( ( Y i ) ) , i , j ( X i - X j ) 2 lub i , j ( Y i - Y j ) 2 nie są zmieniane przez przesunięcie wszystkich X i równomiernie do X i - μ dla pewnej stałej μ lub przesunięcia całego YVar((Xi))Var((Yi))i,j(XiXj)2i,j(YiYj)2XiXiμμ do Y i - νYiYiννXi=Yi=0Var((Xi))=Xi2Var((Yi))=Yi2

  2. Xi2Yi2i,j(XiXj)2i,j(YiYj)2.

  3. Simple expansion of the squares and rearranging the sums give

    i,j(XiXj)2=2Xi22(Xi)(Xj)=2Xi2=2Var((Xi))
    with a similar result for the Y's.

The proof is immediate.

whuber
źródło