Jeżeli i są zmienne i przypadkowe i są stałymi, a
centrującego szczególny przypadek i , więc nie wpływa centrowania kowariancji.XYabCov(X+a,Y+b)=E[(X+a−E[X+a])(Y+b−E[Y+b])]=E[(X+a−E[X]−E[a])(Y+b−E[Y]−E[b])]=E[(X+a−E[X]−a)(Y+b−E[Y]−b)]=E[(X−E[X])(Y−E[Y])]=Cov(X,Y).
a=−E[X]b=−E[Y]
Ponadto, ponieważ korelacja jest zdefiniowana jako nazwa
widzimy, że
nazwa więc centrowanie nie wpływa w szczególności na korelację.Corr(X,Y)=Cov(X,Y)Var(X)Var(Y)−−−−−−−−−−−−√,
Corr(X+a,Y+b)=Cov(X+a,Y+b)Var(X+a)Var(Y+b)−−−−−−−−−−−−−−−−−−√=Cov(X,Y)Var(X)Var(Y)−−−−−−−−−−−−√,
To była wersja populacyjna tej historii. Przykładowa wersja jest taka sama: jeśli użyjemy nazwa
jako nasze oszacowanie kowariancji między i ze sparowanej próbki , a następnie
Covˆ(X,Y)=1n∑i=1n(Xi−1n∑j=1nXj)(Yi−1n∑j=1nYj)
XY(X1,Y1),…,(Xn,Yn)Covˆ(X+a,Y+b)=1n∑i=1n(Xi+a−1n∑j=1n(Xj+a))(Yi+b−1n∑j=1n(Yj+b))=1n∑i=1n(Xi+a−1n∑j=1nXj−nna)(Yi+b−1n∑j=1nYj−nnb)=1n∑i=1n(Xi−1n∑j=1nXj)(Yi−1n∑j=1nYj)=Covˆ(X,Y)
dla dowolny i .ab
Definicja kowariancji i to . Wyrażenie w tym wzorze jest scentralizowaną wersja . Więc już wyśrodkowujemy gdy bierzemy kowariancję, a centrowanie jest operatorem idempotentnym; po wyśrodkowaniu zmiennej dalsze stosowanie procesu centrowania nie zmienia jej. Gdyby formuła nie przyjęła wyśrodkowanych wersji zmiennych, wystąpiłyby wszelkiego rodzaju dziwne efekty, takie jak kowariancja między temperaturą a inną zmienną, która różni się w zależności od tego, czy mierzymy temperaturę w stopniach Celsjusza czy Kelvina.X Y E[(X−E[X])(Y−E[Y])] X−E[X] X X
źródło
„gdzieś” jest raczej nierzetelnym źródłem ...
Kowariancja / korelacja są zdefiniowane z wyraźnym centrowaniem . Jeśli nie wyśrodkujesz danych, nie będziesz obliczać kowariancji / korelacji. (Dokładnie: korelacja Pearsona)
Główna różnica polega na tym, czy wyśrodkowujesz na podstawie modelu teoretycznego (np. Oczekiwana wartość powinna wynosić dokładnie 0), czy na podstawie danych (średnia arytmetyczna). Łatwo zauważyć, że średnia arytmetyczna da mniejszą kowariancję niż jakiekolwiek inne centrum.
Jednak mniejsza kowariancja nie oznacza mniejszej korelacji lub wręcz przeciwnie. Załóżmy, że mamy dane X = (1,2) i Y = (2,1). Łatwo zauważyć, że przy arytmetycznym średnim centrowaniu da to idealnie ujemną korelację, a jeśli wiemy, że proces generowania generuje średnio 0, dane są faktycznie dodatnio skorelowane. W tym przykładzie skupiamy się - ale z teoretyczną oczekiwaną wartością 0.
Może to powstać łatwo. Rozważmy, że mamy matrycę czujników 11x11 z komórkami ponumerowanymi od -5 do +5. Zamiast brać średnią arytmetyczną, sensownym jest użycie tutaj „fizycznej” średniej naszej matrycy czujników, gdy szukamy korelacji zdarzeń czujnika (jeśli policzymy komórki od 0 do 10, użyjemy 5 jako stałej stałej, i otrzymalibyśmy dokładnie takie same wyniki, aby wybór indeksowania zniknął z analizy - fajnie).
źródło