Właśnie zostałem (niejasno) wprowadzony do kowariancji / korelacji odległości . Wydaje się to szczególnie przydatne w wielu sytuacjach nieliniowych, gdy testuje się zależność. Ale nie wydaje się, aby był używany bardzo często, chociaż kowariancja / korelacja są często stosowane w przypadku danych nieliniowych / chaotycznych.
To sprawia, że myślę, że mogą istnieć pewne wady kowariancji odległości. Czym więc są i dlaczego nie zawsze wszyscy używają kowariancji odległości?
correlation
covariance
distance-covariance
naught101
źródło
źródło
Odpowiedzi:
Próbowałem zebrać kilka uwag na temat kowariancji odległości w oparciu o moje wrażenia z przeczytania poniższych referencji. Nie uważam się jednak za eksperta w tym temacie. Komentarze, poprawki, sugestie itp. Są mile widziane.
Uwagi są (silnie) tendencyjne w stosunku do potencjalnych wad, zgodnie z pierwotnym pytaniem .
Moim zdaniem potencjalne wady są następujące:
Powtarzając, ta odpowiedź prawdopodobnie wydaje się dość negatywna. Ale nie o to chodzi. Istnieje kilka bardzo pięknych i interesujących pomysłów związanych z kowariancją odległości, a jej względna nowość otwiera również możliwości badawcze dla pełniejszego zrozumienia.
Referencje :
źródło
Mógłbym coś przeoczyć, ale samo oszacowanie nieliniowej zależności między dwiema zmiennymi nie wydaje się mieć dużej korzyści. Nie powie ci on kształtu relacji. Nie da ci żadnego sposobu przewidywania jednej zmiennej z drugiej. Analogicznie, podczas eksploracyjnej analizy danych czasami stosuje się krzywą lessową (lokalnie ważoną wygładzającą wykres rozrzutu) jako pierwszy krok w kierunku sprawdzenia, czy dane najlepiej modelować z linią prostą, kwadratową, sześcienną itp. Ale less sam w sobie nie jest bardzo przydatnym narzędziem predykcyjnym. To tylko pierwsze przybliżenie na drodze do znalezienia praktycznego równania opisującego dwuwymiarowy kształt. To równanie, w przeciwieństwie do lessa (lub wyniku kowariancji odległości), może stanowić podstawę modelu potwierdzającego.
źródło