Rzucam tutaj problem tak, jak go otrzymałem.
Mam dwie zmienne losowe. Jeden z nich jest ciągły (Y), a drugi dyskretny i zostanie przyjęty jako porządkowy (X). Umieściłem poniżej wątku, który otrzymałem wraz z zapytaniem.
Osoba, która przesłała mi dane, chce zmierzyć siłę powiązania między X i Y. Poszukuję pomysłów, które nie byłyby napełnione założeniami dotyczącymi tego, jaki proces wygenerował dane. Zauważ, że nie chodzi tu o znalezienie nieparametrycznego sposobu testowania siły związku (jak w bootstrapie), ale o znalezienie nieparametrycznego sposobu jej pomiaru .
Z drugiej strony wydajność nie stanowi problemu, ponieważ istnieje wiele punktów danych.
correlation
nonparametric
ordinal-data
association-measure
użytkownik603
źródło
źródło
Odpowiedzi:
Z definicji skala porządkowa jest miernikiem, w którym rzeczywiste odległości między wycięciami
1 2 3 4
są nieznane. To tak, jakbyś widział władcę pod narkotykami / alkoholem. Rzeczywiste odległości mogą być dowolne. To może być1 2 3 4
lub1 2 3 4
czy cokolwiek innego. Nie możemy obliczyć statystyki - takiej jak korelacja - chyba że zdecydujemy o odległościach, naprawimy je.Istnieją również inne podejścia. Ale w jakikolwiek sposób przekształcamy skalę porządkową monotonicznie „tak, aby ...” (jakieś założenie lub cel), ponieważ skala porządkowa jest dla nas zniekształcona w nieznany sposób. Zasadniczo inną decyzją byłoby najpierw „wytrzeźwienie” i zadecydowanie, że albo nie jest on zniekształcony (tj. Jest to interwał), albo jest zniekształcony w znany sposób (jest nieokreślony) lub jest nominalny.
Niektóre podejścia asymetryczne mogą obejmować regresję porządkową zmiennej porządkowej przez drugą (przedziałową / ciągłą). Lub regresja liniowa tego ostatniego przez porządkową, z modelem, w którym predyktor jest przyjmowany jako kontrast wielomianowy (to znaczy wprowadzany jako
b1X + b2X^2 + b3X^3,...
). Słabość tych podejść polega na tym, że są one asymetryczne: jedna zmienna jest zależna, a druga niezależna.źródło
Bibliografia
Reshef, D., Reshef, Y., Finucane, H., Grossman, S., McVean, G., Turnbaugh, P., Lander, E., Mitzenmacher, M., i Sabeti, P. (2011). Wykrywanie nowych skojarzeń w dużych zestawach danych. Science , 334 (6062): 1518–1524.
Reshef, D., Reshef, Y., Mitzenmacher, M., i Sabeti, P. (2013). Analiza równoważności maksymalnego współczynnika informacyjnego z porównaniami . arXiv , 14 sierpnia.
źródło