Ostatnio natknąłem się na skalowanie wielowymiarowe. Staram się lepiej zrozumieć to narzędzie i jego rolę we współczesnej statystyce. Oto kilka pytań przewodnich:
- Na jakie pytania odpowiada?
- Którzy badacze są często zainteresowani jego użyciem?
- Czy istnieją inne techniki statystyczne, które wykonują podobne funkcje?
- Jaka teoria się wokół niej rozwija?
- Jak „MDS” odnosi się do „SSA”?
Z góry przepraszam, że zadałem tak mieszane / niezorganizowane pytanie, ale taka jest natura mojego obecnego etapu w tej dziedzinie.
multidimensional-scaling
Tal Galili
źródło
źródło
Odpowiedzi:
Jeśli zaakceptujesz zwięzłą odpowiedź ...
Na jakie pytania odpowiada? Wizualne odwzorowanie parowych podobieństw w przestrzeni euklidesowej (głównie) o niskiej wymiarowości.
Którzy badacze są często zainteresowani jego użyciem? Każdy, kto chce wyświetlić skupiska punktów lub uzyskać wgląd w możliwe ukryte wymiary, wzdłuż których rozróżniają się punkty. Lub kto po prostu chce przekształcić macierz zbliżeniową w dane zmiennych punktów X.
Czy istnieją inne techniki statystyczne, które wykonują podobne funkcje? PCA (liniowy, nieliniowy), analiza korespondencji, rozwijanie wielowymiarowe (wersja MDS dla matryc prostokątnych). Są one na różne sposoby powiązane z MDS, ale rzadko są postrzegane jako jego substytuty. (Liniowe PCA i CA są ściśle powiązanymi operacjami zmniejszającymi przestrzeń algebry liniowej , odpowiednio, na kwadratowych i prostokątnych macierzach. MDS i MDU są podobnymi iteracyjnymi, ogólnie nieliniowymi algorytmami dopasowywania przestrzeni, odpowiednio na macierzach kwadratowych i prostokątnych.)
Jak „MDS” odnosi się do „SSA”? Informacje na ten temat można znaleźć na stronie Wikipedii MDS.
Aktualizacja ostatniego punktu. Ta notatka techniczna SPSS pozostawia wrażenie, że SSA jest przykładem rozwijania się wielowymiarowego (procedura PREFSCAL w SPSS). Ten ostatni, jak zauważyłem powyżej, to algo MDS zastosowane do prostokątnych (a nie kwadratowych symetrycznych) matryc.
źródło
@ttnphns zapewnił dobry przegląd. Chcę tylko dodać kilka drobiazgów. Greenacre wykonał sporo pracy z Analizą korespondencji i jak jest on powiązany z innymi technikami statystycznymi (takimi jak MDS, ale także PCA i inne), możesz rzucić okiem na jego rzeczy (na przykład ta prezentacja może być pomocny). Ponadto MDS jest zwykle używany do tworzenia fabuły (chociaż można po prostu wyodrębnić niektóre informacje liczbowe), a on napisał książkę o tym ogólnym typie fabuły i umieścił ją w Internecie za darmo tutaj(choć tylko jeden rozdział dotyczy samych wykresów MDS). Wreszcie, jeśli chodzi o typowe zastosowanie, jest ono bardzo często stosowane w badaniach rynku i pozycjonowaniu produktów, gdzie badacze używają go opisowo, aby zrozumieć, w jaki sposób konsumenci myślą o podobieństwach między różnymi produktami konkurencyjnymi; nie chcesz, aby Twój produkt był słabo odróżniany od reszty.
źródło
Dodatkową zaletą jest to, że można użyć MDS do analizy danych, dla których nie znasz ważnych zmiennych lub wymiarów. Standardowa procedura polegałaby na: 1) ustaleniu przez uczestników rangi, sortowania lub bezpośredniej identyfikacji podobieństwa między obiektami; 2) przekształcić odpowiedzi w macierz niepodobności; 3) zastosuj MDS i najlepiej znajdź model 2 lub 3D; 4) opracuj hipotezy dotyczące wymiarów tworzących mapę.
Moim osobistym zdaniem jest to, że istnieją inne narzędzia do zmniejszania wymiarów, które zwykle lepiej nadają się do tego celu, ale to, co zapewnia MDS, jest szansą na rozwinięcie teorii na temat wymiarów używanych do organizowania sądów. Ważne jest również, aby pamiętać o stopniu stresu (zniekształceniach wynikających z redukcji wymiarów) i uwzględnić to w swoim myśleniu.
Myślę, że jedną z najlepszych książek na temat MDS jest „Applied Multidimensional Scaling” Borg, Groenen i Mair (2013).
źródło