Jaka jest rola MDS we współczesnej statystyce?

18

Ostatnio natknąłem się na skalowanie wielowymiarowe. Staram się lepiej zrozumieć to narzędzie i jego rolę we współczesnej statystyce. Oto kilka pytań przewodnich:

  • Na jakie pytania odpowiada?
  • Którzy badacze są często zainteresowani jego użyciem?
  • Czy istnieją inne techniki statystyczne, które wykonują podobne funkcje?
  • Jaka teoria się wokół niej rozwija?
  • Jak „MDS” odnosi się do „SSA”?

Z góry przepraszam, że zadałem tak mieszane / niezorganizowane pytanie, ale taka jest natura mojego obecnego etapu w tej dziedzinie.

Tal Galili
źródło
7
Ilustracje w innym miejscu na SE dotyczą dwóch pierwszych punktów: gis.stackexchange.com/a/20428 ; gis.stackexchange.com/a/15567
whuber

Odpowiedzi:

24

Jeśli zaakceptujesz zwięzłą odpowiedź ...

Na jakie pytania odpowiada? Wizualne odwzorowanie parowych podobieństw w przestrzeni euklidesowej (głównie) o niskiej wymiarowości.

Którzy badacze są często zainteresowani jego użyciem? Każdy, kto chce wyświetlić skupiska punktów lub uzyskać wgląd w możliwe ukryte wymiary, wzdłuż których rozróżniają się punkty. Lub kto po prostu chce przekształcić macierz zbliżeniową w dane zmiennych punktów X.

Czy istnieją inne techniki statystyczne, które wykonują podobne funkcje? PCA (liniowy, nieliniowy), analiza korespondencji, rozwijanie wielowymiarowe (wersja MDS dla matryc prostokątnych). Są one na różne sposoby powiązane z MDS, ale rzadko są postrzegane jako jego substytuty. (Liniowe PCA i CA są ściśle powiązanymi operacjami zmniejszającymi przestrzeń algebry liniowej , odpowiednio, na kwadratowych i prostokątnych macierzach. MDS i MDU są podobnymi iteracyjnymi, ogólnie nieliniowymi algorytmami dopasowywania przestrzeni, odpowiednio na macierzach kwadratowych i prostokątnych.)

STEDmST=mD+EES(klasyczny lub prosty MDS) lub mapa wielu matryc jednocześnie z dodatkową mapą wag (różnice indywidualne lub ważony MDS). Istnieją również inne formy, takie jak powtarzany MDS i ogólny MDS. Tak więc MDS jest różnorodną techniką.

Jak „MDS” odnosi się do „SSA”? Informacje na ten temat można znaleźć na stronie Wikipedii MDS.

Aktualizacja ostatniego punktu. Ta notatka techniczna SPSS pozostawia wrażenie, że SSA jest przykładem rozwijania się wielowymiarowego (procedura PREFSCAL w SPSS). Ten ostatni, jak zauważyłem powyżej, to algo MDS zastosowane do prostokątnych (a nie kwadratowych symetrycznych) matryc.

ttnphns
źródło
3
(+1) Ładne podsumowanie! Forrest Young (cytowany już przez @whuber w swoim komentarzu), Yoshio Takane i Jan de Leeuw mają bardzo dobre artykuły na temat MDS.
chl
@chl, dzięki: przydatne artykuły na stronie
Takane
6

@ttnphns zapewnił dobry przegląd. Chcę tylko dodać kilka drobiazgów. Greenacre wykonał sporo pracy z Analizą korespondencji i jak jest on powiązany z innymi technikami statystycznymi (takimi jak MDS, ale także PCA i inne), możesz rzucić okiem na jego rzeczy (na przykład ta prezentacja może być pomocny). Ponadto MDS jest zwykle używany do tworzenia fabuły (chociaż można po prostu wyodrębnić niektóre informacje liczbowe), a on napisał książkę o tym ogólnym typie fabuły i umieścił ją w Internecie za darmo tutaj(choć tylko jeden rozdział dotyczy samych wykresów MDS). Wreszcie, jeśli chodzi o typowe zastosowanie, jest ono bardzo często stosowane w badaniach rynku i pozycjonowaniu produktów, gdzie badacze używają go opisowo, aby zrozumieć, w jaki sposób konsumenci myślą o podobieństwach między różnymi produktami konkurencyjnymi; nie chcesz, aby Twój produkt był słabo odróżniany od reszty.

gung - Przywróć Monikę
źródło
1
(+1) Zrozumienie Biplots , autor: Gower i kol. jest także świetną książką (zawiera binarny pakiet R , tylko dla systemu Windows), z około 50 stron na MDS i nieliniowych biplotach.
chl
2
@chl, dzięki za wskazówkę, ta książka wygląda interesująco.
gung - Przywróć Monikę
1

Dodatkową zaletą jest to, że można użyć MDS do analizy danych, dla których nie znasz ważnych zmiennych lub wymiarów. Standardowa procedura polegałaby na: 1) ustaleniu przez uczestników rangi, sortowania lub bezpośredniej identyfikacji podobieństwa między obiektami; 2) przekształcić odpowiedzi w macierz niepodobności; 3) zastosuj MDS i najlepiej znajdź model 2 lub 3D; 4) opracuj hipotezy dotyczące wymiarów tworzących mapę.

Moim osobistym zdaniem jest to, że istnieją inne narzędzia do zmniejszania wymiarów, które zwykle lepiej nadają się do tego celu, ale to, co zapewnia MDS, jest szansą na rozwinięcie teorii na temat wymiarów używanych do organizowania sądów. Ważne jest również, aby pamiętać o stopniu stresu (zniekształceniach wynikających z redukcji wymiarów) i uwzględnić to w swoim myśleniu.

Myślę, że jedną z najlepszych książek na temat MDS jest „Applied Multidimensional Scaling” Borg, Groenen i Mair (2013).

użytkownik3550400
źródło