Pytanie zostało zadane tutaj, ale nikt nie udzielił dobrej odpowiedzi. Myślę więc, że dobrym pomysłem jest powtórzenie tego, a także chciałbym dodać więcej komentarzy / pytań.
Pierwsze pytanie brzmi: jaka jest różnica między „modelowaniem ścieżki PLS” a „regresją PLS”? Mówiąc bardziej ogólnie, czym jest modelowanie równań strukturalnych (SEM), modelowanie ścieżek i regresja? Według mnie regresja skupia się bardziej na przewidywaniu, podczas gdy SEM koncentruje się na związku między odpowiedzią a predyktorami, a modelowanie ścieżki jest szczególnym przypadkiem SEM?
Moje drugie pytanie brzmi: jak wiarygodna jest PLS? Ostatnio był przedmiotem wielu krytyków, jak podkreślono w Rönkkö i in. 2016 i Rönkkö i in. 2015, co prowadzi do odrzucenia artykułów opartych na PLS w czasopismach wysokiego poziomu, takich jak Journal of Operations Management ( tutaj jest uwaga redaktora czasopisma):
Odrzucamy praktycznie wszystkie manuskrypty oparte na PLS, ponieważ doszliśmy do wniosku, że PLS jest bez wyjątku niewłaściwym podejściem do modelowania w modelach wykorzystywanych przez badaczy OM .
Powinienem zauważyć, że moją dziedziną jest spektroskopia, ani zarządzanie / psychologia, ani statystyka. W linkowanych powyżej artykułach autorzy mówią więcej o PLS jako metodzie SEM, ale dla mnie ich krytyka wydaje się dotyczyć również regresji PLS.
Odpowiedzi:
Brak, są synonimami.
SEM jest formą regresji. Regresja to dowolna metoda, która koreluje zmienne niezależne i zależne i obejmuje metody wykorzystujące wiele zmiennych obsługiwanych jako osobne jednostki. SEM używa matematycznych zależności między zmiennymi w celu ograniczenia ostatecznego modelu, w przypadku PLS jest to kowariancja. Rozumiem, że modelowanie ścieżki jest terminem specyficznym dla dziedziny (nie mojej, jestem spektroskopistą jak ty).
Doskonały odpór znajduje się w Henseler i in. 2013 Wspólne przekonania i rzeczywistość na temat PLS . Główny problem dotyczy Rönkkö i in. jest to, że PLS nie radził sobie świetnie w niektórych sytuacjach, które zakładają wspólny ukryty czynnik. PLS jest w rzeczywistości zaprojektowany do obsługi wielu ukrytych czynników, co jest sytuacją znacznie bardziej powszechną w prawdziwym świecie.
Jak godny zaufania? Do spektroskopii jest to doskonałe narzędzie, ale ma swoje ograniczenia. Grozi to nadmiernym dopasowaniem, ponieważ może budować złożone modele, które wychwytują wkład z wielu podstawowych czynników. Z tego powodu należy go używać ostrożnie, dlatego niezbędna jest odpowiednia walidacja zewnętrzna, ale te zastrzeżenia dotyczą wszystkich narzędzi do budowania modeli. Pracuję głównie nad zestawami danych ze świata rzeczywistego przez 2 dekady i nie spotkałem żadnego eksperymentalnego zestawu danych, który miałby tylko jeden wspólny czynnik leżący u podstaw zmiennej zależnej (ani oparty na danych, ani na teorii naukowej).
źródło