Staram się poszerzyć swoją wiedzę na temat statystyki. Pochodzę z nauk fizycznych z podejściem opartym na „recepturze” do testowania statystycznego, gdzie, jak mówimy, jest ciągły, czy jest normalnie rozproszony - regresja OLS .
W swoim czytaniu natrafiłem na pojęcia: model efektów losowych, model efektów stałych, model marginalny. Moje pytania to:
- Mówiąc bardzo prosto, czym one są?
- Jakie są między nimi różnice?
- Czy któryś z nich jest synonimem?
- Skąd się biorą tradycyjne testy, takie jak regresja OLS, ANOVA i ANCOVA?
Po prostu próbuję zdecydować, gdzie iść dalej dzięki samokształceniu.
Odpowiedzi:
To pytanie zostało częściowo omówione na tej stronie, jak poniżej, a opinie wydają się mieszane.
Wszystkie terminy są ogólnie związane z danymi podłużnymi / panelowymi / klastrowanymi / hierarchicznymi i powtarzanymi pomiarami (w formacie regresji zaawansowanej i ANOVA), ale mają wiele znaczeń w innym kontekście. Chciałbym odpowiedzieć na pytanie w formułach opartych na mojej wiedzy.
Model z efektami stałymi
Model efektów losowych
Model brzeżny
Model brzeżny jest na ogół porównywany do modelu warunkowego (model efektów losowych), a ten pierwszy koncentruje się na średniej populacji (weźmy model liniowy na przykład) podczas gdy ten drugi dotyczy średniej warunkowejInterpretacja i skala współczynników regresji między modelem krańcowym a modelem efektów losowych byłaby inna dla modeli nieliniowych (np. Regresja logistyczna). Niech , a następnie
źródło
Popraw mnie, jeśli się tu mylę:
Koncepcyjnie istnieją cztery możliwe efekty: Stałe przechwytywanie, stały współczynnik, losowe przechwytywanie, losowy współczynnik. Większość modeli regresji to „efekty losowe”, więc mają losowe przechwyty i losowe współczynniki. Termin „efekt losowy” wszedł w życie w przeciwieństwie do „efektu stałego”.
„Efekt stały” występuje, gdy zmienna wpływa na część próbki, ale nie na wszystkie. Najprostsza wersja modelu z efektem stałym (koncepcyjnie) byłaby zmienną fikcyjną, dla efektu stałego z wartością binarną. Modele te mają pojedynczy losowy punkt przecięcia, stałe współczynniki efektu i współczynniki zmiennej losowej.
Następnym poziomem komplikacji (koncepcyjnie) jest sytuacja, gdy ustalony efekt nie jest binarny, lecz nominalny, z wieloma wartościami. W tym przypadku generowany jest model z wieloma punktami przechwytywania (po jednym dla każdej wartości nominalnej). W tym miejscu uzyskuje się klasyczne „wiele linii” modelu danych panelu , w którym każda z „opcji” zmiennej o stałym efekcie ma swój własny efekt. Zaletą zrzucenia wszystkich różnych serii danych specyficznych dla czynnika w jedną regresję (zamiast wykonywania każdego czynnika stałego efektu jako własnej regresji) jest to, że można zebrać wariancję wszystkich różnych efektów w jednym równaniu, i tak uzyskaj lepsze (bardziej pewne) wartości dla wszystkich swoich współczynników.
„Trzeci poziom” komplikacji miałby miejsce, gdy „ustalony efekt” sam w sobie jest zmienną losową, z tym wyjątkiem, że jego skutki są „ustalone”, aby wpływać tylko na podzbiór próbki. W tym momencie model będzie miał losowy punkt przecięcia, wiele stałych punktów przechwytywania i wiele zmiennych losowych. Myślę, że jest to tak zwany model „efektów mieszanych”?
Modele „efektu mieszanego” są wykorzystywane do modelowania wielopoziomowego (MLM), ponieważ „efekty stałe” można wykorzystać do zagnieżdżania jednego podzbioru danych w innym. To grupowanie może mieć wiele poziomów, z uczniami zagnieżdżonymi w klasach, zagnieżdżonymi w szkołach. Szkoła ma stały wpływ na klasy, a klasy na uczniów. (Szkoła może, ale nie musi, mieć ustalonego wpływu na ucznia, w zależności od projektu eksperymentalnego - nie jestem pewien)
Modele danych panelowych są modelami z efektem mieszanym, ale do grupowania używają dwóch wymiarów, zazwyczaj czasu i jakiejś kategorii.
źródło