Znaczenie „design” w matrycy projektowej?

13

W regresji liniowej , dlaczego nazywa się macierzą projektową? Czy można zaprojektować lub skonstruować dowolnie, tak jak w sztuce?Y=XβXX

Tim
źródło
3
Pochodzenie tego terminu jest dość stare i wierzę, że w analizie eksperymentów sięga początków wnioskowania statystycznego; w szczególności myślę, że odnosiło się to do sposobu, w jaki matryca X odnosiła się do rzeczywistego projektu eksperymentalnego (konkretne ustawienia wartości ). Jeśli znajdę konkretną referencję, opublikuję odpowiedź. x
Glen_b
@Glen_b: Dzięki! Czy „projekt” ma coś wspólnego z wyborem transformacji zmiennej wejściowej, tak że zmienna wyjściowa jest również liniowa w transformowanej zmiennej wejściowej? Na przykład macierz projektowa w regresji wielomianowej?
Tim
2
Podczas projektowania eksperymentu można określić wartości . X
whuber

Odpowiedzi:

15

Aby podać przykład zgodny z odpowiedzią @ neverKnowsBest, należy wziąć pod uwagę, że w eksperymencie czynnikowym istnieją 3 czynniki, każdy traktowany jako zmienne kategorialne z 2 poziomami, a każda możliwa kombinacja poziomów czynników jest testowana w ramach każdej replikacji. Gdyby eksperyment przeprowadzono tylko raz (bez replikacji), ten projekt wymagałby przebiegów. Przebiegi można opisać następującą macierzą 8x3: gdzie wiersze reprezentują przebiegi, a kolumny reprezentują poziomy czynniki: 2 3 = 8 [ 0 0 0 1 0 0 0 1 0 1 1 0 0 0 1 1 0 1 0 1 1 1 1 1 ] [ A B C ] .2323=8

[000100010110001101011111]
[ABC].
(Pierwsza kolumna reprezentuje poziom czynnika A, druga kolumna B i trzecia kolumna C). Jest to określane jako matryca projektowa, ponieważ opisuje projekt eksperymentu. Pierwszy przebieg jest zbierany na „niskim” poziomie wszystkich czynników, drugi przebieg jest zbierany na „wysokim” poziomie czynnika A i „niskich” poziomach czynników B i C itd.

AB, AC, BC i ABC \\ \ end {array} \ right]. Chociaż dwie macierze są ze sobą powiązane, macierz projektowa opisuje, w jaki sposób gromadzone są dane, podczas gdy matryca modelowa jest wykorzystywana do analizy wyników eksperymentu.[ I A B C A B A C B C A B C ].

[1000111011000011101001011110100010011001110101001011001011111111]
[IABCABACBCABC].

Cytowania

Montgomery, D. (2009). Projektowanie i analiza eksperymentów, wydanie 7. John Wiley & Sons Inc.

tjnel
źródło
9

W zaprojektowanych eksperymentach często niepokoimy się o macierz projektową zawierającą poziomy czynników, na których wykonujemy eksperyment, oraz o matrycę modelową (zapisaną również jako ale tak naprawdę funkcja macierzy projektowej) zawierający rzeczy takie jak kolumna wszystkich 1 (reprezentujących termin przechwytujący) oraz produkty i potęgi kolumn macierzy projektowej (reprezentujące takie rzeczy, jak interakcja i warunki modelu wielomianowego). Nazwałbym w matrycą modelu.X XXXXy=Xβ

Projektowanie eksperymentów koncentruje się na tym, jak skonstruować macierz projektową i macierz modelową, ponieważ dzieje się to przed zgromadzeniem danych. Jeśli dane są już zebrane, projekt jest ustawiony w kamieniu, ale nadal można zmienić matrycę modelu. Czasami w zaprojektowanym eksperymencie w macierzy projektu znajdują się pewne stałe kolumny zwane zmiennymi towarzyszącymi, które nie mogą kontrolować, ale można je obserwować.

Istnieją pewne rzeczy, które mogą się zdarzyć w zależności od wyboru modelu i projektu ... niektóre parametry mogą być trudne do oszacowania (większe wariancje estymatora) lub możesz nie być w stanie oszacować niektórych parametrów w ogóle. Powiedziałbym, że wybór odpowiedniego modelu ma pewne elementy sztuki, a na pewno jest sztuka projektowania eksperymentów.

nigdy nie wie najlepiej
źródło
2
Jest to bardzo pomocne, ale tutaj znajduje się przypis „kowariant”. Niektóre osoby używają tego terminu znacznie szerzej dla dowolnego rodzaju predyktora lub zmiennej niezależnej. (Oczywiście istnieje wiele innych synonimów.)
Nick Cox
(+1) Bardzo miło za twój pierwszy wkład - witamy na naszej stronie!
whuber
2

Nazywa się to macierzą projektową, ponieważ kolumny macierzy są oparte na projekcie modelu. Nie sądzę, aby można było stworzyć arbitralnie w tym sensie, że jak tylko model zostanie ustalony, tak samo ma się macierz projektowa (w zasadzie jedna kolumna w dla każdej którą próbujesz oszacować). Ponieważ jednak budowanie modelu można uznać za sztukę, tak też może być w przypadku budowania matrycy projektowej.X X βXXXβ


źródło
2

X to tylko twoje dane (minus zmienna odpowiedzi). Uważam, że jest to określane jako matryca projektowa, ponieważ definiuje „projekt” twojego modelu (poprzez szkolenie).

Czy X można zaprojektować lub skonstruować dowolnie, tak jak w sztuce?

Zasadniczo to pytanie sprowadza się do „czy możesz zbudować model wyszkolony na produkowanych danych”, na które odpowiedź brzmi oczywiście tak. Na przykład, oto jeden sposób na skonstruowanie dowolnej macierzy projektowej (wektor projektowy, naprawdę), która da model z predefiniowanym nachyleniem i przechwyceniem:

design_mat=function(b, a){
  X = runif(100)
  Y = a*X + b
  data.frame(X,Y)
}

df = design_mat(-5, 12.3)

(lm(Y~X, data=df))

Call:
lm(formula = Y ~ X, data = df)

Coefficients:
(Intercept)            X  
       -5.0         12.3  

W moim przykładzie „skonstruowałem” odpowiedź z losowych danych projektowych w celach ilustracyjnych, ale równie łatwo mogłeś skonstruować macierz projektową z losowej odpowiedzi przy użyciu .X=Yba

David Marks
źródło