Jak obliczyć przedziały ufności współczynników regresji w PLS?

10

Podstawowym model PLS jest dana macierzy X i n wektor Y są związane przez X = T P ' + E , Y = T Q ' + f , gdzie t jest utajony N x k macierzy i E , f są warunkami szumu (sumowanie X , y są wyśrodkowane).n×mXny

X=T.P.+mi,
y=T.q+fa,
T.n×kmi,faX,y

PLS wytwarza oszacowania , a „skrót” wektorem współczynników regresji p tak, że r ~ X p . Chciałbym znaleźć rozkład beta w pewnych upraszczających założeniach, które prawdopodobnie powinny zawierać następujące elementy:T.,P.,qβ^yXβ^β^

  1. Model jest poprawny, tzn. dla nieznanego T , P , q ;X=T.P.+mi,y=T.q+faT.,P.,q
  2. Liczba ukrytych czynników, , jest znana i stosowana w algorytmie PLS;k
  3. Rzeczywiste terminy błędów są oznaczone jako zero-średnia normalna ze znanymi wariancjami;

To pytanie jest nieco niezdefiniowane, ponieważ istnieje wiele wariantów algorytmu PLS, ale zaakceptowałbym wyniki dla każdego z nich. Chciałbym również przyjąć wytyczne dotyczące sposobu oszacowania rozkładu β poprzez np bootstrap, ale być może to jest oddzielna sprawa.β^

shabbychef
źródło

Odpowiedzi:

9

Czy znasz ten artykuł: Regresja PLS: podstawowe narzędzie chemometrii ? Wyprowadzanie SE i CI dla parametrów PLS opisano w §3.11.

Generalnie polegam na Bootstrap do obliczania CI, jak zasugerowano np. W Abdi, H. Częściowa regresja metodą najmniejszych kwadratów i projekcja na regresji struktury utajonej (regresja PLS) . Wydaje mi się, że pamiętam teoretyczne rozwiązania omówione w Tenenhaus M. (1998) La régression PLS: Théorie et pratique (Technip), ale na razie nie mogę sprawdzić, ponieważ nie mam tej książki. Na razie istnieje kilka przydatnych pakietów R, takich jak plsRglm .

PS Właśnie odkryłem artykuł Nicole Krämer w odniesieniu do pakietu plsdof R.

chl
źródło
2

Odkryłem artykuł Reissa i in. glin. , Częściowe obliczenie przedziału ufności metodą najmniejszych kwadratów dla przemysłowej prognozy jakości na końcu partii , w której pojawia się cytat:

Prognozie PLS powinien towarzyszyć internetowy przedział ufności, aby wskazać dokładność prognozy. Sformułowanie przedziału ufności dla prognozy PLS jest obszarem badań, w którym nie stwierdzono „złotego standardu”.

Niniejszy artykuł zawiera odniesienie do „doskonałego przeglądu takiej pracy”, Standardowego błędu prognozowania dla wielościeżkowego PLS , autorstwa Fabera i Bro, oraz artykułu Fabera i Kowalskiego, Propagacja błędów pomiarowych do walidacji prognoz uzyskanych przez regresję głównego elementu i częściowe najmniejsze kwadraty . Podsumuję te wyniki, gdy staną się dostępne ...

shabbychef
źródło
(+1) Dobrze wiedzieć, dziękuję. Muszę jeszcze raz spojrzeć na dzieło Michela Tenenhaus - dam ci znać, jeśli uważam, że coś jest interesujące.
chl