Jakie są „wartości początkowe” w funkcji glm ()?

12

Jakie są parametry start, etastart, mustartw GLM function () ? Szukałem w dokumentach i Internecie, ale nie znalazłem jasnego wyjaśnienia, co to oznacza.

Przypomina to bayesowskie „wartości początkowe” dla łańcuchów, ale wątpię, aby było to powiązane, ponieważ funkcja glm () w R jest statystyką częstokroć ...

Ciekawy
źródło

Odpowiedzi:

10

Ma to po prostu związek z techniką szacowania - w jaki sposób uzyskuje się zestaw oszacowań parametrów w modelu. Uogólniony model liniowy jest dopasowany przez iteracyjnie przeważone najmniejsze kwadraty. Na początek wybiera się dowolny zestaw wag (często wszystkie są równe początkowi), a następnie wybiera się oszacowania parametrów w predyktorze liniowym, które minimalizują ważoną sumę kwadratów reszt. Te oszacowane parametry w predyktorze liniowym są używane do oszacowania nowego wektora średnich. Z tego wynika nowy zestaw wag - na przykład, w zależności od używanej funkcji rodziny i łącza, wariancja odpowiedzi może być proporcjonalna do średniej odpowiedzi - więc wagi będą odwrotnie proporcjonalne do średniej. Ten nowy zestaw wag jest wykorzystywany w nowej iteracji całej procedury.

Tak więc trzy argumenty do glm (), o które pytałeś, są po prostu sposobami na rozpoczęcie procedury przez użytkownika w dowolnym arbitralnym punkcie, zamiast pozwolić mu wybrać własny domyślny punkt początkowy. Z pliku pomocy, do którego linkujesz:

  • start - wartości początkowe dla parametrów w predyktorze liniowym.
  • etastart - wartości początkowe dla predyktora liniowego.
  • mustart - początkowe wartości dla wektora średnich.
Peter Ellis
źródło
Dzięki Peter! To całkowicie przypomina bayesowską procedurę MCMC! Myślałem, że pakiety dla częstych są bardziej sprytne i nie działają w ten sposób :-) Właśnie o to się myliłem ... dlaczego, u licha, jest coś takiego jak początkowe wartości w pakiecie dla częstych :-)
Ciekawy
1
Czasami bez wartości początkowych nie można zbiegać się lub zbierać na lokalnym maksimum, który nie jest rozwiązaniem globalnie optymalnym. Dobrze jest mieć możliwość wypróbowania różnych wartości początkowych.
Peter Ellis,
Zaczynam mieć wrażenie, że nawet glm()jest bayesowski :-)
Ciekawy
4
@Curious To nie jest szczególnie bayesowski. Prosisz tylko, aby pakiet oprogramowania znalazł konkretny punkt za pomocą techniki wyszukiwania. Wartości początkowe mówią po prostu, od czego zacząć - nie nadaje szczególnej wagi tej odpowiedzi, ale może pomóc, jeśli wędruje po skomplikowanej przestrzeni. Nie ma nic szczególnie bayesowskiego w „Zacznę od, powiedzmy, 0,05 i stamtąd
będę