Jak odczytać dobroć dopasowania na nls R?

12

Próbuję zinterpretować dane wyjściowe nls (). Przeczytałem ten post, ale nadal nie rozumiem, jak wybrać najlepsze dopasowanie. Z moich ataków mam dwa wyjścia:

> summary(m)

  Formula: y ~ I(a * x^b)

  Parameters:
  Estimate Std. Error t value Pr(>|t|)    
  a 479.92903   62.96371   7.622 0.000618 ***
  b   0.27553    0.04534   6.077 0.001744 ** 
  ---
  Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

  Residual standard error: 120.1 on 5 degrees of freedom

  Number of iterations to convergence: 10 
  Achieved convergence tolerance: 6.315e-06 

i

> summary(m1)

  Formula: y ~ I(a * log(x))

  Parameters:
  Estimate Std. Error t value Pr(>|t|)    
  a   384.49      50.29   7.645 0.000261 ***
  ---
  Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

  Residual standard error: 297.4 on 6 degrees of freedom

  Number of iterations to convergence: 1 
  Achieved convergence tolerance: 1.280e-11

Pierwszy ma dwa parametry i mniejszy błąd resztkowy. Drugi tylko jeden parametr, ale najgorszy błąd resztkowy. Który najlepiej pasuje?

emanuele
źródło
4
Ocena modelu to znacznie więcej niż przeglądanie jednej lub dwóch statystyk podsumowujących. Jak wyglądają resztki? Czy któreś z danych wykazują zbyt dużą dźwignię? Co mówi dobroć diagnostyki dopasowania? Czy teoria sugeruje, że jeden z tych modeli powinien być preferowany? Dla jakich wartości pasowania te różnią się znacznie i czy to ma znaczenie? Itd.x
whuber
3
Usunąłem odpowiedź, która sugerowała użycie AIC, ponieważ komentarz stanowił przekonujący argument, że AIC nie ma ogólnie zastosowania do wyboru nlspasowań. Zawsze starałbym się decydować o modelu nieliniowym opartym na wiedzy mechanistycznej, szczególnie jeśli zestaw danych jest tak mały jak twój.
Roland
1
Hmmm. Czy oryginalny komentator usuniętej teraz odpowiedzi @ Roland chętnie opublikuje komentarz ponownie? Nie jest dla mnie od razu oczywiste, dlaczego AIC nie byłby odpowiedni ... (chociaż stat.ethz.ch/pipermail/r-help/2010-August/250742.html daje pewne wskazówki) - i na koniec, jeśli próbujesz zidentyfikować transformację mocy, możesz spróbować transformacji Box-Coxa ( boxcoxw MASSpakiecie)
Ben Bolker 24.09.12
1
AIC można wykorzystać do wyboru modeli.

Odpowiedzi:

2

Możesz po prostu użyć testu F i anova, aby je porównać. Oto kilka kodów.

> x <- 1:10
> y <- 2*x + 3                            
> yeps <- y + rnorm(length(y), sd = 0.01)
> 
> 
> m1=nls(yeps ~ a + b*x, start = list(a = 0.12345, b = 0.54321))
> summary(m1)

Formula: yeps ~ a + b * x

Parameters:
   Estimate Std. Error t value Pr(>|t|)    
a 2.9965562  0.0052838   567.1   <2e-16 ***
b 2.0016282  0.0008516  2350.6   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.007735 on 8 degrees of freedom

Number of iterations to convergence: 2 
Achieved convergence tolerance: 3.386e-09 

> 
> 
> m2=nls(yeps ~ a + b*x+c*I(x^5), start = list(a = 0.12345, b = 0.54321,c=10))
> summary(m2)

Formula: yeps ~ a + b * x + c * I(x^5)

Parameters:
   Estimate Std. Error  t value Pr(>|t|)    
a 3.003e+00  5.820e-03  516.010   <2e-16 ***
b 1.999e+00  1.364e-03 1466.004   <2e-16 ***
c 2.332e-07  1.236e-07    1.886    0.101    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.006733 on 7 degrees of freedom

Number of iterations to convergence: 2 
Achieved convergence tolerance: 1.300e-06 

> 
> anova(m1,m2)
Analysis of Variance Table

Model 1: yeps ~ a + b * x
Model 2: yeps ~ a + b * x + c * I(x^5)
  Res.Df Res.Sum Sq Df     Sum Sq F value Pr(>F)
1      8 0.00047860                             
2      7 0.00031735  1 0.00016124  3.5567 0.1013
>
Stat
źródło
5
Więcej informacji na temat interpretacji wyników?
skan
Proszę rozwinąć Z moim zestawem danych nie otrzymuję danych wyjściowych dla wartości F i dla Pr (> F). Po co przeprowadzać analizy anova? Znam go tylko do porównywania kategorii, a nie modeli.
user3386170