Jaki jest rozkład błędu wokół danych wzrostu logistycznego?

10

W ekologii często używamy logistycznego równania wzrostu:

Nt=KN0ertK+N0ert1

lub

Nt=KN0N0+(KN0)ert

gdzie jest nośnością (osiągnięta maksymalna gęstość), jest gęstością początkową, jest szybkością wzrostu, jest czasem od początkowej.KN0rt

Wartość ma miękką górną granicę i dolną granicę , z silną dolną granicą na .Nt(K)(N0)0

Ponadto, w moim specyficznym kontekście, pomiary są wykonywane przy użyciu gęstości optycznej lub fluorescencji, z których oba mają teoretyczne maksima, a zatem silną górną granicę.Nt

Błąd wokół jest więc prawdopodobnie najlepiej opisany ograniczonym rozkładem.Nt

Przy małych wartościach rozkład prawdopodobnie ma silne dodatnie pochylenie, natomiast przy wartościach zbliżających się do K rozkład prawdopodobnie ma silne ujemne pochylenie. Rozkład prawdopodobnie ma zatem parametr kształtu, który można powiązać z .NtNtNt

Wariancja może również wzrosnąć wraz z .Nt

Oto graficzny przykład

wprowadź opis zdjęcia tutaj

z

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

które mogą być wytwarzane wr

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • Jaki byłby teoretyczny rozkład błędów wokół (biorąc pod uwagę zarówno model, jak i dostarczone informacje empiryczne)?Nt

  • W jaki sposób parametry tego rozkładu odnoszą się do wartości lub czasu (jeśli przy użyciu parametrów tryb nie może być bezpośrednio powiązany z np. normal)?NtNt

  • Czy ten rozkład ma zaimplementowaną funkcję gęstości w ?R

Dotychczasowe wskazówki:

  • Zakładając normalność wokół (prowadzi do )NtK
  • Logit rozkład normalny wokół , ale trudność w dopasowaniu parametrów kształtu alfa i betaNt/max
  • Rozkład normalny wokół logikiNt/max
Etienne Low-Décarie
źródło
1
Koncentrując się na dystrybucji błędu to pytanie odzwierciedla wyrafinowany myślenie o modelu, ale należy pamiętać, że rozkład błędu w postaci funkcjonalnej niekoniecznie mają żadnej relacji do samej formie. Składniki prawidłowej odpowiedzi można natomiast znaleźć w informacji o tym, jak następuje wzrost, o naturalnych zmianach i czasie (które koniecznie zostaną wchłonięte przez błąd), o możliwej błędnej specyfikacji modelu oraz o tym, jak ( i ) są mierzone. KrNtt
whuber
@ Whuber, próbowałem odnieść się do niektórych twoich komentarzy w ostatnim wydaniu.
Etienne Low-Décarie
1
5 sądzę, że jeśli potrafisz scharakteryzować właściwości rozkładu hałasu tak, jak masz, to możesz wybrać parametryczną formę z tymi właściwościami. Myślę, że podsumowując, rodzina musi 1. być zdefiniowana w skończonych odstępach czasu, 2. pozwolić na lewe pochylenie, prawe pochylenie i symetrię. oraz 3. ma wariancję, która rośnie wraz ze wzrostem Nt. Rozkład beta pasuje do rachunku dla 1 i 2. Stały przedział wynosi [0, 1]. Aby umożliwić zwiększenie wariancji, moglibyśmy dodać parametr c, który rozkłada rozkład na przedziały [0, c].
Michael R. Chernick

Odpowiedzi:

3

Jak zauważył Michael Chernick, najlepiej nadaje się do tego skalowana dystrybucja beta. Jednak dla wszystkich praktycznych celów i oczekując, że NIGDY nie będzieszjeśli model jest idealnie poprawny, lepiej byłoby po prostu modelować średnią za pomocą regresji nieliniowej zgodnie z twoim logistycznym równaniem wzrostu i podsumować to standardowymi błędami odpornymi na heteroskedastyczność. Umieszczenie tego w kontekście maksymalnego prawdopodobieństwa stworzy fałszywe poczucie wielkiej dokładności. Jeśli teoria ekologiczna spowodowałaby rozkład, należy go dopasować. Jeśli twoja teoria pozwala jedynie przewidzieć średnią, powinieneś trzymać się tej interpretacji i nie próbować wymyślać niczego więcej, na przykład pełnego rozkładu. (System krzywych Pearsona był z pewnością fantazyjny 100 lat temu, ale przypadkowe procesy nie postępują zgodnie z równaniami różniczkowymi w celu uzyskania krzywych gęstości, co było jego motywacją dla tych krzywych gęstości - a raczejNt sam - myślę o rozkładzie Poissona jako przykładzie - i nie jestem całkowicie pewien, czy ten efekt zostanie przechwycony przez skalowaną dystrybucję beta; wręcz przeciwnie, zostanie ściśnięty, gdy pociągniesz środek w kierunku jego teoretycznej górnej granicy, co być może będziesz musiał zrobić. Jeśli twoje urządzenie pomiarowe ma górną granicę pomiarów, nie oznacza to, że twój rzeczywisty procesmusi mieć górną granicę; Chciałbym raczej powiedzieć, że błąd pomiaru wprowadzony przez wasze urządzenia staje się krytyczny, gdy proces osiąga górną granicę pomiaru, który jest dość dokładnie mierzony. Jeśli pomieszasz pomiar z procesem leżącym u jego podstaw, powinieneś to wyraźnie rozpoznać, ale wyobrażam sobie, że jesteś bardziej zainteresowany tym procesem niż opisem sposobu działania urządzenia. (Proces będzie za 10 lat; nowe urządzenia pomiarowe mogą być dostępne, więc Twoja praca stanie się przestarzała).

StasK
źródło
Wielkie dzięki! Zgadzam się, że oddzielenie procesu od miary jest interesujące. Sugerowałbym jednak, że większość metod pomiarowych ma tę górną granicę, ale może to być ważne, aby ją wyodrębnić. Jeśli mam gdzie użyć skalowanej wersji beta, pomimo twojego ostrzeżenia o pewności dopasowania MLE, masz jakieś sugestie, jak powiązać parametry kształtu z tym systemem w celu modelowania zmiennych, aby umożliwić MLE?
Etienne Low-Décarie
Jeśli jesteś przekonany, że twoje granice są naprawdę ważne w twojej aplikacji, możesz po prostu trzymać się tej skalowanej wersji beta. Mówię tylko, że nie jestem przekonany. Istnieją modele skróconych danych, w których wszystko, co wiesz, to fakt, że rzeczywista wartość przekracza maksimum, które możesz zmierzyć; czasami są one stosowane łącznie z najwyższym kodowaniem dochodów, podczas gdy ze względów poufności dochody większe niż, powiedzmy, 100 000 USD rocznie są obcięte do 100 000 USD rocznie.
StasK
1

@ whuber ma rację, że nie ma koniecznego związku części strukturalnej tego modelu z rozkładem terminów błędów. Więc nie ma odpowiedzi na twoje pytanie dotyczące teoretycznego rozkładu błędów.

Nie oznacza to jednak, że nie jest to dobre pytanie - wystarczy, że odpowiedź będzie musiała być w dużej mierze empiryczna.

Wygląda na to, że losowość jest addytywna. Nie widzę innego powodu (poza wygodą obliczeniową). Czy istnieje alternatywa, że ​​gdzieś w modelu występuje element losowy? Na przykład patrz poniżej, gdzie losowość jest wprowadzana jako rozkład normalny ze średnią 1, wariancja jest jedyną rzeczą do oszacowania. Nie mam powodu, aby sądzić, że jest to słuszne, poza tym, że daje prawdopodobne wyniki, które wydają się pasować do tego, co chcesz zobaczyć. Czy praktyczne byłoby użycie czegoś takiego jako podstawy do oszacowania modelu, którego nie znam.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

wprowadź opis zdjęcia tutaj

Peter Ellis
źródło
W takim przypadku możesz mieć wartości Nt poniżej zera i powyżej twardej górnej granicy. Ponadto, oczekuje się szumu we wszystkich parametrach (niekoniecznie jako iloczyn parametru z czasem), stąd szum na zmiennej odpowiedzi. Nadal byłbym zainteresowany interpretacją twojego maksymalnego prawdopodobieństwa.
Etienne Low-Décarie
To nie pozwala na ograniczenie rozkładu dla każdej Nt i nie pozwala na pochylenie komponentu hałasu. Nie wiem, czy mój pomysł na skalowaną dystrybucję beta został wykorzystany w literaturze, ale dobrze spełnia ograniczenia. Nie próbowałem tego, ale może można spróbować z najwyższym prawdopodobieństwem. Nie jestem pewien, ale może byłby problem, gdyby c było uwzględnione w oszacowaniu prawdopodobieństwa. Może c można oszacować osobno na podstawie tylko Nt, a następnie resztę modelu można dopasować z maksymalnym prawdopodobieństwem dla każdej stałej Nt.
Michael R. Chernick
Po prostu myślę na głos. Czy ktoś myśli, że ten problem można przekształcić w dobrą pracę naukową?
Michael R. Chernick
Artykuł z 1966 r. Trochę się w tym zastanowił, jednak nie widziałem jeszcze jednego. Może od tego czasu coś się zmieniło? jstor.org/discover/10.2307/…
Etienne Low-Décarie
Daj mi znać, jeśli zdecydujesz się wybrać tę trasę.
Etienne Low-Décarie