W ekologii często używamy logistycznego równania wzrostu:
lub
gdzie jest nośnością (osiągnięta maksymalna gęstość), jest gęstością początkową, jest szybkością wzrostu, jest czasem od początkowej.
Wartość ma miękką górną granicę i dolną granicę , z silną dolną granicą na .
Ponadto, w moim specyficznym kontekście, pomiary są wykonywane przy użyciu gęstości optycznej lub fluorescencji, z których oba mają teoretyczne maksima, a zatem silną górną granicę.
Błąd wokół jest więc prawdopodobnie najlepiej opisany ograniczonym rozkładem.
Przy małych wartościach rozkład prawdopodobnie ma silne dodatnie pochylenie, natomiast przy wartościach zbliżających się do K rozkład prawdopodobnie ma silne ujemne pochylenie. Rozkład prawdopodobnie ma zatem parametr kształtu, który można powiązać z .
Wariancja może również wzrosnąć wraz z .
Oto graficzny przykład
z
K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1
które mogą być wytwarzane wr
library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
Jaki byłby teoretyczny rozkład błędów wokół (biorąc pod uwagę zarówno model, jak i dostarczone informacje empiryczne)?
W jaki sposób parametry tego rozkładu odnoszą się do wartości lub czasu (jeśli przy użyciu parametrów tryb nie może być bezpośrednio powiązany z np. normal)?
Czy ten rozkład ma zaimplementowaną funkcję gęstości w ?
Dotychczasowe wskazówki:
- Zakładając normalność wokół (prowadzi do )
- Logit rozkład normalny wokół , ale trudność w dopasowaniu parametrów kształtu alfa i beta
- Rozkład normalny wokół logiki
źródło
Odpowiedzi:
Jak zauważył Michael Chernick, najlepiej nadaje się do tego skalowana dystrybucja beta. Jednak dla wszystkich praktycznych celów i oczekując, że NIGDY nie będzieszjeśli model jest idealnie poprawny, lepiej byłoby po prostu modelować średnią za pomocą regresji nieliniowej zgodnie z twoim logistycznym równaniem wzrostu i podsumować to standardowymi błędami odpornymi na heteroskedastyczność. Umieszczenie tego w kontekście maksymalnego prawdopodobieństwa stworzy fałszywe poczucie wielkiej dokładności. Jeśli teoria ekologiczna spowodowałaby rozkład, należy go dopasować. Jeśli twoja teoria pozwala jedynie przewidzieć średnią, powinieneś trzymać się tej interpretacji i nie próbować wymyślać niczego więcej, na przykład pełnego rozkładu. (System krzywych Pearsona był z pewnością fantazyjny 100 lat temu, ale przypadkowe procesy nie postępują zgodnie z równaniami różniczkowymi w celu uzyskania krzywych gęstości, co było jego motywacją dla tych krzywych gęstości - a raczejNt sam - myślę o rozkładzie Poissona jako przykładzie - i nie jestem całkowicie pewien, czy ten efekt zostanie przechwycony przez skalowaną dystrybucję beta; wręcz przeciwnie, zostanie ściśnięty, gdy pociągniesz środek w kierunku jego teoretycznej górnej granicy, co być może będziesz musiał zrobić. Jeśli twoje urządzenie pomiarowe ma górną granicę pomiarów, nie oznacza to, że twój rzeczywisty procesmusi mieć górną granicę; Chciałbym raczej powiedzieć, że błąd pomiaru wprowadzony przez wasze urządzenia staje się krytyczny, gdy proces osiąga górną granicę pomiaru, który jest dość dokładnie mierzony. Jeśli pomieszasz pomiar z procesem leżącym u jego podstaw, powinieneś to wyraźnie rozpoznać, ale wyobrażam sobie, że jesteś bardziej zainteresowany tym procesem niż opisem sposobu działania urządzenia. (Proces będzie za 10 lat; nowe urządzenia pomiarowe mogą być dostępne, więc Twoja praca stanie się przestarzała).
źródło
@ whuber ma rację, że nie ma koniecznego związku części strukturalnej tego modelu z rozkładem terminów błędów. Więc nie ma odpowiedzi na twoje pytanie dotyczące teoretycznego rozkładu błędów.
Nie oznacza to jednak, że nie jest to dobre pytanie - wystarczy, że odpowiedź będzie musiała być w dużej mierze empiryczna.
Wygląda na to, że losowość jest addytywna. Nie widzę innego powodu (poza wygodą obliczeniową). Czy istnieje alternatywa, że gdzieś w modelu występuje element losowy? Na przykład patrz poniżej, gdzie losowość jest wprowadzana jako rozkład normalny ze średnią 1, wariancja jest jedyną rzeczą do oszacowania. Nie mam powodu, aby sądzić, że jest to słuszne, poza tym, że daje prawdopodobne wyniki, które wydają się pasować do tego, co chcesz zobaczyć. Czy praktyczne byłoby użycie czegoś takiego jako podstawy do oszacowania modelu, którego nie znam.
źródło