Rozważmy niezależnych próbek otrzymano z losowej zmiennej , który jest przyjmowany śledzić skróconą dystrybucji (np obcięty rozkład normalny ) znanego (Finite) minimalne i maksymalne wartości i , lecz z nieznanych parametrów i . Jeśli następnie non-obcięte rozkładzie estymatorów największej wiarygodności ľ i σ 2 do ľ i Ď 2 z S byłoby średniej próbki μi wariancją Próbka Ď 2=1. Jednak w przypadku skróconego rozkładu wariancja próbki zdefiniowana w ten sposób jest ograniczona przez(b-a)2,więc nie zawsze jest to spójny estymator: dlaσ2>(b-a)2nie może zbiegać się z prawdopodobieństwem doσ2,gdyNprzechodzi w nieskończoność. Tak więc wydaje się, że ľ i σ 2nie są estymatory największej wiarygodności zľi dla skróconego rozkładu. Oczywiście należy się tego spodziewać, ponieważ parametry μ i σ 2 skróconego rozkładu normalnego nie są jego średnią i wariancją.
Jakie zatem są estymatory maksymalnego prawdopodobieństwa parametrów i σ skróconego rozkładu znanych wartości minimalnych i maksymalnych?
Odpowiedzi:
Rozważ dowolną rodzinę w skali lokalizacji określoną przez „standardowy” rozkład ,F
Zakładając, że rozróżnialny, z łatwością stwierdzamy, że pliki PDF to 1F .1σf((x−μ)/σ)dx
Obcinania tych rozkładów ograniczyć ich powiązania pomiędzy i b , a < b , oznacza, że zastępuje się pliki PDFa b a<b
(i są zerami dla wszystkich innych wartości ) gdzie C ( μ , σ , a , b ) = F ( μ , σ ) ( b ) - F ( μ , σ ) ( a ) jest czynnikiem normalizującym potrzebnym do zapewnienia, że f ( μ , σ ; a , b ) całkuje się w jedność. (Zauważ, że C jest identycznie 1x C(μ,σ,a,b)=F(μ,σ)(b)−F(μ,σ)(a) f(μ,σ;a,b) C 1 przy braku obcięcia.) Prawdopodobieństwo dziennika dla danych iid wynosi zatemxi
Critical points (including any global minima) are found where eitherσ=0 (a special case I will ignore here) or the gradient vanishes. Using subscripts to denote derivatives, we may formally compute the gradient and write the likelihood equations as
Becausea and b are fixed, drop them from the notation and write nCμ(μ,σ,a,b)/C(μ,σ,a,b) as A(μ,σ) and nCσ(μ,σ,a,b)/C(μ,σ,a,b) as B(μ,σ) . (With no truncation, both functions would be identically zero.) Separating the terms involving the data from the rest gives
By comparing these to the no-truncation situation it is evident that
Any sufficient statistics for the original problem are sufficient for the truncated problem (because the right hand sides have not changed).
Our ability to find closed-form solutions relies on the tractability ofA and B . If these do not involve μ and σ in simple ways, we cannot hope to obtain closed-form solutions in general.
For the case of a normal family,C(μ,σ,a,b) of course is given by the cumulative normal PDF, which is a difference of error functions: there is no chance that a closed-form solution can be obtained in general. However, there are only two sufficient statistics (the sample mean and variance will do) and the CDF is as smooth as can be, so numerical solutions will be relatively easy to obtain.
źródło