W artykule badawczym na temat analizy wrażliwości modelu równania różniczkowego zwyczajnego układu dynamicznego autor podał rozkład parametru modelu jako Rozkład normalny (średnia = 1e-4, std = 3e-5) obcięty do zakresu [0,5e -4 1,5e-4]. Następnie wykorzystuje próbki z tego obciętego rozkładu do symulacji modelu. Co to znaczy mieć obcięty rozkład i próbkę z tego obciętego rozkładu?
Mógłbym wymyślić dwa sposoby:
- Próbkuj z rozkładu normalnego, ale przed symulacjami zignoruj wszystkie losowe wartości spoza określonego zakresu.
- Jakoś uzyskać specjalny rozkład „Skrócona normalna” i pobrać z niego próbki.
Czy są to prawidłowe i równoważne podejścia?
Uważam, że w pierwszym przypadku, gdyby wykreślić eksperymentalny plik cdf / pdf próbki, nie wyglądałby on jak rozkład normalny, ponieważ krzywe nie rozciągają się do .
qnorm
w pętli R nie jest dobrym pomysłem.Ta metoda jest poprawna, ale jak wspomniał @ Xi'an w swojej odpowiedzi, zajęłoby dużo czasu, gdy zasięg jest mały (a dokładniej, gdy jego miara jest mała w normalnym rozkładzie).
Simulate a truncated distribution using importance sampling
A possibility is to use importance sampling. Consider the case of the standard Gaussian distributionN(0,1) . Forget the previous notations, now let G be the Cauchy distribution. The two above mentionned requirements are fulfilled for G : one simply has G(q)=arctan(q)π+12 and G−1(q)=tan(π(q−12)) . Therefore, the truncated Cauchy distribution is easy to sample by the inversion method and it is a good choice of the instrumental variable for importance sampling of the truncated normal distribution.
After a bit of simplifications, samplingU∼Unif(G(a),G(b)) and taking G−1(U) is equivalent to take tan(U′) with U′∼Unif(arctan(a),arctan(b)) :
Now one has to calculate the weight for each sampled valuexi , defined as the ratio ϕ(x)/g(x) of the two densities up to normalization, hence we can take
The weighted sample(xi,w(xi)) allows to estimate the measure of every interval [u,v] under the target distribution, by summing the weights of each sampled value falling inside the interval:
This provides an estimate of the target cumulative function. We can quickly get and plot it with the
spatsat
package:Of course, the sample(xi) is definitely not a sample of the target distribution, but of the instrumental Cauchy distribution, and one gets a sample of the target distribution by performing weighted resampling, for instance using the multinomial sampling:
Another method: fast inverse transform sampling
Olver and Townsend developed a sampling method for a broad class of continuous distribution. It is implemented in the chebfun2 library for Matlab as well as the ApproxFun library for Julia. I have recently discovered this library and it sounds very promising (not only for random sampling). Basically this is the inversion method but using powerful approximations of the cdf and the inverse cdf. The input is the target density function up to normalization.
The sample is simply generated by the following code:
As checked below, it yields an estimated measure of the interval[2,4] close to the one previously obtained by importance sampling:
źródło