Matematyczna definicja Asymptotyków Infill

10

Piszę artykuł, w którym zastosowano asymptotykę wypełnienia, a jeden z moich recenzentów poprosił mnie o podanie ścisłej matematycznej definicji tego, czym jest asymptotyka wypełnienia (tj. Z symbolami matematycznymi i notacją).

Wydaje mi się, że nie mogę nic znaleźć w literaturze i miałem nadzieję, że ktoś może skierować mnie w stronę niektórych lub podać własną definicję.

Jeśli nie jesteś zaznajomiony z asymptotycznymi wypełnieniami (zwanymi także asymptotycznymi o ustalonej domenie), są one następujące: Asymptotyki wypełniające oparte są na obserwacjach, które stają się coraz bardziej gęste w niektórych stałych i ograniczonych obszarach wraz ze wzrostem ich liczby.

Innymi słowy, asymptotyka wypełnienia to miejsce, w którym gromadzi się więcej danych przez próbkowanie bardziej gęsto w ustalonej dziedzinie.

Patrzyłem już na Stein 1999 i Cressie 1993, ale nie ma tam nic „matematycznie” rygorystycznego.


Oto cytowany fragment mojej pracy.

Dlatego ważne jest, aby rozpoznać rodzaj asymptotyków, z którymi mamy do czynienia. W naszym przypadku asymptotyki, z którymi mamy do czynienia, oparte są na obserwacjach, które stają się coraz bardziej gęste w niektórych ustalonych i ograniczonych regionach wraz ze wzrostem ich liczby. Te typy asymptotyków są znane jako asymptotyki o stałej domenie (Stein, 1999) lub asymptotyki wypełniające (Cressie, 1993). Infill asymptotics, w którym gromadzi się więcej danych, próbkując bardziej gęsto w ustalonej domenie, odegra kluczową rolę w opracowaniu argumentu za ...

Nie bez znaczenia jest to, że próbuję swoje obserwacje za pomocą łacińskiego próbkowania hipersześcianu.

Oto, co ma do powiedzenia książka Cressie o asymptotyce wypełnienia. wprowadź opis zdjęcia tutaj


źródło
Sekcja 5.8, Infill Asymptotics , pierwszego (1991) wydania książki Cressie jest jasna. Chociaż nie podaje definicji w notacji matematycznej, przykład (asymptotyki, które są „delikatniejsze niż wypełnienie”) jest wyraźnie podany dwie strony później przy użyciu notacji matematycznej. Czy mógłbyś zacytować własny opis „asymptotycznych wypełnień”?
whuber
@ whuber Dodałem cytat do pierwotnego pytania
Dziękuję Ci. Cytat ten nie wydaje się wystarczająco szczegółowy. Jak dokładnie zajmujesz się próbkowaniem ustalonej domeny? Przykładem (oferowanym przez Cressie) jest próbkowanie jednego punktu, a następnie, na zawsze, próbkowanie w klastrze wokół innego punktu. Prawdopodobnie miałoby to inne zachowanie asymptotyczne niż na przykład pobieranie próbek za pomocą jednorodnego procesu Poissona.
whuber
@ whuber Używam łacińskich próbek hipersześcianu.
Podaj tę informację w swoim pytaniu, ponieważ ma ona kluczowe znaczenie dla odpowiedzi.
whuber

Odpowiedzi:

0

Definicja asymptotyków wypełniania nie jest szczególnie użyteczna (technicznie, jeśli domena pozostaje stała i wielkość próby wzrasta, to znaczy asymptotyki wypełniania. Ale rozważ przypadek, w którym próbujesz na transecie od 0 do 1, biorąc jedną próbkę w 0,1 / 2, kolejna próbka w 1 / 2,3 / 4, kolejna w przedziale 3/4, 7/8 itd. Będziesz mógł dużo powiedzieć o wartościach w 1, ale nie będziesz mógł powiedzieć dużo jeszcze.)

Aby uzyskać typowy wynik w asymptotyce wypełnienia, potrzebujesz projektu o właściwościach takich jak: dla wszystkich podregionów obszaru , dla dowolnego prawdopodobieństwo prawdopodobieństwa wystąpienia próbki w podregionie zbliża się do 1 jako . Taka próbka jest gęsta w domenie.ϵ > 0 n ϵϵ>0n

Czasami wypełnienie nie jest podane wprost, podany jest tylko projekt. Na przykład w artykule Lahiri (O niespójności estymatorów opartych na danych przestrzennych pod Infill Asymptotics) opisuje projekt, który jest zasadniczo „roztrzęsioną” siatką (pewna losowość jako niewielki poziom, ale generalnie oparty na próbkowaniu w hiper prostokątach podregiony), który jest asymptotycznie gęsty w ustalonej dziedzinie. Uzyskuje wynik (wspólny dla problemów z wypełnieniem), że większość parametrów wariogramu jest szacowana niespójnie.

Lahiri, Lee i Cressie (O rozkładzie asymptotycznym i wydajności asymptotycznej estymatorów najmniejszych kwadratów parametrów wariogramu przestrzennego, J.StatPlanInf 2002, vol. 103, str. 65-85) podobnie rozważają siatki wypełnień, które stają się systematycznie ściślej rozmieszczone, ponownie, dając gęsta próbka.

(Ogólny wynik dla gęstych próbek jest taki, że ponieważ asymptotyka wypełnienia jest naprawdę pojedynczą realizacją procesu przestrzennego, jedynym parametrem prawdziwej wariogramu (superpopulacji), który można konsekwentnie oszacować, jest nachylenie zerowe, ale prognozy są coraz lepsze. )

AlaskaRon
źródło
Czy wiesz, jak udowodnić to stwierdzenie? „dla wszystkich podregionów obszaru ϵ, dla dowolnego ϵ> 0, prawdopodobieństwo wystąpienia próbki w podregionie zbliża się do 1 jako n → ∞. Taka próbka jest gęsta w dziedzinie.”
To prawie definicja „gęsta”. Gęsta sekwencja ma punkt graniczny we wszystkich lokalizacjach. Więc jeśli wybierzesz dowolną lokalizację w regionie i dowolny dysk o promieniu wokół niego, ponieważ dysk ten jest podregionem, w końcu otrzymasz w nim obserwację. (UWAGA: Zakładam, że domeną jest jakiś rozsądny wielokąt, a nie jakaś patologiczna dziwactwo topologiczne ...) Zauważ, że wiele procesów daje gęste sekwencje, w tym procesy przestrzenne Poissona (wszędzie o intensywności> 0), sekwencje ergodyczne, proste losowe próbki i siatki. ϵ
AlaskaRon
Czy znasz jakieś dokumenty, które mówią, że Latin Hypercubes są asymptotycznie gęste?
4

Zacznijmy od definicji próbkowania Latin Hypercube, aby wszystko było idealnie jasne i ustanowić notację. Następnie możemy zdefiniować asymptotykę wypełnienia.

LHS

Latin Hypercube Próbkowanie pola przebiega przez podzielenie każdego wymiaru na części o równej długości , dzieląc go w ten sposób na komórkiB=[l1,u1)×[l2,u2)×[ld,ud)RdN1δi(N)=(uili)/NNd

cN(i1,i2,,id)=[l1+i1δ1(N),l1+(i1+1)δ1(N))×[ld+idδd(N),ld+(id+1)δd(N)),

gdzie dla każdego indeksu .0ij<Nj

Próbkowanie odbywa się poprzez wybranie najpierw takich komórek jednolicie, niezależnie i bez zastąpienie ze zbioru wszystkich takich komórek w taki sposób, żeNS={cN(i11,,id1),,cN(i1N,,idN)}

{ij1,ij2,,ijN}={1,2,,N}, j=1,2,,d.

(To jest wymiarową uogólnienie -wymiarowego sytuacji „jest tylko jedna próbka każdego wiersza i każdej kolumny”). Każdy z komórkach jest następnie próbkowany w miejscu wybranym równomiernie i niezależnie spośród wszystkich punktów w komórce, tworząc zestaw uporządkowanych par wartości (lokalizacja, obserwacja).d2NSN

X(N)={(Z1N,Y1N),,(ZNN,YNN)}

Wypełnij Asymptotyki

Prawdopodobnie Procedura niektóre jest stosowana do każdego Łacińskiej HyperCube próbki o rozmiarze o stałym polu , uzyskując oszacowanie dla każdego z . Powoduje to sekwencjętNX(N)NBtN(X(N))N

t1(X(1)),t2(X(2)),,tN(X(N)),

zmiennych losowych. Asymptotyka wypełnienia odnosi się do zachowania tej sekwencji, gdy rośnie bez wiązania.N

Whuber
źródło