Piszę artykuł, w którym zastosowano asymptotykę wypełnienia, a jeden z moich recenzentów poprosił mnie o podanie ścisłej matematycznej definicji tego, czym jest asymptotyka wypełnienia (tj. Z symbolami matematycznymi i notacją).
Wydaje mi się, że nie mogę nic znaleźć w literaturze i miałem nadzieję, że ktoś może skierować mnie w stronę niektórych lub podać własną definicję.
Jeśli nie jesteś zaznajomiony z asymptotycznymi wypełnieniami (zwanymi także asymptotycznymi o ustalonej domenie), są one następujące: Asymptotyki wypełniające oparte są na obserwacjach, które stają się coraz bardziej gęste w niektórych stałych i ograniczonych obszarach wraz ze wzrostem ich liczby.
Innymi słowy, asymptotyka wypełnienia to miejsce, w którym gromadzi się więcej danych przez próbkowanie bardziej gęsto w ustalonej dziedzinie.
Patrzyłem już na Stein 1999 i Cressie 1993, ale nie ma tam nic „matematycznie” rygorystycznego.
Oto cytowany fragment mojej pracy.
Dlatego ważne jest, aby rozpoznać rodzaj asymptotyków, z którymi mamy do czynienia. W naszym przypadku asymptotyki, z którymi mamy do czynienia, oparte są na obserwacjach, które stają się coraz bardziej gęste w niektórych ustalonych i ograniczonych regionach wraz ze wzrostem ich liczby. Te typy asymptotyków są znane jako asymptotyki o stałej domenie (Stein, 1999) lub asymptotyki wypełniające (Cressie, 1993). Infill asymptotics, w którym gromadzi się więcej danych, próbkując bardziej gęsto w ustalonej domenie, odegra kluczową rolę w opracowaniu argumentu za ...
Nie bez znaczenia jest to, że próbuję swoje obserwacje za pomocą łacińskiego próbkowania hipersześcianu.
Oto, co ma do powiedzenia książka Cressie o asymptotyce wypełnienia.
Odpowiedzi:
Definicja asymptotyków wypełniania nie jest szczególnie użyteczna (technicznie, jeśli domena pozostaje stała i wielkość próby wzrasta, to znaczy asymptotyki wypełniania. Ale rozważ przypadek, w którym próbujesz na transecie od 0 do 1, biorąc jedną próbkę w 0,1 / 2, kolejna próbka w 1 / 2,3 / 4, kolejna w przedziale 3/4, 7/8 itd. Będziesz mógł dużo powiedzieć o wartościach w 1, ale nie będziesz mógł powiedzieć dużo jeszcze.)
Aby uzyskać typowy wynik w asymptotyce wypełnienia, potrzebujesz projektu o właściwościach takich jak: dla wszystkich podregionów obszaru , dla dowolnego prawdopodobieństwo prawdopodobieństwa wystąpienia próbki w podregionie zbliża się do 1 jako . Taka próbka jest gęsta w domenie.ϵ > 0 n → ∞ϵ ϵ>0 n→∞
Czasami wypełnienie nie jest podane wprost, podany jest tylko projekt. Na przykład w artykule Lahiri (O niespójności estymatorów opartych na danych przestrzennych pod Infill Asymptotics) opisuje projekt, który jest zasadniczo „roztrzęsioną” siatką (pewna losowość jako niewielki poziom, ale generalnie oparty na próbkowaniu w hiper prostokątach podregiony), który jest asymptotycznie gęsty w ustalonej dziedzinie. Uzyskuje wynik (wspólny dla problemów z wypełnieniem), że większość parametrów wariogramu jest szacowana niespójnie.
Lahiri, Lee i Cressie (O rozkładzie asymptotycznym i wydajności asymptotycznej estymatorów najmniejszych kwadratów parametrów wariogramu przestrzennego, J.StatPlanInf 2002, vol. 103, str. 65-85) podobnie rozważają siatki wypełnień, które stają się systematycznie ściślej rozmieszczone, ponownie, dając gęsta próbka.
(Ogólny wynik dla gęstych próbek jest taki, że ponieważ asymptotyka wypełnienia jest naprawdę pojedynczą realizacją procesu przestrzennego, jedynym parametrem prawdziwej wariogramu (superpopulacji), który można konsekwentnie oszacować, jest nachylenie zerowe, ale prognozy są coraz lepsze. )
źródło
Zacznijmy od definicji próbkowania Latin Hypercube, aby wszystko było idealnie jasne i ustanowić notację. Następnie możemy zdefiniować asymptotykę wypełnienia.
LHS
Latin Hypercube Próbkowanie pola przebiega przez podzielenie każdego wymiaru na części o równej długości , dzieląc go w ten sposób na komórkiB=[l1,u1)×[l2,u2)×⋯[ld,ud)⊂Rd N≥1 δi(N)=(ui−li)/N Nd
gdzie dla każdego indeksu .0≤ij<N j
Próbkowanie odbywa się poprzez wybranie najpierw takich komórek jednolicie, niezależnie i bez zastąpienie ze zbioru wszystkich takich komórek w taki sposób, żeN S={cN(i11,…,i1d),…,cN(iN1,…,iNd)}
(To jest wymiarową uogólnienie -wymiarowego sytuacji „jest tylko jedna próbka każdego wiersza i każdej kolumny”). Każdy z komórkach jest następnie próbkowany w miejscu wybranym równomiernie i niezależnie spośród wszystkich punktów w komórce, tworząc zestaw uporządkowanych par wartości (lokalizacja, obserwacja).d 2 N S N
Wypełnij Asymptotyki
Prawdopodobnie Procedura niektóre jest stosowana do każdego Łacińskiej HyperCube próbki o rozmiarze o stałym polu , uzyskując oszacowanie dla każdego z . Powoduje to sekwencjętN X(N) N B tN(X(N)) N
zmiennych losowych. Asymptotyka wypełnienia odnosi się do zachowania tej sekwencji, gdy rośnie bez wiązania.N
źródło