Mam kwadrat 2D i mam w nim zestaw punktów, powiedzmy 1000 punktów. Potrzebuję sposobu, aby sprawdzić, czy rozkład punktów wewnątrz kwadratu jest rozłożony (lub bardziej lub mniej równomiernie rozmieszczony), czy też mają tendencję do gromadzenia się w jakimś miejscu wewnątrz kwadratu.
Potrzebuję matematycznego / statystycznego (nie programistycznego) sposobu, aby to ustalić. Poszukałem go, znalazłem coś w rodzaju dobroci dopasowania, Kołmogorowa itp. I po prostu zastanawiam się, czy istnieją inne podejścia do osiągnięcia tego celu. Potrzebujesz tego do papieru klasowego.
Wejścia: kwadrat 2D i 1000 punktów. Wyjście: tak / nie (tak = równomiernie rozłożone, nie = gromadzenie się w niektórych miejscach).
distributions
probability
spatial
point-process
Awangarda
źródło
źródło
R
, istnieje wiele narzędzi do tego zadania .Odpowiedzi:
Myślę, że @John pomysł testu chi = kwadrat jest jedną z możliwości.
Chcielibyście łatki na 2-d, ale chcielibyście je przetestować za pomocą 1-kierunkowego testu chi-kwadrat; to znaczy oczekiwane wartości dla komórek wyniosłyby gdzie N jest liczbą komórek.1000N.
Ale możliwe jest, że inna liczba komórek dałaby inne wnioski.
Inną możliwością jest obliczenie średniej odległości między punktami, a następnie porównanie jej z symulowanymi wynikami tej średniej. Pozwala to uniknąć problemu dowolnej liczby komórek.
EDYCJA (więcej na średnim dystansie)
Przy 1000 punktach jest parami odległości między punktami. Można je obliczyć (stosując, powiedzmy, odległość euklidesową). Odległości te można uśrednić.1000 ∗ 9992)
Następnie możesz wygenerować N (dużą liczbę) zestawów 1000 punktów, które są równomiernie rozmieszczone. Każdy z tych N zestawów ma również średnią odległość między punktami.
Porównaj wyniki dla rzeczywistych punktów z symulowanymi punktami, aby uzyskać wartość p lub po prostu zobaczyć, gdzie spadają.
źródło
Inną możliwością jest test chi-kwadrat. Podziel kwadrat na nie nakładające się łaty o równej wielkości i przetestuj liczbę punktów wchodzących w łaty pod kątem ich oczekiwanej liczby pod hipotezą jednorodności (oczekiwanie na łatę to total_points / total_patches, jeśli wszystkie są równej wielkości) i zastosuj test chi-kwadrat. Na 1000 punktów wystarczy 9 łatek, ale możesz chcieć zastosować większą szczegółowość w zależności od wyglądu danych.
źródło
Dlaczego nie zastosować testu Kołmogorowa-Smirnowa? Tak bym zrobił, szczególnie biorąc pod uwagę, że rozmiar twojej próbki jest wystarczająco duży, aby zrekompensować brak mocy.
Alternatywnie możesz wykonać symulację. To nie jest rygorystyczne, ale dostarcza pewnych dowodów na to, czy dane są równomiernie rozmieszczone.
@whuber Dwuwymiarowe rozszerzenie KS jest dobrze znane (patrz tutaj ). W tym przypadku badamy, czy te 1000 rysunków (współrzędne (x, y)) można wyciągnąć z dwuwymiarowego wspólnie jednorodnego rozkładu - przynajmniej tak czytam „równomiernie rozłożone”. @John, mogłem wyrazić się niezdarnie (ani matematyka, ani angielski nie są moimi pierwszymi językami). Miałem na myśli to, że dokładną wartość p można obliczyć za pomocą testu, takiego jak KS, podczas gdy wartość p (lub jakkolwiek nazwiesz równoważny) dąży tylko asymptotycznie podczas wykonywania symulacji.
źródło