Jak konstruować kwadraty dla procesów punktowych, które różnią się znacznie częstotliwością?

9

Chcę przeprowadzić analizę liczby kwadratów na kilku procesach punktowych (lub jednym oznaczonym procesie punktowym), aby następnie zastosować pewne techniki redukcji wymiarowości.

Znaki nie są identycznie rozmieszczone, tzn. Niektóre znaki pojawiają się dość często, a niektóre są dość rzadkie. Dlatego nie mogę po prostu podzielić mojej przestrzeni 2D na zwykłą siatkę, ponieważ częstsze znaki „przytłoczą” te rzadsze, maskując ich wygląd.

Tak więc próbowałem zbudować moją siatkę tak, aby każda komórka miała co najwyżej N punktów (aby to zrobić, po prostu dzielę każdą komórkę na cztery mniejsze (i jednakowej wielkości) komórki, rekurencyjnie, aż żadna komórka nie ma więcej niż N punktów w to).

Co sądzisz o tej technice „normalizacji”? Czy istnieje standardowy sposób na robienie takich rzeczy?

Wookai
źródło
1
Jeśli używasz zwykłej siatki, a częstsze znaki przewyższają liczby rzadziej, nie rozumiem, jak to „przytłacza” i „maskuje” rzeczy. Czy mógłbyś trochę rozwinąć? Czy próbujesz zastąpić zawartość każdego kwadrata tylko najczęstszym znakiem, czy coś takiego?
Wayne

Odpowiedzi:

1

Użyłem analizy kwadratu tylko na regularnych siatkach. Pomogło to w celu, jakim było porównanie rozproszenia danych próbkowania ze znanym procesem, np. Losowym. Dlatego regularna siatka działała dobrze.
Metoda, którą opracowałeś i opisałeś, nie jest z pewnością liczeniem kwadratowym. Na przykład w metodzie średniej ruchomej jedną z opcji jest zliczanie liczby sąsiadów dla procesu, tj. Uśrednianie, które odbywa się po prostu przez wyszukiwanie w okręgu (w 2D) lub w sferze (w 3D). Twoja metoda wygląda podobnie z nieco innym wykorzystaniem wybranych próbek.

Deweloper
źródło