Statystyki i duże zbiory danych

12
GLM po wyborze lub legalizacji modelu

Chciałbym zadać to pytanie w dwóch częściach. Oba dotyczą uogólnionego modelu liniowego, ale pierwszy dotyczy wyboru modelu, a drugi dotyczy regularyzacji. Tło: Używam modeli GLM (liniowych, logistycznych, regresji gamma) zarówno do prognozowania, jak i do opisu. Kiedy odnoszę się do „ normalnych...

12
Jak szybko próbkować X, jeśli exp (X) ~ Gamma?

Mam prosty problem z próbkowaniem, w którym moja wewnętrzna pętla wygląda następująco: v = sample_gamma(k, a) gdzie sample_gammapróbki z rozkładu gamma tworzą próbkę Dirichleta. Działa dobrze, ale w przypadku niektórych wartości k / a niektóre z niższych obliczeń są niedopełnione. Dostosowałem...

12
Jak zrobić dobrą skalę intensywności kolorów?

Nie jestem dobry w statystyce, ale myślę, że trafiłem we właściwe miejsce. Moje pytanie jest proste: Mój problem polega na porównaniu populacji kilku stanów w małym kraju, ale niektóre stany mają 3000 000 mieszkańców, a niektóre 2 000 mieszkańców. Maluję to na mapie, a „intensywność” koloru...

12
Testowanie różnicy w AIC dwóch nie zagnieżdżonych modeli

Cały sens AIC lub innego kryterium informacyjnego polega na tym, że im mniej, tym lepiej. Więc jeśli mam dwa modele M1: y = a0 + XA + e i M2: y = b0 + ZB + u, a jeśli AIC pierwszego (A1) jest mniejszy niż drugiego (A2), to M1 ma lepsze dopasowanie z punktu widzenia teorii informacji. Ale czy...

12
Oszacowanie parametrów procesu przestrzennego

Dostaję siatki dodatnich wartości całkowitych. Liczby te reprezentują intensywność, która powinna odpowiadać sile przekonania osoby zajmującej to miejsce na siatce (wyższa wartość oznacza wyższe przekonanie). Osoba na ogół będzie miała wpływ na wiele komórek siatki.n × nn×nn\times n Uważam, że...

12
Grupowanie danych przestrzennych w R.

Mam zestaw danych miesięcznych dotyczących temperatury powierzchni morza (SST) i chcę zastosować metodologię klastrową do wykrywania regionów o podobnych wzorcach SST. Mam zestaw miesięcznych plików danych od 1985 do 2009 roku i chcę zastosować klastrowanie do każdego miesiąca jako pierwszy...

12
Przykładowa formuła wielkości dla testu F?

Zastanawiam się, czy istnieje wzór wielkości próby taki jak wzór Lehra, który ma zastosowanie do testu F. Wzór Lehra dla testów t to , gdzie to wielkość efektu ( np. ). Można to uogólnić na gdzie jest stałą, która zależy od szybkości typu I, pożądanej mocy i tego, czy wykonuje się test jednostronny...