Statystyki i duże zbiory danych

17
Jak piszesz ustalenia post-hoc Tukeya?

Jaki jest właściwy sposób na napisanie wyniku post-hoc Tukeya? Istnieje kilka przykładów z różnymi wynikami? Załóżmy, że masz północ, południe, wschód i zachód. North N=50 Mean=2.45 SD=3.9 std error=.577 LB=1.29 UB=3.62 South N=40 Mean=2.54 SD=3.8 std error=.576 LB=1.29 UB=3.63 East N=55...

17
Konwencje notacji zmiennych losowych i ich rozkłady

Mylę się co do prawidłowych oznaczeń znaczeń, a także znaczeń niektórych zapisów dotyczących zmiennych losowych i ich rozkładów. Poniżej wymienię rzeczy, które moim zdaniem są prawdziwe, a także rzeczy, których nie rozumiem i chciałbym wprowadzić / wprowadzić poprawki. Dla ułatwienia odsyłam do...

17
Przedział ufności oparty na bootstrapie

Studiując przedział ufności oparty na bootstrap, raz przeczytałem następujące oświadczenie: Jeśli rozkład bootstrapu jest przekrzywiony w prawo, przedział ufności oparty na bootstrapie zawiera korektę przesunięcia punktów końcowych jeszcze bardziej w prawo; może się to wydawać sprzeczne z...

17
Potwierdzenie rozkładu reszt w regresji liniowej

Załóżmy, że przeprowadziliśmy prostą regresję liniową y=β0+β1x+uy=β0+β1x+uy=\beta_0+\beta_1x+u , zapisaliśmy reszty ui^ui^\hat{u_i} narysowaliśmy histogram rozkładu reszt. Jeśli otrzymamy coś, co wygląda jak dobrze znana dystrybucja, czy możemy założyć, że nasz termin błędu ma tę dystrybucję?...

17
Jak znaleźć lokalne szczyty / doliny w szeregu danych?

Oto mój eksperyment: Korzystam z findPeaksfunkcji w pakiecie quantmod : Chcę wykryć „lokalne” piki w granicach tolerancji 5, tj. Pierwsze lokalizacje po spadku szeregów czasowych od lokalnych pików o 5: aa=100:1 bb=sin(aa/3) cc=aa*bb plot(cc, type="l") p=findPeaks(cc, 5) points(p,...