Pytania oznaczone «metric»

12
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace =...

12
Jak nazywa się metoda szacowania gęstości, w której wszystkie możliwe pary są używane do utworzenia rozkładu normalnej mieszaniny?

Właśnie pomyślałem o zgrabnym (niekoniecznie dobrym) sposobie tworzenia szacunków gęstości jednowymiarowej i moje pytanie brzmi: Czy ta metoda szacowania gęstości ma nazwę? Jeśli nie, to czy jest to szczególny przypadek innej metody w literaturze? Oto metoda: mamy wektor który, jak zakładamy,...

11
Metryki macierzy kowariancji: wady i zalety

Jakie są „najlepsze” wskaźniki dla macierzy kowariancji i dlaczego? Jest dla mnie jasne, że Frobenius i c nie są odpowiednie, a parametryzacje kątów również mają swoje problemy. Intuicyjnie można chcieć kompromisu między tymi dwoma, ale chciałbym również wiedzieć, czy istnieją inne aspekty, o...

11
Test Friedmana vs test Wilcoxona

Usiłuję ocenić wydajność nadzorowanego algorytmu klasyfikacji uczenia maszynowego. Obserwacje dzielą się na klasy nominalne (na razie 2, jednak chciałbym uogólnić to na problemy wielu klas), zaczerpnięte z populacji 99 osób. Jednym z pytań, na które chciałbym odpowiedzieć, jest to, czy algorytm...

10
Czy procesy stochastyczne, takie jak proces Gaussa / proces Dirichleta, mają gęstość? Jeśli nie, w jaki sposób można zastosować do nich regułę Bayesa?

Proces Dirichleta i Proces Gaussa są często nazywane „rozkładami na funkcje” lub „rozkładami na rozkłady”. W takim przypadku, czy mogę sensownie mówić o gęstości funkcji u lekarza ogólnego? Czy proces Gaussa lub proces Dirichleta mają jakieś pojęcie o gęstości prawdopodobieństwa? Jeśli tak nie...

10
Model historii zdarzeń dyskretnych (przeżycie) w R.

Próbuję dopasować model czasu dyskretnego do R, ale nie jestem pewien, jak to zrobić. Czytałem, że możesz zorganizować zmienną zależną w różnych wierszach, po jednym dla każdej obserwacji czasu, i użyć glmfunkcji z łączem logit lub cloglog. W tym sensie, mam trzy kolumny: ID, Event(1 lub 0, w...

10
Jak włączyć innowacyjną wartość odstającą przy obserwacji 48 w moim modelu ARIMA?

Pracuję nad zestawem danych. Po zastosowaniu niektórych technik identyfikacji modelu, wyszłam z modelem ARIMA (0,2,1). Użyłem detectIOfunkcji w pakiecie TSAw R do wykrycia innowacyjnej wartości odstającej (IO) przy 48. obserwacji mojego oryginalnego zestawu danych. Jak włączyć tę wartość...