Statystyki i duże zbiory danych

62
Jak zgłaszać małe wartości

W przypadku niektórych testów Ristnieje dolna granica obliczeń wartości p . Nie jestem pewien, dlaczego jest to ta liczba, jeśli istnieje ku temu dobry powód lub jest to po prostu arbitralne. Wiele innych pakietów statystyk po prostu trafia , więc jest to o wiele wyższy poziom precyzji. Ale nie...

61
Regresja z wieloma zmiennymi zależnymi?

Czy możliwe jest równanie regresji (wielokrotnej) z dwiema lub więcej zmiennymi zależnymi? Jasne, możesz uruchomić dwa oddzielne równania regresji, po jednym dla każdego DV, ale to nie wydaje się, że uchwyciłoby to jakąkolwiek zależność między dwoma

61
Jaki problem rozwiązują metody skurczu?

Sezon wakacyjny dał mi możliwość zwinięcia się przy kominku dzięki elementom statystycznego uczenia się . Z perspektywy (częstej) ekonometrii mam problem z uchwyceniem zastosowania metod skurczu, takich jak regresja grzbietu, lasso i regresja najmniejszego kąta (LAR). Zazwyczaj interesują mnie same...

60
Gdzie wyciąć dendrogram?

Hierarchiczne grupowanie może być reprezentowane przez dendrogram. Cięcie dendrogramu na pewnym poziomie daje zestaw klastrów. Cięcie na innym poziomie daje kolejny zestaw klastrów. Jak wybrałbyś miejsce cięcia dendrogramu? Czy istnieje coś, co moglibyśmy uznać za optymalny punkt? Jeśli patrzę na...