Statystyki i duże zbiory danych

13
Jak skutecznie modelować sieć neuronową?

Jaki powinien być stosunek liczby obserwacji do liczby zmiennych? Jak wykryć nadmierne dopasowanie w modelu sieci neuronowej i jakie są sposoby uniknięcia nadmiernego dopasowania? Jeśli chcę przeprowadzić klasyfikację za pomocą sieci neuronowej, czy klasy powinny mieć równą częstotliwość? Proszę...

13
Testy post hoc w ANCOVA

Pytanie: Jaka jest dobra metoda przeprowadzania testów post hoc różnic między średnimi grupowymi po skorygowaniu o efekt zmiennej towarzyszącej? Przykład prototypowy: Cztery grupy, 30 uczestników na grupę (np. Cztery różne populacje psychologii klinicznej) Zmienna zależna jest liczbą (np....

13
Łatwe wyjaśnienie wykresu współrzędnych równoległych

Przeczytałem i widziałem wiele wykresów współrzędnych równoległych. Czy ktoś może odpowiedzieć na następujący zestaw pytań: Czym są wykresy współrzędnych równoległych (PCP) w prostych słowach, aby laik mógł to zrozumieć? Matematyczne wyjaśnienie z pewną intuicją, jeśli to możliwe Kiedy PCP jest...

13
Zrozumienie AIC i kryterium Schwarz

Korzystam z modelu logistycznego. Rzeczywisty zestaw danych modelu zawiera ponad 100 zmiennych, ale wybieram zestaw danych testowych, w którym jest około 25 zmiennych. Wcześniej stworzyłem również zestaw danych, który zawierał 8–9 zmiennych. Powiedziano mi, że do porównania modelu można użyć...

13
Interpretacja / wykorzystanie gęstości jądra

To może być naiwne pytanie, ale proszę bardzo. Jeśli mam zestaw danych empirycznych i dopasuję do niego gęstość jądra, a następnie uzyskam nową pojedynczą wartość, która prawdopodobnie pochodzi z tego samego procesu, który wygenerował oryginalny zestaw danych, czy mogę przypisać prawdopodobieństwo,...

13
Obliczenie Mediany Median

Robię wiele raportów na temat nieruchomości, a mediana ceny jest często zgłaszana, szczególnie przez NAR (National Association of Realtors). Jak mogę najlepiej powiedzieć, uzyskują one jedynie mediany cen nieruchomości z każdego obszaru. Moje pytanie brzmi: w jaki sposób należy obliczać medianę...