Statystyki i duże zbiory danych

15
Stała normalizująca w twierdzeniu Bayesa

Pr(data)Pr(data)\Pr(\textrm{data}) Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)Pr(parameters∣data)=Pr(data∣parameters)Pr(parameters)Pr(data)\Pr(\text{parameters} \mid \text{data}) = \frac{\Pr(\textrm{data} \mid \textrm{parameters}) \Pr(\text{parameters})}{\Pr(\text{data})}...

15
Jak określić hipotezę zerową w testowaniu hipotez

Jaka jest dobra ogólna zasada wyboru pytania dla hipotezy zerowej. Na przykład, jeśli chcę sprawdzić, czy hipoteza B jest prawdziwa, czy powinienem użyć B jako zerowej, B jako alternatywnej hipotezy, czy NIE B jako zerowej? Mam nadzieję, że pytanie jest jasne. Wiem, że ma to coś wspólnego z błędem,...

15
Jak generować losowe dane kategoryczne?

Powiedzmy, że mam zmienną kategoryczną, która może przyjmować wartości A, B, C i D. Jak wygenerować 10000 losowych punktów danych i kontrolować częstotliwość każdego z nich? Na przykład: A = 10% B = 20% C = 65% D = 5% Jakieś pomysły, jak to