Statystyki i duże zbiory danych

11
Wybór modelu bayesowskiego w PyMC3

Używam PyMC3 do uruchamiania modeli bayesowskich na moich danych. Jestem nowy w modelowaniu bayesowskim, ale według niektórych postów na blogach , Wikipedii i kontroli jakości z tej witryny wydaje się, że poprawnym podejściem jest zastosowanie współczynnika Bayesa i kryterium BIC, aby móc wybrać...

11
Ile dystrybucji jest w GLM?

Zidentyfikowałem wiele miejsc w podręcznikach, w których GLM jest opisany z 5 dystrybucjami (mianowicie, Gamma, Gaussian, Dwumianowy, Odwrotny Gaussian i Poisson). Jest to również zilustrowane funkcją rodzinną w R. Czasami natrafiam na odniesienia do GLM, w których uwzględniono dodatkowe...

11
Oszacuj wariancję populacji, jeśli znana jest średnia populacji

Wiem, że używamy do oszacowania wariancji populacji. Pamiętam wideo z Khan Academy, w którym podana intuicja była taka, że ​​nasza szacunkowa średnia jest prawdopodobnie nieco mniejsza od rzeczywistej, więc odległości byłyby faktycznie większe, więc dzielimy przez mniej ( zamiast ) aby uzyskać...

11
Symulowanie wycieczki Browna przy użyciu mostu Browna?

Chciałbym zasymulować proces wycieczki Browna (ruch Browna, który jest warunkowany, zawsze jest dodatni, gdy do przy ). Ponieważ proces wycieczki Browna jest mostem Browna, który jest uwarunkowany, aby zawsze był dodatni, miałem nadzieję symulować ruch wycieczki Browna za pomocą mostu Browna.0 t =...

11
Rodzinna granica błędów: czy ponowne wykorzystanie zestawów danych w różnych badaniach niezależnych pytań prowadzi do wielu problemów z testowaniem?

Jeśli zespół badaczy przeprowadzi wiele testów (hipotez) na danym zbiorze danych, istnieje obszerna literatura, w której stwierdza się, że powinni oni zastosować jakąś formę korekty do testów wielokrotnych (Bonferroni itp.), Nawet jeśli testy są niezależne. Moje pytanie brzmi: czy ta sama logika...

11
Funkcja kosztu krzyżowego w sieci neuronowej

Patrzę na funkcję kosztu entropii znalezioną w tym samouczku : do= - 1n∑x[ ylna + ( 1 - y) ln( 1 - a ) ]do=-1n∑x[yln⁡za+(1-y)ln⁡(1-za)]C = -\frac{1}{n} \sum_x [y \ln a+(1−y)\ln(1−a)] Co dokładnie sumujemy? Jest to oczywiście ponad , ale i a nie zmieniają się z x . Wszystkie x są wejściami do...

11
Scalanie obserwacji w procesie Gaussa

Używam procesu Gaussa (GP) do regresji. W moim problemie dość często zdarza się, że dwa lub więcej punktów danych są blisko siebie, względem długości skale problemu. Obserwacje mogą być również bardzo głośne. Aby przyspieszyć obliczenia i poprawić precyzję pomiaru , naturalne wydaje się łączenie /...