Statystyki i duże zbiory danych

10
Rozkłady klastrowe

Mam kilka rozkładów (10 rozkładów na poniższym rysunku). W rzeczywistości są to histogramy: na osi x znajduje się 70 wartości, które są wielkościami niektórych cząstek w roztworze, a dla każdej wartości x odpowiadająca wartość y jest proporcją cząstek, których wielkość jest zbliżona do wartości...

10
Podwajanie ogonów w teście permutacji na dwóch próbkach

Załóżmy, że mamy dwie próbki i chcemy ustalić, czy są one pobierane z tego samego rozkładu, przy czym próbki A, B składają się z niektórych liczb całkowitych. Jeśli przetestujemy to za pomocą testu permutacji z dwiema próbkami, w szczególności patrząc na permutacje, w których różnice w średnich...

10
R regresja liniowa zmienna kategorialna „ukryta” wartość

To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R...

10
Pozyskiwanie priorów… za pomocą pieniędzy!

Załóżmy, że mam „ekspertów”, z którymi chciałbym wywołać uprzedniej dystrybucji na jakiejś zmiennej X . Chciałbym ich zmotywować prawdziwymi pieniędzmi . Chodzi o to, aby wywołać priory, obserwować n realizacji losowej zmiennej , a następnie podzielić pewną z góry ustaloną „torebkę” wśród ekspertów...

10
Kwartyle w programie Excel

Interesuje mnie definicja kwartylu, która jest zwykle używana, gdy jesteś w podstawowych statystykach. Mam książkę typu Stat 101, która daje intuicyjną definicję. „Około jedna czwarta danych przypada na pierwszy kwartyl lub poniżej ...”, ale daje przykład, w którym oblicza Q1, Q2 i Q3 dla zestawu...

10
Normalizacja

Istnieje wiele metod przeprowadzania regularyzacji - na przykład regularyzacja oparta na normach , L 1 i L 2 . Według Friedmana Hastie & Tibsharani , najlepszy regulizator zależy od problemu: mianowicie charakteru prawdziwej funkcji celu, konkretnej zastosowanej podstawy, stosunku sygnału do...

10
Jaka jest różnica między statystyką a informatyką?

Zawsze mówimy, że statystyki dotyczą tylko danych. Ale wiemy również, że informatyka czerpie wiedzę z analizy danych. Na przykład ludzie bioinformatyki mogą całkowicie przejść bez biostatystyki. Chcę wiedzieć, jaka jest zasadnicza różnica między statystyką a