Statystyki i duże zbiory danych

12
Jak znaleźć wariancję między punktami wielowymiarowymi?

Załóżmy, że mam macierz X, która jest n przez p, tj. Ma n obserwacji, z każdą obserwacją w przestrzeni p-wymiarowej. Jak znaleźć wariancję tych n obserwacji? W przypadku, gdy p = 1, muszę po prostu użyć formuły regularnej wariancji. Co z przypadkami, w których p>...

12
Strategia dopasowania wysoce nieliniowej funkcji

Do analizy danych z eksperymentu biofizyki próbuję obecnie dopasować krzywą za pomocą wysoce nieliniowego modelu. Funkcja modelu wygląda następująco: y= a x + b x- 1 / 2y=ax+bx−1/2y = ax + bx^{-1/2} Tutaj szczególnie duże znaczenie ma wartość .bbb Wykres dla tej funkcji: (Zauważ, że funkcja...

12
Krzywa ROC przekraczająca przekątną

W tej chwili prowadzę klasyfikator binarny. Kiedy wykreślam krzywą ROC, na początku uzyskuję dobry skok, a następnie zmienia ona kierunek i przecina przekątną, a następnie oczywiście z powrotem w górę, tworząc krzywą w kształcie litery S. Jaka może być interpretacja / wyjaśnienie tego efektu?...

12
Czy magia liczby 20?

Mam referencje, które zalecały rozważenie wielkości próby wynoszącej co najmniej 20 dla dystrybucji dopasowania danych. Czy ma to jakiś

12
Nazwa „paradoksu” zgłoszonego przez Gelmana

W książce Andrew Gelmana „Red State, Blue State” analizuje fakt, że bogaci ludzie w poszczególnych stanach mają tendencję do głosowania bardziej republikańscy niż biedni, ale zamożne państwa głosują bardziej demokratycznie niż biedne. Czy istnieje nazwa tego paradoksu? Wydaje mi się, że jest...