Statystyki i duże zbiory danych

22
Czy niespójne estymatory są kiedykolwiek preferowane?

Spójność jest oczywiście naturalnym i ważnym estymatorem nieruchomości, ale czy są sytuacje, w których lepiej byłoby zastosować niespójny estymator niż spójny? Mówiąc dokładniej, czy istnieją przykłady niespójnego estymatora, który przewyższa rozsądny spójny estymator dla wszystkich skończonych (w...

22
Wykonywanie grupowania K-średnich (lub jego bliskich krewnych) za pomocą macierzy odległości, a nie danych punkt po cechach

Chcę wykonać K-oznacza grupowanie obiektów, które mam, ale obiekty te nie są opisywane jako punkty w przestrzeni, tj. Przez objects x featureszestaw danych. Jestem jednak w stanie obliczyć odległość między dowolnymi dwoma obiektami (jest ona oparta na funkcji podobieństwa). Pozbywam się macierzy...

22
Oczekiwana wartość logarytmu naturalnego

Wiem E(aX+b)=aE(X)+bE(aX+b)=aE(X)+bE(aX+b) = aE(X)+b z , b stałych, więc podane E ( X ) , to łatwo rozwiązać. Wiem również, że nie można tego zastosować, gdy jest to funkcja nieliniowa, jak w tym przypadku E ( 1 / X ) ≠ 1 / E ( X ) , i aby to rozwiązać, muszę dokonać aproksymacji z Taylor's. Więc...

22
Regresja dla modelu formy

Mam zestaw danych, który jest statystykami z internetowego forum dyskusyjnego. Patrzę na rozkład liczby odpowiedzi, których oczekuje się od tematu. W szczególności utworzyłem zestaw danych, który zawiera listę odpowiedzi na temat, a następnie liczbę tematów, które mają taką liczbę...

22
Jak faktycznie działa ładowanie w R?

Patrzyłem na pakiet rozruchowy w R i chociaż znalazłem kilka dobrych starterów, jak go używać, to jeszcze nie znalazłem niczego, co dokładnie opisuje to, co dzieje się „za kulisami”. Na przykład w tym przykładzie przewodnik pokazuje, jak używać standardowych współczynników regresji jako punktu...