Statystyki i duże zbiory danych

28
Co to jest różnorodność?

W technice redukcji wymiarów, takiej jak analiza głównych składników, LDA itp. Często stosuje się termin rozmaitość. Co to jest różnorodność pod względem nietechnicznym? Jeśli punkt należy do sfery, której wymiar Chcę zmniejszyć, a jeśli nie jest to hałas i i są nieskorelowane, to rzeczywiste...

28
Biały szum w statystyce

Często widzę termin biały szum pojawiający się podczas czytania o różnych modelach statystycznych. Muszę jednak przyznać, że nie jestem całkowicie pewien, co to oznacza. Zwykle jest skracany jako . Czy to oznacza, że ​​jest normalnie dystrybuowane, czy może następować po jakiejkolwiek...

28
Jaki jest model statystyczny za algorytmem SVM?

Nauczyłem się, że w przypadku danych przy użyciu podejścia modelowego pierwszym krokiem jest modelowanie procedury danych jako modelu statystycznego. Następnie kolejnym krokiem jest opracowanie wydajnego / szybkiego wnioskowania / algorytmu uczenia się w oparciu o ten model statystyczny. Chcę więc...

28
Łamigłówka: Jaka jest oczekiwana długość sekwencji iid, która monotonicznie wzrasta, gdy jest pobierana z jednolitego rozkładu [0,1]?

To pytanie do wywiadu dotyczące stanowiska analityka ilościowego, przedstawione tutaj . Załóżmy, że rysujemy z jednolitego rozkładu a losowania są takie same, jaka jest oczekiwana długość monotonicznie rosnącego rozkładu? Oznacza to, że przestajemy rysować, jeśli bieżące losowanie jest mniejsze lub...

28
Czy Statistics.com opublikowało złą odpowiedź?

Statistics.com opublikowało problem tygodnia: Wskaźnik oszustw związanych z ubezpieczeniami mieszkaniowymi wynosi 10% (jedno na dziesięć roszczeń jest nieuczciwe). Konsultant zaproponował system uczenia maszynowego do przeglądu roszczeń i zaklasyfikowania ich jako oszustwo lub zakaz oszustwa....

28
Dlaczego mieszanka dwóch normalnie rozłożonych zmiennych jest bimodalna tylko wtedy, gdy ich średnie różnią się co najmniej dwa razy częściej niż standardowe odchylenie standardowe?

Pod mieszaniną dwóch normalnych rozkładów: https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distribution „Mieszanina dwóch rozkładów normalnych ma do oszacowania pięć parametrów: dwa średnie, dwie wariancje i parametr mieszania. Mieszanina dwóch rozkładów normalnych z...

28
Ekstrapolacja v. Interpolacja

Jaka jest różnica między ekstrapolacją a interpolacją i jaki jest najbardziej precyzyjny sposób używania tych terminów? Na przykład widziałem oświadczenie w pracy z interpolacją jako: „Procedura interpoluje kształt oszacowanej funkcji między punktami bin” Zdanie, które używa zarówno...

27
Obliczenia symboliczne w R?

Zablokowana . To pytanie i odpowiedzi są zablokowane, ponieważ pytanie jest nie na temat, ale ma znaczenie historyczne. Obecnie nie akceptuje nowych odpowiedzi ani interakcji. Zastanawiałem się, czy można wykonać obliczenia symboliczne w języku R? Na przykład, Miałem...

27
Czy AIC może porównywać różne typy modeli?

Używam AIC (Akaike's Information Criterion) do porównywania modeli nieliniowych w R. Czy warto porównywać AIC różnych typów modeli? Konkretnie porównuję model dopasowany przez glm do modelu z terminem efektu losowego dopasowanego przez glmer (lme4). Jeśli nie, to czy można dokonać takiego...