Statystyki i duże zbiory danych

9
Jak powstaje wykres „United States of Reddit”?

Poniżej znajduje się wykres z p. 202 Christiana Ruddera Dataclysm , choć został stworzony przez Jamesa Dowdella. To ilustruje relacje między różnymi 200 najpopularniejszymi subredditami, które są obszarami zainteresowania na reddit.com, gdzie użytkownicy mogą przesyłać linki, komentarze i głosy. Są...

9
Efektywny splot (w R)

Chcę obliczyć / ocenić splot g(x)=∫Df(x−t)ϕ(t)dt,g(x)=∫Df(x−t)ϕ(t)dt,g(x)=\int_D f(x-t) \phi(t) dt, gdzie oznacza gęstość i jest gładka funkcja o zwartym nośniku . Splot nie jest dostępny w formie zamkniętej i muszę go zintegrować numerycznie. Moje pytanie brzmi: czy jest na to skuteczny sposób?...

9
Co PCA robi z danymi autokorelowanymi?

Właśnie dlatego, że jakiś korespondent postawił interesujące pytanie dotyczące metod obliczania autokorelacji, zacząłem się nim bawić, prawie bez wiedzy o szeregach czasowych i autokorelacji. Korespondent uporządkował swoje dane (323232 punkty danych szeregu czasowego) przesunięte dodatkowo o...

9
Jakie kryteria zastosować do podziału zmiennych na zmienne objaśniające i odpowiedzi na metody święceń w ekologii?

Mam różne zmienne, które oddziałują w obrębie populacji. Zasadniczo robiłem inwentaryzację krocionogów i mierzyłem inne wartości terenu, takie jak: Gatunek i ilość zebranych okazów Różne środowiska, w których przebywają zwierzęta pH Procent materiału organicznego ilość P, K, Mg, Ca, Mn, Fe, Zn,...

9
Wymiar VC prostokąta

Książka „Wprowadzenie do uczenia maszynowego” autorstwa Ethem Alpaydın stwierdza, że ​​wymiar VC prostokąta wyrównanego do osi wynosi 4. Ale jak prostokąt może zniszczyć zestaw czterech punktów współliniowych z naprzemiennymi dodatnimi i ujemnymi punktami? Czy ktoś może wyjaśnić i udowodnić...