Pytania oznaczone «distributions»

11
Dystrybucja danych procentowych

Mam pytanie dotyczące prawidłowej dystrybucji do użycia przy tworzeniu modelu z moimi danymi. Przeprowadziłem inwentaryzację lasu z 50 działkami, każda działka ma wymiary 20 x 50 m. Dla każdej działki oszacowałem procent korony drzew, która osłania ziemię. Każda działka ma jedną wartość procentową...

11
Co to jest rozkład logarytmiczny?

Czytam podręcznik na temat uczenia maszynowego (Data Mining autorstwa Witten i wsp., 2011) i natknąłem się na ten fragment: ... Ponadto można zastosować różne rozkłady. Chociaż rozkład normalny jest zwykle dobrym wyborem dla atrybutów liczbowych, nie jest odpowiedni dla atrybutów, które mają z...

11
Jak wybrać najlepsze dopasowanie bez nadmiernego dopasowania danych? Modelowanie rozkładu bimodalnego za pomocą N normalnych funkcji itp

Mam oczywiście bimodalny rozkład wartości, który staram się dopasować. Dane mogą być dobrze dopasowane do 2 normalnych funkcji (bimodalnych) lub 3 normalnych funkcji. Ponadto istnieje prawdopodobny fizyczny powód dopasowania danych do 3. Im więcej parametrów zostanie wprowadzonych, tym lepsze...

11
Podziel dane na N równych grup

Mam ramkę danych, która zawiera wartości w 4 kolumnach: Na przykład: ID, price, click count,rating Chciałbym „podzielić” tę ramkę danych na N różnych grup, w których każda grupa będzie miała taką samą liczbę wierszy z takim samym rozkładem ceny, liczby kliknięć i atrybutów ocen. Wszelkie...

11
Ile dystrybucji jest w GLM?

Zidentyfikowałem wiele miejsc w podręcznikach, w których GLM jest opisany z 5 dystrybucjami (mianowicie, Gamma, Gaussian, Dwumianowy, Odwrotny Gaussian i Poisson). Jest to również zilustrowane funkcją rodzinną w R. Czasami natrafiam na odniesienia do GLM, w których uwzględniono dodatkowe...

10
R regresja liniowa zmienna kategorialna „ukryta” wartość

To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R...