Mam dane o tym, ilu użytkowników publikuje ile pytań. Na przykład,
[UserCount, QuestionCount]
[2, 100]
[9, 10]
[3, 80]
... ...
Oznacza to, że 2 użytkowników opublikowało 100 pytań, 9 użytkowników opublikowało 10 pytań i tak dalej. Jak więc ustalić, czy UserCount, QuestionCount
rozkład jest zgodny z prawem mocy?
Znalazłem pakiet poweRlaw . Mogę jednak przekazać tylko jedną grupę liczb, aby dokonać oceny. (Przykładem podanym w tym pakiecie jest częstotliwość słów.) Jak więc korzystać z tego pakietu? Czy mam coś nie tak? Mam również dane o liczbie pytań każdego użytkownika, tj [100, 100, 10, 10, 10 ... ]
. Jeśli przekażę te dane do paczki, co dostanę?
r
hypothesis-testing
goodness-of-fit
power-law
trzeci dzień
źródło
źródło
Odpowiedzi:
Według Clauset i wsp. W ten sposób testujesz ogon prawa mocy za pomocą
poweRlaw
pakietu:dwie ostatnie linie można przepisać jako jedną linię
Ponadto w tym momencie możesz zobaczyć statystyki KS:
Może to zająć trochę czasu, więc idź i napij się herbaty ...
poweRlaw
compare_distributions
comp
comp$test_statistic
data_pl
comp$p_two_side
Powtórz tę czynność z
disexp
,dispois
zajęciach porównać Prawo energetyczne z tych alternatyw.źródło
data("moby")
i użyćmoby
zamiastdata
w moim przykładzie, tak jak we wstępie