Jak zmierzyć / argumentować, czy dopasowanie linii trendu do prawa energetycznego jest dobre?

21

Mam pewne dane, do których próbuję dopasować linię trendu. Wierzę, że dane są zgodne z prawem mocy, dlatego narysowałem dane na osiach log-log, szukając linii prostej. Spowodowało to (prawie) linię prostą, dlatego w programie Excel dodałem linię trendu dla prawa mocy. Będąc nowością statystyczną, moje pytanie brzmi: w jaki sposób mogę teraz najlepiej przejść od „dobrze wygląda, że linia całkiem dobrze pasuje” do „własności liczbowej dowodzi, że wykres ten jest odpowiednio dopasowany przez prawo mocy”? x

W Excelu mogę uzyskać wartość r-kwadrat, choć biorąc pod uwagę moją ograniczoną wiedzę statystyczną, nawet nie wiem, czy jest to właściwe w moich konkretnych okolicznościach. Poniżej zamieściłem obraz przedstawiający wykres danych, z którymi pracuję w programie Excel. Mam trochę doświadczenia z R, więc jeśli moje analizy są ograniczone przez moje narzędzia, jestem otwarty na sugestie, jak udoskonalić go za pomocą R.

alternatywny tekst

Bryce Thomas
źródło
możesz znaleźć kilka pomysłów tutaj freakonometrics.blog.free.fr/index.php?post/2010/09/29/…

Odpowiedzi:

24

Zobacz stronę Aarona Clauseta:

który zawiera linki do kodu do dopasowania praw mocy (Matlab, R, Python, C ++), a także artykuł Clauset i Shalizi, który powinieneś przeczytać jako pierwszy.

Możesz najpierw przeczytać posty na blogach Clauseta i Shalizi:

Podsumowaniem ostatniego linku może być:

  • Wiele rozkładów daje proste linie na wykresie dziennika.

  • Nadużywanie regresji liniowej powoduje płacz małego Gaussa.
    Dopasowywanie linii do wykresu dziennika za pomocą najmniejszych kwadratów to zły pomysł.

  • Użyj maksymalnego prawdopodobieństwa, aby oszacować wykładnik skalowania.
  • Użyj dobroci dopasowania, aby oszacować, gdzie zaczyna się region skalowania.
  • Użyj testu dopasowania, aby sprawdzić dopasowanie.
  • Użyj testu Vuong, aby sprawdzić alternatywy i bądź przygotowany na rozczarowanie.
ars
źródło
1
Popieram to. Istnieje wiele przykładów czegoś, co wyglądało jak prawo potęgi, ale po dokładniejszym zbadaniu okazało się, że nie jest .... i nie, wysokie R ^ 2 na wykresie nie wystarczy.
PeterR
„Więc myślisz…” jest doskonałym odniesieniem. Punkty 1–6 (spośród 7) odnoszą się bezpośrednio do postawionego tutaj pytania.
whuber
Ale rozkład prawa mocy nie jest tym samym, co dopasowanie relacji prawa mocy między dwiema odrębnymi zmiennymi. Zakładałem, że pytanie dotyczy tego ostatniego, choć nie jestem pewien.
onestop
χ2)
2
@JM: nie bardzo, chi-kwadrat jest wrażliwy na binowanie, a wahania ogona komplikują to. Myślę, że nawet z KS przeważają statystyki dla punktów ekstremalnych i jest trochę dyskusji na temat innych testów. @onestop: Przyjąłem inną drogę i po ponownym przeczytaniu możesz mieć rację. Nie jestem do końca pewien ...
ars
3

Jeśli interesują cię dwuwymiarowe funkcje prawa władzy (w przeciwieństwie do jednorzędowych rozkładów prawa władzy), to

Warton i in. „ Dwuwymiarowe metody dopasowania linii dla allometrii ”. Biol. Rev. 81, 259-201 (2006)

jest doskonałym odniesieniem. W takim przypadku regresja jest słuszna, chociaż mogą istnieć pewne poprawki (OLS vs. RMA itp.) W zależności od tego, co mają oznaczać wyniki regresji.


źródło
Aaron - ten link jest martwy, możesz opublikować nowy?
keflavich
Dzięki za to. Większość informacji jest dla rozkładów jednowymiarowych, które ma tendencję do zakopać informacje o dwuwymiarowych relacji ... Tutaj jest link do Riley wystawianie onlinelibrary.wiley.com/doi/abs/10.1017/S1464793106007007
songololo