Czy w statystykach należy przyjąć, że oznacza czy logarytm naturalny ?

18

Studiuję statystyki i często spotykam formuły zawierające logi zawsze jestem zdezorientowany, jeśli powinienem interpretować to jako standardowe znaczenie log, tj. Podstawa 10, lub jeśli w statystyce log ogólnie przyjmuje się, że log naturalny ln.

W szczególności studiuję estymację częstotliwości Good-Turinga jako przykład, ale moje pytanie jest bardziej ogólne.

Giuseppe Romagnuolo
źródło
2
„W wielu aplikacjach naturalny logarytm funkcji wiarygodności, zwany logarytmem prawdopodobieństwa, jest wygodniejszy w pracy”. en.wikipedia.org/wiki/Likelihood_function#Log-likelihood W statystykach często pracujemy z funkcją wiarygodności, zwykle lnjest to brana pod uwagę. Jednak oba są powiązane: log(x) = ln(x) / ln(10) = ln(x) / 2.303i funkcja ln- wiarygodności osiąga ekstremum w tym samym punkcie, co funkcja log10- wiarygodności.
John_West
5
W kilku szczególnych obszarach zastosowania, gdy wspomniane jest , podstawa 10 jest zamierzona, ale jak wskazuje Aksakal, w przeciwnym razie jest to konwencja stosowana w matematyce - że nieadekwatowany oznacza log naturalny. loglog
Glen_b
2
Jak @John_West mówi, że i są identyczne aż do współczynnika skalowania. Są więc takie same tylko, że mierzysz w innej jednostce. ln(x)losolza(x)
1
@Aksakal; to, co mówisz, sprowadza się do powiedzenia, że ​​jednostka jest ważna (patrz mój komentarz powyżej), z czym się zgadzam. Napisałem również aby wyraźnie wskazać bazę. W przypadku (niektórych) zastosowań w statystykach, takich jak maksymalne prawdopodobieństwo, ten współczynnik skalowania jest jednak nieistotny. Wartość maksymalna nie zmieni się po dodaniu współczynnika skalowania. W referencji PO (dobre podejście ...) chcą wykreślić (lub ) w funkcji . Oznacza to, że jednostka zmienia się na obu osiach wykresu, więc wykreślona „krzywa” nie zmienia się. l o g ( N r ) l o g ( Z r ) l o g ( r )losolzalosol(N.r)losol(Zr)losol(r)
1
O ile nie piszesz artykułu, nawet przy użyciu prawdopodobieństwa logarytmicznego skala (podstawa logarytmu) zwykle ma znaczenie. Na przykład statystyki testu logarytmicznego ilorazu prawdopodobieństwa używają Aby użyć wartości krytycznych, trzeba dostosować inną bazę. Jeśli piszesz oprogramowanie, ważne jest, aby uzyskać prawidłową bazę przy korzystaniu z funkcji wiarygodności dziennika z dokumentów itp. Jest zbyt wiele przypadków, w których podstawa jest ważna, aby stwierdzić, że to nie ma znaczenia. ln
Aksakal

Odpowiedzi:

20

Można bezpiecznie założyć, że bez wyraźnego podstawowego = ln w statystykach, ponieważ log podstawowy 10 nie jest często używany w statystykach. Jednak inne plakaty poruszają kwestię, że log 10 lub inne zasady mogą być wspólne w niektórych innych dziedzinach, w których stosuje się statystyki, np. Teorię informacji. Tak więc, kiedy czytasz artykuły z innych dziedzin, czasami się to mylą.log=lnlog10

Strona entropii Wikipedii jest dobrym przykładem mylącego korzystania z . Na tej samej stronie oznaczają bazę 2, e i dowolną bazę. Możesz zrozumieć kontekst, który ma na myśli, ale wymaga to przeczytania tekstu. To nie jest dobry sposób na zaprezentowanie materiału. Porównaj go ze stroną Logarytm, gdzie podstawa jest wyraźnie pokazana w każdej formule lub użyto ln . Osobiście uważam, że jest to właściwa droga: zawsze pokazuj bazę, gdy używany jest znak dziennika . Byłoby to również zgodne z ISO, ponieważ standard nie definiuje użycia nieokreślonej podstawy z symbolem logu, jak wskazał @Henry.logmilnloglog

Wreszcie, norma ISO 31-11 określa znaki i lg dla logarytmu podstawowego 2 i 10. Oba są obecnie rzadko używane. Pamiętam, że używaliśmy lg w liceum, ale było to w innym wieku w innym świecie. Nigdy go nie widziałem, ponieważ był używany w kontekście statystycznym. W LaTeX nie ma nawet tagu lb.funtlglgfunt

Aksakal
źródło
1
Podstawowe logarytmy 2 są również dość powszechne w niektórych polach. Dziennik bez ozdoby rzadko stanowi podstawę 10, ale nie zawsze jest podstawą e .
Nuclear Wang
Pomocne, ale myślę, że „rzadko” jest zbyt silny. Istnieją merytoryczne pola, w których ludzie mogą wiedzieć tylko, lub najlepiej czuć się najlepiej zaznajomionymi z 10 logarytmami podstawowymi. Zauważ, że wiele wykresów pokazuje skale logarytmiczne przy użyciu mocy 10. Ktoś, kto preferuje logarytmy naturalne, nie ma trudności z odkodowaniem takich skal, ale domniemanie jest oparte na podstawie 10.
Nick Cox
@NickCox, OP konkretnie podaje „statystyki” jako pole i nie widzę często logarytmu podstawowego 10 używanego w statystykach.
Aksakal
Wydaje się, że ISO 31-11 określa dla log e i pozostawia niezdefiniowany log niezdefiniowanylnlogmilog
Henry
1
@NickCox, złagodziłem język,
poruszasz
14

To zależy.

Poza kilkoma kontekstami, takimi jak konwersja wartości na decybele, podstawowe 10 logarytmów jest dość rzadkie w równaniach. Jednak wykresy w skali logarytmicznej często znajdują się w bazie-10, chociaż powinno to być dość łatwe do zweryfikowania na podstawie etykiet na osiach.

W kontekście matematycznym bez ozdoby może być dziennikiem naturalnym (tj. Log e lub ln ). Z drugiej strony informatyka często wykorzystuje logarytmy base-2 ( log 2 ) i nie zawsze są one wyraźnie oznaczone jako takie. Dobrą wiadomością jest to, że możesz przechodzić między bazami w sposób trywialny, a użycie „niewłaściwej” bazy sprawi, że Twoja odpowiedź będzie stała.loglogmilnlog2)

W Gale 1995 „good-Turinga bez łez” papierze, logarytmy w tekście faktycznie są (mówi tak na stronie 5), ale kod R / S + w dodatku wykorzystuje funkcję, która jest faktycznie log e lub ln . Jak wskazuje @Henry poniżej, nie ma to praktycznej różnicy.log10loglogmiln

Gdybym był zmuszony zgadywać, oto niektóre heurystyki:

  • Jeśli obecne są również moce 2, lub 10, dzienniki prawdopodobnie będą miały odpowiednią bazę.mi

  • Jeśli wynika z całkowania (lub, bardziej ogólnie, obejmuje rachunek różniczkowy), prawdopodobnie jest to log naturalny.1/x

  • Jeśli wynika to z wielokrotnego dzielenia czegoś na pół (jak w wyszukiwaniu binarnym), prawdopodobnie jest to . Mówiąc bardziej ogólnie, coś można podzielić przez n w przybliżeniu log n razy.log2)nlogn

  • Obliczenia teoretyczno-informacyjne zwykle wykorzystują , szczególnie w nowoczesnej pracy. Możesz jednak sprawdzić jednostki, aby się upewnić: bitylog 2 , natsln i banylog 10 .log2)bitówlog2)natslnzakazylog10

  • Znalezienie punktu, w którym funkcja spada lub wzrasta do (odpowiednio 37% i 63%) wartości początkowej sugeruje log naturalny.1mi lub 1-1mi

Matt Krause
źródło
5
+1. Mała wskazówka jest taka, że ​​jeśli wykładnicze zostaną znalezione w pobliżu, to logarytm naturalny jest bardziej prawdopodobny i odwrotnie z potęgami 10 lub 2. Jeśli która zasada jest używana, pozostaje niejasna, spróbuj odtworzyć przykładowe obliczenia autorów. exp()
Nick Cox,
2
Ponieważ wykresy strony 6 i 7 z papieru Gale wykazują oryginalne jednostki w skali logarytmicznej, a obliczenia są skierowane na zboczu związku logarytmicznego tj w ekspresji log ( N r ) = + b log ( R ) , która odpowiada N R = A r B , nie ma praktycznego znaczenia w tym przypadkublog(Nr)=a+blog(r)Nr=Arb
Henry
2
Innym przykładem kiedy platting giełdowe, przy użyciu protokołu cenę oś zawsze jest podstawa 10bzasmi10
Marek D
3

Aby odpowiedzieć na twoje pytanie: nie, nie możesz założyć ogólnej stałej notacji dla logarytmu.

log10

lnxlogmixmilogx10log10

log2)log2)logmi

0

loglogmilog10

Laurent Duval
źródło
0

miln(L.^)L.^k

ZAjado=2)(k-ln(L.)).

Wydaje się więc, że jeśli użyjesz innej podstawy dla logarytmu w AIC, możesz skończyć wyciąganiem błędnych wniosków i wyborem niewłaściwego modelu.

Bjørn Kjos-Hanssen
źródło