Do czego służy błąd standardowy?

9

Korzystam z samouczka, który znalazłem i wykreślam wartości średnie wraz ze standardowymi błędami, aby pokazać moje dane. Ale mam problem z omówieniem wyników. Moja fabuła jest pokazana poniżej: niektóre standardowe błędy (pokazane jako pasek błędów) różnią się znacznie, a niektóre z nich są bardzo bliskie zeru.

wprowadź opis zdjęcia tutaj

Berkay
źródło
2
Problemem ubocznym jest to, że używanie prętów może być mylące. Praktycznie pręty skierowane w dół są nieco trudniejsze niż pręty skierowane w górę. Zasadniczo takty zaczynające się od 1e-3 są arbitralne. Bardziej pozytywnie, pokazanie oszacowań punktów za pomocą symboli punktów i dodanie słupków błędów byłoby o wiele prostsze niż pokazanie słupków plus słupków błędów. Google „dynamit plot”, aby uzyskać więcej.
Nick Cox
Nie jestem pewien, jakie jest pytanie. W oparciu o odpowiedź, którą zaznaczyłeś poprawną i tytuł, może być po prostu wiedzieć, czym jest błąd standardowy. Ale na podstawie tego, co tu masz, wydaje się, że potrzebujesz pomocy w opisaniu danych. Czy możesz wyjaśnić to pytanie? Ponadto, jeśli potrzebujesz pomocy w opisie danych, prosimy o więcej informacji na temat danych, a nie tylko liczby. Pomocne byłyby wartości N w każdej grupie i znaczenie tych wartości. Pomocne byłyby także wszelkie dokonane transformacje.
Jan

Odpowiedzi:

10

Ogólnie słupki błędów mają na celu przekonanie czytelnika wykresu, że różnice, które widzi na wykresie, są statystycznie znaczące. W przybliżeniu możesz sobie wyobrazić małego gaussa, który±1σ zakres jest pokazany jako ten pasek błędu - „wizualna integracja” iloczynu dwóch takich gaussów jest mniej szansą, że te dwie wartości są naprawdę równe.

W tym konkretnym przypadku widać, że zarówno różnica między czerwoną i fioletową kreską, jak i szarą i zieloną nie są zbyt znaczące.


źródło
co ze standardowym błędem w tym przypadku? jako wykreślone słupki błędów.
berkay
Jest to słaby pasek błędów, jeśli taki jest cel. Brak nakładania się słupków nie jest wystarczający ze względu na istotność statystyczną, a ilość nie nakładania się, która powinna być istotnie różna przy 0,05, zmienia się w zależności od N. A co do cholery oznacza „niezbyt znaczący”? Oba te marginalne warunki, które wskazałeś, nie przejdą testu t.
John,
@John Jak napisałem, paski błędów są wizualną wskazówką, która pomaga w dokonywaniu ocen ad hoc podczas badania fabuły; rzeczywiste testowanie wymaga pewnej hipotezy do przetestowania, dlatego oczywiście powinno się zdarzyć w tekście.
11

Zasadniczo błąd standardowy mówi, jak bardzo jesteś niepewny, czy prawdziwa wartość górnej części słupka jest tam, gdzie pasek ją podaje. Gdy występuje wiele słupków, może także umożliwiać porównania między słupkami w sensie testu statystycznego. Jednak interpretacja ich w ten sposób wymaga pewnych założeń, pokazanych graficznie poniżej. Jeśli naprawdę chcesz porównać słupki, aby zobaczyć, czy różnice są istotne statystycznie, powinieneś uruchomić testy danych i wyświetlić, które testy były znaczące, w ten sposób.

porównanie istotności

Ponadto sugerowałbym stosowanie przedziałów ufności zamiast standardowych błędów.

Ten artykuł jest wart przeczytania:

Cumming and Finch. „Wnioskowanie przez oko: przedziały ufności i sposób odczytywania zdjęć danych”. Am Psych. Vol. 60, nr 2, 170–180.

Ich ogólny wniosek jest następujący: „Szukaj słupków, które odnoszą się bezpośrednio do efektów zainteresowania, bądź wrażliwy na eksperymentalny projekt i interpretuj interwały”.

W przypadku niezależnych próbek przy użyciu przedziałów ufności połowa nakładania się CI oznacza, że ​​różnica jest istotna statystycznie.

niezależne słupki

W przypadku niezależnych próbek wykorzystujących zamiast tego standardowe słupki błędów poniższy wykres pokazuje, jak obliczyć istotność statystyczną:

indep bary, SE

Ari B. Friedman
źródło
To naprawdę nie jest odpowiedź (jeszcze). Czy mógłbyś uzupełnić ten cytat z kilkoma informacjami o tym, jak pomaga odpowiedzieć na pytanie PO? (btw, nie jestem zwycięzcą)
gung - Przywróć Monikę
1
@gung Prawdziwe życie interweniowało, więc opublikowałem częściową odpowiedź. Zaktualizowano
Ari B. Friedman
6

Jak mówi mbq, paski błędów pozwalają czytelnikom poczuć, czy różnice między dwiema grupami są znaczące - tj. Jeśli różnice w każdej z grup są wystarczająco małe, aby uwierzyć, że stwierdzona różnica między twoimi grupami.

Wszystkie pozostałe elementy są równe, większe słupki błędów oznaczają większą różnicę wewnątrz grupy, ale wygląda na to, że oś y wykresu jest przekształcana w dzienniku, więc niższe grupy nie są w tej samej skali, co wyższe.

Powinieneś pamiętać, że wielu czytelników nie zrozumie, co oznaczają paski błędów, nawet jeśli wyraźnie to wyjaśnisz! Często można osiągnąć ten sam cel za pomocą drżącego wykresu punktowego lub wykresu ramkowego (lub obu razem), aby osiągnąć ten sam efekt.

David w
źródło
jeśli chodzi o wspomniany artykuł, jest to interesujące spostrzeżenie, jednak nie jest to dla mnie zaskoczeniem. Uważam, że znaczna część pojęć statystycznych i powszechnych praktyk jest myląca i skomplikowana (mimo że mam duże doświadczenie w matematyce i odbyłem szereg kursów statystyki matematycznej). Osobiście uważam, że wiele pojęć byłoby znacznie łatwiejszych do zrozumienia, gdyby były nauczane wizualnie i przy użyciu przykładów, zamiast długich i skomplikowanych wyjaśnień słownych.
posdef