Pomimo ważnego, ale odrobiny „gotcha” -istycznych wysiłków podejmowanych przez jednostki w celu ujawnienia praktyk drapieżnych czasopism , większe i bardziej fundamentalne zagrożenie kryje się w cieniach badań w dziedzinie nauk społecznych ( choć z pewnością istnieje wiele problemów, którymi naukowcy muszą się zająć ). Aby przejść od razu do rzeczy, zgodnie z jednym poglądem możemy nie być w stanie zaufać współczynnikom korelacji uzyskanym z próbek mniejszych niż 250 .
Trudno byłoby znaleźć test, na którym można by bardziej polegać, aby wywnioskować obecność, kierunek i siłę powiązania między miarami w naukach społecznych niż zaufany współczynnik korelacji. Jednak nie trudno byłoby znaleźć raporty recenzowane, w których można było stwierdzić silne powiązania między dwoma konstruktami na podstawie współczynników korelacji obliczonych na podstawie danych z mniej niż 250 przypadków.
Biorąc pod uwagę obecny kryzys replikacji, przed którym stoją nauki społeczne (patrz drugi link powyżej), jak powinniśmy postrzegać ten raport dotyczący stabilizacji współczynników korelacji tylko w przypadku dużych próbek (przynajmniej według niektórych standardów w dziedzinie nauk społecznych)? Czy to kolejna szczelina w ścianie recenzowanych badań w dziedzinie nauk społecznych, czy jest to względnie trywialna sprawa, która została przesadzona w swojej prezentacji?
Ponieważ prawdopodobnie nie ma jednej poprawnej odpowiedzi na to pytanie, mam nadzieję zamiast tego wygenerować wątek, w którym zasoby dotyczące tego pytania mogą być udostępniane, rozważnie rozważane i dyskutowane (oczywiście grzecznie iz szacunkiem).
źródło
Odpowiedzi:
Dodanie przedziałów ufności dla szacowanych rzeczywistych współczynników korelacjiρ byłby to mały (i bardzo prosty) pierwszy krok we właściwym kierunku. Jego szerokość natychmiast daje wrażenie precyzji korelacji próbki, a jednocześnie pozwala pisarzowi, a także publiczności, przetestować przydatne hipotezy. Co mnie zawsze zastanawiało, kiedy rozmawiałem ze statystykami z nauk społecznych, że powyżej podano współczynnik korelacji próbki absolutnejL = 0,3 (lub jakiś inny limit) uznano za znaczący. W tym samym czasie testowali hipotezę robocząρ ≠ 0 . To jest nieistotne. Dlaczego bardzo mały współczynnik korelacji populacji miałby być nagle uznawany za znaczący? Byłaby „poprawna” hipoteza robocza| ρ | >L. . Posiadanie przedziału ufności dlaρ pod ręką takie hipotezy można łatwo przetestować: po prostu sprawdź, czy odstęp znajduje się całkowicie powyżej L. (albo poniżej - L. ) i wiesz, czy możesz twierdzić o „istotnym” powiązaniu statystycznym nawet w populacji.
Oczywiście samo dodanie przedziału ufności i użycie znaczących testów nie rozwiąże zbyt wielu problemów (takich jak złe projekty próbkowania, pominięte rozważanie pomyłek itp.). Ale to w zasadzie za darmo. Sądzę, że nawet SPSS jest w stanie je obliczyć!
źródło
Jak zauważa Michael M. , wiarygodność zgłoszonych korelacji - lub dowolnego innego oszacowania - można ocenić za pomocą przedziałów ufności. To znaczy do pewnego stopnia. CI będą zbyt wąskie, jeśli modele zostaną wybrane po zebraniu danych, które według szacunków zdarzają się w około 95% przypadków w naukach społecznych (co szczerze stwierdzę, jest to całkowicie moje przypuszczenie).
Środek jest dwojaki:
Mówimy o „powtarzalność kryzys ". Dlatego nieudane replikacje informują nas, że pierwotny efekt był prawdopodobnie tylko przypadkowym hałasem. Musimy zrobić (i sfinansować, napisać, przesłać i zaakceptować) więcej replik. Badania replikacji powoli zyskują uznanie, i to jest dobra rzecz.
Drugie lekarstwo jest oczywiście metaanaliza. Jeśli mamy wiele zgłoszonych korelacji podobnych danych, nawet jeśli każdy z nich ma niski poziomn , możemy połączyć informacje i nauczyć się czegoś. Idealnie byłoby nawet w stanie wykryćstronniczość publikacji w trakcie.
źródło