Potrzebuję trochę pomocy w odzyskaniu danych z kwestionariusza.
Jeden z moich kolegów zastosował kwestionariusz, ale nieumyślnie, zamiast skorzystać z oryginalnej 5-punktowej skali Likerta (zdecydowanie nie zgadzam się zdecydowanie), wstawił szóstą odpowiedź do skali. I, co gorsza, szósta opcja to… „Nie wiem”.
Problemem jest duża część respondentów, którzy w pewnym momencie wybrali „nie wiem”. Gdyby stanowiły stosunkowo niewielki odsetek, po prostu wykluczyłbym je z bazy danych. Jednak rdzeń badań opiera się na modelu koncepcyjnym, a wykluczenie tylu rekordów stworzyłoby problem dla modelu.
Czy ktoś może skierować mnie tutaj we właściwym kierunku? Czy są jakieś „dobre praktyki” lub czy mogę zrobić coś, aby użyć (przekształcić, przekonwertować itp.) Tych odpowiedzi „nie wiem”?
Ponadto, jeśli dokonam jakiejkolwiek manipulacji danymi danymi (tj. Jeśli przekonwertuję odpowiedzi „nie wiem”, przez podstawienie, przypisanie itp.), Jakiego rodzaju „wyłączenie odpowiedzialności”, „ostrzeżenie”, adnotacja, powinienem użyć?
Wiem, że to długa szansa, ale przyznaję, oprócz ratowania odpowiedzi, jestem również ciekawy, jaka jest uzgodniona praktyka (jeśli taka istnieje) w tego typu przypadkach.
PS: Wiem, że to brzmi dziecinnie, ale nie, „kolega” to nie ja :)
źródło
Odpowiedzi:
Po co próbować wymuszać kalibrację czegoś, co nie jest prawdą? Jak powiedział Maarten, nie jest to utrata danych, ale zdobycie informacji. Jeśli istnieje magiczna pigułka, której szukasz, oznacza to, że istnieją pewne założenia dotyczące twojej populacji, które są na przykład nastawione na korzyść jednej konkretnej etykiety, nawet jeśli użytkownicy mówią „nie wiem”.
Całkowicie rozumiem twoją frustrację, ale właściwym sposobem podejścia do problemu jest modyfikacja modelu w celu dopasowania do twoich potrzeb w oparciu o prawdziwe istniejące dane, a nie odwrotnie (modyfikowanie danych).
źródło
Jeśli był to znormalizowany kwestionariusz, który został niezależnie zweryfikowany, nie można twierdzić, że nowy kwestionariusz jest równoważny, a dane nie są już porównywalne. Możesz spróbować zweryfikować i zbadać kwestionariusz w oddzielnych eksperymentach (bardzo czasochłonne i pracochłonne, szczególnie jeśli chcesz również wykazać porównywalność ze starą wersją) lub po prostu zaakceptować, że masz do czynienia z niższą jakością dowodów (ponieważ twoje dane pochodzą z niepotwierdzonego kwestionariusza).
Podczas korzystania z danych będziesz musiał wziąć pod uwagę zmianę. W obliczu pytania o postawę ludzie nie udzielają ci „obiektywnie prawdziwej” odpowiedzi, dają ci odpowiedź, którą uważają za prawdziwą - i na to z pewnością mają wpływ zarówno dostępne opcje odpowiedzi („normują” swoje odpowiedzi do skali) i do posiadanej wiedzy na ten temat (znane są uprzedzenia, które działają inaczej, czasem w różnych kierunkach (!) w zależności od tego, czy uczestnik ma dużą lub małą wiedzę na dany temat).
Tak więc, jeśli mamy do czynienia z ustalonym quesitonnaire, masz dobrą opcję porównania swojej wersji kwestionariusza z oryginalną. Jeśli w oryginale założono, że ludzie wiedzą, co wybierają, i okazuje się, że nie, możesz omówić, w jaki sposób stary model opiera się na błędnych założeniach i jakie są tego konsekwencje. Zauważ, że jest to odkrycie „poboczne”, które stanowi całkiem nowe pytanie badawcze, ale odsuwa cię od pierwotnego, i rzeczywiście pokazuje, że udzielenie odpowiedzi na oryginalne jest znacznie trudniejsze niż myśl, więc z pewnością zwielokrotnia twoją pracę.
Jeśli nie masz do czynienia z ustalonym kwestionariuszem, możesz rzucić okiem i udawać, że kwestionariusz ad hoc został zaplanowany w ten sposób, i odpowiednio ocenić wyniki. Znów może to oznaczać, że wyniki, na które liczyłeś, są nieosiągalne dzięki tej metodzie, ale jest to również ważna rzecz, o której należy wiedzieć.
Aby dobrze zrozumieć, w jaki sposób sformułowania i opcje wpływają na sposób, w jaki kwestionariusze są wypełniane, sugeruję przeczytanie „Psychologii odpowiedzi w ankiecie” Tourangeau i in. Jest to świetna lektura dla każdego, kto kiedykolwiek tworzy kwestionariusz.
źródło
Jeśli zapytasz, ile dzieci urodziło respondenta, odpowiedzi „zero” i „nie dotyczy” nie będą oznaczały ściśle tego samego, ponieważ mężczyźni nie mogą rodzić.
W niektórych kontekstach utożsamianie „nie wiem” z reakcją neutralną może być również błędem koncepcyjnym.
W rzeczywistości masz dwa pytania: dychotomiczne „Czy masz zdanie?” i zwykłe „Co to jest?”, podobnie jak powyżej, masz ukryte „Czy jesteś kobietą”? poza twoim wyraźnym pytaniem.
Oczywiście możesz wprowadzić pewne założenia (czasami poprawnie, czasami tylko dla wygody, a czasem wymuszone), aby umożliwić ci modelowanie, ale nie widzę żadnej uniwersalnej strategii bez wchodzenia w sferę specyfiki twojego zjawiska.
Jako ostatni punkt, o którym należy pomyśleć, nie ma sensu próbować wnioskować na temat męskiej populacji na podstawie kobiecych odpowiedzi na płodność.
źródło
Dylemat, czy w kwestionariuszu składającym się ze skal ratingowych typu Likerta należy włączyć czy nie opcję odpowiedzi Nie wiem, jest wieczny. Często, gdy elementy pytają o opinię, DK jest uwzględniana, ponieważ brak opinii jest sam w sobie ważnym statusem i respondenci oczekują takiej opcji. W inwentarzach cech osobistych, w których ludzie przypisują cechy do docelowej opcji DK, zwykle jest pomijany, ponieważ zwykle oczekuje się, że respondent będzie w stanie ocenić stopień powinowactwa cechy (tj. Respondent jest zawsze postrzegany jako wykwalifikowany); a kiedy czasami napotyka trudności, może (z instrukcji) pominąć ten przedmiot. W spisach cech osobistych, w których ludzie opisują cel (elementy behawioralne) DK (lub nie
@Hatim w swojej odpowiedzi, @Maarten i niektórzy komentatorzy pytania PO rozsądnie stwierdzili, że duża liczba odpowiedzi DK zaobserwowanych w bieżącym badaniu wskazuje na problemy (ważność treści lub wartość twarzy) w przedmiotach lub że badani nie „ pasuje do zamówionego im kwestionariusza.
Ale nigdy nie możesz opowiedzieć tej historii, ostatecznie interpretacja przeszkody spoczywa na tobie (chyba że rozwiążesz ją w oddzielnym dochodzeniu). Można na przykład twierdzić, że włączenie opcji DK do sympatii w tym kwestionariuszu (powiedzmy, że jest to spis cech przypisywania) służy źle, a nie dobrze. Nie dostarczył ci informacji (o których mówią komentatorzy
it proves that the [rating] model is inadequate
), ale raczej rozproszył / uwiódł respondenta. Gdyby nie to, decyzja o ratingu oparta na domyślnym schemacie cech poznawczych mogłaby zostać wywołana; ale zobaczenie opcji chłodzenia wyklucza schemat i powoduje, że można go szybko wycofać.Jeśli dalej przyznasz - na własne ryzyko, ale dlaczego nie? - że łatwo rozpraszającym się lub leniwym podmiotem jest ten, którego potencjał, powstrzymywany widok jest ważny, ale zwykle jest słabo zróżnicowany - to znaczy, że łatwo przywołałby konwencjonalnego das Mana zamiast osobistego Erlebnisa , schematu - wtedy możesz niepewnie spekulować jego brakująca odpowiedź jest zbliżona do średniej próbki lub populacji dla tego elementu. Jeśli tak, to dlaczego nie oznaczać (+ szum) podstawienia brakujących odpowiedzi? Lub możesz zastosować imputację elektromagnetyczną lub regresyjną (+ szum), aby uwzględnić korelacje.
Powtarzam: decyzja o przypisaniu jest możliwa, ale ryzykowna i jest mało prawdopodobna, biorąc pod uwagę dużą ilość brakujących danych, aby przywrócić „naprawdę” nieobecne dane. Jak powiedział @rumtscho, z pewnością nowy kwestionariusz z DK nie jest równoważny z oryginalnym bez DK, a dane nie są już porównywalne.
To były spekulacje. Ale przede wszystkim powinieneś spróbować zbadać zaobserwowane wzorce zaginięcia. Kim są ci, którzy wybrali DK? Czy łączą się w podtypy? Czym różnią się od pozostałych elementów od podpróbki „w porządku”? Niektóre programy mają pakiet analizy brakujących wartości. Następnie możesz zdecydować, czy porzucić ludzi całkowicie, czy częściowo, przypisać im, czy też przeanalizować je jako osobną podpróbkę.
PS Zauważ też, że respondenci są „głupi”. Często po prostu mieszają się z ocenami skali. Na przykład, jeśli punkt DK był umieszczony blisko jednego bieguna skali, często myliłby się z powodu nieuwagi z tym biegunem. Nie żartuję.
źródło
Masz teraz wybranych respondentów do wyrażenia opinii w tej sprawie. Cokolwiek wyciągniesz, będzie dotyczyło wyłącznie tych ludzi. Może to być OK, ponieważ odpytywanie tych „nie wiem” jest z definicji mniej przydatne.
źródło