Muszę przeanalizować za pomocą R dane z ankiety medycznej (z ponad 100 zakodowanymi kolumnami), które pochodzą z CSV. Użyję grzechotkę jakiegoś wstępnej analizy, ale za kulisami to wciąż R.
Jeśli odczytam plik.csv () , kolumny z kodami numerycznymi są traktowane jako dane numeryczne. Zdaję sobie sprawę, że mogę tworzyć z nich kolumny kategorialne za pomocą czynnika (), ale robienie tego dla ponad 100 kolumn jest uciążliwe.
Mam nadzieję, że istnieje lepszy sposób, aby powiedzieć R, aby importował kolumny bezpośrednio jako czynniki. Lub przynajmniej później je przekonwertować.
Dziękuję Ci!
r
categorical-data
data-transformation
wishihadabettername
źródło
źródło
Odpowiedzi:
Za pomocą tego
colClasses
argumentu można określić klasy kolumn danych. Na przykład:przypisze wartość liczbową do pierwszej kolumny, a czynnik do drugiej i trzeciej. Ponieważ masz tak wiele kolumn, skrót może być:
lub niektóre takie odmiany (tj. przypisz liczbowo do pierwszej kolumny, czynnik do następnych 37 kolumn, a następnie znak do ostatniej).
źródło
lub po prostu zrób to po odczytaniu danych
chociaż ten typ Q jest prawdopodobnie bardziej odpowiedni Przepełnienia stosu.edycja : patrz poniżej.
źródło
'T'
i'F'
(zostają przekonwertowane na logiczne).