Czy ktoś wie o R odpowiadającym SAS PROC FREQ
?
Próbuję wygenerować podsumowujące statystyki opisowe dla wielu zmiennych jednocześnie.
r
descriptive-statistics
sas
z0lo
źródło
źródło
Odpowiedzi:
Używam
table
iprop.table
, aleCrossTable
wgmodels
pakiecie może dać wyniki jeszcze bliższe SAS. Zobacz ten link .Ponadto, aby wygenerować „statystyki opisowe dla wielu zmiennych jednocześnie”, należy użyć
summary
funkcji; npsummary(mydata)
.źródło
Podsumowanie danych w bazie R to tylko ból głowy. Jest to jeden z obszarów, w którym SAS działa całkiem dobrze. Dla R polecam
plyr
pakiet.W SAS:
z
plyr
:źródło
Nie używam SAS; więc nie mogę komentować, czy poniższe replikują się
SAS PROC FREQ
, ale są to dwie szybkie strategie opisywania zmiennych w pliku data.frame, których często używam:describe
wHmisc
zapewnia przydatne podsumowanie zmiennych, w tym danych liczbowych i nienumerycznychdescribe
wpsych
zapewnia statystyki opisowe dla danych liczbowychR Przykład
Oto wynik
Hmisc
describe
:Poniżej znajduje się wynik
psych
describe
dla zmiennych numerycznych:źródło
Korzystam z funkcji słownika {EPICALC}, która daje statystyki podsumowujące dla zmiennej numerycznej i tabelę częstotliwości z etykietami poziomu i kodami czynników. http://cran.r-project.org/doc/contrib/Epicalc_Book.pdf (patrz str. 50) Co więcej, jest to bardzo przydatne, ponieważ zapewnia sd dla zmiennych ilościowych.
Cieszyć się !
źródło
codebook()
to określa. 1 problem polega na tym, żena
s są usuwane, co może być potrzebne w twoich wynikach. Jednym ze sposobów radzenia sobie z tym (przynajmniej z czynnikami) jest użycie ? Recode.is.na 1st (np. „Brak”); dla zmiennych numerycznych możesz utworzyć nową zmienną bezpośrednio po lewej stronie kolumny z wartością logiczną na podstawieis.na()
, a następnie uruchomićcodebook()
. Ale to trochę dziwne.Możesz sprawdzić mój pakiet narzędzi podsumowujących ( link CRAN ), który zawiera funkcję podobną do słownika, z opcjami markdown i formatowania HTML.
Podsumowanie ramki danych
CO2
EDYTOWAĆ
W nowszych wersjach summarytools The
freq()
function (która produkuje tabele częstotliwości proste, bardziej do-punktu, w odniesieniu do pierwotnego pytania) akceptuje ramek danych, jak również pojedynczych zmiennych. Aby zobaczyć tabele krzyżowe (co robi również proc freq ), zobaczctable()
funkcję.Częstotliwości
CO2 $ RoślinaTyp : Zamówiony współczynnik
Typ CO2 $Typ : współczynnik
Obróbka CO2 $Typ : współczynnik
źródło
Dziękujemy za wszystkie sugestie wszystkim. Skończyło się na użyciu tabeli lub funkcji numSummary Rcmdr plus zastosuj:
Działa to całkiem dobrze i nie jest zbyt niewygodne. Jednak na pewno spróbuję tych innych rozwiązań!
źródło