Chcę obliczyć podsumowanie zmiennej w data.frame dla każdej unikalnej kombinacji czynników w data.frame. Czy powinienem użyć do tego plyr? Nie przeszkadza mi używanie pętli w przeciwieństwie do apply (); więc po prostu znalezienie każdej unikalnej kombinacji byłoby wystarczające.
r
categorical-data
aggregation
plyr
russellpierce
źródło
źródło
Odpowiedzi:
Chociaż myślę, że
aggregate
prawdopodobnie jest to rozwiązanie, którego szukasz, jeśli chcesz stworzyć wyraźną listę wszystkich możliwych kombinacji czynników,expand.grid
zrobi to za Ciebie. na przykładNastępnie można zapętlić każdy wiersz w wynikowej ramce danych, aby wyciągnąć rekordy z oryginalnych danych.
źródło
Zobacz
aggregate
iby
. Na przykład z pliku pomocy dlaaggregate
:źródło
Oto rozwiązanie plyr, które ma tę zaletę, że zwraca wiele statystyk podsumowujących i tworzy pasek postępu dla długich obliczeń:
źródło
Oprócz innych sugestii
describe.by()
funkcja może byćpsych
przydatna w pakiecie. Można go używać do wyświetlania statystyk podsumowujących dotyczących zmiennych numerycznych na różnych poziomach zmiennej czynnikowej.źródło
Osobiście podoba mi się
cast()
z pakietu przekształcania ze względu na jego prostotę:źródło
W
library(doBy)
istnieje równieżsummaryBy()
funkcja, npźródło