Pytania oznaczone «dplyr»

96
R dplyr: Upuść wiele kolumn

Mam ramkę danych i listę kolumn w tej ramce danych, które chciałbym usunąć. Użyjmy iriszbioru danych jako przykładu. Chciałbym spadać Sepal.Lengthi Sepal.Widthi używać tylko pozostałe kolumny. Jak to zrobić za pomocą selectlub select_z dplyrpakietu? Oto, czego próbowałem do tej pory: drop.cols...

93
Uzyskiwanie najwyższych wartości według grup

Oto przykładowa ramka danych: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Chcę, aby podzbiór dzawierał wiersze z 5 górnymi wartościami xdla każdej wartości grp. Używając base-R, moje podejście wyglądałoby mniej więcej tak: ordered <- d[order(d$x, decreasing = TRUE), ] splits...

93
R Ocena warunkowa przy użyciu operatora potoku%>%

Przy użyciu operatora rury %>%z pakietów, takich jak dplyr, ggvis, dychartsitp, jak to zrobić krok warunkowo? Na przykład; step_1 %>% step_2 %>% if(condition) step_3 Te podejścia wydają się nie działać: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2...

91
dplyr na data.table, czy naprawdę używam data.table?

Jeśli używam składni dplyr na szczycie datatable , czy uzyskam wszystkie korzyści związane z szybkością datatable, nadal używając składni dplyr? Innymi słowy, czy niewłaściwie używam datatable, jeśli wykonuję zapytanie za pomocą składni dplyr? Czy też muszę używać czystej składni datatable, aby...

87
dplyr mutate z wartościami warunkowymi

W dużej ramce danych („myfile”) z czterema kolumnami muszę dodać piątą kolumnę z wartościami warunkowo opartymi na pierwszych czterech kolumnach. Preferuj odpowiedzi z dplyri mutate, głównie ze względu na szybkość w dużych zbiorach danych. Moja ramka danych wygląda następująco: V1 V2 V3 V4 1...

85
dplyr mutuje / zamienia kilka kolumn w podzbiorze wierszy

Jestem w trakcie wypróbowywania przepływu pracy opartego na dplyr (zamiast używania głównie data.table, do czego jestem przyzwyczajony) i napotkałem problem, do którego nie mogę znaleźć równoważnego rozwiązania dplyr . Często spotykam się ze scenariuszem, w którym muszę warunkowo zaktualizować /...

83
Wybierz kolumny na podstawie dopasowania ciągów - dplyr :: select

Mam ramkę danych („dane”) z dużą ilością kolumn. Niektóre kolumny zawierają określony ciąg („ciąg_wyszukiwania”). Jak mogę użyć dplyr::select()podzbioru zawierającego tylko kolumny zawierające ciąg? Próbowałem: # columns as boolean vector select(data, grepl("search_string",colnames(data))) #...

18
Jak zastąpić NA zestawem wartości

Mam następującą ramkę danych: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df To wygląda tak: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b 5 3 c NA 4 d 3 5 e NA Chcę...

9
Skuteczny sposób upuszczania wierszy z nakładającymi się czasami

Mam długi zestaw danych z kolumnami reprezentującymi czasy rozpoczęcia i zakończenia i chcę upuścić wiersz, jeśli pokrywa się on z innym i ma wyższy priorytet (np. 1 jest najwyższym priorytetem). Moje przykładowe dane to library(tidyverse) library(lubridate) times_df <- tibble(start =...

9
Czego nie mogę zrobić z dtplyr, że mogę w data.table

Czy powinienem inwestować wysiłki w uczenie się na przekręcaniu danych w R, szczególnie pomiędzy dplyr, dtplyra data.table? Używam dplyrgłównie, ale gdy dane są za duże na to, skorzystam data.table, co jest rzadkim zjawiskiem. Teraz, gdy dtplyrwersja 1.0 jest dostępna jako interfejs data.table,...