Jak posortować jeden wektor na podstawie wartości innego

112

Mam wektor x, który chciałbym posortować według kolejności wartości w wektorze y. Te dwa wektory nie mają takiej samej długości.

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

Oczekiwany wynik to:

[1] 4 4 4 2 2 1 3 3 3
Learnr
źródło

Odpowiedzi:

70

Oto jedna wkładka ...

y[sort(order(y)[x])]

[edytuj:] To dzieli się w następujący sposób:

order(y)             #We want to sort by y, so order() gives us the sorting order
order(y)[x]          #looks up the sorting order for each x
sort(order(y)[x])    #sorts by that order
y[sort(order(y)[x])] #converts orders back to numbers from orders
Ian Fellows
źródło
1
To jest bardzo zwięzłe, ale trudno mi zrozumieć, co się tam dzieje. Czy mógłbyś trochę rozwinąć?
Matt Parker,
3
To jest ładne i pokazuje dobre zrozumienie wbudowanych funkcji R. +1
Godeke
6
Ogólnie można chcieć to zrobić, nawet jeśli y nie jest permutacją 1: długość (y). W takim przypadku to rozwiązanie nie działa, ale rozwiązanie gd047 poniżej, x [order (match (x, y))], działa.
Rahul Savani,
5
Jestem naprawdę zdumiony, dlaczego ma to 40 głosów za. Nie udaje się to w przypadku tak wielu prostych odmian xi y. x <- c(1,4,2); y <- c(1,2,4)na przykład.
thelatemail
1
@thelatemail Zgadzam się. Powstrzymaj szaleństwo i odrzuć tę odpowiedź!
Ian Fellows,
185

a co z tym

x[order(match(x,y))]
George Dontas
źródło
29
To jest bardzo miłe, lepsze niż akceptowana odpowiedź IMHO, ponieważ jest bardziej ogólna.
fmark
2
Powiedziałbym nawet, że powinno to być w podstawowym GNU-R.
katastrofalna awaria
Ta odpowiedź działała dobrze, gdy używam wektorów znakowych zarówno dla x, jak i y. Dodanie dekompozycji / niewielkiego rozwinięcia, jak w zaakceptowanej odpowiedzi, byłoby fajne
mavericks
4

Możesz zamienić xna uporządkowany czynnik:

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

Oczywiście zmiana twoich liczb na czynniki może radykalnie zmienić sposób, w jaki reaguje kod poniżej x. Ale ponieważ nie podałeś nam żadnego kontekstu na temat tego, co stanie się później, pomyślałem, że zasugerowałbym to jako opcję.

Matt Parker
źródło
1
to powinna być najlepsza odpowiedź, ponieważ działałaby w przypadkach innych niż liczby całkowite; lub działa również, gdy nie ma wartości w xwektorze sortowania yz niewielką zmianą:x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x))))))
rawr
2

Co powiesz na?:

rep(y,table(x)[as.character(y)])

(Ian jest prawdopodobnie nadal lepszy)

Ben Bolker
źródło
2

W przypadku, gdy chcesz uzyskać zamówienie na „y”, niezależnie od tego, czy są to liczby, czy znaki:

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

Kroki:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3
Georgie Shimanovsky
źródło
1

[ Edycja: Najwyraźniej Ian ma właściwe podejście, ale zostawię to potomności.]

Możesz to zrobić bez pętli, indeksując swój wektor y. Dodaj rosnącą wartość liczbową do y i połącz je:

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3
Shane
źródło
0
x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

Wynik w z: 4 4 4 2 2 1 3 3 3

Ważne kroki:

  1. for (i in y) - Pętle nad interesującymi nas elementami.

  2. z <- c (z, ...) - Łączy po kolei każde podwyrażenie

  3. rep (i, sum (x == i)) - Powtarza i (bieżący element zainteresowania) sum (x == i) razy (ile razy znaleźliśmy i w x).

Godeke
źródło
0

Możesz także użyć sqldfi zrobić to za pomocą joinfunkcji sqlpodobnej do następujących:

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]
O mój Boże
źródło