Jak posortować listę / krotkę list / krotkę według elementu o danym indeksie?

657

Mam niektóre dane na liście list lub liście krotek, takie jak to:

data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]

I chcę posortować według 2. elementu w podzbiorze. Oznacza to, że sortowanie według 2,5,8 skąd 2pochodzi (1,2,3), 5pochodzi z (4,5,6). Jak to najczęściej robić? Czy powinienem przechowywać krotki lub listy na mojej liście?

Stan
źródło
51
Jeśli chodzi o „Czy powinienem przechowywać krotki lub listy na mojej liście?”, Podstawową zasadą jest uczynienie rzeczy tak niezmiennymi, jak to możliwe. Jeśli nie musisz modyfikować list podrzędnych w miejscu, zrób je krotkami.
Matthew Flaschen

Odpowiedzi:

1112
sorted_by_second = sorted(data, key=lambda tup: tup[1])

lub:

data.sort(key=lambda tup: tup[1])  # sorts in place
Stephen
źródło
10
Masz pomysł, jak posortować go na większy?
billwild,
63
@billwild: help (sorted). rewers = prawda.
Stephen
34
@Stephen za pomocą itemgetter jest szybszy i prostszy: key=itemgetter(1)i na początku pliku:from operator import itemgetter
Joschua
3
@Cemre jak w drugim przykładzie, sorttutaj jest metoda Listobiektu Pythona, który odbiera funkcję lambda jako keyparametr. Możesz nazwać to jako tup, lub tcokolwiek zechcesz i nadal będzie działać. tuptutaj określa indeks krotki listy, więc 1oznacza, że ​​sortowanie będzie wykonywane według drugich wartości krotek z oryginalnej listy ( 2, 5, 8).
Neurotransmitter
1
Byłem nieco sceptycznie nastawiony do bezpodstawnego twierdzenia, że ​​„korzystanie z itemgetter jest szybsze i prostsze”. Subiektywnie ja natomiast uznać intuicyjne lambdapodejście do być prostsze niż nieintuicyjne itemgetterklasie, itemgetter ma rzeczywiście wydają się być szybsze . Jestem ciekawy, dlaczego tak jest. Podejrzewam, że lambdaponosisz ukryty koszt przechwytywania wszystkich zmiennych lokalnych w kontekście zamknięcia, podczas gdy itemgetterinstancja tego nie robi. tl; dr: Zawsze używaj itemgetter, bo prędkość wygrywa.
Cecil Curry
236
from operator import itemgetter
data.sort(key=itemgetter(1))
manova
źródło
37
To powinna być zaakceptowana odpowiedź. Zobacz też Charlie „s zamieszczone czasy , pokazując itemgetterklasę uporządkować 126% szybciej niż przeciętnie równoważnej lambdafunkcji.
Cecil Curry
9
Możesz także sortować hierarchicznie według wielu indeksów, np.data.sort(key=itemgetter(3,1))
Michael Ohlrogge
57

Chcę tylko dodać odpowiedź Stephena, jeśli chcesz posortować tablicę od wysokiej do niskiej, innym sposobem niż w powyższych komentarzach jest dodanie tego do wiersza:

reverse = True

a wynik będzie następujący:

data.sort(key=lambda tup: tup[1], reverse=True)
sifoo
źródło
48

Aby posortować według wielu kryteriów, mianowicie na przykład według drugiego i trzeciego elementu w krotce, pozwól

data = [(1,2,3),(1,2,1),(1,1,4)]

i tak zdefiniuj na przykład lambda, która zwraca krotkę opisującą priorytet

sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]
wiąz
źródło
28

Odpowiedź Stephena jest tą, której użyłbym. Dla kompletności, oto wzór DSU (decorate-sort-undecorate) z listami:

decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]

Lub bardziej zwięźle:

[b for a,b in sorted((tup[1], tup) for tup in data)]

Jak zauważono w Pythonie sortowania w Pythonie , nie jest to konieczne od Python 2.4, kiedy dostępne są kluczowe funkcje.

tcarobruce
źródło
2
Więc ta odpowiedź jest przydatna w Pythonie 2.3-? Czy są jakieś poprawne zastosowania w bardziej aktualnych wersjach Pythona, wokół których możesz nieco rozwinąć? Jeśli nie, to nie przeszkadzało ... że przechodził obok, widziałem to, a stary noggin zaczął się miażdżyć. W każdym razie, pozdrawiam i dziękuję za ten powrót do wcześniejszych dni Pythona.
Mechanical_meat
19

Aby posortować listę krotek (<word>, <count>), countw porządku malejącym i wordalfabetycznym:

data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]

Używam tej metody:

sorted(data, key=lambda tup:(-tup[1], tup[0]))

i daje mi wynik:

[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]
l mingzhi
źródło
1
co jeśli tup [1] jest łańcuchem?
eric,
12

Bez lambda:

def sec_elem(s):
    return s[1]

sorted(data, key=sec_elem)
Mesco
źródło
9

itemgetter() jest nieco szybszy niż lambda tup: tup[1] , ale wzrost jest stosunkowo niewielki (około 10 do 25 procent).

(Sesja IPython)

>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]

>>> tpls[:5]    # display sample from list
[(1, 0, 0), 
 (8, 5, 5), 
 (5, 4, 0), 
 (5, 7, 7), 
 (4, 2, 1)]

>>> sorted(tpls[:5], key=itemgetter(1))    # example sort
[(1, 0, 0), 
 (4, 2, 1), 
 (5, 4, 0), 
 (8, 5, 5), 
 (5, 7, 7)]

>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop

>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop

>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop
Walter
źródło
Zapoznaj się z rozwiązaniem do sortowania itemgetter dla różnych argumentów zwrotnych dla wielu kolumn tutaj, a następnie musisz ustawić sortowanie w wielu krokach z rzędu: stackoverflow.com/questions/14466068/…
Lorenz
6

Odpowiedź Stephena jest do rzeczy! Oto przykład lepszej wizualizacji,

Wołajcie o fanów Ready Player One! =)

>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]

keyto funkcja, która zostanie wywołana w celu przekształcenia elementów kolekcji w celu porównania .. jak compareTometoda w Javie.

Parametr przekazany do klucza musi być czymś, co można wywołać. Tutaj użycie lambdatworzy anonimową funkcję (którą można wywołać).
Składnia lambda to słowo lambda, po którym następuje iterowalna nazwa, a następnie pojedynczy blok kodu.

Poniżej przykład sortujemy listę krotek, która zawiera informacje o czasie określonego wydarzenia i nazwę aktora.

Sortujemy tę listę według czasu wystąpienia zdarzenia - który jest 0 elementem krotki.

Uwaga - s.sort([cmp[, key[, reverse]]]) sortuje pozycje s na miejscu

Rishi
źródło
-5

Sortowanie krotki jest dość proste:

tuple(sorted(t))
Jayr
źródło