Uzyskaj kartezjański produkt z serii list?

317

Jak mogę uzyskać produkt kartezjański (każdą możliwą kombinację wartości) z grupy list?

Wejście:

somelists = [
   [1, 2, 3],
   ['a', 'b'],
   [4, 5]
]

Pożądane wyjście:

[(1, 'a', 4), (1, 'a', 5), (1, 'b', 4), (1, 'b', 5), (2, 'a', 4), (2, 'a', 5) ...]
.ıu
źródło
24
należy pamiętać, że „każda możliwa kombinacja” to nie to samo, co „produkt kartezjański”, ponieważ w produktach kartezjańskich dozwolone są duplikaty.
Tryptyk
7
Czy istnieje niepowielona wersja produktu kartezjańskiego?
KJW
16
@KJW Tak,set(cartesian product)
NoBugs
5
W produkcie kartezjańskim nie powinno być duplikatów, chyba że same listy wejściowe zawierają duplikaty. Jeśli nie chcesz duplikatów w produkcie kartezjańskim, użyj set(inputlist)wszystkich list wprowadzania. Nie na wyniku.
CamilB
@Triptych co? Standardowa definicja produktu kartezjańskiego to zestaw. Dlaczego tak wielu ludzi głosuje za głosem?
PascalIv

Odpowiedzi:

378

itertools.product

Dostępne z Python 2.6.

import itertools

somelists = [
   [1, 2, 3],
   ['a', 'b'],
   [4, 5]
]
for element in itertools.product(*somelists):
    print(element)

Który jest taki sam jak

for element in itertools.product([1, 2, 3], ['a', 'b'], [4, 5]):
    print(element)
Tryptyk
źródło
22
Chciałem tylko dodać znak „*” jest wymagany, jeśli używasz zmiennych somelists podanych przez OP.
brian buck
1
@jaska: product()generuje nitems_in_a_list ** nlistselementy w wyniku ( reduce(mul, map(len, somelists))). Nie ma powodu, aby sądzić, że uzyskanie pojedynczego elementu nie jest O(nlists)(amortyzowane), tj. Złożoność czasowa jest taka sama jak w przypadku prostych zagnieżdżonych forpętli, np. Dla danych wejściowych w pytaniu :,nlists=3 całkowita liczba elementów w wyniku: 3*2*2i każdy element ma nlistselementy ( 3w tym przypadku).
jfs
2
Jakie jest zastosowanie *przed somelistami? Co to robi?
Vineet Kumar Doshi,
6
@VineetKumarDoshi: Tutaj służy do rozpakowywania listy na wiele argumentów wywołania funkcji. Czytaj więcej tutaj: stackoverflow.com/questions/36901/…
Moberg
4
Uwaga: Działa to tylko wtedy, gdy każda lista zawiera co najmniej jeden element
igo
84
import itertools
>>> for i in itertools.product([1,2,3],['a','b'],[4,5]):
...         print i
...
(1, 'a', 4)
(1, 'a', 5)
(1, 'b', 4)
(1, 'b', 5)
(2, 'a', 4)
(2, 'a', 5)
(2, 'b', 4)
(2, 'b', 5)
(3, 'a', 4)
(3, 'a', 5)
(3, 'b', 4)
(3, 'b', 5)
>>>
Jason Baker
źródło
38

W przypadku Python 2.5 i starszych:

>>> [(a, b, c) for a in [1,2,3] for b in ['a','b'] for c in [4,5]]
[(1, 'a', 4), (1, 'a', 5), (1, 'b', 4), (1, 'b', 5), (2, 'a', 4), 
 (2, 'a', 5), (2, 'b', 4), (2, 'b', 5), (3, 'a', 4), (3, 'a', 5), 
 (3, 'b', 4), (3, 'b', 5)]

Oto rekurencyjna wersja product()(tylko ilustracja):

def product(*args):
    if not args:
        return iter(((),)) # yield tuple()
    return (items + (item,) 
            for items in product(*args[:-1]) for item in args[-1])

Przykład:

>>> list(product([1,2,3], ['a','b'], [4,5])) 
[(1, 'a', 4), (1, 'a', 5), (1, 'b', 4), (1, 'b', 5), (2, 'a', 4), 
 (2, 'a', 5), (2, 'b', 4), (2, 'b', 5), (3, 'a', 4), (3, 'a', 5), 
 (3, 'b', 4), (3, 'b', 5)]
>>> list(product([1,2,3]))
[(1,), (2,), (3,)]
>>> list(product([]))
[]
>>> list(product())
[()]
jfs
źródło
Wersja rekurencyjna nie działa, jeśli niektóre argssą iteratorami.
jfs
20

z itertools.product :

import itertools
result = list(itertools.product(*somelists))
SilentGhost
źródło
6
Jakie jest zastosowanie *przed somelistami?
Vineet Kumar Doshi,
@VineetKumarDoshi „produkt (somelisty)” to kartezjański produkt między podlistami w taki sposób, że Python najpierw otrzymuje „[1, 2, 3]” jako element, a następnie dostaje inny element po następnym poleceniu i jest to łamanie linii, więc pierwszy produkt termin to ([1, 2, 3],), podobnie dla drugiego ([4, 5],), a więc „[([1, 2, 3],), ([4, 5],), ( [6, 7],)] ” . Jeśli chcesz uzyskać produkt kartezjański między elementami wewnątrz krotek, musisz powiedzieć Pythonowi z gwiazdką o strukturze krotki. Do słownika używasz **. Więcej tutaj .
hhh
19

Użyłbym zrozumienia listy:

somelists = [
   [1, 2, 3],
   ['a', 'b'],
   [4, 5]
]

cart_prod = [(a,b,c) for a in somelists[0] for b in somelists[1] for c in somelists[2]]
użytkownik1035648
źródło
1
Naprawdę podoba mi się to rozwiązanie przy użyciu list. Nie wiem, dlaczego nie jest już tak wysoko oceniany, to takie proste.
llekn
20
@llekn, ponieważ kod wydaje się być ustawiony na liczbę list
Bằng Rikimaru
11

Oto rekurencyjny generator, który nie przechowuje żadnych tymczasowych list

def product(ar_list):
    if not ar_list:
        yield ()
    else:
        for a in ar_list[0]:
            for prod in product(ar_list[1:]):
                yield (a,)+prod

print list(product([[1,2],[3,4],[5,6]]))

Wynik:

[(1, 3, 5), (1, 3, 6), (1, 4, 5), (1, 4, 6), (2, 3, 5), (2, 3, 6), (2, 4, 5), (2, 4, 6)]
Anurag Uniyal
źródło
1
Są one jednak przechowywane na stosie.
Quentin Pradet
@QuentinPradet, czy masz na myśli, że generator, tak def f(): while True: yield 1jak my, będzie ciągle zwiększał swój rozmiar stosu, gdy go przejdziemy?
Anurag Uniyal
@QuentinPradet tak, ale nawet w tym przypadku tylko stos potrzebny do maksymalnej głębokości, a nie cała lista, więc w tym przypadku stos 3
Anurag Uniyal
Przepraszam, to prawda. Benchmark może być interesujący. :)
Quentin Pradet
11

W Pythonie 2.6 i nowszych możesz użyć „itertools.product”. W starszych wersjach Pythona możesz użyć następującego (prawie - patrz dokumentacja) równoważnego kodu z dokumentacji , przynajmniej jako punkt wyjścia:

def product(*args, **kwds):
    # product('ABCD', 'xy') --> Ax Ay Bx By Cx Cy Dx Dy
    # product(range(2), repeat=3) --> 000 001 010 011 100 101 110 111
    pools = map(tuple, args) * kwds.get('repeat', 1)
    result = [[]]
    for pool in pools:
        result = [x+[y] for x in result for y in pool]
    for prod in result:
        yield tuple(prod)

Wynikiem obu jest iterator, więc jeśli naprawdę potrzebujesz listy do dalszego przetwarzania, użyj list(result).


źródło
Zgodnie z dokumentacją faktyczna implementacja itertools.product NIE buduje wyników pośrednich, które mogą być kosztowne. Korzystanie z tej techniki może dość szybko wymknąć się spod kontroli w przypadku list o średniej wielkości.
Tryptyk
4
Mogę tylko wskazać OP na dokumentację, a nie dla niego przeczytać.
1
Kod z dokumentacji ma na celu zademonstrowanie działania funkcji produktu, a nie obejście wcześniejszych wersji Pythona.
Tryptyk
9

Chociaż jest już wiele odpowiedzi, chciałbym podzielić się kilkoma przemyśleniami:

Podejście iteracyjne

def cartesian_iterative(pools):
  result = [[]]
  for pool in pools:
    result = [x+[y] for x in result for y in pool]
  return result

Podejście rekurencyjne

def cartesian_recursive(pools):
  if len(pools) > 2:
    pools[0] = product(pools[0], pools[1])
    del pools[1]
    return cartesian_recursive(pools)
  else:
    pools[0] = product(pools[0], pools[1])
    del pools[1]
    return pools
def product(x, y):
  return [xx + [yy] if isinstance(xx, list) else [xx] + [yy] for xx in x for yy in y]

Podejście Lambda

def cartesian_reduct(pools):
  return reduce(lambda x,y: product(x,y) , pools)
weiyixie
źródło
W „Podejściu iteracyjnym” dlaczego wynik jest zadeklarowany jako wynik = [[]] Wiem, że jest to lista_list, ale ogólnie, nawet jeśli zadeklarowaliśmy listę_list, używamy [], a nie [[]]
Sachin S
Jestem trochę nowy, jeśli chodzi o rozwiązania w języku Python. Czy ty lub jakiś przechodzień napiszcie zrozumienie listy w „iteracyjnym podejściu” w osobnych pętlach?
Johnny Boy,
4

Podejście rekurencyjne:

def rec_cart(start, array, partial, results):
  if len(partial) == len(array):
    results.append(partial)
    return 

  for element in array[start]:
    rec_cart(start+1, array, partial+[element], results)

rec_res = []
some_lists = [[1, 2, 3], ['a', 'b'], [4, 5]]  
rec_cart(0, some_lists, [], rec_res)
print(rec_res)

Podejście iteracyjne:

def itr_cart(array):
  results = [[]]
  for i in range(len(array)):
    temp = []
    for res in results:
      for element in array[i]:
        temp.append(res+[element])
    results = temp

  return results

some_lists = [[1, 2, 3], ['a', 'b'], [4, 5]]  
itr_res = itr_cart(some_lists)
print(itr_res)
Jai
źródło
3

Niewielka modyfikacja powyższego generatora rekurencyjnego w wariancie smakowym:

def product_args(*args):
    if args:
        for a in args[0]:
            for prod in product_args(*args[1:]) if args[1:] else ((),):
                yield (a,) + prod

I oczywiście opakowanie, dzięki któremu działa dokładnie tak samo jak to rozwiązanie:

def product2(ar_list):
    """
    >>> list(product(()))
    [()]
    >>> list(product2(()))
    []
    """
    return product_args(*ar_list)

z jednym kompromisem : sprawdza, czy rekurencja powinna przerwać się przy każdej zewnętrznej pętli, i jeden zysk : brak dochodu przy pustym wywołaniu, np.product(()) co, jak sądzę, byłoby semantycznie bardziej poprawne (patrz doctest).

Odnośnie rozumienia listy: definicja matematyczna ma zastosowanie do dowolnej liczby argumentów, podczas gdy rozumienie listy może dotyczyć tylko znanej ich liczby.

Mike Lu
źródło
2

Wystarczy dodać trochę do tego, co już powiedziano: jeśli używasz sympy, możesz używać symboli zamiast ciągów znaków, co czyni je matematycznie użytecznymi.

import itertools
import sympy

x, y = sympy.symbols('x y')

somelist = [[x,y], [1,2,3], [4,5]]
somelist2 = [[1,2], [1,2,3], [4,5]]

for element in itertools.product(*somelist):
  print element

O sympy .

Tyler Heers
źródło
1

Wierzę, że to działa:

def cartesian_product(L):  
   if L:
       return {(a,) + b for a in L[0] 
                        for b in cartesian_product(L[1:])}
   else:
       return {()}
Richard Samuelson
źródło
0

Podejście Stonehenge:

def giveAllLists(a, t):
    if (t + 1 == len(a)):
        x = []
        for i in a[t]:
            p = [i]
            x.append(p)
        return x
    x = []

    out = giveAllLists(a, t + 1)
    for i in a[t]:

        for j in range(len(out)):
            p = [i]
            for oz in out[j]:
                p.append(oz)
            x.append(p)
    return x

xx= [[1,2,3],[22,34,'se'],['k']]
print(giveAllLists(xx, 0))

wynik:

[[1, 22, 'k'], [1, 34, 'k'], [1, 'se', 'k'], [2, 22, 'k'], [2, 34, 'k'], [2, 'se', 'k'], [3, 22, 'k'], [3, 34, 'k'], [3, 'se', 'k']]
Sina
źródło