Próbuję połączyć dwie ramki danych pandy za pomocą dwóch kolumn:
new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]')
ale pojawił się następujący błąd:
pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)()
pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)()
pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)()
pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)()
KeyError: '[B_1, c2]'
Masz jakiś pomysł, jaki powinien być właściwy sposób, aby to zrobić? Dzięki!
python
python-3.x
pandas
join
Edamame
źródło
źródło
left_on
iright_on
powinna być listą ciągów, a nie łańcuchem, który wygląda jak lista.Odpowiedzi:
Spróbuj tego
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html
źródło
left_on
iright_on
są takie samea
ib
czy możemy użyćon = ['a', 'b']
?problem polega na tym, że używając apostrofów ustawiasz przekazywaną wartość jako ciąg znaków, podczas gdy w rzeczywistości, jak stwierdził @Shijo w dokumentacji, funkcja oczekuje etykiety lub listy, ale nie łańcucha! Jeśli lista zawiera każdą z nazw kolumn przekazanych zarówno dla lewej, jak i prawej ramki danych, to każda nazwa kolumny musi osobno znajdować się w apostrofach. Z tego, co zostało powiedziane, możemy zrozumieć, dlaczego jest to niecałkowite:
A oto poprawny sposób korzystania z funkcji:
źródło
Inny sposób na zrobienie tego:
new_df = A_df.merge(B_df, left_on=['A_c1','c2'], right_on = ['B_c1','c2'], how='left')
źródło