Próbuję przekonwertować listę list, która wygląda następująco na ramkę danych Pandas
[['New York Yankees ', '"Acevedo Juan" ', 900000, ' Pitcher\n'],
['New York Yankees ', '"Anderson Jason"', 300000, ' Pitcher\n'],
['New York Yankees ', '"Clemens Roger" ', 10100000, ' Pitcher\n'],
['New York Yankees ', '"Contreras Jose"', 5500000, ' Pitcher\n']]
Zasadniczo próbuję przekonwertować każdy element w tablicy na ramkę danych pandy, która ma cztery kolumny. Jakie byłoby najlepsze podejście do tego jako pd.Dataframe nie do końca daje mi to, czego szukam.
Odpowiedzi:
źródło
DataFrame["Team"]
musi odnosić się do pierwszego elementu każdej podlisty (tj.data[i][0]
) IDataFrame["Position"]
do ostatniego elementu każdej podlisty (tj.data[i][-1]
)?columns
parametru DataFrame.from_records .Po uzyskaniu danych:
Możesz utworzyć ramkę danych z transponowanych danych:
Inny sposób:
źródło
Możesz po prostu bezpośrednio zdefiniować go jako ramkę danych w następujący sposób:
źródło
źródło
Ten był zdecydowanie najprostszy:
teraz, jeśli klucze są pierwszą listą na liście list (dane [0]), możesz przypisać je do nagłówków kolumn w ramce danych w następujący sposób:
źródło