Jak mogę czytać w pliku .csv (bez nagłówków) i kiedy chcę tylko podzestawu kolumn (powiedzmy 4 i 7 z 20 kolumn), używając pand? Nie mogę tego zrobićusecols
Poprzednie odpowiedzi były dobre i poprawne, ale moim zdaniem dodatkowy names
parametr sprawi, że będzie idealny, i powinien to być zalecany sposób, szczególnie gdy csv nie ma headers
.
usecols
i names
parametrydf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
lub użyj, header=None
aby wyraźnie powiedzieć ludziom, że csv
nie ma nagłówków (w każdym razie obie linie są identyczne )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Abyś mógł odzyskać swoje dane przez
# with `names` parameter
df['colA']
df['colB']
zamiast
# without `names` parameter
df[0]
df[1]
Na podstawie read_csv , kiedy names
zostaną przekazane jawnie, header
będą zachowywać się jak None
zamiast 0
, więc można pominąć, header=None
jeśli names
istnieją.
Upewnij się, że podałeś pass header=None
i add usecols=[3,6]
dla czwartej i siódmej kolumny.