Jak przekonwertować kolumnę ciągów danych DataFrame (w formacie dd / mm / rrrr ) na czasy danych?
283
Jak przekonwertować kolumnę ciągów danych DataFrame (w formacie dd / mm / rrrr ) na czasy danych?
Najprostszym sposobem jest użycie to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Jest to również dayfirst
argument za czasami europejskimi (ale uważaj, to nie jest ścisłe ).
Oto jest w akcji:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Możesz przekazać określony format :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
powinny działać.SettingWithCopyWarning
daje wystarczającą ilość materiałuJeśli kolumna z datą jest łańcuchem w formacie „2017-01-01”, możesz użyć pandy astype, aby przekonwertować ją na datę i godzinę.
df['date'] = df['date'].astype('datetime64[ns]')
lub użyj datetime64 [D], jeśli chcesz precyzji dnia, a nie nanosekund
print(type(df_launath['date'].iloc[0]))
daje
<class 'pandas._libs.tslib.Timestamp'>
tak samo jak w przypadku korzystania z pandas.to_datetimeMożesz spróbować z innymi formatami niż „% Y-% m-% d”, ale przynajmniej to działa.
źródło
Jeśli chcesz określić trudne formaty, możesz użyć następujących opcji:
Więcej informacji
format
tutaj:źródło
Jeśli masz randkę z wieloma formatami, nie zapomnij ustawić,
infer_datetime_format=True
aby ułatwić życiedf['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Źródło: pd.to_datetime
lub jeśli chcesz niestandardowego podejścia:
źródło