Konwertuj typ kolumny DataFrame z ciągu na format daty i godziny, format dd / mm / rrrr

Odpowiedzi:

475

Najprostszym sposobem jest użycie to_datetime:

df['col'] = pd.to_datetime(df['col'])

Jest to również dayfirstargument za czasami europejskimi (ale uważaj, to nie jest ścisłe ).

Oto jest w akcji:

In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0   2005-05-23 00:00:00
dtype: datetime64[ns]

Możesz przekazać określony format :

In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0   2005-05-23
dtype: datetime64[ns]
Andy Hayden
źródło
dzięki za powtórkę, czy mogę zdefiniować jej format? jak „% d /% m /% Y”? bardzo mile widziane
perygeum
2
@shootingstars moze zobacz stackoverflow.com/questions/13703720/…
Andy Hayden
1
@shootingstars przechodzące przez tablicę DatetimeIndex(df['col']).to_pydatetime()powinny działać.
Andy Hayden
1
Nvm, skomentowałem zbyt wcześnie. Poszukiwanie SettingWithCopyWarningdaje wystarczającą ilość materiału
Sundeep,
2
Podwójne nawiasy klamrowe @daneshjai tworzą DataFrame (tylko z jedną kolumną) w porównaniu z pojedynczymi nawiasami klamrowymi, które otrzymują kolumnę jako Serię.
Andy Hayden
36

Jeśli kolumna z datą jest łańcuchem w formacie „2017-01-01”, możesz użyć pandy astype, aby przekonwertować ją na datę i godzinę.

df['date'] = df['date'].astype('datetime64[ns]')

lub użyj datetime64 [D], jeśli chcesz precyzji dnia, a nie nanosekund

print(type(df_launath['date'].iloc[0]))

daje

<class 'pandas._libs.tslib.Timestamp'> tak samo jak w przypadku korzystania z pandas.to_datetime

Możesz spróbować z innymi formatami niż „% Y-% m-% d”, ale przynajmniej to działa.

sigurdb
źródło
2

Jeśli masz randkę z wieloma formatami, nie zapomnij ustawić, infer_datetime_format=Trueaby ułatwić życie

df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)

Źródło: pd.to_datetime

lub jeśli chcesz niestandardowego podejścia:

def autoconvert_datetime(value):
    formats = ['%m/%d/%Y', '%m-%d-%y']  # formats to try
    result_format = '%d-%m-%Y'  # output format
    for dt_format in formats:
        try:
            dt_obj = datetime.strptime(value, dt_format)
            return dt_obj.strftime(result_format)
        except Exception as e:  # throws exception when format doesn't match
            pass
    return value  # let it be if it doesn't match

df['date'] = df['date'].apply(autoconvert_datetime)
abhyudayasrinet
źródło