Mam jedno pole w pandach DataFrame, które zostało zaimportowane jako format ciągu. Powinna to być zmienna datetime. Jak przekonwertować go na kolumnę daty i godziny, a następnie filtrować według daty.
Przykład:
- DataFrame Name: raw_data
- Nazwa kolumny: Mycol
- Format wartości w kolumnie: „05SEP2014: 00: 00: 00.000”
format
argument nie jest wymagany.to_datetime
jest bystry. Śmiało i spróbuj, nie próbując dopasować swoich danych.SettingWithCopyWarning
korzystania z @ darth-behfans stackoverflow.com/a/42773096/4487805infer_datetime_format=True
może także zwiększyć szybkość analizowania do ~ 5-10x (zgodnie z dokumentacją pandy), jeśli nie podasz ciągu formatu.Możesz użyć metody DataFrame
.apply()
do działania na wartościach w Mycolu:źródło
Jeśli chcesz przekonwertować więcej niż jedną kolumnę, możesz wykonać następujące czynności:
źródło
działa, jednak powoduje ostrzeżenie w języku Python o wartości Próbuje być ustawiona na kopii wycinka z DataFrame. Spróbuj użyć
.loc[row_indexer,col_indexer] = value
zamiast tegoSądzę, że jest to spowodowane indeksowaniem łańcuchowym.
źródło
Użyj
to_datetime
funkcji pandy, aby parsować kolumnę jako DateTime. Ponadto przy użyciuinfer_datetime_format=True
automatycznie wykrywa format i konwertuje wspomnianą kolumnę na DateTime.źródło