Jak zbudować obiekt timedelta z prostego ciągu

100

Piszę funkcję, która potrzebuje danych wejściowych timedelta do przekazania w postaci ciągu. Użytkownik musi wpisać coś w rodzaju „32 min” lub „2h32m”, a nawet „4:13” lub „5hr34m56s” ... Czy jest jakaś biblioteka lub coś, co ma już zaimplementowane tego typu rzeczy?

ksiądzc
źródło
Dla ludzi po prostu patrząc na budowę obiektu timedelta z ddni, hgodzin, mminut i ssekund, stosując jedną linię (po imporcie datetime) datetime.timedelta(days = d, hours = h, minutes=m, seconds=s).
zthomas.nc

Odpowiedzi:

74

W przypadku pierwszego formatu (5hr34m56s) należy analizować przy użyciu wyrażeń regularnych

Oto rozwiązanie ponownie oparte:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 
virhilo
źródło
4
Myślałem o jakiejś funkcji, która mogłaby zabrać wszystko, co do niej rzucisz, i nadal byłaby w stanie obsłużyć konwersję do timedelta.
ksiądz
2
Dodałem przykład rozwiązania bazującego ponownie :)
virhilo
4
Nie rozumiem, jak dateutil.parser.parse może analizować czasy trwania, wydaje się, że zawsze zwraca datę i godzinę. czego mi brakuje?
Nickolay
7
dateutil.parser.parsenie analizuje timedeltaobiektów. Zwraca a datetime, co spowodowałoby wyjątek dla łańcuchów, takich jak '28:32:11.10'.
Mów
99

Dla mnie najbardziej eleganckim rozwiązaniem, bez konieczności uciekania się do zewnętrznych bibliotek, takich jak dateutil lub ręcznego analizowania danych wejściowych, jest użycie potężnej metody analizy ciągów datetimestrptime .

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

Następnie możesz normalnie używać obiektu timedelta, przekonwertować go na sekundy, aby upewnić się, że zrobiliśmy właściwą rzecz itp.

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())
metakermit
źródło
33
Zwróć uwagę, że to podejście działa tylko wtedy, gdy przedział czasu jest krótszy niż 24 godziny ( datetime.strptime("32:20:25","%H:%M:%S")nie działa) i musisz znać dokładny format wejściowy.
verdesmarald
Ta tylko część odpowiada na pytanie PO. Jeśli funkcja musi obsługiwać wiele formatów - nadal potrzebujesz dodatkowej kontroli formatu (1 dwukropek czy 2?).
Danny Staple
3
@verdesmarald Czy więc od Pythona 3.5, czy istnieje eleganckie rozwiązanie bez użycia zewnętrznych bibliotek i bez zakładania, że ​​okres jest krótszy niż 24 godziny?
maksymalnie
1
Uważam, że potrzeba ręcznego określania nazwanych parametrów timedeltaparametru jest dość irytująca, ale najlepsze, co mogę wymyślić, aby tego uniknąć, to:, delta = t - datetime.combine(t.date(), time.min)co jest ... okropne.
Kyle Strand
2
Poważnym problemem związanym z tym podejściem jest to, że jeśli uwzględnisz dni, a następnie wysłanie% d do czasu strptime, nie umożliwi Ci wprowadzenia dnia 0, ponieważ tylko dni> = 1 są ważne dla daty.
user1581390
77

Miałem trochę czasu na moje ręce wczoraj, więc opracowany @virhilo „s odpowiedź do modułu Pythona, dodając kilka formatów ekspresji czasu więcej, w tym wszystkie te wymagane przez @priestc .

Kod źródłowy jest na github (licencja MIT) dla każdego, kto tego chce. Jest również na PyPI:

pip install pytimeparse

Zwraca czas jako liczbę sekund:

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72
wildwilhelm
źródło
czy istnieje odpowiednik Java / Scala?
luca.giovagnoli
Niesamowite!
Wielkie
@ luca.giovagnoli W Scali możesz użyć klasy Duration. Czas trwania można skonstruować z ciągów takich jak „15 sekund”, „4 minuty” itp.
Konrad Malik
14

Chciałem wprowadzić tylko czas, a następnie dodać go do różnych dat, więc to zadziałało:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")
kztd
źródło
dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)działa również ...
576i
8

Zmodyfikowałem ładną odpowiedź virhilo z kilkoma ulepszeniami:

  • dodano twierdzenie, że ciąg jest prawidłowym ciągiem czasu
  • zamień wskaźnik godzinowy „hr” na „h”
  • uwzględniać wskaźnik „d” - dni
  • zezwalaj na czasy inne niż całkowite (np. 3m0.25s3 minuty, 0,25 sekundy)

.

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)
Piotr
źródło
1
Świetny! Dodałem „*” między elementami, aby umożliwić również „1d 3h 5m”
Marcel Waldvogel
@MarcelWaldvogel miło, jeśli skopiujesz tekst nowego wyrażenia regularnego, dodam twoją odpowiedź
Piotr
@virhilo i Peter: Moja niewielka ewolucja twojego kodu jest tutaj: github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/… . Zakładam, że użycie twojego kodu jest w porządku. Czy masz jakieś preferencje dotyczące licencji? MIT, Apache, GPL,…?
Marcel Waldvogel
1
Marcel, możesz wysłać mi swój adres, żebym mógł pozwać? JK śmiało, każda licencja jest w porządku.
Peter
Oto nowy Regex; różnica polega na "*" s: regex = re.compile (r '^ ((? P <dni> [\. \ d] +?) d)? *' r '((? P <hours> [\ . \ d] +?) h)? * 'r' ((? P <minuty> [\. \ d] +?) m)? * 'r' ((? P <sekundy> [\. \ d] +?) s)? $ ')
Marcel Waldvogel
3

Django zawiera funkcję narzędziową parse_duration(). Z dokumentacji :

Analizuje ciąg i zwraca plik datetime.timedelta .

Oczekuje danych w formacie "DD HH:MM:SS.uuuuuu"lub określonym przez ISO 8601 (np. P4DT1H15M20SKtóry jest równoważny 4 1:15:20) lub w formacie interwału dziennego PostgreSQL (np 3 days 04:05:06.).

Don Kirkby
źródło
Więcej informacji: parse_duration()funkcja Django używa dopasowania wyrażenia regularnego pod maską.
Eido95
2

Jeśli używasz Pythona 3, oto zaktualizowana wersja rozwiązania Hari Shankara, z którego korzystałem:

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)
Alexey Kislitsin
źródło