Wyzwanie
Znajdź najkrótszą regex tego
- zatwierdza, tj. dopasowuje, każdą możliwą datę w proleptycznym kalendarzu gregoriańskim (która dotyczy również wszystkich dat przed jej pierwszym przyjęciem w 1582 r.) oraz
- nie pasuje do żadnej niepoprawnej daty.
Wynik
Wyniki są zatem zgodne z prawdą lub falsey.
Wejście
Dane wejściowe są w jednym z 3 rozszerzonych formatów daty ISO 8601 - bez żadnych czasów.
Pierwsze dwa to ±YYYY-MM-DD
(rok, miesiąc, dzień) i ±YYYY-DDD
(rok, dzień). Oba wymagają specjalnej obudowy na dzień przestępny. Są naiwnie dobierane osobno przez te rozszerzone RX:
(?<year>[+-]?\d{4,})-(?<month>\d\d)-(?<day>\d\d)
(?<year>[+-]?\d{4,})-(?<doy>\d{3})
Trzeci format wejściowy to ±YYYY-wWW-D
(rok, tydzień, dzień). Jest to skomplikowane ze względu na skomplikowany wzór tygodnia przestępnego.
(?<year>-?\d{4,})-W(?<week>\d\d)-(?<dow>\d)
Podstawowa, ale niewystarczająca kontrola poprawności dla wszystkich trzech razem wyglądałaby mniej więcej tak:
[+-]?\d{4,}-((0\d|1[0-2])-([0-2]\d|3[01]) ↩
|([0-2]\d\d|3[0-5]\d|36[0-6]) ↩
|(W([0-4]\d|5[0-3])-[1-7]))
Warunki
Rok przestępny w Proleptycznym kalendarzu gregoriańskim zawiera dzień przestępny, …-02-29
a zatem ma 366 dni, stąd też …-366
istnieje. Dzieje się tak w każdym roku, którego liczba porządkowa jest podzielna przez 4, ale nie przez 100, chyba że jest również podzielna przez 400.
Rok zerowy istnieje w tym kalendarzu i jest to rok przestępny.
Długie lata w tygodniu kalendarza ISO zawiera tydzień 53., które mogłyby jeden perspektywie „ skok tydzień ”. Dzieje się tak we wszystkich latach, w których 1 stycznia jest czwartkiem, a dodatkowo we wszystkich latach przestępnych, w których jest środa. Okazuje się, że występuje zwykle co 5 lub 6 lat, na pozór nieregularny wzór.
Rok ma co najmniej 4 cyfry. Lata z więcej niż 10 cyframi nie muszą być obsługiwane, ponieważ jest to wystarczająco blisko epoki wszechświata (około 14 miliardów lat). Wiodący znak plus jest opcjonalny, chociaż rzeczywisty standard sugeruje, że powinien być wymagany przez lata z więcej niż 4 cyframi.
Częściowe lub skrócone daty, tj. Z dokładnością poniżej jednego dnia, nie mogą być akceptowane.
Części zapisu daty, np. Miesiąc, nie muszą być dopasowywane przez grupę, do której można się odwoływać.
Zasady
To jest golf golfowy. Najkrótsze wyrażenie regularne bez wykonanego kodu wygrywa. Aktualizacja: Możesz używać funkcji takich jak rekurencja i zbalansowane grupy, ale zostaniesz ukarany grzywną 10-krotnie, przez co liczba postaci zostanie pomnożona! Jest to teraz inne niż zasady gry w golfa Hard Code: Regex dla podzielności przez 7 . Wcześniejsza odpowiedź wygrywa remis.
Przypadki testowe
Prawidłowe testy
2015-08-10
2015-10-08
12015-08-10
-2015-08-10
+2015-08-10
0015-08-10
1582-10-10
2015-02-28
2016-02-29
2000-02-29
0000-02-29
-2000-02-29
-2016-02-29
200000-02-29
2016-366
2000-366
0000-366
-2016-366
-2000-366
2015-081
2015-W33-1
2015-W53-7
2015-08-10
Ostatni jest opcjonalnie ważny, tzn. Można przyciąć początkowe i końcowe spacje w łańcuchach wejściowych.
Niepoprawne formaty
-0000-08-10 # that's an arbitrary decision
15-08-10 # year is at least 4 digits long
2015-8-10 # month (and day) is exactly two digits long, i.e. leading zero is required
015-08-10 # year is at least 4 digits long
20150810 # though a valid ISO format, we require separators; could also be interpreted as a 8-digit year
2015 08 10 # separator must be hyphen-minus
2015.08.10 # separator must be hyphen-minus
2015–08–10 # separator must be hyphen-minus
2015-0810
201508-10 # could be October in the year 201508
2015 - 08 - 10 # no internal spaces allowed
2015-w33-1 # letter ‘W’ must be uppercase
2015W33-1 # it would be unambiguous to omit the separator in front of a letter, but not in the standard
2015W331 # though a valid ISO format we require separators
2015-W331
2015-W33 # a valid ISO date, but we require day-precision
2015W33
Nieprawidłowe daty
2015 # a valid ISO format, but we require day-precision
2015-08 # a valid ISO format, but we require day-precision
2015-00-10 # month range is 1–12
2015-13-10 # month range is 1–12
2015-08-00 # day range is 1–28 through 31
2015-08-32 # max. day range is 1–31
2015-04-31 # day range for April is 1–30
2015-02-30 # day range for February is 1–28 or 29
2015-02-29 # day range for common February is 1–28
2100-02-29 # most century years are non-leap
-2100-02-29 # most century years are non-leap
2015-000 # day range is 1–365 or 366
2015-366 # day range is 1–365 in common years
2016-367 # day range is 1–366 in leap years
2100-366 # most century years are non-leap
-2100-366 # most century years are non-leap
2015-W00-1 # week range is 1–52 or 53
2015-W54-1 # week range is 1–53 in long years
2016-W53-1 # week range is 1–52 in short years
2015-W33-0 # day range is 1–7
2015-W33-8 # day range is 1–7
źródło
Odpowiedzi:
PCRE (także Perl), 778 bajtów
Dołączyłem ograniczniki do liczby bajtów, aby pokazać, że nie opiera się na żadnych flagach.
To nie nie pasuje do ważnych dat w ramach innych ciągów, takie jak
1234-56-89 2016-02-29 9876-54-32
. Wyrażenie regularne jest krótsze, ponieważ nie sprawdza maksymalnie 10 cyfr dla roku.Rozszerzony o komentarze:
źródło
(?!…)
wyrażeniom w porównaniu do mojego rozwiązania.(?!…)
Wyrażenia zapisują tylko kilka bajtów. Zmniejszyłem wiele bajtów, łącząc trzy pozytywne / negatywne wzorce tygodnia / dnia tygodnia w jeden. Te ostatnie nie pasują do siebie. Mam więc 8 długich pod-wzorów do 5. Ponadto, ponieważ|20|25|
jest tej samej długości, co|2[05]|
wybrałem dla bardziej czytelnej opcji.-0000-08-10
i nie pasuje␠2015-08-10␠
do początkowych i końcowych białych znaków, ale ponieważ obie były przypadkowymi decyzjami lub opcjonalnymi funkcjami, pozwolę mu się przesunąć.W(?!00)([0-4]\d|51|52)-[1-7]
musi być czymś równoważnymW(?!00)([0-4]\d|5[0-2])-[1-7]
. Dodaje to jeden znak do długości. 779PCRE:
603940947949956 bajtówUwaga: niektóre pary nawiasów mogłyby zostać upuszczone.
Podzielność przez 4
Wielokrotności 4 powtarzają się w prostym wzorze:
20, 24, 28, 32, 36,
40, 44, 48, 52, 56,
60, 64, 68, 72, 76,
80, 84, 88, 92, 96, …
To, lub odwrotnie, może być dopasowane również przez proste wyrażenie regularne dla wszystkich liczb dwucyfrowych z wiodącym zerem:
Mógłby zaoszczędzić trochę bajtów, gdyby istniały klasy znaków dla cyfr nieparzystych i parzystych (jak
\o
i\e
), ale nie są tak daleko, jak mi wiadomo.Lat
To wyrażenie wystarczyłoby dla kalendarza juliańskiego, ale wykrycie gregoriańskiego roku przestępnego musi w szczególnym przypadku poprzedzać
00
podzielność wieku przez 4:Wymagałoby to pewnych zmian w celu wprowadzenia zakazu
-0000-…
(wraz z-00000-…
itp.) Lub wymuszenia znaku plus dla dodatnich liczb roku z więcej niż 4 cyframi. To ostatnie byłoby raczej proste, ale nie jest wymagane:Dzień roku
Trzycyfrowe daty porządkowe są raczej proste, musimy ograniczyć się
-366
do lat przestępnych (i nie zezwalać-000
).Dzień miesiąca roku
Siedem miesięcy z 31 dniami to
01
styczeń,03
marzec,05
maj,07
lipiec,08
sierpień,10
październik i12
grudzień. Tylko cztery miesiące mają dokładnie 30 dni,04
kwiecień,06
czerwiec,09
wrzesień i11
listopad. Wreszcie02
luty ma 28 dni wspólnych lat i 29 dni przestępnych. Możemy najpierw skonstruować wyrażenie regularne na zawsze ważnych dni01
przez28
, a następnie dodać szczególne przypadki.Nie może być ani miesiąc, ani dzień,
00
który nie był objęty wcześniejszą wersją.Dzień tygodnia roku
Wszystkie lata obejmują 52 tygodnie
Długie lata, które obejmują
-W53
powtarzanie w cyklu 400-letnim, np. Dodaj 2000 dla bieżącego cyklu i znajdź bieżący rok w trzeciej pozycji:Każdy z czterech stuleci ma unikalny wzór. Prawdopodobnie nie ma zbyt wiele miejsca na optymalizację.
04|09|15|20|26|32|37|43|48|54|60|65|71|76|82|88|93|99
05|11|16|22|28|33|39|44|50|56|61|67|72|78|84|89|95
01|07|12|18|24|29|35|40|46|52|57|63|68|74|80|85|91|96
03|08|14|20|25|31|36|42|48|53|59|64|70|76|81|87|92|98
Możemy pogrupować według dowolnej cyfry, aby dowiedzieć się, że możemy zapisać około dwóch bajtów:
0[49]|15|2[06]|3[27]|4[38]|54|6[05]|7[16]|8[28]|9[39]
05|1[16]|2[28]|3[39]|44|5[06]|6[17]|7[28]|8[49]|95
0[17]|1[28]|2[49]|35|4[06]|5[27]|6[38]|74|8[05]|9[16]
0[38]|14|2[05]|3[16]|4[28]|5[39]|64|7[06]|8[17]|9[28]
[26]0|71|[38]2|[49]3|[05]4|15|[27]6|37|[48]8|[09]9
50|[16]1|[27]2|33|[48]4|[09]5|[15]6|67|[27]8|[38]9
[48]0|[09]1|[15]2|63|[27]4|[38]5|[49]6|[05]7|[16]8|29
[27]0|[38]1|[49]2|[05]3|[16]4|25|[37]6|87|[049]8|[5]9
Liczbę stuleci można łatwo dopasować ponownie poprzez zmianę wyrażenia podzielności.
[02468][048]|[13579][26]
[02468][159]|[13579][37]
[02468][26]|[13579][048]
[02468][37]|[13579][159]
Jak dotąd działa to tylko dla pozytywnych lat, w tym dla roku zerowego. W przypadku lat ujemnych musimy odjąć wartości z powyższej listy od 400, a resztę wykonać ponownie, ponieważ wzorzec nie jest symetryczny.
02|08|13|19|24|30|36|41|47|52|58|64|69|75|80|86|92|97
04|09|15|20|26|32|37|43|48|54|60|65|71|76|82|88|93|99
05|11|16|22|28|33|39|44|50|56|61|67|72|78|84|89|95
01|07|12|18|24|29|35|40|46|52|57|63|68|74|80|85|91|96
lub
0[28]|1[39]|24|3[06]|4[17]|5[28]|6[49]|75|8[06]|9[27]
0[49]|15|2[06]|3[27]|4[38]|54|6[05]|7[16]|8[28]|9[39]
0[51]|16|2[28]|3[39]|44|5[06]|6[17]|7[28]|8[49]|95
0[17]|1[28]|2[49]|35|4[06]|5[27]|6[38]|74|8[05]|9[16]
Kładąc wszystko razem
Dowolny rok
Dodatki do roku przestępnego
Dodatki do roku przestępnego
źródło
\s*
.