Konwertuj zakres dat na opis interwału

11

W ostatnim projekcie wymagano podania, kiedy zasób zostanie w pełni wykorzystany. Oprócz daty wyczerpania kalendarza poproszono mnie o pokazanie pozostałego czasu w formacie angielskim, np. „1 rok, 3 miesiące do końca”.

Wbudowana DATEDIFFfunkcja

Zwraca liczbę ... określonych granic datapart przekroczonych między określoną datą początkową i końcową.

Jeśli zastosuje się go w takiej postaci, może to powodować mylące lub mylące wyniki. Na przykład użycie przedziału YEAR pokazałoby, że 1999-12-31 (RRRR-MM-DD) i 2000-01-01 są w odstępie jednego roku, podczas gdy zdrowy rozsądek mówi, że te daty są oddzielone tylko o 1 dzień. I odwrotnie, stosując przedział DAY 1999-12-31 i 2010-12-31 dzieli się 4018 dni, podczas gdy większość ludzi uważa, że ​​„11 lat” to lepszy opis.

Począwszy od liczby dni i obliczania miesięcy i lat, podatne byłyby na błędy w roku przestępnym i wielkości miesiąca.

Zastanawiałem się, jak można to zaimplementować w różnych dialektach SQL? Przykładowe dane wyjściowe obejmują:

create table TestData(
    FromDate date not null,
    ToDate date not null,
    ExpectedResult varchar(100) not null); -- exact formatting is unimportant

insert TestData (FromDate, ToDate, ExpectedResult)
values ('1999-12-31', '1999-12-31', '0 days'),
       ('1999-12-31', '2000-01-01', '1 day'),
       ('2000-01-01', '2000-02-01', '1 month'),
       ('2000-02-01', '2000-03-01', '1 month'),              -- month length not important
       ('2000-01-28', '2000-02-29', '1 month, 1 day'),       -- leap years to be accounted for
       ('2000-01-01', '2000-12-31', '11 months, 30 days'),
       ('2000-02-28', '2000-03-01', '2 days'),
       ('2001-02-28', '2001-03-01', '1 day'),                -- not a leap year
       ('2000-01-01', '2001-01-01', '1 year'),
       ('2000-01-01', '2011-01-01', '11 years'),
       ('9999-12-30', '9999-12-31', '1 day'),                -- catch overflow in date calculations
       ('1900-01-01', '9999-12-31', '8099 years 11 months 30 days');  -- min(date) to max(date)

Zdarza mi się używać programu SQL Server 2008R2, ale jestem zainteresowany, aby dowiedzieć się, jak poradzą sobie z tym inne dialekty.

Michael Green
źródło

Odpowiedzi:

9

Poniższe rozwiązanie dotyczy programu SQL Server. Podejście jest podobne do Serga, ponieważ zapytanie używa tylko funkcji DATEADD i DATEDIFF. To nie oznacza jednak, stanowią odstępach negatywnych ( fromdate > todate ), i wywodzi latach i miesiącach od całkowitej różnicy miesięcy:

WITH
  MonthDiff AS
  (
    SELECT
      t.FromDate,
      t.ToDate,
      t.ExpectedResult,
      Months = x.Months - CASE WHEN DAY(t.FromDate) > DAY(t.ToDate) THEN 1 ELSE 0 END
    FROM
      dbo.TestData AS t
      CROSS APPLY (SELECT DATEDIFF(MONTH, t.FromDate, t.ToDate)) AS x (Months)
  )
SELECT
  t.FromDate,
  t.ToDate,
  t.ExpectedResult,
  Result = ISNULL(NULLIF(ISNULL(x.Years  + CASE x.Years  WHEN '1' THEN ' year '  ELSE ' years '  END, '')
                       + ISNULL(x.Months + CASE x.Months WHEN '1' THEN ' month ' ELSE ' months ' END, '')
                       + ISNULL(x.Days   + CASE x.Days   WHEN '1' THEN ' day '   ELSE ' days '   END, ''), ''), '0 days')
FROM
  MonthDiff AS t
  CROSS APPLY
  (
    SELECT
      CAST(NULLIF(t.Months / 12, 0) AS varchar(10)),
      CAST(NULLIF(t.Months % 12, 0) AS varchar(10)),
      CAST(NULLIF(DATEDIFF(DAY, DATEADD(MONTH, t.Months, t.FromDate), t.ToDate), 0) AS varchar(10))
  ) AS x (Years, Months, Days)
;

Wynik:

FromDate    ToDate      ExpectedResult                 Result
----------  ----------  -----------------------------  -----------------------------
1999-12-31  1999-12-31  0 days                         0 days
1999-12-31  2000-01-01  1 day                          1 day 
2000-01-01  2000-02-01  1 month                        1 month 
2000-02-01  2000-03-01  1 month                        1 month 
2000-01-28  2000-02-29  1 month, 1 day                 1 month 1 day 
2000-01-01  2000-12-31  11 months, 30 days             11 months 30 days 
2000-02-28  2000-03-01  2 days                         2 days 
2001-02-28  2001-03-01  1 day                          1 day 
2000-01-01  2001-01-01  1 year                         1 year 
2000-01-01  2011-01-01  11 years                       11 years 
9999-12-30  9999-12-31  1 day                          1 day 
1900-01-01  9999-12-31  8099 years 11 months 30 days   8099 years 11 months 30 days 
Andriy M.
źródło
10

Ta odpowiedź pokazuje implementację przy użyciu funkcji CLR programu SQL Server (2005+).

-- Enable CLR (if necessary)
EXECUTE sys.sp_configure 
    @configname = 'clr enabled',
    @configvalue = 1;

RECONFIGURE;

Montaż i funkcja

CREATE ASSEMBLY DBA
AUTHORIZATION dbo
FROM 0x
WITH PERMISSION_SET = SAFE;
GO
CREATE FUNCTION dbo.IntervalDescription
(
    @From date, 
    @To date
)
RETURNS nvarchar(100)
AS EXTERNAL NAME 
    DBA.UserDefinedFunctions.IntervalDescription;

Stosowanie

SELECT 
    TD.FromDate,
    TD.ToDate,
    TD.ExpectedResult, 
    IntervalDescription = dbo.IntervalDescription(TD.FromDate, TD.ToDate) 
FROM dbo.TestData AS TD;

Wynik

Plan

Wynik

Źródło

Nie jestem programistą C #!

using Microsoft.SqlServer.Server;
using System;
using System.Text;

public partial class UserDefinedFunctions
{
    [SqlFunction
        (
        DataAccess = DataAccessKind.None,
        SystemDataAccess = SystemDataAccessKind.None,
        IsDeterministic = true,
        IsPrecise = true,
        Name = "IntervalDescription"
        )
    ]
    [return: SqlFacet(IsFixedLength = false, IsNullable = false, MaxSize = 100)]
    public static string IntervalDescription(DateTime From, DateTime To)
    {
        var workDate = From;
        int years = To.Year - From.Year;
        int months = 0;
        int days = 0;

        if (years != 0)
        {
            if (From.Month > To.Month || (From.Month == To.Month && From.Day > To.Day))
            {
                years--;
            }
            workDate = workDate.AddYears(years);
        }

        while (workDate < To && (workDate.Year != DateTime.MaxValue.Year || workDate.Month != DateTime.MaxValue.Month))
        {
            if (workDate.AddMonths(1) <= To)
            {
                months++;
                workDate = workDate.AddMonths(1);
            }
            else
            {
                break;
            }
        }

        while (workDate < To)
        {
            days++;
            workDate = workDate.AddDays(1);
        }

        StringBuilder sb = new StringBuilder(100);

        if (years > 0)
        {
            sb.Append(years);
            sb.Append(years == 1 ? " year" : " years");
            sb.Append((months > 0 || days > 0) ? ", " : string.Empty);
        }

        if (months > 0)
        {
            sb.Append(months);
            sb.Append(months == 1 ? " month" : " months");
            sb.Append(days > 0 ? ", " : string.Empty);
        }

        if (days > 0 || (years == 0 && months == 0))
        {
            sb.Append(days);
            sb.Append(days == 1 ? " day" : " days");
        }

        return
            sb.ToString();

    }
}
Paul White 9
źródło
8

Moja wersja, zaimplementowana w SQL Server 2008R2 SP2.

CREATE FUNCTION dbo.ReadableInterval(
    @FromDate AS date,
    @ToDate AS date
)
RETURNS TABLE AS RETURN 
(
with YearStep as
(
    select
        max(n1.Number) as YearNumber
    from dbo.Numbers as n1
    where n1.Number <= DATEDIFF(YEAR, @FromDate, @ToDate)  -- see comment (A)
    and DATEADD(YEAR, n1.Number, @FromDate) <= @ToDate     -- see comment (B)
)
, MonthStep as
(
    select
        max(n2.Number) as MonthNumber
    from dbo.Numbers as n2
    cross apply YearStep as y1
    where n2.Number <= DATEDIFF(MONTH, DATEADD(YEAR, y1.YearNumber, @FromDate), @ToDate)
    and DATEADD(MONTH, n2.Number, DATEADD(YEAR, y1.YearNumber, @FromDate)) <= @ToDate
)
, DayStep as
(
    select
        DATEDIFF(day, DATEADD(MONTH, m1.MonthNumber, DATEADD(YEAR, y2.YearNumber, @FromDate)), @ToDate) as DayNumber
    from MonthStep as m1
    cross apply YearStep as y2
)
select
    y.YearNumber,
    m.MonthNumber,
    d.DayNumber
from YearStep as y
cross apply MonthStep as m
cross apply DayStep as d
)

Przy podanych danych testowych wyniki są

select
    td.FromDate,
    td.ToDate,
    td.ExpectedResult,
    ri.YearNumber as Years,
    ri.MonthNumber as Months,
    ri.DayNumber as [Days]
from dbo.TestData as td
cross apply dbo.ReadableInterval(td.FromDate, td.ToDate) as ri;
FromDate   ToDate     ExpectedResult               Years Months Days
---------- ---------- ---------------------------- ----- ------ ----
1999-12-31 1999-12-31 0 days                           0      0    0
1999-12-31 2000-01-01 1 day                            0      0    1
2000-01-01 2000-02-01 1 month                          0      1    0
2000-02-01 2000-03-01 1 month                          0      1    0
2000-01-28 2000-02-29 1 month, 1 day                   0      1    1
2000-01-01 2000-12-31 11 months, 30 days               0     11   30
2000-02-28 2000-03-01 2 days                           0      0    2
2001-02-28 2001-03-01 1 day                            0      0    1
2000-01-01 2001-01-01 1 year                           1      0    0
2000-01-01 2011-01-01 11 years                        11      0    0
9999-12-30 9999-12-31 1 day                            0      0    1
1900-01-01 9999-12-31 8099 years 11 months 30 days  8099     11   30

Wyjaśnienie

Moje ogólne podejście polega na tym, aby pójść naprzód od wcześniejszej daty, najpierw w latach, potem w miesiącach, a następnie w dniach. Na każdym poziomie szczegółowości celem jest zbliżenie się do daty końcowej bez przekraczania jej, a następnie przejście do następnego niższego poziomu.

Korzystam z tabeli liczb, aby ułatwić obliczenia zbliżające się, ale nie do końca. Z tej tabeli DATEADDmogę znaleźć największą liczbę lat / miesięcy / dni, które poprzedzają ToDate- komentarz (B) w kodzie.

Ponieważ szukałem numeru MAX, a moja tabela liczb jest na nim skupiona, optymalizator wykonał skan malejący, podając wartości do DATEADD. Powodowało to błędy przepełnienia daty, ponieważ Numbers zawiera ponad 100 000 wierszy. DATEADD(YEAR, 100000, @FromDate)jest większy niż 9999-12-31 i pojawia się błąd. Predykat (A) określa górny limit wartości liczby, od której rozpoczyna się skanowanie do tyłu, unikając przepełnienia daty. W związku z tym plan zapytań przechodzi przez bardzo niewiele wierszy dla nawet bardzo dużych zakresów dat.

Podejście to stosuje się do wyszukiwania lat i miesięcy, z wyjątkiem tego, że punkt początkowy dla miesięcy jest przyspieszony o tyle lat, ile znalazłem w pierwszym CTE. DAYS to mój najniższy poziom szczegółowości, więc wystarczy DATEDIFF.

Można to rozszerzyć na większą szczegółowość, zwracając interwał w godzinach, minutach i sekundach, jeśli to konieczne.

Michael Green
źródło
7

PostgreSQL obsługuje agefunkcję gotową do użycia:

select
  FromDate,
  ToDate,
  ExpectedResult,
  age(ToDate, FromDate)
from TestData;

Daje to pożądany rezultat, daje dodatkowe wartości czasu.

FromDate      ToDate        ExpectedResult                  age
----------    ----------    ----------------------------    --------------------------
1999-12-31    1999-12-31    0 days                          00:00:00
1999-12-31    2000-01-01    1 day                           1 day
2000-01-01    2000-02-01    1 month                         1 mon
2000-02-01    2000-03-01    1 month                         1 mon
2000-01-28    2000-02-29    1 month, 1 day                  1 mon 1 day
2000-01-01    2000-12-31    11 months, 30 days              11 mons 30 days
2000-02-28    2000-03-01    2 days                          2 days
2001-02-28    2001-03-01    1 day                           1 day
2000-01-01    2001-01-01    1 year                          1 year
2000-01-01    2011-01-01    11 years                        11 years
9999-12-30    9999-12-31    1 day                           1 day
1900-01-01    9999-12-31    8099 years 11 months 30 days    8099 years 11 mons 30 days
Michael Green
źródło
5

Wersja bez numbertabeli lub licznika wymagana. Daje taki sam wynik na danych testowych Michaela Greena. Różnią się danymi, gdzie @FromDate > @ToDate. ReadableInterval2zwraca wartości ujemne przeciwne zerom.

CREATE FUNCTION dbo.ReadableInterval2(
    @FromDate AS date,
    @ToDate AS date
)
RETURNS TABLE AS RETURN 
(with checkData as (
    select 
       fromDate = case when @FromDate > @ToDate then @ToDate else @FromDate end,
       toDate = case when @FromDate <= @ToDate then @ToDate else @FromDate end,
       k = case when @FromDate > @ToDate then -1 else 1 end
), MonthStep as (
    select k, FromDate, ToDate,
        YearNumber = x.months / 12,
        MonthNumber = x.months % 12
    from checkdata
    cross apply(
        select months = DATEDIFF(MONTH, FromDate, ToDate)
            - case when DAY(FromDate) > DAY(ToDate) then 1 else 0 end
        ) x
)
select YearNumber = k*YearNumber, 
      MonthNumber = k*MonthNumber,
      DayNumber = k*DATEDIFF(day, DATEADD(MONTH, MonthNumber, DATEADD(YEAR, YearNumber, FromDate)), ToDate) 
    from MonthStep 
)
Serg
źródło
1
Co jest złego w tabeli liczb? Są dość przydatne w przypadku różnych problemów, mają niewielki rozmiar i często działają lepiej niż alternatywy (rekurencyjne CTE, XML itp.).
Aaron Bertrand
3
@AaronBertrand Zgadzam się, że są bardzo przydatne. Ale właśnie tutaj nie widzę, która tabela numerów problemów pomaga rozwiązać. Bez rekurencji, bez XML, czysto skalarne funkcje DATEADD, DATEDIFF. Może być trochę gadatliwy.
Serg
Niezłe! Wziąłem zlecenie FromDate / ToDate, jak podano, ponieważ jest ono sprawdzone gdzie indziej, ale dobry punkt dobrze wykonany. Wynik ujemny jest przydatnym dodatkiem.
Michael Green