Jak uzyskać wiersz MAX

20

W SQL Server zawsze znajdowałem problem z uzyskaniem maksymalnej liczby wierszy dla zestawu danych, szukam listy metod do uzyskania maksymalnej liczby wierszy z pewnymi wskazówkami dotyczącymi wydajności i łatwości konserwacji.

Przykładowa tabela:

DECLARE @Test TABLE (ID INT IDENTITY(1,1), name VARCHAR(50), 
                     dateOfBirth DATETIME, TaxNumber varchar(10))

INSERT INTO @Test (name, dateOfBirth, TaxNumber)
SELECT 'Fred', convert(datetime, '25/01/1976', 103), '123' UNION ALL
SELECT 'Bob', convert(datetime, '03/03/1976', 103), '234'  UNION ALL
SELECT 'Jane', convert(datetime, '13/06/1996', 103), '345' UNION ALL
SELECT 'Fred', convert(datetime, '14/02/1982', 103), '456' UNION ALL
SELECT 'Bob', convert(datetime, '25/10/1983', 103), '567' UNION ALL
SELECT 'Jane', convert(datetime, '12/04/1995', 103), '678' UNION ALL
SELECT 'Fred', convert(datetime, '03/03/1976', 103), '789'

select * from @Test

Daje:

ID          name      dateOfBirth             TaxNumber
----------- --------- ----------------------- ----------
1           Fred      1976-01-25 00:00:00.000 123
2           Bob       1976-03-03 00:00:00.000 234
3           Jane      1996-06-13 00:00:00.000 345
4           Fred      1982-02-14 00:00:00.000 456
5           Bob       1983-10-25 00:00:00.000 567
6           Jane      1995-04-12 00:00:00.000 678
7           Fred      1976-03-03 00:00:00.000 789

Jeśli chcę odzyskać pełne dane najstarszej osoby (pogrupowane według nazwiska), jakich metod mogę użyć?

Pożądane wyjście:

ID          name      dateOfBirth             TaxNumber
----------- --------- ----------------------- ----------
1           Fred      1976-01-25 00:00:00.000 123
2           Bob       1976-03-03 00:00:00.000 234
6           Jane      1995-04-12 00:00:00.000 678
Andrew Bickerton
źródło

Odpowiedzi:

20

Dwie zwykłe metody: funkcja agregująca i rankingowa.

Agregacja działa na SQL Server 2000. Oba sposoby mogą korzystać z CTE lub tabeli pochodnej

Jeśli chodzi o wydajność, zauważyłem, że agregacja działa lepiej. Wygląda jednak na to, że funkcje rankingowe SQL Server 2008 działają znacznie lepiej niż na SQL Server 2005. Nie korzystam jeszcze z SQL Server 2008 z dnia na dzień (duża firma dinsoaur), więc nie mogę komentować.

Istnieją 2 odpowiednie pytania SO, ale nie mogę ich obecnie znaleźć. Jednym z nich jest pytanie o wysokie logiczne IO z funkcjami rankingu, innym jest testowanie rankingu w komentarzach w stosunku do SQL 2k5 vs 2k8. Przepraszam.

--aggregate + CTE
;WITH cOldest AS
(
    SELECT name, MIN(dateOfBirth) AS MinDOB FROM @Test GROUP BY name
)
SELECT
    T.*
FROM
    @Test T
    JOIN
    cOldest C ON T.name = C.name AND T.dateOfBirth = C.MinDOB
ORDER BY
    T.ID

--aggregate + derived table
SELECT
    T.*
FROM
    @Test T
    JOIN
    (
    SELECT name, MIN(dateOfBirth) AS MinDOB FROM @Test GROUP BY name
    ) C ON T.name = C.name AND T.dateOfBirth = C.MinDOB
ORDER BY
    T.ID

--ranking + CTE
;WITH cOldest AS
(
    SELECT *, ROW_NUMBER() OVER (PARTITION BY name ORDER BY dateOfBirth) AS rnDOB FROM @Test
)
SELECT
    C.*
FROM
    cOldest C
WHERE
    C.rnDOB = 1
ORDER BY
    C.ID

--ranking + derived table
SELECT
    C.*
FROM
    (SELECT *, ROW_NUMBER() OVER (PARTITION BY name ORDER BY dateOfBirth) AS rnDOB FROM @Test) C
WHERE
    C.rnDOB = 1
ORDER BY
    C.ID
gbn
źródło