Jak zapytać o wartości i atrybuty XML z tabeli w SQL Server?

88

Mam tabelę zawierającą Xmlkolumnę:

SELECT * 
FROM Sqm

wprowadź opis obrazu tutaj

Przykładem xmldanych w wierszu byłoby:

<Sqm version="1.2">
  <Metrics>
    <Metric id="TransactionCleanupThread.RecordUsedTransactionShift" type="timer" unit="µs" count="1" sum="21490"   average="21490"   minValue="73701"    maxValue="73701"                               >73701</Metric>
    <Metric id="TransactionCleanupThread.RefundOldTrans"             type="timer" unit="µs" count="1" sum="184487"  average="184487"  minValue="632704"   maxValue="632704"                              >632704</Metric>
    <Metric id="Database.CreateConnection_SaveContextUserGUID"       type="timer" unit="µs" count="2" sum="7562"    average="3781"    minValue="12928"    maxValue="13006"    standardDeviation="16"     >12967</Metric>
    <Metric id="Global.CurrentUser"                                  type="timer" unit="µs" count="6" sum="4022464" average="670411"  minValue="15"       maxValue="13794345" standardDeviation="1642047">2299194</Metric>
    <Metric id="Global.CurrentUser_FetchIdentityFromDatabase"        type="timer" unit="µs" count="1" sum="4010057" average="4010057" minValue="13752614" maxValue="13752614"                            >13752614</Metric>
  </Metrics>
</Sqm>

W przypadku tych danych chciałbym:

SqmId  id                                                   type   unit  count  sum      minValue  maxValue  standardDeviation  Value
=====  ===================================================  =====  ====  =====  ======   ========  ========  =================  ======
1      TransactionCleanupThread.RecordUsedTransactionShift  timer  µs    1      21490    73701     73701     NULL               73701
1      TransactionCleanupThread.RefundOldTrans              timer  µs    1      184487   632704    632704    NULL               632704
1      Database.CreateConnection_SaveContextUserGUID        timer  µs    2      7562     12928     13006     16                 12967
1      Global.CurrentUser                                   timer  µs    6      4022464  15        13794345  1642047            2299194
1      Global.CurrentUser_FetchIdentityFromDatabase         timer  µs    1      4010057  13752614  13752614  NULL               13752614
2      ...

W końcu będę faktycznie wystąpi SUM(), MIN(), MAX()agregacji. Ale na razie próbuję tylko zapytać kolumnę xml.

W pseudokodzie chciałbym spróbować czegoś takiego:

SELECT
    SqmId,
    Data.query('/Sqm/Metrics/Metric/@id') AS id,
    Data.query('/Sqm/Metrics/Metric/@type') AS type,
    Data.query('/Sqm/Metrics/Metric/@unit') AS unit,
    Data.query('/Sqm/Metrics/Metric/@sum') AS sum,
    Data.query('/Sqm/Metrics/Metric/@count') AS count,
    Data.query('/Sqm/Metrics/Metric/@minValue') AS minValue,
    Data.query('/Sqm/Metrics/Metric/@maxValue') AS maxValue,
    Data.query('/Sqm/Metrics/Metric/@standardDeviation') AS standardDeviation,
    Data.query('/Sqm/Metrics/Metric') AS value
FROM Sqm

Ale to zapytanie SQL nie działa:

Msg 2396, poziom 16, stan 1, wiersz 2
XQuery [Sqm.data.query ()]: atrybut nie może pojawiać się poza elementem

Polowałem i to niesamowite, jak słabo udokumentowane, lub na przykład, zapytania Xml są. Większość zasobów zamiast odpytywania tabeli , odpytuje zmienną ; czego nie robię. Większość zasobów używa zapytań XML tylko do filtrowania i zaznaczania, zamiast odczytywać wartości. Większość zasobów odczytuje zakodowane na stałe węzły potomne (według indeksu), a nie rzeczywiste wartości.

Powiązane zasoby, które przeczytałem

Aktualizacja: .value zamiast .query

Próbowałem losowo użyć .valuezamiast .query:

SELECT
    Sqm.SqmId,
    Data.value('/Sqm/Metrics/Metric/@id', 'varchar(max)') AS id,
    Data.value('/Sqm/Metrics/Metric/@type', 'varchar(max)') AS type,
    Data.value('/Sqm/Metrics/Metric/@unit', 'varchar(max)') AS unit,
    Data.value('/Sqm/Metrics/Metric/@sum', 'varchar(max)') AS sum,
    Data.value('/Sqm/Metrics/Metric/@count', 'varchar(max)') AS count,
    Data.value('/Sqm/Metrics/Metric/@minValue', 'varchar(max)') AS minValue,
    Data.value('/Sqm/Metrics/Metric/@maxValue', 'varchar(max)') AS maxValue,
    Data.value('/Sqm/Metrics/Metric/@standardDeviation', 'varchar(max)') AS standardDeviation,
    Data.value('/Sqm/Metrics/Metric', 'varchar(max)') AS value
FROM Sqm

Ale to też nie działa:

Msg 2389, poziom 16, stan 1, wiersz 3 XQuery [Sqm.data.value ()]:
„value ()” wymaga singletona (lub pustej sekwencji), znaleziono operand typu „xdt: untypedAtomic *”

Ian Boyd
źródło

Odpowiedzi:

113

Właściwie jesteś blisko celu, wystarczy użyć metody nodes () , aby podzielić wiersze, a następnie uzyskać wartości:

select
    s.SqmId,
    m.c.value('@id', 'varchar(max)') as id,
    m.c.value('@type', 'varchar(max)') as type,
    m.c.value('@unit', 'varchar(max)') as unit,
    m.c.value('@sum', 'varchar(max)') as [sum],
    m.c.value('@count', 'varchar(max)') as [count],
    m.c.value('@minValue', 'varchar(max)') as minValue,
    m.c.value('@maxValue', 'varchar(max)') as maxValue,
    m.c.value('.', 'nvarchar(max)') as Value,
    m.c.value('(text())[1]', 'nvarchar(max)') as Value2
from sqm as s
    outer apply s.data.nodes('Sqm/Metrics/Metric') as m(c)

sql fiddle demo

Roman Pekar
źródło
1
Jak uzyskać „wartość” samego węzła? Wydaje się, że nie ma sposobu, aby select m.*zobaczyć sekretny, magiczny, pośredni stół, który skonstruował. Jaka jest składnia zapytania o wartość elementu? np. wartość <Metric>8675309</Metric>to „8675309”
Ian Boyd
1
@IanBoyd przepraszam, przegapiłem to, zobacz zaktualizowane. Możesz użyć '.' lub tekst, jeśli mogą istnieć elementy zagnieżdżone
Roman Pekar
2
Czego aliasy s, mi creprezentują w tej kwerendzie?
Ian R. O'Brien
3
@ IanR.O'Brien mjest resultset zwracany przez nodes()funkcję, sto sqmsam stół, cjest kolumna z typem danych XML w zestawie wyników zwracanych przez nodes()funkcję
Roman Pekar
11

Próbowałem zrobić coś bardzo podobnego, ale nie korzystałem z węzłów. Jednak moja struktura xml jest trochę inna.

Masz to tak:

<Metrics>
    <Metric id="TransactionCleanupThread.RefundOldTrans" type="timer" ...>

Gdyby zamiast tego wyglądało tak:

<Metrics>
    <Metric>
        <id>TransactionCleanupThread.RefundOldTrans</id>
        <type>timer</type>
        .
        .
        .

Następnie możesz po prostu użyć tej instrukcji SQL.

SELECT
    Sqm.SqmId,
    Data.value('(/Sqm/Metrics/Metric/id)[1]', 'varchar(max)') as id,
    Data.value('(/Sqm/Metrics/Metric/type)[1]', 'varchar(max)') AS type,
    Data.value('(/Sqm/Metrics/Metric/unit)[1]', 'varchar(max)') AS unit,
    Data.value('(/Sqm/Metrics/Metric/sum)[1]', 'varchar(max)') AS sum,
    Data.value('(/Sqm/Metrics/Metric/count)[1]', 'varchar(max)') AS count,
    Data.value('(/Sqm/Metrics/Metric/minValue)[1]', 'varchar(max)') AS minValue,
    Data.value('(/Sqm/Metrics/Metric/maxValue)[1]', 'varchar(max)') AS maxValue,
    Data.value('(/Sqm/Metrics/Metric/stdDeviation)[1]', 'varchar(max)') AS stdDeviation,
FROM Sqm

Dla mnie jest to znacznie mniej zagmatwane niż stosowanie aplikacji zewnętrznej lub nakładania krzyżowego.

Mam nadzieję, że pomoże to komuś innemu szukającemu prostszego rozwiązania!

Ryan Dorendorf
źródło
1
w kodzie brakuje otwierających nawiasów. dodaj również /text()po id itp., aby zwiększyć wydajność
Danny Rancher
To jest najbardziej proste. Dzięki, działało perfekcyjnie.
SE
Jak zapytać tabelę z kolumną typu XML za pomocą tego podejścia? Dziękuję Ci.
FMFF
10

użyj valuezamiast query(należy określić indeks węzła do zwrócenia w XQuery, a także przekazać typ danych sql do zwrócenia jako drugi parametr):

select
    xt.Id
    , x.m.value( '@id[1]', 'varchar(max)' ) MetricId
from
    XmlTest xt
    cross apply xt.XmlData.nodes( '/Sqm/Metrics/Metric' ) x(m)
Moho
źródło
8

Nie rozumiem, dlaczego niektórzy sugerują użycie cross applylub outer applyprzekonwertowanie XML na tabelę wartości. Dla mnie to po prostu przyniosło zbyt wiele danych.

Oto mój przykład, w jaki sposób można utworzyć xmlobiekt, a następnie przekształcić go w tabelę.

(Dodałem spacje do mojego ciągu xml, aby ułatwić czytanie).

DECLARE @str nvarchar(2000)

SET @str = ''
SET @str = @str + '<users>'
SET @str = @str + '  <user>'
SET @str = @str + '     <firstName>Mike</firstName>'
SET @str = @str + '     <lastName>Gledhill</lastName>'
SET @str = @str + '     <age>31</age>'
SET @str = @str + '  </user>'
SET @str = @str + '  <user>'
SET @str = @str + '     <firstName>Mark</firstName>'
SET @str = @str + '     <lastName>Stevens</lastName>'
SET @str = @str + '     <age>42</age>'
SET @str = @str + '  </user>'
SET @str = @str + '  <user>'
SET @str = @str + '     <firstName>Sarah</firstName>'
SET @str = @str + '     <lastName>Brown</lastName>'
SET @str = @str + '     <age>23</age>'
SET @str = @str + '  </user>'
SET @str = @str + '</users>'

DECLARE @xml xml
SELECT @xml = CAST(CAST(@str AS VARBINARY(MAX)) AS XML) 

--  Iterate through each of the "users\user" records in our XML
SELECT 
    x.Rec.query('./firstName').value('.', 'nvarchar(2000)') AS 'FirstName',
    x.Rec.query('./lastName').value('.', 'nvarchar(2000)') AS 'LastName',
    x.Rec.query('./age').value('.', 'int') AS 'Age'
FROM @xml.nodes('/users/user') as x(Rec)

A oto wynik:

wprowadź opis obrazu tutaj

Mike Gledhill
źródło
Ciekawe ... dlaczego zagnieżdżone rzutowanie Varbinary(max)przed rzutowaniem XML, proszę?
EvilDr
Jak zapytać tabelę z kolumną typu XML za pomocą tego podejścia? Dziękuję Ci.
FMFF