FOR XML nie może serializować danych, ponieważ zawiera znak (0x0000)

18

Mam duże zapytanie (w razie potrzeby opublikuję je tutaj) i otrzymuję ten błąd:

Msg 6841, poziom 16, stan 1, wiersz 1
FOR XML nie może serializować danych dla węzła „NoName”, ponieważ zawiera znak (0x0000), który nie jest dozwolony w XML. Aby odzyskać te dane za pomocą FOR XML, przekonwertuj je na dane binarne, varbinary lub graficzne i użyj dyrektywy BINARY BASE64.

Jedyną częścią, której używam, FOR XMLjest tutaj:

WHERE 
    (CodFuncionario = Results.CodFuncionario) 
FOR XML PATH(''), TYPE).value('(./text())[1]', 
    'VARCHAR(MAX)'), 1, 2, '') AS [Experiencia]

Ale co to jest node noname? i jak mogę szukać tej wartości:(0x0000)

To jest jedno z podkwerend (jedyna część, którą mam dla XML):

SELECT 
    [CodFuncionario],
    STUFF
    (
        (
            SELECT 
                ' / ' + 
            CAST
            (
                [DescFuncao] + '-' + 
                [DescTempoExperiencia] 
                AS VARCHAR(MAX)
            )...
FROM 
    [Linked_Server].db.dbo.tblFuncionarioExperiencia T0
INNER JOIN
    [Linked_Server].db.dbo.tblFuncao T1 On T0.codFuncao = T1.CodFuncao
INNER JOIN
    [Linked_Server].db.dbo.tblTempoExperiencia T2 ON T0.CodTempoExperiencia = T2.CodTempoExperiencia 
WHERE 
   (CodFuncionario = Results.CodFuncionario) 
   FOR XML PATH(''), TYPE).value('(./text())[1]', 'VARCHAR(MAX)'), 1, 2, '') AS [Experiencia]
  FROM 
      [Linked_Server].db.dbo.tblFuncionarioExperiencia Results  
  GROUP BY 
      CodFuncionario) as T2

  On T0.CodFuncionario = T2.CodFuncionario

Left Join...
Racer SQL
źródło

Odpowiedzi:

10

Linia:

...
SELECT 
    [CodFuncionario],
    STUFF
    (
        (
            SELECT 
                ' / ' + 
                CAST
                (
                    [DescFuncao] + '-' + 
                    [DescTempoExperiencia] 
                    AS VARCHAR(MAX)
                )...

Powinien być:

...
SELECT 
    [CodFuncionario],
    STUFF
    (
        (
            SELECT 
                ' / ' + 
                CAST
                (
                    replace -- *** NEW! ***
                    (
                        [DescFuncao] + '-' + 
                        [DescTempoExperiencia],
                        char(0),
                        ''
                    ) 
                    AS VARCHAR(MAX)
                )...
Rob Farley
źródło
11

Gdy robię to, pojawia się ten sam błąd:

DECLARE @foo VARCHAR(32) = CHAR(0); -- 0x0000
SELECT @foo FOR XML PATH, TYPE;

Więc znajdź wszystkie wystąpienia DescFuncaolub DescTempoExperiencia(niestety nie korzystasz z aliasingu tabel, więc nie można powiedzieć, z której tabeli pochodzą) i gdzie je zawiera CHAR(0), i napraw je. Na przykład:

UPDATE dbo.whatever 
  SET DescFuncao = REPLACE(DescFuncao, CHAR(0), '')
  WHERE DescFuncao LIKE '%' + CHAR(0) + '%';

Nie wystarczy odfiltrować te wiersze w zapytaniu, ponieważ nie wiesz, w którym momencie metody XML zaczną działać, ale możesz także spróbować:

STUFF(( SELECT ' / ' + CAST(REPLACE([DescFuncao] + '-' 
  + [DescTempoExperiencia], CHAR(0), '') AS VARCHAR(MAX))

Oczywiście jednokrotne naprawienie danych źródłowych będzie o wiele bardziej wydajne niż uruchamianie tych procedur zamiany za każdym razem .

Uwaga: to może nie być jedyny konkretny znak, który powoduje ten problem. 0x0001-> 0x0008wygeneruje również ten sam błąd. Więc jeśli masz tam również te postacie, powinieneś sprawdzić, skąd pochodzą i naprawić źródło.

Aaron Bertrand
źródło
1
Co powiesz na dane z dużą ilością emoji?
devinbost
10

Przetestowałem to ze znaków ASCII 0-255 i okazało się, że pojawi się ten błąd dla znaków: 0x0000, 0x0001, 0x0002, 0x0003, 0x0004, 0x0005, 0x0006, 0x0007, 0x0008, 0x000B, 0x000C, 0x000E, 0x000F, 0x0010, 0x0011, 0x0012, 0x0013, 0x0014, 0x0015, 0x0016, 0x0017, 0x0018, 0x0019, 0x001A, 0x001B, 0x001C, 0x001D, 0x001E, 0x001F.

Jednym obejściem jest usunięcie , TYPEz instrukcji XML.

Innym sposobem jest usunięcie tych znaków z instrukcji select:

REPLACE( REPLACE( REPLACE( REPLACE( REPLACE( 
REPLACE( REPLACE( REPLACE( REPLACE( REPLACE( 
REPLACE( REPLACE( REPLACE( REPLACE( REPLACE( 
REPLACE( REPLACE( REPLACE( REPLACE( REPLACE( 
REPLACE( REPLACE( REPLACE( REPLACE( REPLACE( 
REPLACE( REPLACE( REPLACE( REPLACE( 
    < YOUR EXPRESSION TO BE CLEANED >
,char(0x0000),'') ,char(0x0001),'') ,char(0x0002),'') ,char(0x0003),'') ,char(0x0004),'') 
,char(0x0005),'') ,char(0x0006),'') ,char(0x0007),'') ,char(0x0008),'') ,char(0x000B),'') 
,char(0x000C),'') ,char(0x000E),'') ,char(0x000F),'') ,char(0x0010),'') ,char(0x0011),'') 
,char(0x0012),'') ,char(0x0013),'') ,char(0x0014),'') ,char(0x0015),'') ,char(0x0016),'') 
,char(0x0017),'') ,char(0x0018),'') ,char(0x0019),'') ,char(0x001A),'') ,char(0x001B),'') 
,char(0x001C),'') ,char(0x001D),'') ,char(0x001E),'') ,char(0x001F),'')

Można również utworzyć funkcję za pomocą tych instrukcji replace.

jumxozizi
źródło
Ten pomysł obejścia pomógł mi znaleźć miejsce w dużym złożonym wspólnym wyrażeniu tabelowym, które w bloku xml zawodziło z powodu tego błędu.
Keith John Hutchison
2
Ten skrypt jest użyteczny (choć boleśnie powolny), ale nie działa na znaki emoji (takie jak 0xD83D) i podejrzewam, że może być ich dużo ... przynajmniej w moich danych. : '(Lub powinienem powiedzieć: 0x1F62D
devinbost
1

Optymalizacja odpowiedzi z @jumxozizi za pomocą translate () (SQL Server 2017 ++). Poniższy kod zastąpi te znaki kropkami.

declare
    @illegalChars nvarchar(4000) = 
        char(0) + char(1) + char(2) + char(3) + char(4) + char(5) + char(6) + char(7) + char(8) + char(11) + 
        char(12) + char(14) + char(15) + char(16) + char(17) + char(18) + char(19) + char(20) + char(21) + char(22) + 
        char(23) + char(24) + char(25) + char(26) + char(27) + char(28) + char(29) + char(30) + char(31);

select translate(input, @illegalChars, replicate('.', len(@illegalChars))) as Result

Aby je zamiast tego rozebrać, można je najpierw przetłumaczyć () na char (0), a następnie zawinąć w funkcję replace ().

Od pomysłu: /programming//a/55906638/538763

Crokusek
źródło