Odpowiednik funkcji Split w T-SQL?

130

Chcę podzielić „1,2,3,4,5,6,7,8,9,10,11,12,13,14,15 ...” (rozdzielany przecinkami) na tabelę lub zmienną tabeli .

Czy ktoś ma funkcję, która zwraca każdą z rzędu?

jinsungy
źródło
http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=50648 Wybór różnych metod
czosnek adolf
1
Erland Sommarskog utrzymuje autorytatywną odpowiedź na to pytanie przez ostatnie 12 lat: http://www.sommarskog.se/arrays-in-sql.html Nie warto odtwarzać wszystkich opcji tutaj w StackOverflow, po prostu odwiedź jego stronę i dowiesz się wszystkiego, co kiedykolwiek chciałeś wiedzieć.
Portman
2
Niedawno przeprowadziłem drobne badanie porównujące najczęstsze podejścia do tego problemu, które mogą być warte przeczytania: sqlperformance.com/2012/07/t-sql-queries/split-strings i sqlperformance.com/2012/08/t- sql-queries /…
Aaron Bertrand
1
możliwy duplikat Split string w SQL
Prahalad Gaggar
Wygląda na to, że masz tutaj kilka dobrych odpowiedzi; dlaczego nie oznaczyć jednego z nich jako odpowiedzi lub opisać bardziej szczegółowo swój problem, jeśli nadal nie ma na niego odpowiedzi.
RyanfaeScotland

Odpowiedzi:

51

Oto nieco staroświeckie rozwiązanie:

/*
  Splits string into parts delimitered with specified character.
*/
CREATE FUNCTION [dbo].[SDF_SplitString]
(
  @sString nvarchar(2048),
  @cDelimiter nchar(1)
)
RETURNS @tParts TABLE ( part nvarchar(2048) )
AS
BEGIN
  if @sString is null return
  declare @iStart int,
      @iPos int
  if substring( @sString, 1, 1 ) = @cDelimiter 
  begin
    set @iStart = 2
    insert into @tParts
    values( null )
  end
  else 
    set @iStart = 1
  while 1=1
  begin
    set @iPos = charindex( @cDelimiter, @sString, @iStart )
    if @iPos = 0
      set @iPos = len( @sString )+1
    if @iPos - @iStart > 0     
      insert into @tParts
      values ( substring( @sString, @iStart, @iPos-@iStart ))
    else
      insert into @tParts
      values( null )
    set @iStart = @iPos+1
    if @iStart > len( @sString ) 
      break
  end
  RETURN

END

W SQL Server 2008 można osiągnąć to samo za pomocą kodu .NET. Może działałoby to szybciej, ale zdecydowanie takie podejście jest łatwiejsze w zarządzaniu.

XOR
źródło
Dzięki, też chciałbym wiedzieć. Czy jest tu błąd? Napisałem ten kod może 6 lat temu i od tego czasu działał dobrze.
XOR
Zgadzam się. Jest to bardzo dobre rozwiązanie, gdy nie chcesz (lub po prostu nie możesz) angażować się w tworzenie parametrów typu tabeli, co ma miejsce w moim przypadku. Administratorzy baz danych zablokowali tę funkcję i nie pozwolą na to. Dzięki XOR!
dscarr
ZADEKLAROWAĆ VarString NVARCHAR (2048) = 'Mike / John / Miko / Matt'; ZADEKLAROWAĆ CaracString NVARCHAR (1) = '/'; SELECT * FROM dbo.FnSplitString (VarString, CaracString)
fernando yevenes
57

Spróbuj tego

DECLARE @xml xml, @str varchar(100), @delimiter varchar(10)
SET @str = '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15'
SET @delimiter = ','
SET @xml = cast(('<X>'+replace(@str, @delimiter, '</X><X>')+'</X>') as xml)
SELECT C.value('.', 'varchar(10)') as value FROM @xml.nodes('X') as X(C)

LUB

DECLARE @str varchar(100), @delimiter varchar(10)
SET @str = '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15'
SET @delimiter = ','
;WITH cte AS
(
  SELECT 0 a, 1 b
  UNION ALL
  SELECT b, CHARINDEX(@delimiter, @str, b) + LEN(@delimiter)
  FROM CTE
  WHERE b > a
)
SELECT SUBSTRING(@str, a,
CASE WHEN b > LEN(@delimiter) 
  THEN b - a - LEN(@delimiter) 
  ELSE LEN(@str) - a + 1 END) value   
FROM cte WHERE a > 0

Wiele innych sposobów na zrobienie tego samego jest tutaj. Jak podzielić ciąg rozdzielany przecinkami?

priyanka.sarkar
źródło
9
Uwaga dla nikogo szukasz ogólny rozdzielacz ciąg: Pierwsze rozwiązanie podane tutaj nie jest ogólną splitter ciąg - jest bezpieczny tylko wtedy, gdy masz pewność, że wejście nie będzie zawierać <, >lub &(np wejściowy jest ciągiem liczb całkowitych). Każdy z powyższych trzech znaków spowoduje wyświetlenie błędu analizy zamiast oczekiwanego wyniku.
miroxlav
1
Wydarzenie z problemami, o których wspomniał miroxlav (które powinno być rozwiązane po pewnym przemyśleniu), to zdecydowanie jedno z najbardziej kreatywnych rozwiązań, jakie znalazłem (pierwsze)! Bardzo dobrze!
major-mann
Linia SELECT b, CHARINDEX(@delimiter, @str, b) + LEN(@delimiter)powinna być SELECT b, CHARINDEX(@delimiter, @str, b+1) + LEN(@delimiter). B + 1 robi dużą różnicę. Testowany tutaj ze spacją jako separatorem, nie działał bez tej poprawki.
JwJosefy
@miroxlav Z mojego doświadczenia wynika również, że używanie XML do dzielenia łańcucha jest niezwykle kosztownym objazdem.
underscore_d
Świetne rozwiązania! Warto zauważyć, że użytkownicy mogą chcieć dodać MAXRECURSIONopcję dzielenia więcej niż 100 części, zastąpić LENczymś ze stackoverflow.com/q/2025585, aby obsłużyć spacje i wykluczyć NULLwiersze dla NULLdanych wejściowych.
Kevinoid
27

Oznaczyłeś ten SQL Server 2008, ale przyszli odwiedzający to pytanie (używając SQL Server 2016+) będą chcieli wiedzieć o tym STRING_SPLIT.

Dzięki tej nowej wbudowanej funkcji możesz teraz po prostu użyć

SELECT TRY_CAST(value AS INT)
FROM  STRING_SPLIT ('1,2,3,4,5,6,7,8,9,10,11,12,13,14,15', ',') 

Niektóre ograniczenia tej funkcji i niektóre obiecujące wyniki testów wydajności znajdują się w tym poście na blogu Aarona Bertranda .

Martin Smith
źródło
13

To jest najbardziej podobne do .NET, dla tych z Was, którzy znają tę funkcję:

CREATE FUNCTION dbo.[String.Split]
(
  @Text VARCHAR(MAX),
  @Delimiter VARCHAR(100),
  @Index INT
)
RETURNS VARCHAR(MAX)
AS BEGIN
  DECLARE @A TABLE (ID INT IDENTITY, V VARCHAR(MAX));
  DECLARE @R VARCHAR(MAX);
  WITH CTE AS
  (
  SELECT 0 A, 1 B
  UNION ALL
  SELECT B, CONVERT(INT,CHARINDEX(@Delimiter, @Text, B) + LEN(@Delimiter))
  FROM CTE
  WHERE B > A
  )
  INSERT @A(V)
  SELECT SUBSTRING(@Text,A,CASE WHEN B > LEN(@Delimiter) THEN B-A-LEN(@Delimiter) ELSE LEN(@Text) - A + 1 END) VALUE   
  FROM CTE WHERE A >0

  SELECT   @R
  =      V
  FROM    @A
  WHERE    ID = @Index + 1
  RETURN   @R
END

SELECT dbo.[String.Split]('121,2,3,0',',',1) -- gives '2'
Todd
źródło
9

tutaj jest funkcja podziału, o którą prosiłeś

CREATE FUNCTION [dbo].[split](
     @delimited NVARCHAR(MAX),
     @delimiter NVARCHAR(100)
    ) RETURNS @t TABLE (id INT IDENTITY(1,1), val NVARCHAR(MAX))
    AS
    BEGIN
     DECLARE @xml XML
     SET @xml = N'<t>' + REPLACE(@delimited,@delimiter,'</t><t>') + '</t>'

     INSERT INTO @t(val)
     SELECT r.value('.','varchar(MAX)') as item
     FROM @xml.nodes('/t') as records(r)
     RETURN
    END

wykonać funkcję w ten sposób

select * from dbo.split('1,2,3,4,5,6,7,8,9,10,11,12,13,14,15',',')
Sivaganesh Tamilvendhan
źródło
5
DECLARE
  @InputString NVARCHAR(MAX) = 'token1,token2,token3,token4,token5'
  , @delimiter varchar(10) = ','

DECLARE @xml AS XML = CAST(('<X>'+REPLACE(@InputString,@delimiter ,'</X><X>')+'</X>') AS XML)
SELECT C.value('.', 'varchar(10)') AS value
FROM @xml.nodes('X') as X(C)

Źródło tej odpowiedzi: http://sqlhint.com/sqlserver/how-to/best-split-function-tsql-delimited

Mihai Bejenariu
źródło
Chociaż może to teoretycznie odpowiedzieć na pytanie, lepiej byłoby zawrzeć tutaj zasadnicze części odpowiedzi i podać link do odniesienia.
Xavi López
1
@Xavi: ok, zawarłem najważniejsze części odpowiedzi. Dzięki za podpowiedź.
Mihai Bejenariu
3

Kusi mnie, żeby wcisnąć swoje ulubione rozwiązanie. Wynikowa tabela będzie składać się z 2 kolumn: PosIdx dla pozycji znalezionej liczby całkowitej; i wartość w liczbie całkowitej.


create function FnSplitToTableInt
(
  @param nvarchar(4000)
)
returns table as
return
  with Numbers(Number) as 
  (
    select 1 
    union all 
    select Number + 1 from Numbers where Number < 4000
  ),
  Found as
  (
    select 
      Number as PosIdx,
      convert(int, ltrim(rtrim(convert(nvarchar(4000), 
        substring(@param, Number, 
        charindex(N',' collate Latin1_General_BIN, 
        @param + N',', Number) - Number))))) as Value
    from  
      Numbers 
    where 
      Number <= len(@param)
    and substring(N',' + @param, Number, 1) = N',' collate Latin1_General_BIN
  )
  select 
    PosIdx, 
    case when isnumeric(Value) = 1 
      then convert(int, Value) 
      else convert(int, null) end as Value 
  from 
    Found

Działa przy użyciu rekurencyjnego CTE jako listy pozycji, domyślnie od 1 do 100. Jeśli potrzebujesz pracować z łańcuchem dłuższym niż 100, po prostu wywołaj tę funkcję za pomocą opcji „option (maxrecursion 4000)”, jak poniżej:


select * from FnSplitToTableInt
(
  '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' + 
  '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' +
  '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' +
  '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' +
  '9, 8, 7, 6, 5, 4, 3, 2, 1, 0'
) 
option (maxrecursion 4000)
Irawan Soetomo
źródło
2
+1 za wzmiankę o opcji maxrecursion. Oczywiście ciężka rekurencja powinna być używana ostrożnie w środowisku produkcyjnym, ale świetnie nadaje się do używania CTE do wykonywania ciężkich zadań importu lub konwersji danych.
Tim Medora
3
CREATE FUNCTION Split
(
 @delimited nvarchar(max),
 @delimiter nvarchar(100)
) RETURNS @t TABLE
(
-- Id column can be commented out, not required for sql splitting string
 id int identity(1,1), -- I use this column for numbering splitted parts
 val nvarchar(max)
)
AS
BEGIN
 declare @xml xml
 set @xml = N'<root><r>' + replace(@delimited,@delimiter,'</r><r>') + '</r></root>'

 insert into @t(val)
 select
  r.value('.','varchar(max)') as item
 from @xml.nodes('//root/r') as records(r)

 RETURN
END
GO

stosowanie

Select * from dbo.Split(N'1,2,3,4,6',',')
Reza
źródło
3

Ten prosty CTE da to, czego potrzebujesz:

DECLARE @csv varchar(max) = '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15';
--append comma to the list for CTE to work correctly
SET @csv = @csv + ',';
--remove double commas (empty entries)
SET @csv = replace(@csv, ',,', ',');
WITH CteCsv AS (
  SELECT CHARINDEX(',', @csv) idx, SUBSTRING(@csv, 1, CHARINDEX(',', @csv) - 1) [Value]
  UNION ALL
  SELECT CHARINDEX(',', @csv, idx + 1), SUBSTRING(@csv, idx + 1, CHARINDEX(',', @csv, idx + 1) - idx - 1) FROM CteCsv
  WHERE CHARINDEX(',', @csv, idx + 1) > 0
)

SELECT [Value] FROM CteCsv
Michał Turczyn
źródło
@jinsungy Możesz spojrzeć na tę odpowiedź, jest bardziej wydajna niż zaakceptowana odpowiedź i prostsza.
Michał Turczyn
2

Jest to kolejna wersja, która naprawdę nie ma żadnych ograniczeń (np .: znaki specjalne przy użyciu podejścia xml, liczba rekordów w podejściu CTE) i działa znacznie szybciej w oparciu o test na 10M + rekordach ze średnią długością łańcucha źródłowego 4000. Mam nadzieję, że to może pomóc.

Create function [dbo].[udf_split] (
  @ListString nvarchar(max),
  @Delimiter nvarchar(1000),
  @IncludeEmpty bit) 
Returns @ListTable TABLE (ID int, ListValue nvarchar(1000))
AS
BEGIN
  Declare @CurrentPosition int, @NextPosition int, @Item nvarchar(max), @ID int, @L int
  Select @ID = 1,
  @L = len(replace(@Delimiter,' ','^')),
      @ListString = @ListString + @Delimiter,
      @CurrentPosition = 1 
  Select @NextPosition = Charindex(@Delimiter, @ListString, @CurrentPosition)
  While @NextPosition > 0 Begin
  Set @Item = LTRIM(RTRIM(SUBSTRING(@ListString, @CurrentPosition, @NextPosition-@CurrentPosition)))
  If   @IncludeEmpty=1 or LEN(@Item)>0 Begin 
   Insert Into @ListTable (ID, ListValue) Values (@ID, @Item)
   Set @ID = @ID+1
  End
  Set @CurrentPosition = @NextPosition+@L
  Set @NextPosition = Charindex(@Delimiter, @ListString, @CurrentPosition)
 End
  RETURN
END
Scormer
źródło
1

Użycie tabeli tally to jedna funkcja podzielonego łańcucha (najlepsze możliwe podejście) autorstwa Jeffa Modena

CREATE FUNCTION [dbo].[DelimitedSplit8K]
    (@pString VARCHAR(8000), @pDelimiter CHAR(1))
RETURNS TABLE WITH SCHEMABINDING AS
 RETURN
--===== "Inline" CTE Driven "Tally Table" produces values from 0 up to 10,000...
   -- enough to cover NVARCHAR(4000)
 WITH E1(N) AS (
         SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
         SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
         SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
        ),             --10E+1 or 10 rows
    E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
    E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
 cteTally(N) AS (--==== This provides the "base" CTE and limits the number of rows right up front
           -- for both a performance gain and prevention of accidental "overruns"
         SELECT TOP (ISNULL(DATALENGTH(@pString),0)) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
        ),
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter)
         SELECT 1 UNION ALL
         SELECT t.N+1 FROM cteTally t WHERE SUBSTRING(@pString,t.N,1) = @pDelimiter
        ),
cteLen(N1,L1) AS(--==== Return start and length (for use in substring)
         SELECT s.N1,
            ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000)
          FROM cteStart s
        )
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found.
 SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY l.N1),
    Item    = SUBSTRING(@pString, l.N1, l.L1)
  FROM cteLen l
;

Skierowany od Tally OH! Ulepszona funkcja „CSV Splitter” języka SQL 8K

P ரதீப்
źródło
0

Ten blog zawiera całkiem niezłe rozwiązanie wykorzystujące XML w T-SQL.

Oto funkcja, którą wymyśliłem na podstawie tego bloga (zmień nazwę funkcji i typ wyniku rzutowania na potrzeby):

SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE FUNCTION [dbo].[SplitIntoBigints]
(@List varchar(MAX), @Splitter char)
RETURNS TABLE 
AS
RETURN 
(
  WITH SplittedXML AS(
    SELECT CAST('<v>' + REPLACE(@List, @Splitter, '</v><v>') + '</v>' AS XML) AS Splitted
  )
  SELECT x.v.value('.', 'bigint') AS Value
  FROM SplittedXML
  CROSS APPLY Splitted.nodes('//v') x(v)
)
GO
kzfabi
źródło
0
CREATE Function [dbo].[CsvToInt] ( @Array varchar(4000)) 
returns @IntTable table 
(IntValue int)
AS
begin
declare @separator char(1)
set @separator = ','
declare @separator_position int 
declare @array_value varchar(4000) 

set @array = @array + ','

while patindex('%,%' , @array) <> 0 
begin

select @separator_position = patindex('%,%' , @array)
select @array_value = left(@array, @separator_position - 1)

Insert @IntTable
Values (Cast(@array_value as int))
select @array = stuff(@array, 1, @separator_position, '')
end
Metafora
źródło
0
/* *Object: UserDefinedFunction [dbo].[Split]  Script Date: 10/04/2013 18:18:38* */
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
ALTER FUNCTION [dbo].[Split]
(@List varchar(8000),@SplitOn Nvarchar(5))
RETURNS @RtnValue table
(Id int identity(1,1),Value nvarchar(100))
AS
BEGIN
  Set @List = Replace(@List,'''','')
  While (Charindex(@SplitOn,@List)>0)
  Begin

  Insert Into @RtnValue (value)
  Select
  Value = ltrim(rtrim(Substring(@List,1,Charindex(@SplitOn,@List)-1)))

  Set @List = Substring(@List,Charindex(@SplitOn,@List)+len(@SplitOn),len(@List))
  End

  Insert Into @RtnValue (Value)
  Select Value = ltrim(rtrim(@List))

  Return
END
go

Select *
From [Clv].[Split] ('1,2,3,3,3,3,',',')
GO
satynowy
źródło