Symulowanie funkcji MySQL group_concat w Microsoft SQL Server 2005?

347

Próbuję migrować aplikację opartą na MySQL do Microsoft SQL Server 2005 (nie z wyboru, ale takie jest życie).

W oryginalnej aplikacji używaliśmy prawie całkowicie instrukcji zgodnych z ANSI-SQL, z jednym znaczącym wyjątkiem - group_concatdość często korzystaliśmy z funkcji MySQL .

group_concatnawiasem mówiąc, robi to: biorąc pod uwagę tabelę, powiedzmy, nazwisk pracowników i projektów ...

SELECT empName, projID FROM project_members;

zwroty:

ANDY   |  A100
ANDY   |  B391
ANDY   |  X010
TOM    |  A100
TOM    |  A510

... a oto, co otrzymujesz dzięki group_concat:

SELECT 
    empName, group_concat(projID SEPARATOR ' / ') 
FROM 
    project_members 
GROUP BY 
    empName;

zwroty:

ANDY   |  A100 / B391 / X010
TOM    |  A100 / A510

Chciałbym więc wiedzieć: czy w SQL Server można napisać funkcję zdefiniowaną przez użytkownika, która emuluje jej funkcjonalność group_concat?

Nie mam prawie żadnego doświadczenia w korzystaniu z UDF, procedur przechowywanych itp., Po prostu prosty SQL, więc proszę o pomyłkę po zbyt wielu wyjaśnieniach :)

DanM
źródło
To stare pytanie, ale podoba mi się podane tutaj rozwiązanie CLR .
Diego
możliwy duplikat Jak utworzyć listę rozdzielaną przecinkami za pomocą zapytania SQL? - ten post jest szerszy, więc wybrałbym go jako kanoniczny
TMS
możliwy duplikat funkcji SQL group_concat w programie SQL Server
Trikaldarshi
Skąd wiesz, według której kolejności należy zbudować listę, np. Wyświetlasz A100 / B391 / X010, ale biorąc pod uwagę, że nie ma niejawnego uporządkowania w relacyjnej bazie danych, równie łatwo mogłaby to być X010 / A100 / B391 lub dowolna inna kombinacja.
Steve Ford

Odpowiedzi:

174

Nie ma PRAWDZIWEGO łatwego sposobu na zrobienie tego. Jednak istnieje wiele pomysłów.

Najlepszy, jaki znalazłem :

SELECT table_name, LEFT(column_names , LEN(column_names )-1) AS column_names
FROM information_schema.columns AS extern
CROSS APPLY
(
    SELECT column_name + ','
    FROM information_schema.columns AS intern
    WHERE extern.table_name = intern.table_name
    FOR XML PATH('')
) pre_trimmed (column_names)
GROUP BY table_name, column_names;

Lub wersja, która działa poprawnie, jeśli dane mogą zawierać znaki takie jak <

WITH extern
     AS (SELECT DISTINCT table_name
         FROM   INFORMATION_SCHEMA.COLUMNS)
SELECT table_name,
       LEFT(y.column_names, LEN(y.column_names) - 1) AS column_names
FROM   extern
       CROSS APPLY (SELECT column_name + ','
                    FROM   INFORMATION_SCHEMA.COLUMNS AS intern
                    WHERE  extern.table_name = intern.table_name
                    FOR XML PATH(''), TYPE) x (column_names)
       CROSS APPLY (SELECT x.column_names.value('.', 'NVARCHAR(MAX)')) y(column_names) 
BradC
źródło
1
Ten przykład zadziałał dla mnie, ale próbowałem wykonać kolejną agregację i nie zadziałał, dał mi błąd: „nazwa korelacji„ pre_trimmed ”jest podana wiele razy w klauzuli FROM.”
PhilChuang
7
„pre_trimmed” jest tylko aliasem dla podzapytania. Aliasy są wymagane dla podkwerend i muszą być unikalne, więc dla innego podkwerendy zmień je na coś wyjątkowego ...
Koen
2
czy możesz pokazać przykład bez nazwy_tabeli jako nazwy kolumny, jest to mylące.
S.Mason
169

Być może jestem trochę spóźniony na imprezę, ale ta metoda działa dla mnie i jest łatwiejsza niż metoda COALESCE.

SELECT STUFF(
             (SELECT ',' + Column_Name 
              FROM Table_Name
              FOR XML PATH (''))
             , 1, 1, '')
Scott
źródło
1
To pokazuje tylko, jak łączyć wartości - group_concat konkatuje je według grup, co jest trudniejsze (i czego wymaga OP). Zobacz zaakceptowaną odpowiedź na SO 15154644, aby dowiedzieć się, jak to zrobić - klauzula WHERE jest krytycznym dodatkiem
DJDave
@DJDave odnosił się do tej odpowiedzi . Zobacz także zaakceptowaną odpowiedź na podobne pytanie .
John Cummings
51

Być może jest już za późno, aby przynieść korzyści, ale czy nie jest to najłatwiejszy sposób na zrobienie czegoś?

SELECT     empName, projIDs = replace
                          ((SELECT Surname AS [data()]
                              FROM project_members
                              WHERE  empName = a.empName
                              ORDER BY empName FOR xml path('')), ' ', REQUIRED SEPERATOR)
FROM         project_members a
WHERE     empName IS NOT NULL
GROUP BY empName
J Hardiman
źródło
Ciekawy. Już ukończyłem projekt, ale spróbuję tej metody. Dzięki!
DanM
7
Fajna sztuczka - jedynym problemem są nazwiska ze spacjami, które zastąpią spację separatorem.
Mark Elliot
Sam napotkałem taki problem, Mark. Niestety, dopóki MSSQL nie nadejdzie z czasem i nie wprowadzi GROUP_CONCAT, jest to najmniej jedna z najbardziej obciążających metod, jakie udało mi się wymyślić, co jest tutaj potrzebne.
J Hardiman,
Dzięki za to! Oto SQL Fiddle pokazujący, że działa: sqlfiddle.com/#!6/c5d56/3
uciekł
42

SQL Server 2017 wprowadza nową funkcję agregującą

STRING_AGG ( expression, separator).

Łączy wartości wyrażeń łańcuchowych i umieszcza między nimi wartości separatora. Separator nie jest dodawany na końcu ciągu.

Połączone elementy można zamówić, dołączając WITHIN GROUP (ORDER BY some_expression)

W przypadku wersji 2005-2016 zwykle używam metody XML w zaakceptowanej odpowiedzi.

Jednak w niektórych okolicznościach może się to nie powieść. na przykład, jeśli dane mają być łączone zawiera CHAR(29)widać

FOR XML nie może serializować danych ... ponieważ zawiera znak (0x001D), który jest niedozwolony w XML.

Bardziej niezawodną metodą, która może poradzić sobie ze wszystkimi postaciami, byłoby użycie agregatu CLR. Jednak zastosowanie tego uporządkowania w połączonych elementach jest trudniejsze.

Metoda przypisywania do zmiennej nie jest gwarantowana i należy jej unikać w kodzie produkcyjnym.

Martin Smith
źródło
Jest to również dostępne teraz w Azure SQL: azure.microsoft.com/en-us/roadmap/…
Simon_Weaver
34

Spójrz na projekt GROUP_CONCAT na Github, myślę, że robię dokładnie to, czego szukasz:

Ten projekt zawiera zestaw zdefiniowanych przez użytkownika funkcji agregujących SQLCLR (SQLCLR UDA), które łącznie oferują funkcjonalność podobną do funkcji MySQL GROUP_CONCAT. Istnieje wiele funkcji zapewniających najlepszą wydajność w oparciu o wymaganą funkcjonalność ...

MaxiWheat
źródło
2
@ MaxiWheat: wielu facetów nie czyta pytań ani nie odpowiada ostrożnie przed kliknięciem głosowania. Wpływa bezpośrednio na post właściciela z powodu jego błędu.
Steve Lam
Działa świetnie. Jedyną funkcją, której mi brakuje, jest możliwość sortowania według kolumny, którą MySQL group_concat () może polubić:GROUP_CONCAT(klascode,'(',name,')' ORDER BY klascode ASC SEPARATOR ', ')
stycznia o
10

Aby połączyć wszystkie nazwiska kierowników projektów z projektów, które mają wielu kierowników projektów, napisz:

SELECT a.project_id,a.project_name,Stuff((SELECT N'/ ' + first_name + ', '+last_name FROM projects_v 
where a.project_id=project_id
 FOR
 XML PATH(''),TYPE).value('text()[1]','nvarchar(max)'),1,2,N''
) mgr_names
from projects_v a
group by a.project_id,a.project_name
Cmaly
źródło
9

Za pomocą poniższego kodu musisz ustawić PermissionLevel = Zewnętrzne we właściwościach projektu przed wdrożeniem i zmienić bazę danych, aby ufała kodowi zewnętrznemu (koniecznie przeczytaj gdzie indziej o zagrożeniach bezpieczeństwa i alternatywach [jak certyfikaty]), uruchamiając polecenie „ZMIEŃ bazę danych TRUSTWORTHY ON ”.

using System;
using System.Collections.Generic;
using System.Data.SqlTypes;
using System.IO;
using System.Runtime.Serialization;
using System.Runtime.Serialization.Formatters.Binary;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined,
MaxByteSize=8000,
IsInvariantToDuplicates=true,
IsInvariantToNulls=true,
IsInvariantToOrder=true,
IsNullIfEmpty=true)]
    public struct CommaDelimit : IBinarySerialize
{


[Serializable]
 private class StringList : List<string>
 { }

 private StringList List;

 public void Init()
 {
  this.List = new StringList();
 }

 public void Accumulate(SqlString value)
 {
  if (!value.IsNull)
   this.Add(value.Value);
 }

 private void Add(string value)
 {
  if (!this.List.Contains(value))
   this.List.Add(value);
 }

 public void Merge(CommaDelimit group)
 {
  foreach (string s in group.List)
  {
   this.Add(s);
  }
 }

 void IBinarySerialize.Read(BinaryReader reader)
 {
    IFormatter formatter = new BinaryFormatter();
    this.List = (StringList)formatter.Deserialize(reader.BaseStream);
 }

 public SqlString Terminate()
 {
  if (this.List.Count == 0)
   return SqlString.Null;

  const string Separator = ", ";

  this.List.Sort();

  return new SqlString(String.Join(Separator, this.List.ToArray()));
 }

 void IBinarySerialize.Write(BinaryWriter writer)
 {
  IFormatter formatter = new BinaryFormatter();
  formatter.Serialize(writer.BaseStream, this.List);
 }
    }

Przetestowałem to za pomocą zapytania, które wygląda następująco:

SELECT 
 dbo.CommaDelimit(X.value) [delimited] 
FROM 
 (
  SELECT 'D' [value] 
  UNION ALL SELECT 'B' [value] 
  UNION ALL SELECT 'B' [value] -- intentional duplicate
  UNION ALL SELECT 'A' [value] 
  UNION ALL SELECT 'C' [value] 
 ) X 

I daje: A, B, C, D

GregTSmith
źródło
9

Próbowałem tych, ale dla moich celów w MS SQL Server 2005 najbardziej przydatne były następujące, które znalazłem na xaprb

declare @result varchar(8000);

set @result = '';

select @result = @result + name + ' '

from master.dbo.systypes;

select rtrim(@result);

@Zaznacz, jak wspomniałeś, to znak kosmiczny sprawił mi problemy.

isoughtajam
źródło
Myślę, że silnik tak naprawdę nie gwarantuje żadnego zamówienia za pomocą tej metody, ponieważ zmienne są obliczane jako przepływy danych w zależności od planu wykonania. Jak dotąd wydaje się, że działa przez większość czasu.
phil_w
6

O odpowiedzi J Hardimana, a co powiesz na:

SELECT empName, projIDs=
  REPLACE(
    REPLACE(
      (SELECT REPLACE(projID, ' ', '-somebody-puts-microsoft-out-of-his-misery-please-') AS [data()] FROM project_members WHERE empName=a.empName FOR XML PATH('')), 
      ' ', 
      ' / '), 
    '-somebody-puts-microsoft-out-of-his-misery-please-',
    ' ') 
  FROM project_members a WHERE empName IS NOT NULL GROUP BY empName

Nawiasem mówiąc, czy użycie „nazwiska” jest literówką, czy też nie rozumiem tutaj pojęcia?

W każdym razie, wielkie dzięki, chłopaki, ponieważ zaoszczędziło mi to sporo czasu :)

użytkownik422190
źródło
1
Raczej nieprzyjazna odpowiedź, jeśli mnie o to poprosisz i wcale nie jest pomocna jako odpowiedź.
Tim Meers,
1
tylko widząc to teraz ... Nie miałem tego na myśli w tym sensie, kiedy byłem bardzo sfrustrowany serwerem SQL (wciąż jestem). odpowiedzi z tego postu naprawdę były pomocne; EDYCJA: dlaczego nie było to pomocne? to
załatwiło sprawę
1

Dla moich kolegów Googlersów, oto bardzo proste rozwiązanie typu plug-and-play, które działało dla mnie po zmaganiu się z bardziej złożonymi rozwiązaniami przez jakiś czas:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ CONVERT(VARCHAR(10), projID ) 
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Zauważ, że musiałem przekonwertować identyfikator na VARCHAR, aby połączyć go jako ciąg. Jeśli nie musisz tego robić, oto jeszcze prostsza wersja:

SELECT
distinct empName,
NewColumnName=STUFF((SELECT ','+ projID
                     FROM returns 
                     WHERE empName=t.empName FOR XML PATH('')) , 1 , 1 , '' )
FROM 
returns t

Wszelkie podziękowania należą się tutaj: https://social.msdn.microsoft.com/Forums/sqlserver/en-US/9508abc2-46e7-4186-b57f-7f368374e084/replicating-groupconcat-function-of-mysql-in- sql-server? forum = transactsql

krock
źródło