c # datatable do csv

113

Czy ktoś mógłby mi powiedzieć, dlaczego poniższy kod nie działa. Dane są zapisywane w pliku csv, jednak dane nie są rozdzielane. To wszystko istnieje w pierwszej komórce każdego wiersza.

StringBuilder sb = new StringBuilder();

foreach (DataColumn col in dt.Columns)
{
    sb.Append(col.ColumnName + ',');
}

sb.Remove(sb.Length - 1, 1);
sb.Append(Environment.NewLine);

foreach (DataRow row in dt.Rows)
{
    for (int i = 0; i < dt.Columns.Count; i++)
    {
        sb.Append(row[i].ToString() + ",");
    }

    sb.Append(Environment.NewLine);
}

File.WriteAllText("test.csv", sb.ToString());

Dzięki.

Darren Young
źródło
Możesz sprawdzić to gist.github.com/riyadparvez/4467668
użytkownik
Opracowałem rozszerzenie o wysokiej wydajności. sprawdź tę odpowiedź
Nigje

Odpowiedzi:

229

Następująca krótsza wersja otwiera się dobrze w programie Excel, być może problemem był końcowy przecinek

.net = 3,5

StringBuilder sb = new StringBuilder(); 

string[] columnNames = dt.Columns.Cast<DataColumn>().
                                  Select(column => column.ColumnName).
                                  ToArray();
sb.AppendLine(string.Join(",", columnNames));

foreach (DataRow row in dt.Rows)
{
    string[] fields = row.ItemArray.Select(field => field.ToString()).
                                    ToArray();
    sb.AppendLine(string.Join(",", fields));
}

File.WriteAllText("test.csv", sb.ToString());

.net> = 4.0

I jak zauważył Tim, jeśli korzystasz z .net> = 4, możesz go jeszcze skrócić:

StringBuilder sb = new StringBuilder(); 

IEnumerable<string> columnNames = dt.Columns.Cast<DataColumn>().
                                  Select(column => column.ColumnName);
sb.AppendLine(string.Join(",", columnNames));

foreach (DataRow row in dt.Rows)
{
    IEnumerable<string> fields = row.ItemArray.Select(field => field.ToString());
    sb.AppendLine(string.Join(",", fields));
}

File.WriteAllText("test.csv", sb.ToString());

Zgodnie z sugestią Christiana, jeśli chcesz obsługiwać znaki specjalne uciekające w polach, zamień blok pętli na:

foreach (DataRow row in dt.Rows)
{
    IEnumerable<string> fields = row.ItemArray.Select(field => 
      string.Concat("\"", field.ToString().Replace("\"", "\"\""), "\""));
    sb.AppendLine(string.Join(",", fields));
}

I ostatnia sugestia, możesz napisać zawartość csv wiersz po wierszu zamiast całego dokumentu, aby uniknąć posiadania dużego dokumentu w pamięci.

vc 74
źródło
2
Nie ma potrzeby kopiowania ItemArraydo nowego String[], możesz pominąć .ToArray().NET 4 i użyć String.Joinprzeciążenia, które zajmuje IEnumerable<T>(edytowane).
Tim Schmelter,
2
@TimSchmelter, tak, ale te przeciążenia zostały wprowadzone w .net4, kod nie zostanie skompilowany, jeśli OP używa .net <4
vc 74
18
Ta metoda nie uwzględnia przecinka w wartości kolumny.
Christian
2
Zamiast IEnumerable <string> fields = row.ItemArray.Select (field => field.ToString (). Replace ("\" "," \ "\")); sb.AppendLine ("\" "+ string.Join ("\", \ "", pola) + "\" ");
Chrześcijanin
2
@ Si8 Co masz na myśli? Ta odpowiedź wykorzystuje tylko komponenty db i &nbspjest typowa dla dokumentów HTML / XML. To nie powyższy kod go tworzy, chyba że tabela &nbsp;wyraźnie zawiera
vc 74
37

Zawarłem to w klasie rozszerzenia, która umożliwia wywołanie:

myDataTable.WriteToCsvFile("C:\\MyDataTable.csv");

na dowolnym DataTable.

public static class DataTableExtensions 
{
    public static void WriteToCsvFile(this DataTable dataTable, string filePath) 
    {
        StringBuilder fileContent = new StringBuilder();

        foreach (var col in dataTable.Columns) 
        {
            fileContent.Append(col.ToString() + ",");
        }

        fileContent.Replace(",", System.Environment.NewLine, fileContent.Length - 1, 1);

        foreach (DataRow dr in dataTable.Rows) 
        {
            foreach (var column in dr.ItemArray) 
            {
                fileContent.Append("\"" + column.ToString() + "\",");
            }

            fileContent.Replace(",", System.Environment.NewLine, fileContent.Length - 1, 1);
        }

        System.IO.File.WriteAllText(filePath, fileContent.ToString());
    }
}
Paul Grimshaw
źródło
25

Nowa funkcja rozszerzenia oparta na odpowiedzi Paula Grimshawa. Wyczyściłem to i dodałem możliwość obsługi nieoczekiwanych danych. (Puste dane, osadzone cytaty i przecinki w nagłówkach ...)

Zwraca również łańcuch, który jest bardziej elastyczny. Zwraca Null, jeśli obiekt tabeli nie zawiera żadnej struktury.

    public static string ToCsv(this DataTable dataTable) {
        StringBuilder sbData = new StringBuilder();

        // Only return Null if there is no structure.
        if (dataTable.Columns.Count == 0)
            return null;

        foreach (var col in dataTable.Columns) {
            if (col == null)
                sbData.Append(",");
            else
                sbData.Append("\"" + col.ToString().Replace("\"", "\"\"") + "\",");
        }

        sbData.Replace(",", System.Environment.NewLine, sbData.Length - 1, 1);

        foreach (DataRow dr in dataTable.Rows) {
            foreach (var column in dr.ItemArray) {
                if (column == null)
                    sbData.Append(",");
                else
                    sbData.Append("\"" + column.ToString().Replace("\"", "\"\"") + "\",");
            }
            sbData.Replace(",", System.Environment.NewLine, sbData.Length - 1, 1);
        }

        return sbData.ToString();
    }

Nazywasz to następująco:

var csvData = dataTableOject.ToCsv();
AnthonyVO
źródło
1
Ten jest najlepszy z pozostałych tutaj. Dobra robota. Dzięki
Fandango68
Fantastyczne rozwiązanie. Dodano komentarze lokalnie, ale można było z nich korzystać po wyjęciu z pudełka bez konieczności wspinania się na górę. Dziękuję Ci.
j.hull
Pokochałem to! Użyłem go jako metody niestatycznej i właśnie przekazałem mój DataTable jako parametr. Działało świetnie, dziękuję.
Kid Koder
9

Jeśli kod wywołujący odwołuje się do System.Windows.Formszestawu, możesz rozważyć radykalnie inne podejście. Moja strategia polega na użyciu funkcji już dostarczonych przez framework, aby osiągnąć to w bardzo niewielu wierszach kodu i bez konieczności przechodzenia przez kolumny i wiersze. Poniższy kod programowo tworzy plik DataGridVieww locie i ustawia DataGridView.DataSourcego na DataTable. Następnie programowo zaznaczam wszystkie komórki (w tym nagłówek) w DataGridViewi wywołuję DataGridView.GetClipboardContent(), umieszczając wyniki w systemie Windows Clipboard. Następnie „wklejam” zawartość schowka do wywołania File.WriteAllText(), upewniając się, że określam formatowanie „wklej” jako TextDataFormat.CommaSeparatedValue.

Oto kod:

public static void DataTableToCSV(DataTable Table, string Filename)
{
    using(DataGridView dataGrid = new DataGridView())
    {
        // Save the current state of the clipboard so we can restore it after we are done
        IDataObject objectSave = Clipboard.GetDataObject();

        // Set the DataSource
        dataGrid.DataSource = Table;
        // Choose whether to write header. Use EnableWithoutHeaderText instead to omit header.
        dataGrid.ClipboardCopyMode = DataGridViewClipboardCopyMode.EnableAlwaysIncludeHeaderText;
        // Select all the cells
        dataGrid.SelectAll();
        // Copy (set clipboard)
        Clipboard.SetDataObject(dataGrid.GetClipboardContent());
        // Paste (get the clipboard and serialize it to a file)
        File.WriteAllText(Filename,Clipboard.GetText(TextDataFormat.CommaSeparatedValue));              

        // Restore the current state of the clipboard so the effect is seamless
        if(objectSave != null) // If we try to set the Clipboard to an object that is null, it will throw...
        {
            Clipboard.SetDataObject(objectSave);
        }
    }
}

Zauważ, że zachowuję również zawartość schowka przed rozpoczęciem i przywracam go, gdy skończę, aby użytkownik nie dostał wielu nieoczekiwanych śmieci przy następnej próbie wklejenia. Główne zastrzeżenia dotyczące tego podejścia to 1) Twoja klasa musi się odwoływaćSystem.Windows.Forms , co może nie mieć miejsca w warstwie abstrakcji danych, 2) Twój zestaw będzie musiał być przeznaczony dla platformy .NET 4.5, ponieważ DataGridView nie istnieje w 4.0, i 3) Metoda nie powiedzie się, jeśli schowek jest używany przez inny proces.

W każdym razie to podejście może nie być odpowiednie w twojej sytuacji, ale jest mimo wszystko interesujące i może być kolejnym narzędziem w twoim zestawie narzędzi.

Adam White
źródło
1
używanie schowka nie jest potrzebne stackoverflow.com/questions/40726017/… . .GetClipboardContentobsługuje również kilka skrajnych przypadków wartości, które zawierają ,. ", \t(konwertuje tabulator na spację)
Slai
2
To dobrze, ale co, jeśli ktoś używa maszyny w tym samym czasie i w krytycznym momencie umieści coś w schowku.
Ayo Adesina
7

Zrobiłem to niedawno, ale dodałem podwójne cudzysłowy wokół moich wartości.

Na przykład zmień te dwie linie:

sb.Append("\"" + col.ColumnName + "\","); 
...
sb.Append("\"" + row[i].ToString() + "\","); 
Ben Jakuben
źródło
Dzięki za sugestię, ale czy wszystkie dane nadal znajdują się w pierwszej komórce każdego wiersza?
Darren Young,
7

Spróbuj zmienić sb.Append(Environment.NewLine);na sb.AppendLine();.

StringBuilder sb = new StringBuilder();          
foreach (DataColumn col in dt.Columns)         
{             
    sb.Append(col.ColumnName + ',');         
}          

sb.Remove(sb.Length - 1, 1);         
sb.AppendLine();          

foreach (DataRow row in dt.Rows)         
{             
    for (int i = 0; i < dt.Columns.Count; i++)             
    {                 
        sb.Append(row[i].ToString() + ",");             
    }              

    sb.AppendLine();         
}          

File.WriteAllText("test.csv", sb.ToString());
Neil Knight
źródło
To da dwa zwroty.
Darren Young,
@alexl: To jest to, z czym pierwotnie szedłem, ale było to z głowy, dopóki VS nie odpalił: o)
Neil Knight,
5

Spróbuj ;zamiast tego,

Mam nadzieję, że to pomoże

alexl
źródło
5

Przeczytaj to i to ?


Lepsza byłaby implementacja

var result = new StringBuilder();
for (int i = 0; i < table.Columns.Count; i++)
{
    result.Append(table.Columns[i].ColumnName);
    result.Append(i == table.Columns.Count - 1 ? "\n" : ",");
}

foreach (DataRow row in table.Rows)
{
    for (int i = 0; i < table.Columns.Count; i++)
    {
        result.Append(row[i].ToString());
        result.Append(i == table.Columns.Count - 1 ? "\n" : ",");
    }
}
 File.WriteAllText("test.csv", result.ToString());
naveen
źródło
5

Błąd jest separatorem listy.

Zamiast pisać sb.Append(something... + ',')powinieneś wpisać coś w rodzajusb.Append(something... + System.Globalization.CultureInfo.CurrentCulture.TextInfo.ListSeparator);

Musisz umieścić znak separatora listy skonfigurowany w systemie operacyjnym (jak w powyższym przykładzie) lub separator listy na komputerze klienta, na którym plik ma być obserwowany. Inną opcją byłoby skonfigurowanie go w pliku app.config lub web.config jako parametr swojej aplikacji.

Martín Delafuente
źródło
5

4 linie kodu:

public static string ToCSV(DataTable tbl)
{
    StringBuilder strb = new StringBuilder();

    //column headers
    strb.AppendLine(string.Join(",", tbl.Columns.Cast<DataColumn>()
        .Select(s => "\"" + s.ColumnName + "\"")));

    //rows
    tbl.AsEnumerable().Select(s => strb.AppendLine(
        string.Join(",", s.ItemArray.Select(
            i => "\"" + i.ToString() + "\"")))).ToList();

    return strb.ToString();
}

Zauważ, że ToList()koniec jest ważny; Potrzebuję czegoś, co wymusi ocenę wyrażenia. Gdybym grał w golfa kodowego, przydałbym sięMin() zamiast tego.

Zauważ również, że wynik będzie miał na końcu znak nowej linii z powodu ostatniego wywołania do AppendLine(). Możesz tego nie chcieć. Możesz po prostu zadzwonić, TrimEnd()aby go usunąć.

user2023861
źródło
3

Oto ulepszenie posta vc-74, które obsługuje przecinki w taki sam sposób, jak Excel. Program Excel umieszcza dane w cudzysłowach, jeśli dane zawierają przecinek, ale nie cytuje, jeśli dane nie zawierają przecinka.

    public static string ToCsv(this DataTable inDataTable, bool inIncludeHeaders = true)
    {
        var builder = new StringBuilder();
        var columnNames = inDataTable.Columns.Cast<DataColumn>().Select(column => column.ColumnName);
        if (inIncludeHeaders)
            builder.AppendLine(string.Join(",", columnNames));
        foreach (DataRow row in inDataTable.Rows)
        {
            var fields = row.ItemArray.Select(field => field.ToString().WrapInQuotesIfContains(","));
            builder.AppendLine(string.Join(",", fields));
        }

        return builder.ToString();
    }

    public static string WrapInQuotesIfContains(this string inString, string inSearchString)
    {
        if (inString.Contains(inSearchString))
            return "\"" + inString+ "\"";
        return inString;
    }
Rhyous
źródło
2

Aby napisać do pliku, myślę, że następująca metoda jest najbardziej wydajna i prosta: (Jeśli chcesz, możesz dodać cudzysłowy)

public static void WriteCsv(DataTable dt, string path)
{
    using (var writer = new StreamWriter(path)) {
        writer.WriteLine(string.Join(",", dt.Columns.Cast<DataColumn>().Select(dc => dc.ColumnName)));
        foreach (DataRow row in dt.Rows) {
            writer.WriteLine(string.Join(",", row.ItemArray));
        }
    }
}
Student 222
źródło
2

Aby naśladować plik Excel CSV:

public static string Convert(DataTable dt)
{
    StringBuilder sb = new StringBuilder();

    IEnumerable<string> columnNames = dt.Columns.Cast<DataColumn>().
                                        Select(column => column.ColumnName);
    sb.AppendLine(string.Join(",", columnNames));

    foreach (DataRow row in dt.Rows)
    {
        IEnumerable<string> fields = row.ItemArray.Select(field =>
        {
            string s = field.ToString().Replace("\"", "\"\"");
            if(s.Contains(','))
                s = string.Concat("\"", s, "\"");
            return s;
        });
        sb.AppendLine(string.Join(",", fields));
    }

    return sb.ToString().Trim();
}
James Carter
źródło
1
StringBuilder sb = new StringBuilder();
        SaveFileDialog fileSave = new SaveFileDialog();
        IEnumerable<string> columnNames = tbCifSil.Columns.Cast<DataColumn>().
                                          Select(column => column.ColumnName);
        sb.AppendLine(string.Join(",", columnNames));

        foreach (DataRow row in tbCifSil.Rows)
        {
            IEnumerable<string> fields = row.ItemArray.Select(field =>string.Concat("\"", field.ToString().Replace("\"", "\"\""), "\""));
            sb.AppendLine(string.Join(",", fields));
        }

        fileSave.ShowDialog();
        File.WriteAllText(fileSave.FileName, sb.ToString());
Nam Nguyễn
źródło
Witamy w StackOverflow! Odpowiedzi są najlepsze, gdy zawierają opis fragmentu kodu. Osobiście odkryłem, że kiedy nazwy zmiennych ustawiają się między pytaniem a odpowiedzią, są dla mnie bardziej pomocne.
AWinkle
1
public void ExpoetToCSV(DataTable dtDataTable, string strFilePath)
{

    StreamWriter sw = new StreamWriter(strFilePath, false);
    //headers   
    for (int i = 0; i < dtDataTable.Columns.Count; i++)
    {
        sw.Write(dtDataTable.Columns[i].ToString().Trim());
        if (i < dtDataTable.Columns.Count - 1)
        {
            sw.Write(",");
        }
    }
    sw.Write(sw.NewLine);
    foreach (DataRow dr in dtDataTable.Rows)
    {
        for (int i = 0; i < dtDataTable.Columns.Count; i++)
        {
            if (!Convert.IsDBNull(dr[i]))
            {
                string value = dr[i].ToString().Trim();
                if (value.Contains(','))
                {
                    value = String.Format("\"{0}\"", value);
                    sw.Write(value);
                }
                else
                {
                    sw.Write(dr[i].ToString().Trim());
                }
            }
            if (i < dtDataTable.Columns.Count - 1)
            {
                sw.Write(",");
            }
        }
        sw.Write(sw.NewLine);
    }
    sw.Close();
}
Ghebrehiywet
źródło
1

Prawdopodobnie najłatwiejszym sposobem będzie użycie:

https://github.com/ukushu/DataExporter

szczególnie w przypadku danych datatable zawierających /r/nznaki lub symbol separatora wewnątrz komórek dataTable.Prawie wszystkie inne odpowiedzi nie będą działać z takimi komórkami.

wystarczy napisać następujący kod:

Csv csv = new Csv("\t");//Needed delimiter 

var columnNames = dt.Columns.Cast<DataColumn>().
    Select(column => column.ColumnName).ToArray();

csv.AddRow(columnNames);

foreach (DataRow row in dt.Rows)
{
    var fields = row.ItemArray.Select(field => field.ToString()).ToArray;
    csv.AddRow(fields);   
}

csv.Save();
Andrzej
źródło
0

Na wypadek, gdyby ktoś się na to natknął, użyłem File.ReadAllText do uzyskania danych CSV, a następnie zmodyfikowałem je i zapisałem z powrotem za pomocą File.WriteAllText . \ R \ n CRLF były w porządku, ale karty \ t zostały zignorowane, gdy Excel je otworzył. (Wszystkie dotychczasowe rozwiązania w tym wątku używają separatora przecinków, ale to nie ma znaczenia). Notatnik pokazywał ten sam format w pliku wynikowym, co w źródle. A Diff pokazał nawet, że pliki są identyczne. Ale dostałem wskazówkę, kiedy otworzyłem plik w programie Visual Studio za pomocą edytora binarnego. Plik źródłowy był w formacie Unicode, ale celem był ASCII . Aby to naprawić, zmodyfikowałem zarówno ReadAllText, jak i WriteAllText z trzecim argumentem ustawionym jako System.Text.Encoding.Unicode i stamtąd Excel mógł otworzyć zaktualizowany plik.

TonyG
źródło
0

FYR

private string ExportDatatableToCSV(DataTable dtTable)
{
    StringBuilder sbldr = new StringBuilder();
    if (dtTable.Columns.Count != 0)
    {
        foreach (DataColumn col in dtTable.Columns)
        {
            sbldr.Append(col.ColumnName + ',');
        }
        sbldr.Append("\r\n");
        foreach (DataRow row in dtTable.Rows)
        {
            foreach (DataColumn column in dtTable.Columns)
            {
                sbldr.Append(row[column].ToString() + ',');
            }
            sbldr.Append("\r\n");
        }
    }
    return sbldr.ToString();
}
Julia
źródło
0

Oto moje rozwiązanie, oparte na wcześniejszych odpowiedziach Paula Grimshawa i Anthony'ego VO . Wysłałem kod w projekcie C # na Github .

Moim głównym wkładem jest wyeliminowanie jawnego tworzenia i manipulowania StringBuildera zamiast pracy tylko z IEnumerable. Pozwala to uniknąć alokacji dużego bufora w pamięci.

public static class Util
{
    public static string EscapeQuotes(this string self) {
        return self?.Replace("\"", "\"\"") ?? "";
    }

    public static string Surround(this string self, string before, string after) {
        return $"{before}{self}{after}";
    }

    public static string Quoted(this string self, string quotes = "\"") {
        return self.Surround(quotes, quotes);
    }

    public static string QuotedCSVFieldIfNecessary(this string self) {
        return (self == null) ? "" : self.Contains('"') ? self.Quoted() : self; 
    }

    public static string ToCsvField(this string self) {
        return self.EscapeQuotes().QuotedCSVFieldIfNecessary();
    }

    public static string ToCsvRow(this IEnumerable<string> self){
        return string.Join(",", self.Select(ToCsvField));
    }

    public static IEnumerable<string> ToCsvRows(this DataTable self) {          
        yield return self.Columns.OfType<object>().Select(c => c.ToString()).ToCsvRow();
        foreach (var dr in self.Rows.OfType<DataRow>())
            yield return dr.ItemArray.Select(item => item.ToString()).ToCsvRow();
    }

    public static void ToCsvFile(this DataTable self, string path) {
        File.WriteAllLines(path, self.ToCsvRows());
    }

}

To podejście ładnie łączy się z konwersją IEnumerabledo DataTable, zgodnie z pytaniem tutaj .

cdiggins
źródło
0
        DataTable dt = yourData();
        StringBuilder csv = new StringBuilder();
        int dcCounter = 0;

        foreach (DataColumn dc in dt.Columns)
        {
            csv.Append(dc);
            if (dcCounter != dt.Columns.Count - 1)
            {
                csv.Append(",");
            }
            dcCounter++;
        }
        csv.AppendLine();

        int numOfDc = dt.Columns.Count;
        foreach (DataRow dr in dt.Rows)
        {
            int colIndex = 0;
            while (colIndex <= numOfDc - 1)
            {
                var colVal = dr[colIndex].ToString();
                if (colVal != null && colVal != "")
                {
                    DateTime isDateTime;
                    if (DateTime.TryParse(colVal, out isDateTime))
                    {
                        csv.Append(Convert.ToDateTime(colVal).ToShortDateString());
                    }
                    else
                    {
                        csv.Append(dr[colIndex]);
                    }
                }
                else
                {
                    csv.Append("N/A");
                }
                if (colIndex != numOfDc - 1)
                {
                    csv.Append(",");
                }
                colIndex++;
            }
            csv.AppendLine();

Musiałem też nadpisać dane, dlatego jest kilka stwierdzeń „jeśli jeszcze”. Musiałem się upewnić, że jeśli pole jest puste, aby zamiast tego wprowadzić „N / A”, lub jeśli pole daty zostało sformatowane jako „01/01/1900: 00”, zostanie zapisane jako „01/01/1900” zamiast.

BondAddict
źródło
0
StringBuilder sb = new StringBuilder();

        foreach (DataColumn col in table.Columns)
        {
            sb.Append(col.ColumnName + ";");
        }

        foreach (DataRow row in table.Rows)
        {
            sb.AppendLine();
            foreach (DataColumn col in table.Columns)
            {
                sb.Append($@"{Convert.ToString(row[col])}" + ";");
            }
        }
        File.WriteAllText(path, sb.ToString());
Inuria
źródło
-1

jeśli wszystkie dane nadal znajdują się w pierwszej komórce, oznacza to, że aplikacja, w której otworzyłeś plik, oczekuje na inny separator. MSExcel może traktować przecinek jako separator, chyba że określono inaczej.

akram agbarya
źródło