Uwzględniać nagłówki podczas korzystania z SELECT INTO OUTFILE?

117

Czy można w jakiś sposób dołączyć nagłówki podczas korzystania z MySQL INTO OUTFILE?

Brett
źródło

Odpowiedzi:

166

Trzeba by było samodzielnie zakodować te nagłówki. Coś jak:

SELECT 'ColName1', 'ColName2', 'ColName3'
UNION ALL
SELECT ColName1, ColName2, ColName3
    FROM YourTable
    INTO OUTFILE '/path/outfile'
Joe Stefanelli
źródło
14
Ale to nie zadziała, jeśli ORDER BYw SELECTklauzuli występuje. Linia nagłówka może znajdować się w dowolnym miejscu w wygenerowanym pliku, w zależności od kolejności.
COil
Zobacz kilka odpowiedzi poniżej, aby poznać pomysły na użycie ORDER BY, a także odpowiedź Matta na sposób szybkiego uzyskania wszystkich ColName1, ColName2 itd. Bardzo przydatne dodatki do tej wspaniałej odpowiedzi!
Andrew T,
1
Ta odpowiedź wydaje się być właściwa, do diabła nawet użyłem jej prawie na ślepo na moim serwerze deweloperskim ... Bez nagłówków kolumn zrzucenie 240 milionów wierszy zajmuje około 50 sekund. Z tym UNION ALL serwer wpada w poważne kłopoty, próbując zrobić tabelę tymczasową przed zrzuceniem wszystkiego, minęło już ponad 10 minut i nadal czeka, aż tabela tymczasowa zostanie zapisana na dysku! Pamiętaj o tym! Z pewnością wolałbyś dodać nazwy kolumn w inny sposób, nawet jeśli oznacza to otwarcie pliku za pomocą innego języka programowania.
Salketer
Wydaje się, że działa to tylko wtedy, gdy wszystkie kolumny YourTable są znakowymi typami danych, co ma sens. W przeciwnym razie pojawi się nieprzydatny błąd: „Użyte instrukcje SELECT mają inną liczbę kolumn”.
TheBamf
1
Jest to jeden z powodów, dla których rozważam przejście na inny DBMS.
e18r
85

Rozwiązanie dostarczone przez Joe Steanelli działa, ale tworzenie listy kolumn jest niewygodne, gdy w grę wchodzą dziesiątki lub setki kolumn. Oto jak uzyskać listę kolumn tabeli my_table w my_schema .

-- override GROUP_CONCAT limit of 1024 characters to avoid a truncated result
set session group_concat_max_len = 1000000;

select GROUP_CONCAT(CONCAT("'",COLUMN_NAME,"'"))
from INFORMATION_SCHEMA.COLUMNS
WHERE TABLE_NAME = 'my_table'
AND TABLE_SCHEMA = 'my_schema'
order BY ORDINAL_POSITION

Teraz możesz skopiować i wkleić wynikowy wiersz jako pierwszą instrukcję w metodzie Joe.

matowe
źródło
2
Spowoduje to zwrócenie wszystkich połączonych kolumn w jednym polu. Nie mogę połączyć tego z inną instrukcją SELECT, która zwraca wiele pól. Jest to jednak bardzo przydatne do uzyskania linii, którą mogę skopiować i wkleić jako nagłówek mojego pliku wyjściowego.
tmoore82
1
Chodzi o to, aby skopiować wynikowe pojedyncze pole i wkleić je do instrukcji UNION zamiast ręcznie wpisywać kolumnę1, kolumnę2 itd., Gdy używasz metody Joe (zaakceptowana odpowiedź), aby szybciej uzyskać listę kolumn!
Andrew T,
Chciałem wyeksportować cały mój schemat tabeli / pól. Ta odpowiedź w połączeniu z zaakceptowaną załatwiła sprawę!
Rémi Breton
@Chris ORDER BY ORDINAL_POSITIONsobie z tym poradzi
Matt
1
ORDER BY ORDINAL_POSITION powinno być częścią wywołania GROUP_CONCAT (), tak jak wGROUP_CONCAT(CONCAT('"',COLUMN_NAME,'"') order BY ORDINAL_POSITION)
Apuleius
15

Dla złożonego wyboru z ORDER BY używam:

SELECT * FROM (
    SELECT 'Column name #1', 'Column name #2', 'Column name ##'
    UNION ALL
    (
        // complex SELECT statement with WHERE, ORDER BY, GROUP BY etc.
    )
) resulting_set
INTO OUTFILE '/path/to/file';
evilguc
źródło
To rozwiązanie sprawdza się dobrze przy zamawianiu drugiego (złożonego) zapytania; jeśli nie zrobisz tego w ten sposób, w końcu zamówisz pierwszą kolumnę, co również jest niepożądane. Niezła sugestia @evilguc!
Aaron
Nie zadziałało ze mną, po wykonaniu UNION ALL kolejność kolumny id jest pomieszana
Mohanad Kaleia
6

Możesz użyć przygotowanego zestawienia z odpowiedzią lucka i dynamicznie wyeksportować tabelę z nazwami kolumn w CSV:

--If your table has too many columns
SET GLOBAL group_concat_max_len = 100000000;
--Prepared statement
SET @SQL = ( select CONCAT('SELECT * INTO OUTFILE \'YOUR_PATH\' FIELDS TERMINATED BY \',\' OPTIONALLY ENCLOSED BY \'"\' ESCAPED BY \'\' LINES TERMINATED BY \'\\n\' FROM (SELECT ', GROUP_CONCAT(CONCAT("'",COLUMN_NAME,"'")),' UNION select * from YOUR_TABLE) as tmp') from INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = 'YOUR_TABLE' AND TABLE_SCHEMA = 'YOUR_SCHEMA' order BY ORDINAL_POSITION );
--Execute it
PREPARE stmt FROM @SQL;
EXECUTE stmt;

Dziękuję Lucku.

Vrag
źródło
6

Umożliwi to uporządkowanie kolumn i / lub ograniczenie

SELECT 'ColName1', 'ColName2', 'ColName3'
UNION ALL
SELECT * from (SELECT ColName1, ColName2, ColName3
    FROM YourTable order by ColName1 limit 3) a
    INTO OUTFILE '/path/outfile';
Donald Wagner
źródło
1
Tylko uwaga, że ​​ten układ zapytań działał dla mnie również w MariaDB 10.1; inne układy sugerowane w tym wątku nie.
ProgrammerDan
Z jakiegoś powodu wyskakuje nagłówek na dole, ale działa dobrze, aby umieścić go z powrotem na górze w aplikacji arkusza kalkulacyjnego, dziwne, ale wiwatujące
Dmitri DB,
Utknąłem również z mariaDB. przy ekstrakcji zaledwie 100 leadów było to ponad 14 sekund szybciej niż uruchomienie zaakceptowanej odpowiedzi. Pierwsze podanie zaakceptowane: Query OK, 100 rows affected (14.72 sec) Drugie podanie TwoimQuery OK, 101 rows affected (0.00 sec)
Casper Wilkes
6

Po prostu wykonuję 2 zapytania, najpierw, aby uzyskać wynik zapytania (limit 1) z nazwami kolumn (bez kodu stałego, żadnych problemów z połączeniami, kolejnością, niestandardowymi nazwami kolumn itp.), A po drugie, aby wykonać zapytanie i połączyć pliki w jeden plik CSV plik:

CSVHEAD=`/usr/bin/mysql $CONNECTION_STRING -e "$QUERY limit 1;"|head -n1|xargs|sed -e "s/ /'\;'/g"`
echo "\'$CSVHEAD\'" > $TMP/head.txt
/usr/bin/mysql $CONNECTION_STRING -e "$QUERY into outfile '${TMP}/data.txt' fields terminated by ';' optionally enclosed by '\"' escaped by '' lines terminated by '\r\n';"
cat $TMP/head.txt $TMP/data.txt > $TMP/data.csv
user3037511
źródło
5

Z podobnym problemem spotkałem się podczas wykonywania zapytania mysql na dużych tabelach w NodeJS. Podejście, które zastosowałem, aby dołączyć nagłówki do mojego pliku CSV, jest następujące

  1. Użyj zapytania OUTFILE, aby przygotować plik bez nagłówków

        SELECT * INTO OUTFILE [FILE_NAME] FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED 
        BY '\"' LINES TERMINATED BY '\n' FROM [TABLE_NAME]
  2. Pobierz nagłówki kolumn dla tabeli użytej w punkcie 1

        select GROUP_CONCAT(CONCAT(\"\",COLUMN_NAME,\"\")) as col_names from 
        INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = [TABLE_NAME] AND TABLE_SCHEMA 
        = [DATABASE_NAME] ORDER BY ORDINAL_POSITION
  3. Dołącz nagłówki kolumn do pliku utworzonego w kroku 1 przy użyciu pakietu npm przedpend-file

Wykonanie każdego kroku było kontrolowane za pomocą obietnic w NodeJS.

rahul shukla
źródło
3

Jest to alternatywny kod, jeśli znasz język Python lub R, a Twój stół mieści się w pamięci.

Zaimportuj tabelę SQL do języka Python lub R, a następnie wyeksportuj stamtąd jako plik CSV, a otrzymasz nazwy kolumn oraz dane.

Oto jak to robię używając R, wymaga biblioteki RMySQL:

db <- dbConnect(MySQL(), user='user', password='password', dbname='myschema', host='localhost')

query <- dbSendQuery(db, "select * from mytable")
dataset <- fetch(query, n=-1)

write.csv(dataset, 'mytable_backup.csv')

To trochę oszustwo, ale stwierdziłem, że było to szybkie obejście, gdy moja liczba kolumn była zbyt długa, aby użyć powyższej metody konkatacji. Uwaga: R doda kolumnę „row.names” na początku pliku CSV, więc zechcesz ją usunąć, jeśli musisz polegać na pliku CSV w celu odtworzenia tabeli.

Joining Dots
źródło
2

Tak więc, jeśli wszystkie kolumny my_tablesą typu znakowego , możemy połączyć najlepsze odpowiedzi (Joe, Matt i evilguc) razem, aby nagłówek został dodany automatycznie w jednym „prostym” zapytaniu SQL, np.

select * from (
  (select column_name
    from information_schema.columns
    where table_name = 'my_table'
    and table_schema = 'my_schema'
    order by ordinal_position)
  union all
  (select *  // potentially complex SELECT statement with WHERE, ORDER BY, GROUP BY etc.
  from my_table)) as tbl
into outfile '/path/outfile'
fields terminated by ',' optionally enclosed by '"' escaped by '\\'
lines terminated by '\n';

gdzie ostatnie kilka wierszy tworzy wynik csv.

Zauważ, że może to być powolne, jeśli my_tablejest bardzo duże.

TheBamf
źródło
zawiera błąd „Użyte instrukcje SELECT mają inną liczbę kolumn”. Sir
Bowei Liu,
1

Myślę, że jeśli użyjesz UNION, to zadziała:

select 'header 1', 'header 2', ...
union
select col1, col2, ... from ...

Nie znam sposobu bezpośredniego określenia nagłówków za pomocą składni INTO OUTFILE.

Paul W.
źródło
1
UNION ALL byłoby bezpieczniejsze i szybsze.
Toxalot
1

Właściwie możesz sprawić, by działało nawet z ORDER BY.

Potrzebuje tylko trochę sztuczek w kolejności według instrukcji - używamy instrukcji case i zastępujemy wartość nagłówka inną wartością, która gwarantuje pierwsze sortowanie na liście (oczywiście zależy to od typu pola i tego, czy sortujesz ASC, czy DESC)

Załóżmy, że masz trzy pola, name (varchar), is_active (bool), date_something_happens (date) i chcesz posortować dwa drugie malejąco:

select 
        'name'
      , 'is_active' as is_active
      , date_something_happens as 'date_something_happens'

 union all

 select name, is_active, date_something_happens

 from
    my_table

 order by
     (case is_active when 'is_active' then 0 else is_active end) desc
   , (case date when 'date' then '9999-12-30' else date end) desc
Simon Woolf
źródło
1

Ponieważ funkcjonalność „nagłówków dołączania” nie wydaje się być jeszcze wbudowana, a większość „rozwiązań” wymaga ręcznego wpisywania nazw kolumn i / lub nawet nie bierze pod uwagę złączeń, radziłbym obejść problem .

  • Najlepszą alternatywą, jaką do tej pory znalazłem, jest użycie przyzwoitego narzędzia (używam HeidiSQL ).
    Umieść swoje żądanie, wybierz siatkę, kliknij prawym przyciskiem myszy i wyeksportuj do pliku. Posiada wszystkie niezbędne opcje do czystego eksportu i powinien obsługiwać większość potrzeb.

  • W tym samym pomyśle podejście user3037511 działa dobrze i można je łatwo zautomatyzować .
    Po prostu uruchom swoje żądanie za pomocą wiersza poleceń, aby uzyskać nagłówki. Możesz uzyskać dane za pomocą SELECT INTO OUTFILE ... lub uruchamiając zapytanie bez ograniczeń, do wyboru.

    Zauważ, że przekierowanie wyjścia do pliku działa jak urok zarówno w systemie Linux, jak i Windows.


To sprawia, że ​​chcę podkreślić, że w 80% przypadków, gdy chcę użyć SELECT FROM INFILE lub SELECT INTO OUTFILE, w końcu używam czegoś innego z powodu pewnych ograniczeń (tutaj brak opcji nagłówków, na AWS-RDS, brakujące prawa i tak dalej.)

Stąd, nie dokładnie odpowiedzieć na PO za pytanie ... ale powinien odpowiadać jego potrzeb :)
EDIT: i rzeczywiście odpowiedzieć na jego pytanie: no
jak z 2017-09-07, po prostu nie może zawierać nagłówki jeśli ciebie trzymaj się polecenia SELECT INTO OUTFILE
: |

Balmipour
źródło
1

przykład z czujnika nazwy tabeli w mojej bazie danych z kolumnami (id, czas, jednostka)

select ('id') as id, ('time') as time, ('unit') as unit
UNION ALL
SELECT * INTO OUTFILE 'C:/Users/User/Downloads/data.csv'
  FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
  LINES TERMINATED BY '\n'
  FROM sensor
Dayanand SK
źródło
0

Pisałem swój kod w PHP i miałem trochę problemów z używaniem funkcji concat i union, a także nie korzystałem ze zmiennych SQL, jakikolwiek sposób, w jaki go uruchomiłem, oto mój kod:

//first I connected to the information_scheme DB

$headercon=mysqli_connect("localhost", "USERNAME", "PASSWORD", "information_schema");

//took the healders out in a string (I could not get the concat function to work, so I wrote a loop for it)

    $headers = '';
    $sql = "SELECT column_name AS columns FROM `COLUMNS` WHERE table_schema = 'YOUR_DB_NAME' AND table_name = 'YOUR_TABLE_NAME'";
    $result = $headercon->query($sql);
    while($row = $result->fetch_row())
    {
        $headers = $headers . "'" . $row[0] . "', ";
    }
$headers = substr("$headers", 0, -2);

// connect to the DB of interest

$con=mysqli_connect("localhost", "USERNAME", "PASSWORD", "YOUR_DB_NAME");

// export the results to csv
$sql4 = "SELECT $headers UNION SELECT * FROM YOUR_TABLE_NAME WHERE ... INTO OUTFILE '/output.csv' FIELDS TERMINATED BY ','";
$result4 = $con->query($sql4);
user5671922
źródło
0

Oto sposób na dynamiczne pobieranie tytułów nagłówków z nazw kolumn.

/* Change table_name and database_name */
SET @table_name = 'table_name';
SET @table_schema = 'database_name';
SET @default_group_concat_max_len = (SELECT @@group_concat_max_len);

/* Sets Group Concat Max Limit larger for tables with a lot of columns */
SET SESSION group_concat_max_len = 1000000;

SET @col_names = (
  SELECT GROUP_CONCAT(QUOTE(`column_name`)) AS columns
  FROM information_schema.columns
  WHERE table_schema = @table_schema
  AND table_name = @table_name);

SET @cols = CONCAT('(SELECT ', @col_names, ')');

SET @query = CONCAT('(SELECT * FROM ', @table_schema, '.', @table_name,
  ' INTO OUTFILE \'/tmp/your_csv_file.csv\'
  FIELDS ENCLOSED BY \'\\\'\' TERMINATED BY \'\t\' ESCAPED BY \'\'
  LINES TERMINATED BY \'\n\')');

/* Concatenates column names to query */
SET @sql = CONCAT(@cols, ' UNION ALL ', @query);

/* Resets Group Contact Max Limit back to original value */
SET SESSION group_concat_max_len = @default_group_concat_max_len;

PREPARE stmt FROM @sql;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
RNickMcCandless
źródło
1
Niezłe rozwiązanie. Przyjęłam to do moich celów. Dzięki!
Denis Kulagin,
0

Chciałbym dodać do odpowiedzi udzielonej przez Sangama Belose. Oto jego kod:

select ('id') as id, ('time') as time, ('unit') as unit
UNION ALL
SELECT * INTO OUTFILE 'C:/Users/User/Downloads/data.csv'
  FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"'
  LINES TERMINATED BY '\n'
  FROM sensor

Jeśli jednak nie ustawiłeś swojego "secure_file_priv"w zmiennych, może to nie działać. W tym celu sprawdź folder ustawiony dla tej zmiennej przez:

SHOW VARIABLES LIKE "secure_file_priv"

Wynik powinien wyglądać następująco:

mysql> show variables like "%secure_file_priv%";
+------------------+------------------------------------------------+
| Variable_name    | Value                                          |
+------------------+------------------------------------------------+
| secure_file_priv | C:\ProgramData\MySQL\MySQL Server 8.0\Uploads\ |
+------------------+------------------------------------------------+
1 row in set, 1 warning (0.00 sec)

Możesz zmienić tę zmienną lub zmienić zapytanie, aby wyprowadzało plik do pokazanej domyślnej ścieżki.

RGregg
źródło
0

Sam MySQL nie wystarczy, aby zrobić to po prostu. Poniżej znajduje się skrypt PHP, który wyświetla kolumny i dane w formacie CSV.

Wprowadź nazwę bazy danych i tabele u góry.

<?php

set_time_limit( 24192000 );
ini_set( 'memory_limit', '-1' );
setlocale( LC_CTYPE, 'en_US.UTF-8' );
mb_regex_encoding( 'UTF-8' );

$dbn = 'DB_NAME';
$tbls = array(
'TABLE1',
'TABLE2',
'TABLE3'
);

$db = new PDO( 'mysql:host=localhost;dbname=' . $dbn . ';charset=UTF8', 'root', 'pass' );

foreach( $tbls as $tbl )
{
    echo $tbl . "\n";
    $path = '/var/lib/mysql/' . $tbl . '.csv';

    $colStr = '';
    $cols = $db->query( 'SELECT COLUMN_NAME AS `column` FROM INFORMATION_SCHEMA.COLUMNS WHERE TABLE_NAME = "' . $tbl . '" AND TABLE_SCHEMA = "' . $dbn . '"' )->fetchAll( PDO::FETCH_COLUMN );
    foreach( $cols as $col )
    {
        if( $colStr ) $colStr .= ', ';
        $colStr .= '"' . $col . '"';
    }

    $db->query(
    'SELECT *
    FROM
    (
        SELECT ' . $colStr . '
        UNION ALL
        SELECT * FROM ' . $tbl . '
    ) AS sub
    INTO OUTFILE "' . $path . '"
    FIELDS TERMINATED BY ","
    ENCLOSED BY "\""
    LINES TERMINATED BY "\n"'
    );

    exec( 'gzip ' . $path );

    print_r( $db->errorInfo() );
}

?>

Będziesz potrzebował tego katalogu, do którego chcesz wyprowadzać. MySQL musi mieć możliwość zapisu w katalogu.

$path = '/var/lib/mysql/' . $tbl . '.csv';

Możesz edytować opcje eksportu CSV w zapytaniu:

INTO OUTFILE "' . $path . '"
FIELDS TERMINATED BY ","
ENCLOSED BY "\""
LINES TERMINATED BY "\n"'

Na końcu jest wywołanie exec do GZipa CSV.

Kohjah Breese
źródło
-1
WYBIERZ „ColName1”, „ColName2”, „ColName3”
UNIA WSZYSTKO
Wybierz opcję ColName1, ColName2, ColName3
    Z YourTable
    INTO OUTFILE 'c: \\ datasheet.csv' POLA ZAKOŃCZONE PRZEZ ',' OPCJONALNIE ZAŁĄCZONE PRZEZ '"' LINIE ZAKOŃCZONE PRZEZ '\ n' 
manoj singh
źródło