Mam dwa pliki po 3 GB każdy, aby wykonać porównanie i zapisać dane różnicowe w trzecim pliku.
Poniżej podano przykładowe dane.
Plik 1 : June_01_2018.csv
Plik 2 : June_02_2018.csv
Uwaga : chcę zapisać różnicę w trzecim pliku z nagłówkami kolumn.
Oczekiwany wynik : Trzeci plik powinien zawierać rekordy od ID
11 do 15 z nagłówkami kolumn.
Moja próba : fc
polecenie w wierszu polecenia,
>fc June_01_2018.csv June_02_2018.csv > June_Diff.csv
Ale uzyskanie nieoczekiwanego rezultatu:
fc
jest interaktywnym narzędziem wiersza poleceń, tzn. zawsze generuje dane czytelne dla człowieka. Dodatkowo porównuje pliki tekstowe linia po linii i nie wie o znaczeniu linii. W twoim przypadku pierwszy wiersz zawierający nagłówki kolumn jest identyczny w obu plikach, więc nie jest drukowany. Jeśli czytasz dokumenty , zobaczysz, że twój wynik jest oczekiwanym rezultatem. Wątpię, czyfc
jest właściwym narzędziem do tego zadania.Odpowiedzi:
Nadzieje nie mają nic wspólnego z (realistycznymi) oczekiwaniami.
Nagłówek jest dokładnie taki sam, więc nigdy nie może być różnicy.
Również reprezentacja programu Excel nie jest plikiem csv, powinieneś opublikować oryginalne pliki jako tekst.
Następujący plik wsadowy czyta w nagłówku i powtarza echo do pliku różnicowego.
Zamiast fc używa findstr z opcjami
Wariant z fc
To pozostawia tylko linię końcową.
źródło
FINDSTR: Search string too long
.comparing
i*****