Próbuję wydrukować unikalne wpisy w kolumnie .csv
pliku. W tym celu próbowałem:
awk -F "," '{print $6}' dataCoarse.csv | uniq -u
który po prostu drukuje szóstą kolumnę taką, jaka jest. Wciąż są zduplikowane wpisy. Jak mogę wydrukować tylko unikalne linie?
Edycja: Myślę, że muszę usunąć puste spacje poprzedzające lub kończące dowolny znak w każdej linii lub w uniq
jakiś sposób je zignorować. Jak mogę to zrobić?
unix
terminal
osx-yosemite
uniq
Azotan sodu
źródło
źródło
sed 's/ //'
ale nadal widzi dwa identyczne wpisy jako unikalne i drukuje osobno.Odpowiedzi:
Też miałem ten problem! Sprawdź to rozwiązanie podobnego problemu. Zasadniczo chcesz najpierw przesłać dane do potoku
sort
, ponieważuniq
liczy tylko kolejne wystąpienia danych jako duplikaty.awk -F "," '{print $6}' dataCoarse.csv | sort -u
powinien dać ci wynik, którego szukasz.źródło