Pracuję z ogromnym plikiem danych (około 400 000 wierszy i 8 kolumn) w pakiecie Libre Office. Muszę pozbyć się pewnych wierszy, więc wybrałem wszystkie komórki o pożądanej wartości (za pomocą Find & Replace
) i próbowałem Edit > Delete Cells > Delete entire row(s)
. Ekran zanika i nadal, po około 15 minutach nigdzie mnie nie dostanie (ekran zanika na szaro, program nie odpowiada). Wybranie „tylko” kilku tysięcy wierszy spowodowało to samo.
Czy istnieje alternatywny sposób pozbycia się tysięcy wierszy w tym samym czasie? Rozwiązania w Libre Office, Gnumeric lub R lub innym otwartym oprogramowaniu są mile widziane.
Dane są zorganizowane w ten sposób (mała próbka):
Region, czas, itd., Wartości
Cypr, JanDec 2000, gdzieś, 0
Cypr, JanDec 2001, kody, 74.2
Cypr, JanDec 2002, kody, 68,7
Cypr, JanDec 2003, kody, 59.1
Cypr, JanDec 2004, kody, 50.3
Cypr, JanDec 2005, somecodes, 71.1
Cypr, styczeń 2006, kody, 45,7
Cypr, JanDec 2007, somecodes, 45,7
Cypr, JanDec 2008, kody, 50,4
Cypr, JanDec 2009, somecodes, 80
Cypr, JanDec 2010, kody, 47.2
Cypr, JanDec 2011, somecodes, 44.1
Hiszpania, JanDec 2000, gdzieś, 5
...
Okres czasu wynosi od 2000 do 2011 roku. Muszę pozbyć się wszystkich wierszy zawierających lata 2000–2005 i 2011.
źródło
read.csv
i stamtąd filtrować. jeśli nie masz wystarczającej ilości pamięci RAM, możesz nadal korzystaćsqldf
pakiet, aby zrobić to samoOdpowiedzi:
Spróbuj tego:
1. Zapisz go jako CSV.
Zmień nazwę na TXT (jeśli w systemie Windows usuń zaznaczenie pola wyboru, aby ukryć znane rozszerzenia, na narzędziach & gt; opcje pokazywania rozszerzeń), tylko LibreOffice nie próbuje go otwierać za pomocą Calc.
Otwórz go za pomocą Write. Aby zrobić to bardziej czysto dla oczu, wybierz Dysplay & gt; Układ sieciowy.
Wybierz linie, które chcesz wymazać i zrób to. Od pierwszej linii, umieść kursor przed pierwszym znakiem, następnie przytrzymaj shift i użyj klawiszy strzałek w dół / w górę, aby wybrać linie do usunięcia.
Po zakończeniu usuwania nieistotnych linii zapisz plik (jako TXT) i zmień jego nazwę na CSV.
Uwaga: usuniesz wszystkie formuły, jeśli istnieją.
źródło