Jak mogę otworzyć podzbiór dużego (35 MB) pliku .xlsx?

1

Mam Ubuntu 10.04 działającego na Dell Optiplex z 4 GB pamięci i dwoma procesorami 3,16 GHz.

Otrzymałem arkusz kalkulacyjny 35 MB. Otworzył się w Gnumeric po 5 minutach z błędami i nie został otwarty w Open Office (zabity po 20 minutach), nawet po nadaniu najwyższego priorytetu procesowi „soffice” (niceness = -20).

Jaki jest najlepszy sposób radzenia sobie z takim plikiem? Czy jest możliwe wyodrębnienie podzbioru pierwszych kilkuset wierszy, dzięki czemu mogę opracować skrypt, którego będę musiał użyć do przeanalizowania całego pliku?

aktualizacja:

Funkcja linii poleceń ssconvert BigFile.xlsx BigFile.csv spowodował te same błędy co Gnumeric (nie dziwi, ponieważ używa Gnumeric ssconvert )

David LeBauer
źródło

Odpowiedzi:

1

Prawdopodobnie ale potrzebujesz trochę pracy ręcznej.

Pliki xslx są w rzeczywistości plikami ZIP z danymi XML. Po prostu rozpakuj plik i zajrzyj do środka. Format nie jest czymś, co rozsądny umysł łatwo zrozumie, ale powinno być możliwe otwarcie plików arkusza, poszukaj Row elementy i usuń wszystko po pierwszych kilkuset.

Alternatywnie możesz spróbować otworzyć plik za pomocą POI Apache ; po prostu daj Java 1 GB pamięci RAM i może działać.

Aaron Digulla
źródło