Podczas korzystania wget
ze skryptu do pobierania niektórych plików z Dokumentów Google nazwa pliku nie jest zachowywana. Na przykład:
wget 'http://spreadsheets.google.com/pub?key=pyj6tScZqmEfbZyl0qjbiRQ&output=xls'
zapisuje plik jako pub?key=pyj6tScZqmEfbZyl0qjbiRQ
zamiast indicatorhivestimatedprevalence15-49.xls
, co otrzymuję, jeśli kliknę link w przeglądarce. Czy jest jakiś sposób na wymuszenie tego „podobnego do przeglądarki” zachowania wget
?
Możesz spróbować użyć curl, aby pobrać i zachować oryginalną nazwę pliku:
zobacz opcje wiersza polecenia curl .
źródło
Link do Dokumentów Google naprawdę nakazuje skryptowi uruchomienie na serwerze, który analizuje go w żądanym pliku. Plik, zgodnie z moją najlepszą wiedzą, nie istnieje nigdy na serwerze w formie els, ale jest generowany w czasie wykonywania, gdy go o to poprosisz. Dlatego nie ma nic do zdobycia przez wget.
Aby pobrać plik, musisz użyć interfejsu API Google http://code.google.com/apis/documents/docs/3.0/developers_guide_protocol.html#DownloadingDocs/ .
źródło
.xls
plik w locie. Jednak pełna wersja przeglądarki nie ma z tym problemu. Więc oczywiście można obejść się bez interfejsu API Dokumentów.