Pytania oznaczone «web-scraping»

Web scraping to proces wyodrębniania określonych informacji ze stron internetowych, które nie zapewniają łatwo API ani innych metod automatycznego wyszukiwania danych. Pytania dotyczące „Jak rozpocząć pracę ze skrobaniem” (np. Z Excel VBA) powinny być * dokładnie zbadane *, ponieważ dostępne są liczne próbki kodu funkcjonalnego. Metody skrobania sieci obejmują aplikacje innych firm, tworzenie niestandardowego oprogramowania, a nawet ręczne zbieranie danych w ustandaryzowany sposób.

386
Jak znaleźć elementy według klasy

Mam problem z analizowaniem elementów HTML z atrybutem „class” za pomocą Beautifulsoup. Kod wygląda następująco soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div W tym samym wierszu pojawia się błąd „po” zakończeniu...

128
Lalkarz: przekaż zmienną w .evaluate ()

Próbuję przekazać zmienną do page.evaluate()funkcji w Puppeteer , ale kiedy używam następującego bardzo uproszczonego przykładu, zmiennaevalVar jest niezdefiniowana. Jestem nowy w Puppeteer i nie mogę znaleźć żadnych przykładów do zbudowania, więc potrzebuję pomocy w przekazaniu tej zmiennej do...

16
Jak mogę szybciej zgarniać

Praca tutaj jest zeskrobać API witrynę, która rozpoczyna się od https://xxx.xxx.xxx/xxx/1.jsoncelu https://xxx.xxx.xxx/xxx/1417749.jsoni zapisz go dokładnie MongoDB. Do tego mam następujący kod: client = pymongo.MongoClient("mongodb://127.0.0.1:27017") db = client["thread1"] com =...