Jak korzystać z pakietu HTML Agility Pack ?
Mój dokument XHTML nie jest w pełni ważny. Dlatego chciałem go użyć. Jak korzystać z niego w moim projekcie? Mój projekt jest w C #.
c#
html
html-agility-pack
carla
źródło
źródło
var body = CQ.CreateFromFile(filePath)["body"]
.Odpowiedzi:
Najpierw zainstaluj pakiet nuget HTMLAgilityPack w swoim projekcie.
Następnie jako przykład:
(Uwaga: ten kod jest tylko przykładem i niekoniecznie najlepszym / jedynym podejściem. Nie używaj go na ślepo we własnej aplikacji).
HtmlDocument.Load()
Metoda akceptuje również strumień, który jest bardzo przydatny w integracji z innymi klasami zorientowane strumienia w .NET Framework. ChociażHtmlEntity.DeEntitize()
jest inną przydatną metodą poprawnego przetwarzania jednostek HTML. (dzięki Matthew)HtmlDocument
iHtmlNode
są to klasy, z których będziesz najczęściej korzystać. Podobnie jak parser XML, udostępnia metody selectSingleNode i selectNodes, które akceptują wyrażenia XPath.Zwróć uwagę na
HtmlDocument.Option??????
właściwości boolowskie. Kontrolują one, w jaki sposóbLoad
iLoadXML
metody będą przetwarzały Twój HTML / XHTML.Istnieje również skompilowany plik pomocy o nazwie HtmlAgilityPack.chm, który zawiera pełne odwołanie do każdego obiektu. Zwykle znajduje się w folderze podstawowym rozwiązania.
źródło
SelectSingleNode()
wydaje się, że został usunięty jakiś czas temuNie wiem, czy ci to pomoże, ale napisałem kilka artykułów, które wprowadzają w podstawy.
Następny artykuł jest w 95% kompletny, muszę tylko napisać wyjaśnienia kilku ostatnich fragmentów kodu, który napisałem. Jeśli jesteś zainteresowany, postaram się pamiętać o opublikowaniu tutaj, kiedy go opublikuję.
źródło
HtmlAgilityPack używa składni XPath i chociaż wielu twierdzi, że jest słabo udokumentowana, nie miałem problemu z użyciem jej przy pomocy tej dokumentacji XPath: https://www.w3schools.com/xml/xpath_syntax.asp
Do analizowania
Ja to zrobiłem:
źródło
XPath
standardu. Najpierw należy nauczyć się tego standardu, a potem wszystko będzie łatwe.Główny kod związany z HTMLAgilityPack jest następujący
źródło
źródło
Pierwsze kroki - pakiet HTML Agility
źródło
Spróbuj tego
źródło