Jak parsować dane z wnętrza tagu za pomocą Applescript?

0

Jak parsować dane z wnętrza tagu za pomocą Applescript? Wiem, że Applescript ma words 3 thru -2 of myTextVariableskładnię - ale jak mam go użyć, aby mieć pewność, że otrzymuję tylko
This is my textz poniższych tagów?

<p>This is my text</p>

lub

<p class="new">This is my text</p>

lub

<h1>This is my text</h1>

lub

<content class="new" id="content">This is my text</content>
cwd
źródło
1
Pośpiesz się, ale zobacz: Analiza kodu HTML w AppleScript
slhck 16.11.11

Odpowiedzi:

1

Po prostu użyłbym wyrażenia regularnego w powłoce lub w jakimś języku skryptowym powłoki:

paragraphs of (do shell script "/bin/echo " & quoted form of "<p class=\"new\">yyy</p><p>uuu</p>" & " | ruby -e 'puts $<.read.scan(/<p.*?>(.+?)<\\/p>/)'")

Lri
źródło
Dzięki @Lri Miałem nadzieję na odpowiedź od eksperta AppleScript :) Robiłem coś podobnego, ale zastanawiałem się, czy istnieje lepszy sposób - cieszę się, że wspierasz korzystanie z powłoki. Jedno, dlaczego warto używać /bin/echozamiast, echoale nie /usr/bin/rubyzamiast ruby?
cwd 17.11.11
@cwd Ponieważ domyślne echo w shodwrotnych ukośnikach: osx - Jak mogę uniknąć argumentów powłoki w AppleScript? - Przepełnienie stosu
Lri