Jak parsować dane z wnętrza tagu za pomocą Applescript? Wiem, że Applescript ma words 3 thru -2 of myTextVariable
składnię - ale jak mam go użyć, aby mieć pewność, że otrzymuję tylko This is my text
z poniższych tagów?
<p>This is my text</p>
lub
<p class="new">This is my text</p>
lub
<h1>This is my text</h1>
lub
<content class="new" id="content">This is my text</content>
Odpowiedzi:
Po prostu użyłbym wyrażenia regularnego w powłoce lub w jakimś języku skryptowym powłoki:
paragraphs of (do shell script "/bin/echo " & quoted form of "<p class=\"new\">yyy</p><p>uuu</p>" & " | ruby -e 'puts $<.read.scan(/<p.*?>(.+?)<\\/p>/)'")
źródło
/bin/echo
zamiast,echo
ale nie/usr/bin/ruby
zamiastruby
?sh
odwrotnych ukośnikach: osx - Jak mogę uniknąć argumentów powłoki w AppleScript? - Przepełnienie stosu