Jak przesłać formularz za pomocą PhantomJS

161

Próbuję użyć phantomJS (co za niesamowite narzędzie przy okazji!), Aby przesłać formularz dla strony, dla której mam poświadczenia logowania, a następnie wyprowadzić zawartość strony docelowej na standardowe wyjście. Jestem w stanie uzyskać dostęp do formularza i pomyślnie ustawić jego wartości za pomocą fantomu, ale nie jestem do końca pewien, jaka jest właściwa składnia, aby przesłać formularz i wyprowadzić zawartość kolejnej strony. Do tej pory mam:

var page = new WebPage();
var url = phantom.args[0];

page.open(url, function (status) {

  if (status !== 'success') {
      console.log('Unable to access network');
  } else {

    console.log(page.evaluate(function () {

      var arr = document.getElementsByClassName("login-form");
      var i;

      for (i=0; i < arr.length; i++) {

        if (arr[i].getAttribute('method') == "POST") {
          arr[i].elements["email"].value="[email protected]";
          arr[i].elements["password"].value="mypassword";

          // This part doesn't seem to work. It returns the content
          // of the current page, not the content of the page after 
          // the submit has been executed. Am I correctly instrumenting
          // the submit in Phantom?
          arr[i].submit();
          return document.querySelectorAll('html')[0].outerHTML;
        }

      }

      return "failed :-(";

    }));
  }

  phantom.exit();
}
Vijay Boyapati
źródło

Odpowiedzi:

227

Rozgryzłem to. Zasadniczo jest to problem asynchroniczny. Nie możesz po prostu przesłać i oczekiwać natychmiastowego renderowania kolejnej strony. Musisz poczekać, aż zostanie wyzwolone zdarzenie onLoad dla następnej strony. Mój kod jest poniżej:

var page = new WebPage(), testindex = 0, loadInProgress = false;

page.onConsoleMessage = function(msg) {
  console.log(msg);
};

page.onLoadStarted = function() {
  loadInProgress = true;
  console.log("load started");
};

page.onLoadFinished = function() {
  loadInProgress = false;
  console.log("load finished");
};

var steps = [
  function() {
    //Load Login Page
    page.open("https://website.com/theformpage/");
  },
  function() {
    //Enter Credentials
    page.evaluate(function() {

      var arr = document.getElementsByClassName("login-form");
      var i;

      for (i=0; i < arr.length; i++) { 
        if (arr[i].getAttribute('method') == "POST") {

          arr[i].elements["email"].value="mylogin";
          arr[i].elements["password"].value="mypassword";
          return;
        }
      }
    });
  }, 
  function() {
    //Login
    page.evaluate(function() {
      var arr = document.getElementsByClassName("login-form");
      var i;

      for (i=0; i < arr.length; i++) {
        if (arr[i].getAttribute('method') == "POST") {
          arr[i].submit();
          return;
        }
      }

    });
  }, 
  function() {
    // Output content of page to stdout after form has been submitted
    page.evaluate(function() {
      console.log(document.querySelectorAll('html')[0].outerHTML);
    });
  }
];


interval = setInterval(function() {
  if (!loadInProgress && typeof steps[testindex] == "function") {
    console.log("step " + (testindex + 1));
    steps[testindex]();
    testindex++;
  }
  if (typeof steps[testindex] != "function") {
    console.log("test complete!");
    phantom.exit();
  }
}, 50);
Vijay Boyapati
źródło
3
to świetny szablon. Oto kilka rzeczy, dodałem: wewnątrz setIntervalZastosowanie var func = steps[testindex], a następnie console.log("step " + (testindex + 1) + ": " + funcName(func)). Pozwala to na dodanie opisu do wykonywanych czynności.
Jonno
patrz tutaj dla funcName. Poza tym było mi łatwiej, kiedy przeglądałem serię stron internetowych i próbowałem różnych technik renderowania ostatniej strony przy użyciu page.render("output.png");.
Jonno
2
To jest naprawdę pomocny post. Jedno pytanie. Gdy przesyłasz formularz za pomocą POST, dane są wysyłane do serwera, a serwer zwraca odpowiedź. Gdzie jest kod, w którym obsługujesz tę odpowiedź, czy jest to automatycznie wykonywane przez phantomjs? Ponadto po przesłaniu formularza serwer może zwrócić COOKIE, a moje pytanie brzmi: * czy ten plik cookie jest dostępny w phantom.cookiesobiekcie, gdy serwer zwraca odpowiedź * ?
MrD
używaj CasperJS jest lepszy niż PhantomJS, ma możliwość wysyłania do formularzy bez skomplikowanego kodowania
waza123
Czy mógłbyś to też sprawdzić stackoverflow.com/questions/44624964/phantom-js-on-web-project
Manik
62

Ponadto CasperJS zapewnia ładny, wysokopoziomowy interfejs do nawigacji w PhantomJS, w tym do klikania linków i wypełniania formularzy.

CasperJS

Zaktualizowano o artykuł z 28 lipca 2015 roku porównujący PhantomJS i CasperJS .

(Dzięki komentatorowi Mr. M!)

arboc7
źródło
1
Casper nie działał dla mnie, ponieważ można było wypełnić formularz tylko przy użyciu imienia i nazwiska. Musiałem użyć id.
user984003
4
@ user984003 Powinieneś móc ustawić selektor #someidna wypełnianie na podstawie identyfikatora.
arboc7
2
CasperJS to dar niebios! To sprawia, że ​​skrobanie stron ASPX jest dziecinnie proste. Dziękuję Ci!
Tobia
@ user984003 Nie wiem, czy korzystałeś ze starszej wersji, ale obecna ma funkcję fillSelectors () do wypełniania pól formularza za pomocą dowolnego selektora.
Tobia
3
Każdy, kto używa PhantomJS, powinien zacząć używać CasperJS. Oto post opisujący, dlaczego: code-epicenter.com/why-is-casperjs-better-than-phantomjs
MrD.
19

Wysyłanie surowych żądań POST może być czasami wygodniejsze. Poniżej możesz zobaczyć oryginalny przykład post.js z PhantomJS

// Example using HTTP POST operation

var page = require('webpage').create(),
    server = 'http://posttestserver.com/post.php?dump',
    data = 'universe=expanding&answer=42';

page.open(server, 'post', data, function (status) {
    if (status !== 'success') {
        console.log('Unable to post!');
    } else {
        console.log(page.content);
    }
    phantom.exit();
});
Jakub M.
źródło
6
Miejcie świadomość, czytelnicy, że wykonywanie GETżądań w podobny sposób (poprzez zrobienie czegoś podobnego page.open(server, 'get', data, ...) nie zadziała.
zbr
7

Jak wspomniano powyżej CasperJS to najlepsze narzędzie do wypełniania i wysyłania formularzy. Najprostszy możliwy przykład wypełnienia i przesłania formularza za pomocą funkcji fill () :

casper.start("http://example.com/login", function() {
//searches and fills the form with id="loginForm"
  this.fill('form#loginForm', {
    'login':    'admin',
    'password':    '12345678'
   }, true);
  this.evaluate(function(){
    //trigger click event on submit button
    document.querySelector('input[type="submit"]').click();
  });
});
DominikStyp
źródło