La Red de Conocimientos Pedagógicos - Currículum vitae - ¿Cómo captura phantomjs los datos dinámicos de la página?

¿Cómo captura phantomjs los datos dinámicos de la página?

Phantomjs puede ejecutar js. Debido a que es un navegador sin cabeza, también puede ejecutar nodos dom, lo cual es muy adecuado para el web scraping.

Por ejemplo, necesitamos rastrear por lotes el contenido de "Hoy en el historial" en la página web. Sitio web

La observación de la estructura DOM muestra que solo necesitamos llegar. Entonces usamos selectores avanzados para construir fragmentos dom.

Variable d = ' '

var c = document.querySelectorAll('.List Alli')

var l = c.length

for(var I = 0;iltl;i){

d=d c[i]. Título '\n '

}

Luego deje que el código js se ejecute en phantomjs~

var page = require('página web'). create();

Page.open ('/'), function(status){//Abre la página.

If (status! == 'Éxito'){

console.log('No se puede cargar la dirección');

}De lo contrario{

consola . log(página . evaluar(función(){

Variable d= ' '

var c = document.querySelectorAll('.List Alli') p>

var l = c.length

for(var I = 0;i ltl;i){

d=d c[i]. >

}

Retorno d

}))

}

Phantom.exit();

} p>

});

Finalmente lo guardamos como catch.js, lo ejecutamos en DOS y enviamos el contenido a un archivo txt (también se puede escribir usando el archivo phantomjs). API).