Dudas con HtmlUnit y XPath (Java)

Spacelord

Buenas.

Resulta que estoy mapeando el contenido de una web en XML y recuperando el valor de algunos tags con XPath, pero tengo algunos problemas y no sé si estoy pidiéndole demasiado a HtmlUnit o es que no sé hacerlo.

En primer lugar, en algunas páginas me saltan mil warnings de Rhino (el motor Javascript que incorpora HtmlUnit) acerca de "missing context". Imagino que será un conflicto de versiones, que la página usará una versión de JS más actual que la del motor y de ahí los problemas. El asunto es que además de los warnings me saltan excepciones, que es lo que me para el código. Son mensajes tal que así:

EcmaError: lineNumber=[6] column=[0] lineSource=[null] name=[TypeError] sourceName=[http://tiendas.mediamarkt.es/templates/WLSMERGED/jsMergedMM_3021_1.js] message=[TypeError: Cannot call method "contains" of undefined (http://tiendas.mediamarkt.es/templates/WLSMERGED/jsMergedMM_3021_1.js#6)]

En otras páginas no me da ningún problema y me recupera perfectamente los tags, así que asumo que es un tema del motor JS de HtmlUnit y las discrepancias que pueda haber entre la versión que usa y la que usa la web que intento mapear.

¿Hay alguna forma de upgradear Rhino o de solucionar este problema?

Usuarios habituales

  • Spacelord