Recopilar enlaces de otras páginas

B

Buenas tardes! Hace tiempo vi por ahí un script escrito en python que recopilaba los enlaces de una página web de descarga de películas y generaba un fichero con todos estos enlaces recopilados. El caso es que ahora me veo en la necesidad de hacer algo parecido pero no tengo ni idea de por dónde cogerlo.
La idea es poder coger enlaces y texto del html de una página web ajena y con ello generar un archivo que muestre estos textos con los enlaces en una lista.

Busco alguna pequeña indicación (lenguaje, librería, clase..) para saber más o menos por dónde tirar ya que estoy perdidísimo :f5:
Gracias :D

Merkury

Busca scrap web en gogle y encontraras toda la informacion que necesitas.

En mi github tengo un repo que se llama Sainsburys Scrapper que hago algo parecido (pillo un link creo que era) con PHP, echale un ojo.

1 respuesta
Ranthas

JSoup si te decides por Java es sencillo de usar.

https://jsoup.org/

1 respuesta
B

#2 Scrap! Esa era la palabra clave, lo había buscado de mil formas diferentes y no salía nada.
#3 Me he decantado por esta opción y enseguida lo tenía funcionando, gracias :)

1

Usuarios habituales