¿Qué lenguaje usar?

M

Capturar algunos datos específicos de páginas que yo quiero y después hacer un buscador.

Vi hace unos días un tutorial de python de cómo hacer un capturador de links o algo parecido, pero no encuentro el vídeo ahora mismo.

Usarías PHP para todo (para hacer el buscador y el algortimo de capturar links etc.)

RPV: una "araña" web

Saludos.

DelArco

Hombre, si tienes que tirar de tutorial vamos mal . Usa lo que conozcas.

1 respuesta
M

#2 Pero quizá haya lenguajes que para hacer eso estén mejor "optimizados", a eso me refiero.

1 respuesta
ToxicAvenger

#3 Si, pero como no lo sepas usar... Yo opino que mejor tirar de lo que conozcas.

1
eisenfaust

#1

https://metacpan.org/module/LWP::Simple

https://metacpan.org/module/WWW::Mechanize

1
M

Lo que no me queda claro es lo siguiente:

El usuario entra en una página hecha en PHP la cual es un buscador de equipos de fútbol por ejemplo, y le da a "Mostrar todos los equipos".

La "araña" lo que haría sería buscar en la web de marca.com/equipos (inventada), y coger el nombre de los equipos con el script que hiciese

Si por ejemplo el script ( la "araña" ) lo hiciese en python, ¿cuándo y dónde debería ejecutar dicho script? Es posible hacer lo que digo? (la página estaría en php)

JuAn4k4

La araña es un proceso que se ejecuta por debajo (Background task), que actualiza el contenido de tu base de datos.

Lo otro es una interfaz a tu base de datos, actualizada de forma transparente por tu bot.

A veces, en los TOS de las webs ya te pone que no se permiten bots que pillen datos para ellos.

Lo puedes hacer en dos lenguajes distintos, la pagina en si lo puedes hacer en php si es lo que conoces, el bot lo puedes hacer en el que te de la gana. De php no soy muy entendido, pero no se yo si se pueden hacer jobs y esas cosas... yo diria que no.

desgraciao

Si sabes PHP podrias parsear paginas y programar tareas, asi como hacer toda la interfaz que comentas... aunque dudo mucho que sea la opcion mas optima.

Usuarios habituales