Obtener datos de una web - C#

-Kalambre-

Hola, me ha surgido una duda, quiero recoger cierta información de una página web.
Para ser más exacto la información que quiero recoger son las modelos de la web myfreecams que están online.

Lo que hago ahora es guardar la sección "model explorer" en una variable y parsear el html y así sucesivamente con las páginas que haya, 1, 2, 3, 4 etc... así voy recogiendo los nombres y desplegandolos en un listview.

Luego a la hora de actualizar el listview, de nuevo a parsear. Estoy utilizando el HtmlAgility Pack.

Como lo tengo ahora me vale, pero me gustaría saber si hay alguna otra forma (más liviana quizás) de hacer esto mismo. Alguna idea o sugerencia es bienvenida, llevo relativamente poco trasteando con C#.

Saludos.

tracker086

La verdad que no se muy bien como funciona HtmlAgility Pack, lo he echado un ojo rapido antes de postear.

Yo hace unos días hice algo parecido, para un programa q estoy haciendo de series, para que cogiera los datos de las series de IMDb.com lo hice mediante expresiones regulares. La verdad no se si es algo asi lo que buscas pero por si acaso jeje.

Un saludo!

-Kalambre-

Hola tracker086, gracias por tu respuesta, he estado leyendo estos días bastante sobre "web scraping" para ver cual sería la mejor opción.

Pensé en las expresiones regulares como bien has dicho, pero lo veo más para parsear códigos pequeños. Conforme la aplicación vaya avanzando no solo sacaré las modelos que estén online, si no que serán más datos, edad, país, cam score, etc.. y me supondrá parsear mucho html con lo que elegí el HtmlAgility Pack que fue el que más me convenció.

La opción de tratar el código como xml lo tengo desechado.

Me parece que está un poco jodido acceder a los recursos de esta web de manera externa a ella, pero bueno con curiosidad y ganas a ver si saco algo.

Saludos :P

Usuarios habituales

  • -Kalambre-
  • tracker086