codigo fuente, java

Bocasucia

buenas, alguien tiene algun codigo en java que dado un codigo fuente lo trate de tal forma que extraiga los links?
gracias

kas

Los links? links web?

Si fuese asi, no es mas que hacerte un programa que abra un archivo e irte paseando por cada linea y por cada letra, para buscar una cadena que empieze por http por ejemplo.. o por lo que tu quieras.

Bocasucia

#2 es algo mas complicado que eso

en realidad me interesan los links del mismo dominio, no que vayan a otros dominios, pero bueno, cualquier cosa me vale

LOc0

Mírate esto -> http://www.regular-expressions.info/java.html

Salu2 ;)

maRc

Porías echar un vistazo en www.google.com/codesearch

Khendel

ves leyendo linea a linea con un ImputStreamReader, y lo vas tratando con las funciones de la clase String

primero debes buscar el tag de html '<a' i luego el parametro 'href=', justo despues del igual estara el link

Saludos y suerte

Bocasucia

#6 si es como yo lo hago, o como he intentado hacerlo, pero es una mierda, cada link esta de una forma distinta y no es facil pillarlos para que te queden bien

Usuarios habituales

  • Bocasucia
  • Khendel
  • maRc
  • LOc0
  • kas