Búsqueda masiva de una cadena de texto

neiclon

Hola:

Tengo un pequeño proyecto entre manos y necesito hacer algo que a priori debería ser sencillo, pero habría que dar con la herramienta adecuada.

Tengo una larga sucesión de archivos.docx y necesito extraer un dato de todos ellos. A ver como me explico:

1) Tengo que buscar por una palabra clave que es "<a href='"
2) Necesito toda la información que va delante de esa cadena de texto.

Por ejemplo: hay un archivo 1.docx donde está la cadena "<a href='http://google.es'>", hay otro archivo 2.docx donde esta la cadena "<a href='http://yahoo.es".

Si pruebas a hacer una búsqueda en Windows con la cadena "<a href='" funciona y te saca los resultados, pero ni salen completos ni tienes maneras de exportarlos...

Espero haberme explicado.

¡Muchas gracias!

r6n

Con el Excel puedes hacerlo. Eso si, te tocará buscar las funciones adecuadas y posiblemente ir separando los datos en columnas hasta dejar una columna con exactamente lo que necesitas.

Revisa las funciones de texto, alguna te servirá https://support.office.com/es-es/article/funciones-de-excel-por-categor%C3%ADa-5f91f4e9-7b42-46d2-9bd1-63f26a86c0eb

1 respuesta
HeXaN

PowerGREP.

garlor

cualquier programa que te permita buscar en archivos por expresiones regulares

notepad++ tambien tiene una opcion para hacer busquedas recursivas en un directorio, tambien puedes hacer copy de lo que encuentra, lo de exportarlo ya no se

1 respuesta
neiclon

#2 Lo que no me termina de quedar claro es si con excel puedo buscar texto en archivos externos, si existe esta función o está limitado por ahí.

#4 Mi primera idea es usar Notepad++ porque me sirvió para algo similar hace poco... por desgracia, no busca en Docx...

2 respuestas
r6n

#5 No, con Excel no. Yo entendí que tenías un listado en docx y necesitabas "filtrar" todos esos datos.
Prueba con lo que te dice el pato o cambia el formato del documento a alguno que puedas usar con Notepad++

1 respuesta
neiclon

#6 Lo de cambiar el formato es lo ideal (el powerGREP es que es de pago y eso), lo único es que todavía no he encontrado ningún programa masivo que funcione. Son 17.000 archivos docx; he probado varios y siempre se satura el programa, hasta que se bloquea...

1 respuesta
HeXaN

#7 Tiene versión de prueba.

http://download.jgsoft.com/powergrep/SetupPowerGREPDemo.exe

B

.

garlor

#5 si que busca en los archivos docx, solo que los docx supongo que tienen el texto formateado

es como si me dices que quieres buscar todas las imagenes que tengan cierta palabra escrita, has de usar algo que sea capaz de reconocer la palabra dentro del formato, no puedes abrir el archivo directamente y buscarlo

Usuarios habituales