Extracción de Metadata con Metagoofil


Metadata
Significa literalmente <<sobre datos>>, son datos que describen otros datos.

Uso: metagoofil opciones...

          -d: dominio a buscar
          -t: filetype para descargar (pdf, doc, xls, ppt, odp, ods, docx, xlsx, pptx)
          -l: límite de resultados para buscar (predeterminado 200)
          -h: trabaja con documentos en el directorio (utiliza "sí" para el análisis local)
          -n: límite de archivos para descargar
          -o: directorio de trabajo (ubicación para guardar los archivos descargados)
          -f: archivo de salida

metagoofil -d victima.com -t pdf -l 20 -n 10 -o reporte -f reporte.html

¿Que es Metagoofil?
-----------------------------
Metagoofil es una herramienta escrita en Python para extraer metadatos de documentos públicos (pdf, doc, xls, ppt, etc) disponibles en los sitios web de destino. Esta información podría ser útil porque puede obtener nombres de usuario válidos, nombres de personas, para usar posteriormente en ataques de contraseña de fuerza bruta. Vpn, ftp, webapps), la herramienta también extraerá interesantes "rutas" de los documentos, donde podemos obtener nombres de recursos compartidos, nombres de servidores, etc.
Esta nueva versión también extraerá las direcciones de correo electrónico de los documentos PDF y Word.

¿Cómo funciona?
-------------------------
La herramienta primero realiza una consulta en Google solicitando diferentes tipos de archivos que pueden tener metadatos útiles (pdf, doc, xls, ppt, etc), luego descargará esos documentos al disco y extraerá los metadatos del archivo usando bibliotecas específicas para analizar diferentes archivos Tipos (Hachoir, Pdfminer, etc.)

Vamos a la acción people...
Comandos: metagoofil -d idat.edu.pe -t pdf -l 20 -n 10 -o reporte -f reporte.html
Como podemos observar ya termino el proceso, automáticamente nos arrojó los resultados para verlos desde la terminal pero algo que recalcar nos genero el reporte en un archivo que le pusimos reporte.html e incluso descargo documentos .pdf de sitio web.
Lo vamos a abrir con nuestro navegador preferido.



Como ven podemos visualizar los resultados con mas detalles...
Ahora veremos los .pdf que nos genero con el nombre que le dimos en un principio genero la carpeta reporte y dentro extrajo los pdf del sitio web, ahora podemos sacar todos los metadatos con la herramienta ExifTool que lo deje en un post pasado en este mismo blog mi gente.



Espero que les haya sido de utilidad este humilde post, nos vemos hasta una nueva oportunidad people.
#########################################################################
Descarga de Metagoofil:
Tutorial:
Mi Fanpage:

Greetz: Hiro Maxwell
Atte: Jey Zeta

Comentarios

Entradas populares