Extraer enlaces internos de una web

Dado a una nueva idea que tuve, necesitaba extraer los enlaces internos de ciertas páginas en concreto.  Hacer el trabajo manualmente sería como apagar el pc e irme a recoger naranjas (nada en contra, es un simple ejemplo) entonces necesitaba algo que me ayudase para agilizarlo.

Que yo sepa y haya encontrado sólamente hay 2 opciones ágiles y ambas necesitan el uso de Firefox. La primera me costó muchísimo encontrarla, se llama Link Gopher y realiza exactamente lo que estoy buscando y nada más: extrae todos los enlaces de una página web, los ordena, quita los dulpicados te los muestra en una nueva pestaña listos para copiar y pegar >:]

La segunda es utilizar SEO Quake: el addon tiene muchisimas funciones interesantes relacionadas con el SEO que no me voy a poner a explicar, una de ellas es ver los enlaces internos de una determinada página web con sus respectivos datos (Alexa, PR, etc.) y poder guardarlos en formato CSV para luego utilizarlos.

Ambas realizan lo que quiero y si algún día necesitas hacer lo mismo ya tenés la solución.

7 comentarios en «Extraer enlaces internos de una web»

  1. Pues a ver que os parece esta herramienta. Es un programita bastante ligero que se llama «xenu». Con ponerlo en google sale en primera posición(a mí).

    A parte de rápida. Lo que más valoro es que pinchando con boton derecho en propiedades sobre los enlaces rotos, te dice de donde viene para arreglarlo en un periquete.

  2. Hola, que interesante ! lo que quiero preguntar es si puedo extraer de esa pagina web (Vademecum.com) los registros de las tablas de la base de datos en formato de excel o word.
    En caso de que no se pueda, fijate que compre el cd de Vademecum , (que en realidad es un buscador de medicinas y su principio activo), pero tampoco me deja ir a los registros de la base de datos, como podria desencriptar el disco e ir a la carpeta que contiene los datos.
    Muchas gracias y felicidades por tu blog.
    Saludos desde Mexico

  3. Gracias tio, estaba matado porque quería bajarme tela de fondos de pantalla de una página con neodowloader, pero no podía porque había mas enlaces en la página.
    Ahora cojo todos lo enlaces y se los baja…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *