Importer une liste de liens dans Firefox et vérifier leur validité

Voici une astuce qui permet, en utilisant Mozilla Firefox et quelques extensions qui vont bien, de faire un premier écrémage sur une liste d’URLs (qui a parlé de scrap?) quand on a juste un navigateur à disposition   : différencier les liens valides et  invalides

Si on ouvre un fichier texte sous Firefox, on se retrouve avec une liste de liens bruts qui n’est pas vraiment exploitable.

Linkification est une extension qui permet de rendre un lien non cliquable, cliquable.
Son fonctionnement est assez simple : elle se contente de rajouter une balise <a> avant et après chaque lien détecté (allez faire un tour dans les options, il y a pas mal de paramètres qui peuvent être modifiés)
Sur mon poste, avec un fichier texte de 330 Ko qui contient ~5000 URLs, il faut lui laisser 4-5 minutes pour toutes les rendre cliquables.

Au passage, si vous avez l’extension Web Developer installée, en faisant ‘Voir Source‘ puis ‘Voir le code source généré‘ vous récupérez la page HTML avec les liens hypertexte.


LinkChecker est une extension qui permet de tester tous les liens <a href> d’une page : elle met en surbrillance chacun avec une couleur différente selon son état :
– Vert  : les liens valides
– Rouge : liens invalides, c’est à dire les codes d’erreurs http  (les codes http 30x, 40x et 50x) ou les Timeout
– Gris : les liens exclus. Ils correspondent à ce qui est renseigné dans les options de l’extension (dans l’onglet ‘exclusions‘) et apparemment tout ce qui n’est pas en http (protocoles mails, FTP, …)

La blague du siècle c’est qu’en la testant sur le site du développeur, tous les liens sont bons sauf le lien vers linkCheck qui renvoie un 404 🙂

Test de liens avec l'extension Firefox LinkChecker
En vert les liens valides, en rouge le lien cassé et en gris le lien exclus

 

Un fichier de test est disponible sur geckozone si vous voulez tester ces 2 extensions Firefox.

Pour résumer, vous importez votre fichier brut, ensuite, linkification transforme chaque lien en URL cliquable puis LinkChecker va toutes les tester une à une et vous indiquer leur état.

Cette méthode, qui détourne l’utilisation principale des navigateurs, n’est pas fiable à 100% mais peut dépanner quand on a que ça sous la main

Post Comment