Un outil pour scrap

Scrap ou scraping, c’est le moyen de récupérer les données d’un sites en « affichant » les pages webs. Ca fait un bout de temps que j’en cherche un pour des projets perso ou pour le boulot (j’ai des outils qui ne me permettent pas de faire d’extracts :'().

Et, j’ai enfin trouver quelque chose qui me plait.

logo de BAS scrap

Il s’agit de BrowserAutomationStudio (ou BAS) disponible ICI. Je l’ai trouvé après être tombé sur une vidéo youtube traitant de Zenoposter (un autre outil de scrap) mais trop cher pour moi (100€).

Honnêtement, malgré mon manque de point de comparaison le peux que j’ai testé BAS il semble adapté à ce que je veux faire. Les guides de débuts (ICI) sont vraiment bien expliqués (en anglais ou en Russe (oui bon ça va)). Et commencent avec un exemple très concret: scrap / parser les résultats d’une recherche Google sur X pages.

C’est le type d’outil (comme AHK) que je qualifie de « crade » mais parfois indispensable. Par exemple, avec AHK j’ai scripté un truc que tout le monde qualifiait d’impossible à automatiser… ça a été repris et amélioré et maintenant on peut configurer l’équipement à distance avec une configuration Usine.

Bref, j’ai quelques idées dont:

  • Récupérer des images par thématique sur des bibliothèques
  • Analyse de mots clés
  • Extraire des listes de snipets
  • Poster mes snipets perso sur mon wiki perso (vraiment la flemme de le faire à la main)

Si je trouve des astuces je t’en parlerai, promis =)

A+ =)