Le paysage des outils de monitoring Web est resté presque identique pendant plusieurs années.

Les outils gratuits, Diphur, FollowThatPage, PageMonitor, WatchThatPage, Change Detection,…

Les outils payants à plusieurs dizaines de milliers d’euros par an, Keywatch, Digimind, AMI Software, …

Entre les deux, WebSite Watcher puissant mais d’une ergonomie BAC+20 et KB-Crawl proposant un crawler et une plate-forme de diffusion NOT User friendly.

 

Dans cet environnement plutôt statique un outil sort du lot suite à son arrivée en 2013. Cet outil est le fruit de 10 ans de R&D. L’esprit qui a animé sa conception et qui continu de nourrir son développement est d’offrir un outil de surveillance très simple à utiliser.

TadaWeb (http://www.tadaweb.com/) n’est pas un crawler, il ne stocke aucune donnée, mais un outil qui utilise des “recettes”  (Tadas) qui ré exécutent automatiquement des processus effectués auparavant de façon manuelle ; se connecter sur un site, cliquer sur un lien, remplir un formulaire, sélectionner une partie de texte, …

TadaWeb est constitué des deux interfaces distinctes :

  • Le creator,  est un logiciel qui s’intalle sur le poste de l’utilisateur et supporte tous les environnements (Mac, Windows, Linux), interface de paramétrage et d’administration
  • L’interface web qui permet de gérer la consultation des résultats, leur diffusion, ainsi que les fonctions collaboratives (partage, annotation, …)

 

Le creator

Le creator comprend trois espaces distincts :

  • la colonne d’outils (à gauche),
  • le tableau blanc ou espace de travail (au centre),
  • le navigateur interne à droite.

laptop_creator

Les six fonctions principales du creator sont :

1 – Sélection des sources, outils d’extraction et de transformations

2 – Gestion des requêtes

3 – Gestion et structuration de l’information

4 – Extraction et consolidation de la veille stratégique

5 – Sauvegarde et ré exécution des requêtes

6 – Visualisation et analyse des sources

 

Les éléments disponibles sont répartis en différents onglets qui correspondent à la structure que doit respecter un Tada pour fonctionner :

  • Définir des sources,
  • indiquer quelles données extraire à partir de ces sources
  • préciser comment les transformer

 

L’onglet Source de définir la ou les sources à surveiller, c’est un principe que l’on retrouve sur les outil comme KB-Crawl ou KeyWatch, à l’opposé des plateformes qui proposent des bouquets non paramétrables ; ici le module URL permet de paramétrer la surveillance de n’importe quelle page Web, tandis que le module RSS permet de lire les flux.

Des modules plus précis permettent d’accélérer le paramétrage de notre veille concurrentielle :

  • Modules sur les moteurs de recherche (Google; Bing, Yahoo, …)
  • Modules sur les réseaux sociaux (Facebook, Twitter, Linkedin, Google+, Youtube, …)
  • Module business (Crunchbase)
  • Module offres d’emploi (Indeed)

Capture

L’onglet Extract rassemble l’ensemble des outils d’extraction des sources définies dans l’onglet source ; il est possible d’extraire une liste, une tableau, une image, un lien, …

Il est possible aussi possible d’extraire un formulaire, utile quand on souhaite ré exécuter automatiquement un requête sur le moteur de recherche interne d’un site. Enfin on peut extraire un flux RSS, en apparence, mais l’utilisation du module “Extract RSS” va permettre de dénicher le flux RSS caché et de l’utiliser pour surveiller les nouveautés.

Une perle dans l’extraction et le module “Extract Knowledge” ; il s’agit d’une module d’analyse sémantique et d’analyse de sentiment qui peut en outre détecter les entités nommées. Le résultat est restitué sous la forme d’un tableau contenant la liste des pays, villes, personnes, sociétés, … localisés dans la page de manière intelligente et automatisée ; ensuite cette liste est utilisée dans les modules de recherche afin de fournir une grappe d’information dans le but par exemple de simuler un organigramme d’entreprise ou d’extraire les décideurs de vos concurrents.

 

L’onglet Transform contient des modules qui achèvent le processus automatique en transformant les données de différentes manières :

  • Le module “Filter” permet de filtrer par mots clés,
  • le module “Transform” permet de supprimer ou conserver des lignes au sein des listes
  • le module ‘Merge” permet de fusionner des listes, utile par exemple pour rassembler les fils Twitter
  • le module “Remove Duplicate” permet d’éliminer les doublons
  • le module “Navigate” permet de cliquer automatiquement sur le premier lien de la zone surveillée,
  • le module “For Each Loop” ré exécute automatiquement la même opération sur tout les éléments d’une liste

En combinant ces deux derniers modules, on peut donc cliquer sur tous les liens d’une section d’actualité pour en récupérer le texte qu’on pourra par exemple filtrer ensuite par mot clés.

D’autres fonctions plus basiques permettent de séparer, combiner, comparer les données extraient.

 

Une fois fabriquée, la recette peut être sauvegardée, lors de cette étape il va être déterminé la structure du rapport de veille :

  • Titre,
  • table des matières,
  • sections,
  • sous sections

Avec chaque fois les différents flux de données qu’on y aura rangés.

L’interface web

La consultation de ces Tadas s’effectue sur l’interface Web.

laptopscreen2

  1. Accès à vos TaDa, alertes et archives,
  2. Affichage rapide des informations et analyses
  3. Partage de l’information avec vos équipes
  4. Alerte et nouveaux contenus

 

Il est possible de consulter un Tada en cliquant dessus, les derniers résultats disponibles depuis la dernière consultation sont surlignés ; il est possible en amont de paramétrer des alertes par mails.

Son tableau de bord est exportable en pdf et accessble en API JSON. TadaWeb ne stocke aucune donnée, ce qui oblige l’utilisateur à consulter ses rapports de veille au moins une fois par jour.

Il est possible de concevoir un journal qui peut regrouper jusqu’à 6 Tadas. Ce journal peut être exporté en pdf et partagé au moyen d’un lien secret, y compris avec des personnes non membre de TadaWeb.

Il est enfin possible de partager un Tada ou un journal avec des collaborateurs et de gérer des groupes à visibilité réduite ; le tout afin de favoriser l’échange par des commentaires et des notations.

 

Pourquoi mettre en avant TadaWeb, il est abordable (3 000 euros / an), simple d’utilisation et performant, l’idéal pour se mettre à automatiser sa veille stratégique.

 

Un peu de teasing …  de la veille stratégique à la e-réputation avec sindup (http://fr.sindup.com), une autre approche de la veille stratégique.