Web Analytics

Un article de Wikipédia, l'encyclopédie libre.

Les Web Analytics regroupent la mesure, la collecte, l'analyse et la présentation de données provenant d'Internet utilisées afin de comprendre et d'optimiser l'utilisation du Web.

Dans un contexte de vente en ligne, les Web Analytics font référence à la mesure d'aspects d'un site web liés à la stratégie commerciale de l'entreprise comme, par exemple, quelles sont les pages web ayant conduit au plus grand nombre d'achats en ligne ?

Sommaire

[modifier] Les technologies utilisées

[modifier] L'analyse des logs

Un log (anglicisme) est un fichier texte regroupant l’ensemble des événements survenus sur un serveur web incluant les requêtes et les réponses. Les fichiers logs sont des fichiers générés par les serveurs web à chacune de leurs transactions. On peut en modifier le format pour les rendre plus compatibles avec les différents outils d'analyse.

[modifier] La pose de marqueurs ou 'tags'

Le manque de précision de l'analyse des logs ont conduit au développement des technologies de marqueurs, appelés en anglais 'tags' [1] Les marqueurs ou 'tags' sont généralement des appels d'images invoqués par Javascript dans le code de la page web. ( à compléter )

  1. on parle aussi de web beacons ou de web bugs (mouchards)

[modifier] Logs ou tags?

[modifier] L'avantage des logs

Les logs sont générés par défaut par le serveur web. Ils suivent [#Liens_externes différents formats] relativement standardisés.

[modifier] L'avantage des tags

Les tags utilisent Javascript pour définir des variables ou des évènements à traquer. Comme le code Javascript est exécuté à chaque visualisation de la page web, on court-circuite ainsi le système de cache du navigateur en rendant plus exhaustif le suivi du trafic, des variables et des évenements.

[modifier] Méthodes mixtes dites 'hybrides'

Certains outils de web Analytics, comme Webtrends, utilisent une méthode hybride qui consiste à insérer par Javascript (via un serveur séparé) les informations correspondants au tags dans les logs.

[modifier] Autres méthodes

L'analyse de trames réseau (en anglais packet sniffing), permet d'observer l'activité réseau d'un serveur web et d'en déduire son traffic. A l'instar d'une solution de type logs, on y perd les notions d'évènements et d'interactivité.

[modifier] L'argument financier

Les logs sont générés automatiquement par le serveur web mais peuvent, au bout d'un certain temps, représenter une masse de données assez considérable (plusieurs gigaoctets. Il devient préférable de générer des logs par semaine ou par mois de l'année. Ces logs doivent être stockés et pouvoir être aussi accessibles et transférables que possible.

Les méthodes à base de tags stockent souvent leurs informations directement dans une base de données qui sert par la suite à générer les rapports.

[modifier] Définitions et vocabulaire

  • Pages vues: désigne le nombre de fois où une page web est affichée ('rendue') dans un navigateur web. On parle aussi d'impressions.
  • Visites: Une visite est définie comme une série de pages web consultées de façon consécutive durant un laps de temps défini. On parle aussi de sessions.
  • Visiteur / visiteur unique: Un visiteur est un internaute qui:
    • consulte une série de pages web consécutives (détectées par les tags)
    • effectue une série de requêtes Web (enregistrées dans les logs)

Le caractère unique vient de l'attribution d'un identifiant unique : numéro de session (log) ou cookie.

[modifier] Les différents acteurs du marché

  • CoreMetrics
  • Edatis
  • eStat de Médiamétrie
  • Google Analytics
  • IndexTools
  • Nedstat
  • Omniture
  • phpMyVisites
  • Piwik
  • Unica
  • WebTrends
  • XiTi

[modifier] Méthodes liées aux web Analytics

[modifier] Les problèmes inhérents aux cookies

Deux attributs caractérisent un cookie en termes de web analytics: son domaine et sa date d'expiration. C'est d'ailleurs très souvent la date d'expiration du cookie qui détermine l'unicité d'un visiteur.

Si le domaine est le même que celui du site qui est consulté, on parle de cookie d'origine (en anglais: first-party cookie). En revanche, si le domaine est différent du site consulté, on parle de cookie tiers (en anglais: third-party cookie). La plupart des cookies tiers sont générés par des sites d'annonceurs publicitaires ou de ciblage d'audience Internet.

Les cookies tiers sont très souvent la cible d'outils ou de filtres anti-spyware ou anti-publicitaires qui bloquent la création de ces cookies. En ajoutant à cela les différents mécanismes d'effacement des cookies, les chiffres concernant les visiteurs uniques peuvent être réduits de 5% à 40%. Ce grand écart est une estimation car il est extrêmement difficile d'évaluer avec précision le taux de blocage et/ou d'effacement des cookies.

De manière générale, les cookies d'origine sont moins sujets au blocage car jugés moins intrusifs que les cookies tiers mais demeurent quand même sensibles à l'effacement.

[modifier] Campagnes: pages personnalisées ou liens entrants?

[modifier] Voir aussi

[modifier] Liens internes

[modifier] Bibliographie

  • Web Analytics Demystified by Eric T. Peterson, Celilo Group Media (2004), ISBN 0-9743584-2-8.
  • Web Site Measurement Hacks by Eric T. Peterson, O'Reilly (2005), ISBN 0-596-00988-7.

[modifier] Liens externes