Leçon de webanalyse 1 – La longue traîne des landing pages et la problématique du plan de taggage
Certains de nos lecteurs nous ont fait remarqué que nous ne parlions pas assez de la webanalyse qui pourtant est une de nos passions. Dans un souci de toujours plus partager avec vous, nous avons donc décidé de nous lancer dans un cycle de quelques posts que nous appelerons “leçon de webanalyse” qui vous permettra de progresser avec nous sur le sujet.
Au programme du jour, un sujet évoqué par David Degrenne de 1ere-Position, pendant la convention e-commerce : la longue traîne des recherches, que nous allons aborder sous l’angle des landing pages. Plus concrètement, il s’agit pour vous de comprendre par où arrivent vos internautes… Le problème, c’est qu’a priori, grâce aux moteurs de recherche, toutes les pages de votre site sont une landing page potentielle. Pour les sceptiques, les chiffres moyens indiquent que la page d’accueil ne représente que 30% des entrées de votre site. Dès lors, si vous avez un site simple avec 10 pages, la suite de cet article n’évoquera pas grand chose pour vous. Mais lorsqu’on considère un e-commerçant avec milliers de pages produit, un site de contenu avec des dizaines de milliers d’articles, ou tout simplement un blog avec quelques milliers de posts (démultipliés par les pages de tags), vous vous rendez compte qu’il y a une vraie problématique d’aggrégation des données : impossible d’étudier chaque landing page dans le détail. D’ailleurs, il faut noter que ces pages (fiche produit, article…) ont à chaque fois beaucoup de choses en commun. Si les choses sont bien faites, la struture est identique et optimiser la structure “fiche produit” aura une répercussion sur l’ensemble des fiches.
Mettez en place un plan de taggage
Il existe une problématique d’aggrégation, mais il ne faut pas aggréger à l’aveugle. En effet, il faut segmenter vos catégories de pages dès la mise en place de votre outil de webanalyse en taggant intelligemment votre contenu. Trop de fois nous avons été confrontés à des sites qui taggent l’ensemble de leurs pages de contenu uniquement sous le tag “contenu”. Mais de quoi parle-t’on ? Fiche produit ? Article ? Thématique de l’article ? Il s’agit donc en amont de votre création de site de vous interroger sur le plan de taggage de votre site.
Solution de secours : la catégorisation sous Excel
Si vous n’avez pas eu le réflexe de tagger et de catégoriser finement l’intégralité de vos pages, pas de panique: il reste toujours la possibilité de réutiliser et de nettoyer les URLS pour leur assigner des catégories. Exemple :
Prenons un exemple simpliste : vous êtes un site éditeur de contenu qui publie des articles, des dossiers ainsi que des interviews sur les problématiques suivantes: santé, beauté, psychologie, etc.
Les URLS de vos articles ressembleront (vraisemblablement) à :
http://www.monsite.com/article/santé/la-sante-des-francais.html
http://www.monsite.com/dossier/beauté/les-conseils-de-beauté.html
http://www.monsite.com/interview/psychologie/jean-truc-psychologue-analyse.html
Si par malheur l’extraction fine de ces différentes catégories & tags n’est pas possible dans votre outil de webanalyse préféré, il vous reste la solution du retraitement à la main avec excel.
Ne tenez pas compte de la première partie de l’URL et ne regardez que le texte de l’URL présent à partir du 23e caractère. A droite de la colonne des URLS que vous aurez préalablement extrait dans votre outil, la formule suivante ressortira pour chaque URL la catégorie de chaque URL. Si l’URL ne commence pas par les catégories que vous avez défini, j’ai imposé qu’elle soit par défaut taggée “Divers”.
=si(gauche(A1;23)=”Article”;”article”; si(gauche(A1;23)=”Dossier”;”Dossier”; si(gauche(A1;23)=”Interview”;”Interview”;Divers)))
Pour les amoureux d’Excel, l’imbrication de fonctions “Si” est limitée (autour de 10 “Si” maximum si je me rappelle bien 😉 ); si vous avez plus de 10 catégories, vous devrez procéder en deux ou trois fois.
Remarquez: la formule fonctionne aussi si vous souhaitez regarder si votre système de referer marche correctement. Par exemple, si vous avez choisi de présenter des pages différentes selon le mot-clé tapé dans Google, vous pouvez extraire les parties ?referrer=Google / ?referrer=aol avec la formule droite=si(..;..;si(..;..;si(..;..;..))), et vérifier que les landing pages sont bien personnalisées à chaque fois, et pas de manière parcellaire.
Allez plus loin que les 500 premières lignes : la longue traîne est longue !!!
L’autre enseignement, c’est que l’outil de webanalyse arrive parfois difficilement – même si le plan de taggage est fait correctement – à faire ressortir des enseignements de la longue traîne des landing pages de votre site. N’hésitez pas à opérer des extractions et à faire le travail vous-même… Google Analytics ne permet pas d’extraire plus de 500 lignes en une fois (un peu dommage, non ?); vous devrez donc extraire en 5, 10 ou 15 fois !! D’autres outils comme Xiti permettent d’extraire d’un seul coup, mais il me semble que l’extract est parfois limité à 65000 lignes (à confirmer), ce qui peut être problématique si votre longue traîne de landing page fait 100 000, voire 150 000 lignes – pour les grands sites avec énormément de contenu ou de références produit. Pour info, contrairement à Excel 2003 qui ne gère que 65 000 lignes, Excel 2007 permet de gérer jusqu’à 1 000 000 de lignes, ce qui laisse de la marge pour l’analyse.
Sur l’exemple simpliste que je vous ai cité tout à l’heure, voici le type de data que l’on peut en ressortir avec un simple Tableau Croisé Dynamique (TCD)… Mais évidemment, cela prend beaucoup plus de sens lorsque le taggage est exhaustif et que l’on peut classer chaque URL par type (Dossier, Article, …) et par tag (beauté, santé, psychologie…).
Voilà pour ce premier mini-cours de Webanalyse… n’hésitez pas à commenter si l’explication n’est pas suffisamment claire 😉