Aucun système de statistique et de mesure d’audience pour Internet n’est précis à 100% !

Les statistiques de SPIP

  • concernent uniquement la partie publique
  • par période de 24h commençant à 0h00
  • et ne comptabilisent qu’une visite par IP

À partir de la version 1.9 :

  • Un visiteur est identifié par son IP [1], et on « suit » ce visiteur avec un fichier de visite, qui est mis à jour à chaque nouveau hit.
  • Toutes les 5 minutes SPIP « ramasse » les fichiers datant de plus de 30 minutes, et enregistre les visites dans la base.
  • La nouvelle définition d’une visite est donc : une série de « hits » en provenance d’une même IP, et qui s’interrompt pendant 30 minutes.

Vous avez dit Proxy ?

Prenons les abonnés de Wanamoo [2]. Ils passent tous par des proxy [3] de Wanamoo.

Que voit SPIP ? L’IP du proxy.

→ Tous les n abonnés de Wanamoo qui visitent un site SPIP sont au mieux vus comme x proxy, x étant très inférieur à n

Analyser de logs du serveur web

Urchin, webalizer… se basent sur les logs du serveur web.

→ il ne voient pas les visites passant par un cache.

Outils de stats en ligne

Prenons l’exemple de Xiti. Le code sur la page web appelant Xiti est image ou un javascript traité par le navigateur de l’internaute.

Or un certain nombre de client n’ont pas d’images (ou pas d’images d’un autre serveur, c’est une option anti publicité dans Mozilla FireFox) et/ou pas de javascript.

→ Xiti ne voit pas toutes les visites non plus

Complément d’informations 2018 par Cédric

La différence fondamentale entre les mesures de SPIP et les mesures d’outils comme G Analytics, Matomo/Piwik c’est que SPIP prend la mesure sur le hit PHP là ou les 2 autres outils utilisent un marqueur Javascript.

Par construction ils évitent donc de compter tout robot qui se contente de récupérer la page principale mais n’execute pas le JS (mais du coup ils ratent aussi les éventuels visiteurs sans JS).

A contrario SPIP voit ces visites, mais souvent il compte aussi des bots qui se font passer par des utilisateurs normaux ou dont il ne connait pas le User Agent pour l’éviter.

Comme la nature est bien faite (et SPIP aussi), vous pourriez utiliser le plugin statsjs (kudo Fil) qui va alors compter via un marqueur JS.

  • Avantage : un décompte beaucoup plus proche de celui des autres outils.
  • Inconvénient : ça va charger le serveur Apache car chaque hit d’une page sera doublonné par un hit de comptage de stats (du moins pour les humains, puisque les robots n’appelleront pas le hit JS).

Le plugin statsjs permet aussi de continuer à utiliser les stats de SPIP même si on utilise un reverse-proxy comme Varnish devant.

Conclusion

Aucun système de mesure n’est fiable à 100%.

Celui de SPIP a le mérite :

  • d’indiquer une tendance
  • d’indiquer les liens entrant (et selon le principe du proxy, il est tout à fait possible d’avoir plus de liens entrant que d’IP unique)
  • d’être intégré à l’admin de SPIP

Bref, concentrez-vous sur votre contenu, tenez compte des variations et tendances de visites et écrivez vos textes en fonction de ce qui sera intéressant pour vos lecteurs.

[1En fait un hash de son IP, plus court et moins fliquant. Cette valeur n’est pas conservée en base.

[2Fournisseur d’Accès à Internet majoritaire en France, pratiquant pourtant les tarifs les plus élevés

[3Proxy = mandataire : « qui agit en place de »