Piwik par l’exemple, avec les stats d’Octobre

closeCet article a été publié il y a 9 ans 4 mois 18 jours, il est donc possible qu’il ne soit plus à jour. Les informations proposées sont donc peut-être expirées.

Piwik est un logiciel libre qui se veut être un remplaçant à Google Analytics. Mais justement, à quoi sert un tel outil, qu’il soit centralisé (Google) ou maison (Piwik) ? Que permet-il de faire ? Principal usage, de l’analyse de trafic d’un site web : nombre de visiteurs, pages vues… Avec la méfiance toujours plus grande dans les services US, et surtout le comportement de Google, Piwik permet de reprendre le contrôle sur ces données qui vous concernent forcément un peu en tant que visiteur. Car vous le verrez, on en apprend des choses.

C’est quoi le « web analytics » ?

Il s’agit de recueillir et analyser les données de visites d’un site web (son audience). Les possibilités sont multiples : nombre de visites, origine, suivi sur le site, type de matériel… Une quantité de données qui permettent un profilage plus ou moins fin des visiteurs, pour des objectifs multiples : optimisation du type de contenu à produire en fonction du nombre de vues des articles précédents, analyse de comportement pour optimiser le contenu publicitaire et donc la monétisation, analyse des dispositifs de visionnage pour orienter les évolutions de la charte graphique (un site à forte audience mobile mettra une plus grande attention dans un design responsive léger pour optimiser l’affichage sur les smartphones)… Bref, Une fois les données collectées, les possibilités de traitement sont nombreuses quelque soit l’éthique derrière.

Je l’avais annoncé dans le billet anniversaire, j’utilise Piwik depuis quelques mois pour collecter des statistiques sur ce que regardent les visiteurs, et surtout combien ils sont. Une curiosité du même type de celle qui m’a poussé sur MongoDB par exemple. Par nature l’outil collecte bien plus de choses, et on verra ce qui m’intéresse seulement, et aussi combien l’outil est plus respectueux des visiteurs que Google.

Piwik est une application Web

Ça parait bête dit comme ça, mais après tout, puisqu’on analyse le trafic d’un ou plusieurs sites web, il n’est pas idiot d’avoir un outil d’analyse lui aussi sous la forme d’un site web. En l’occurrence, Piwik est une application utilisant PHP et une base de données MySQL/MariaDB. Et évidemment un serveur Web, Apache ou Nginx, les plus répandus conviennent parfaitement (je n’ai pas testé les autres). Et il se met à jour directement depuis l’interface de l’application, un peu à la manière de WordPress. Je l’ai installé à côté du blog, sur son propre sous-domaine accompagné de son propre vhost Apache, mais il est tout à fait possible de l’installer comme un sous-dossier d’un site existant. L’application est fournie avec un assistant d’installation très simple et très bien fait qui demandera, entre autres, le chemin d’installation. On le récupère sur cette page. Sur le site on voit que Piwik propose aussi de l’héberger pour vous, moyennant finance évidemment. Mais on perd un peu d’indépendance, alors que c’est ce qu’on cherche en théorie avec un tel outil.

Note : à ceux qui penseraient que ce projet est réservé à de petites structures, sachez que des organisations telles que Sharp, T-Mobile, Wikimedia Allemagne, Forbes l’utilisent. Et je pense qu’ils tiennent autre chose qu’un petit blog perso.

Pour vous faire une idée, je vous conseille d’aller tester la démo sur le site officiel.

Piwik vous laisse le contrôle

Piwik étant un outil à installer « localement », les données qu’il collecte sont « exclusives », comprenez qu’en tant qu’administrateur du site aucune entité n’y a accès tant que vous ne le voulez pas. Et c’est une base de données MySQL, donc vous avec toute latitude sur la forme des données. Vous avez la possibilité de passer soit par Javascript, soit par une image pour collecter les données (une méthode qu’utilisent Facebook, Twitter, Google et autres à chaque fois que vous voyez les boutons de partage sur un site, que vous partagiez ou pas : ils savent que vous avez lu l’article, même s’ils ne vous le disent pas). Du côté utilisateur, Piwik respecte la recommandation Do Not Track, un signal qui est envoyé par votre navigateur pour indiquer au site web de ne pas enregistrer les informations vous concernant. Il est possible aussi dans la configuration de l’application de choisir la finesse de certaines données récoltées. Vous avez aussi la possibilité d’installer un cookie pour interdire à Piwik de collecter les données.

piwik-privacy

Le problème de DNT, c’est que le site peut choisir d’en tenir compte ou pas. Autant dire que la majorité des sites embarquant de la pub Google et autre se torchent avec, puisque c’est leur fonds de commerce (comme on a l’habitude de dire, si c’est gratuit, le produit c’est vous). Ceux qui utilisent Piwik vous respectent donc plus que Google.

Et sur le blog, ça donne quoi ?

Plusieurs précisions avant de vous balancer du chiffre comme ça : Do Not Track est activé et respecté, la collecte se fait par Javascript (au moyen de l’extension wp-piwik). Il est donc certain que je n’ai pas l’intégralité des visiteurs. Ne soyez pas non plus choqué par le détail de certaines données : elles paraissent trop nombreuses, mais elles sont, en grande majorité, utiles. Comme toujours, certains les utiliseront à mauvais escient (GAFA- Google, Apple, Facebook, Amazon-, NSA…), personnellement, vous allez juste satisfaire ma gourmandise en matière de curiosité. Bref, j’en reparlerais probablement quand l’installation aura un an, mais pour la présentation j’ai décidé de me concentrer sur les données du mois d’Octobre.

Côté contenu j’ai publié six articles, du barbu /proc , ainsi que bash et nano/vi, en passant par du plus graphique Sublime Text 2, pour finir sur la personnalisation de Firefox et enfin une pause télé. Soit un tous les cinq jours en moyenne. Ajoutez les cinquante-six articles précédents, et vous avez une soixantaine d’articles dans lesquels piocher astuces, présentations, tests, orientés plus ou moins techniques, bref, dans l’absolu peu de contenu (le blog est jeune), mais du contenu relativement varié. Je n’en suis pas encore, à l’image d’un Frédéric Bezies, ou d’un Cyrille Borne (gourou du Blog libre), à vous conseiller musique et bédés, mais ça se pourrait un jour. Après tout, j’ai deux articles sur le jeu vidéo à mon actif, alors sait-on jamais…

Visites

J’ai donc 1479 visites sur le mois d’octobre, pour 2311 pages vues, dont 1985 uniques (ce qui veut dire que certaines pages reviennent souvent). 70% de ces visites ne l’ont été que sur une seule page. J’ai un record de 25 actions pour une seule visite, ce qui veut dire qu’un visiteur a fait 25 « clics », que ce soit pour des articles, des catégories, des enregistrement de photos, des liens externes…

Comme DNT est activé, le chiffre de visites réel est probablement un peu plus grand. Ne pas oublier aussi que les web crawlers (les robots des moteurs de recherches divers et variés connus) sont ignorés des statistiques, ce sont donc des données réelles qui tombent.

Nombre de visites quotidiennes sur le mois d'octobre

Nombre de visites quotidiennes sur le mois d’octobre

Du côté de l’origine (appelé référent), 71% des visites viennent de moteurs de recherche. Dans le détail je suis assez surpris, même si je ne dispose pas systématiquement des mots-clés recherchés (oui car on peut parfois les avoir aussi), de voir certains résultats assez bien classés dans Google, alors que je ne suis pas particulièrement attentif au référencement. Je n’ai d’ailleurs jamais demandé à Google de scanner le blog, il l’a fait tout seul. 21% sont des entrées directes, donc saisies dans la barre d’adresses ou en marque-pages du navigateur (techniquement, toutes les entrées pour lesquelles le référent n’existe pas). Enfin, 8% proviennent d’autres sites : blogrolls, lecteurs de flux RSS, réseaux sociaux… Je remercie tout particulièrement la-vache-libre.org qui constitue la première source externe hors moteurs de recherche, devant Twitter sur lequel je poste automatiquement la sortie d’un nouvel article (qui est visible par leur raccourcisseur d’url, t.co). Les visites depuis certains blogs s’expliquent par le fait que lorsque je commente, je renseigne le blog dans l’adresse de site web.

Petite anecdote sur le fait que vous ne pouvez pas tout maîtriser : bien que je n’y soit absolument pas présent, j’ai deux entrées qui viennent de Facebook (dont une du site mobile). Après tout, dans les boutons de partage (qui sont fait maison, donc sans traçage), il y en a un pour Facebook. Sectaire mais pas trop 😛

D’ailleurs, Piwik vous permet aussi de suivre spécifiquement l’évolution sur les réseaux sociaux, et vous présente aussi un zoli graphique (quand j’en ai fait d’autres maison pour ce billet) :

piwik-socialnetworks

Dernier point : la popularité. L’article le plus consulté est celui sur OpenELEC, pourtant publié au mois d’Août. En excluant la page d’accueil, le podium se poursuit avec l’article sur sudo, et en bronze, la réflexion sur le serveur perso. Fait étonnant, pratiquement tous les articles ont été consultés au moins une fois. Piwik vous permet de suivre l’évolution pour chaque article, avec chiffres et graphiques.

Moteurs de recherche

Côté moteurs de recherche, sans surprise, l’écrasante majorité vient de Google, suivi par Google Images compté à part. Quand je dis écrasante, c’est que derrière, j’ai cinq Yahoo, un Ask (probablement un Windows qui a été infecté par du spyware), et un DuckDuckGo, ce qui n’est vraiment pas assez. Donc 99% de Google. Et on se demande pourquoi la NSA ne s’embête plus à taper dans leur énorme masse de données hein…

piwik-searchengines

À noter qu’il m’est arrivé sur les autres mois de voir passer de temps en temps du Bing. Mais toujours trop, trop peu de DuckDuckGo. Par contre, je ne m’étendrais pas sur les mots-clés, parce que dans beaucoup trop de cas, ils ne sont pas récupérés (1020 « Mot clef indéfini »). L’explication de la FAQ indique que les moteurs ne renvoient pas le mot-clef pour des raisons de vie privée (mouais, Google ne le renvoie pas seulement si le compte Google est renseigné, mais il le se le garde tout de même pour Google Analytics; à part ça tout va pour le mieux dans le petit monde de l’abus de position dominante…).

Navigateurs

Commençons dans l’aspect technique avec une donnée assez simple, le navigateur utilisé pour venir sur le site. De nos jours, la multiplicité des appareils et des systèmes d’exploitation est heureusement balancée par la disponibilité étendue de navigateurs multiplate-formes, tel Firefox, qu’on retrouve sur PC Windows et Linux, Mac, Android (smartphones et tablettes). Les navigateurs sont d’abord classés par famille, et il est possible d’aller dans le détail ensuite. Allez, voici un petit camembert fait maison :

piwik-browsers

Si dans l’absolu j’ai le poil qui se hérisse à la vue d’autant de Chrome, ça se calme un peu quand on sait que Chromium est inclus dedans (même si minoritaire), ainsi que Chrome Mobile (imposé par Google dans les versions récentes d’Android), et il faut se taper le rapport détaillé pour avoir les vraies stats du mauvais élève (pareil, les utilisateurs d’Iceweasel sont regroupés dans Firefox). Enfin, le mauvais élève, c’est le visiteur, car si on regarde un peu dans le bordel que constitue le détail, notamment du côté de Chrome dont manifestement tout le monde se fout, j’ai recensé pas moins d’une vingtaine de versions différentes. Oui, certains utilisent encore Chrome 11, allez pas me demander pourquoi. Et non, du côté de Firefox, pas mieux puisque plusieurs visites sont encore faites avec Firefox 3.6, qui n’est plus mis à jour depuis… plus de deux ans. Pour ceux-ci, sachez qu’il n’est pas question simplement de fonctions ajoutées ou de changement d’interface. La sécurité est de nos jours plus primordiale que jamais, et vous êtes des passoires.

En parlant de passoires, plus de 80% des visiteurs ont Flash, ou Java, ou les deux. Essayez dans la mesure du possible de vous en passer, ou de ne pas les laisser activés par défaut (l’activation à la demande de Firefox sera d’un grand secours, et il force maintenant la désactivation des anciennes versions des plugins, tel Java qui laisse TOUTES les versions successives du plugin, dont le retrait sous Windows est compliqué sans bricolage).

Systèmes d’exploitation

Considérant que 1268 visites sont regroupées dans la catégorie Bureau, il ne sera nullement surprenant que 890 soient des Windows, soit un peu plus de 70%. Derrière se trouve Linux avec 283 visites, suivi par Android, Mac OS, iOS. Un dernier groupe minuscule composé de Blackberry OS (!) Chrome OS, Windows Mobile (en réalité Windows Phone) et Unix (re !) qui totalise sept visites ferme la marche.

piwik-os

Pareil, dans le détail, c’est très fouillis, avec dans les OVNIs, un FreeBSD (probablement l’Unix), un Windows NT (pas encore à la retraite manifestement), huit iOS 8.1 alors que le système vient à peine de sortir, quinze OS X 10.10 Yosemite (pareil) et, horreur, 85 passoires Windows XP. Un Windows 10 vient compléter le tableau des étrangetés (celui-ci étant en plein développement).

Résolutions

Pourquoi faire un chapitre dessus ? vous allez comprendre. Voyons d’abord le top 4 (les deux « derniers » étant ex-aequo) :

  • 1920*1080
  • 1366*768
  • 1600*900
  • 1680*1050

Bien, mais ces résolutions qui sont au moins HD-ready ne représentent que 726 visites, soit 49%. Les 51% restants se composent de 110 résolutions différentes. J’ai donc eu raison de préparer le terrain et de choisir dès le départ le thème Responsive, conçu pour s’adapter à une large palette d’écrans. Et donc pour reprendre mes griefs sur les versions de navigateur, le côté Responsive s’apprécie mieux avec un navigateur récent.

La plus petite résolution est un extra-terrestre dont peu de monde devinerait la signification, tant elle paraît faible : 276*80. Il s’agit en fait d’une « mésinterprétation » des infos provenant d’un navigateur en mode texte, elinks (c’est moi, cherchez pas). Sinon, c’est 320*450, ce qui est tout de même assez faible (un smartphone de la taille d’un Galaxy Ace, par exemple). La plus balaise, et là, c’est du jamais vu pour moi, c’est 6048*1080. Ce qui paraît débile puisque j’ai une largeur max prévue pour un seul écran (le bloc de texte principal prend 66% de la taille globale), et à l’instar de certaines résolutions qui font penser à un écran à la verticale, il aurait été plus avisé pour avoir plus de contenu de se concentrer dessus (mon oncle a procédé de cette façon avec son deuxième écran à la verticale, pour faciliter la lecture de documents). Pour un seul écran c’est 2560*1600 le maximum, ce qui est déjà très confortable.

Conclusion

Piwik est donc un outil permettant de traiter une masse conséquente d’informations. Il permet, en outre, de gérer des événements spéciaux, de suivre d’éventuelles campagnes, de créer ses propres variables de suivi, se préparer des objectifs (notamment publicitaires)… Bref, un outil taillé pour les professionnels du Web qui chercheraient à trouver ou retrouver une indépendance qui devrait rester le propre d’Internet. Ne pas oublier que le Web et les moteurs de recherche existaient déjà avant Google. Je parlais du respect, mais pour peu que vous ayez un compte Google renseigné sur votre mobile, ou que votre navigateur reste connecté dessus (cookie), eh bien Google est capable de dresser, avec votre nom collé dessus, la liste des sites que vous visitez. En clair, il vous espionne en permanence, pire qu’une petite amie jalouse (ou un petit ami jaloux, mais personnellement ça ne me concerne pas 🙂 ).

Ah oui aussi, je ne me suis concentré que sur les données disponibles depuis l’interface Web (certaines s’affichant dès le dashboard, sur lequel on peut régler la plage temporelle des données). Dans quelques temps, on pourrait s’amuser à suivre l’évolution des OS ou des navigateurs, un peut comme l’a fait Next INpact sur cinq ans. Pour des traitements plus lourds, on appréciera dès lors le fait que la base de données soit stockées sur un serveur MySQL. Certains sites le font aussi avec un outil fait maison, à base de MongoDB. Enfin bref, l’analyse d’audience est un outil « standard » pour tout Webmaster qui cherche comment faire évoluer son site.

3 Commentaires
Le plus ancien
Le plus récent
Commentaires en ligne
Afficher tous les commentaires
trackback
Tracking sur le blog avec Piwik - Julien Doclot
27/05/2015 17:30

[…] car je l’avais déjà utilisé auparavant. Mais grâce à une article de mon cher ami Seboss666, j’ai décidé d’installer […]

trackback
Analyser l’audience de votre site web avec Piwik | Le blog d'Hugo
16/06/2016 13:08

[…] les mots-clés, comme l’écrit Seboss666 sur son blog les mots-clés ne sont pas renvoyés par les moteurs de recherches, […]

trackback

[…] les mots-clés, comme l’écrit Seboss666 sur son blog les mots-clés ne sont pas renvoyés par les moteurs de recherches, […]