racine uZine

Dans la même rubrique
Mise en page : manuel de référence
26 mai 2003
16 août 2002
15 juin 2002
11 décembre 2001
7 décembre 2001
2 juin 2001
24 mai 2001
22 mai 2001
20 mai 2001
18 mai 2001
16 mai 2001
14 mai 2001
3 mai 2001
 
mercredi 31 juillet 2002

La « popularité » des articles

par l’équipe de SPIP

La notion de popularité, exposée ci-dessous, apparaît dans SPIP 1.4.

- Comment décompter des visites

Des centaines de méthodes statistiques existent pour décompter des visites sur un site donné. La plupart donnent des courbes horaires, ou par jour, qui permettent de savoir si son site « monte » ou « descend », et de vérifier qu’il y a plus de gens sur le net en fin d’après-midi et dans la semaine, que le week-end ou la nuit...

Notre objectif est un peu différent : il s’agit d’attribuer à chaque article une valeur de « popularité » reflétant assez rapidement une tendance, et permettant de comparer l’activité de différents articles, soit de manière globale sur tout le site (hit-parade), soit à l’intérieur d’une rubrique, soit parmi les articles d’un même auteur, etc.

La méthode retenue est la suivante :
- chaque visite sur un article ajoute un certain nombre de points à cet article ; 1 point si c’est un article que l’on consulte depuis le site lui-même en suivant un lien, et 2 points si c’est une « entrée directe » depuis un site extérieur (moteur de recherche, lien hypertexte, syndication...)
- toutes les 10 minutes, le score obtenu est multiplié par un petit facteur d’escompte, qui fait qu’un point attribué par une visite à 10h12 le mercredi ne vaut plus, le lendemain à la même heure, qu’un demi-point, et, le vendredi à 10h12, un quart de point... ;
- le tout est calculé de manière à ce que, dans l’hypothèse où l’article reçoit toujours le même nombre x de visites par unité de temps, son score se stabilise sur cette valeur x. Autrement dit, si la fréquentation de l’article est stationnaire, sa popularité finira par refléter exactement son nombre de visites par jour (modulo le score 2 donné pour les entrées directes) ;
- cette popularité s’exprime de deux manières : l’une, la popularité_absolue, exprime le score en question (évaluation de la fréquentation quotidienne de l’article) ; l’autre, la popularité_relative, un pourcentage relatif à l’article du site ayant la plus forte popularité (popularité_max) ;
- enfin, la somme de toutes ces valeurs (absolues) sur le site donne la popularité_site, qui permet de comparer la fréquentation de deux sites sous spip...

- Balises

Des balises permettent de récupérer et d’afficher ces valeurs. La boucle ci-dessous résume l’ensemble de ces balises :

NB : bien que les données soient représentées, dans la base de spip, sous forme de nombres réels, le rendu de toutes ces balises est toujours donné sous la forme d’un nombre entier, ce qui donnera, sur des sites très peu
fréquentés (sites de tests, notamment), des choses amusantes du genre :

« Cet article a une popularité absolue égale à 1, soit 17 % de 2. Au total, ce
site fait environ 5 visites par jour. »

- Critères

Enfin, un critère de tri peu se révéler utile : {par popularite}, que l’on utilisera par exemple de la manière suivante pour afficher la liste des 10 articles les plus populaires de la rubrique courante :

<BOUCLE_hitparade(ARTICLES){id_rubrique}{par popularite}{inverse}{0,10}>
...
</BOUCLE_hitparade>

(On enlèvera {id_rubrique} pour afficher un hit-parade du site.)

 
 
l’équipe de SPIP
Imprimer
format impression
l’équipe de SPIP
2 juin 2001
1er juin 2001
 
SPIP
Web indépendant