Mais au fait, c’est quoi un flux RSS ?
En ces temps d’infobésité, il est nécessaire d’optimiser son temps de visionnage, pour ne pas non plus passer tout son temps sur le web. Le RSS, co-inventé entre autre par Aaron Swartz (suicidé par le FBI pour cause de volonté de liberté de la connaissance), est un format de données permettant de regrouper, en un même lieu, les articles de différents sites.
Au départ était le XML
Le XML est un système de description reposant sur des balises. Vous en utilisez une forme très populaire tous les jours : le HTML. L’idée, c’est de décrire les propriétés ou le caractère d’un élément entre des balises. Exemple :
1 2 3 4 |
<texte> <titre>Hello world</titre> <paragraphe>Coucou tout le monde, c'est Seb</paragraphe> </texte> |
On voit l’idée : les balises ont une forme prédéfinie, entre chevrons (< et >), on « ouvre une balise » pour dire que tout ce qui vient après fait partie d’un même bloc, et on « ferme » la balise en réutilisant la même syntaxe mais en préfixant le nom d’un /. L’indentation permet d’améliorer la lecture à l’écran, mais parfois, certains sites s’en passent, ce qui ne gêne pas la lecture par des programmes, juste par l’être humain.
Théoriquement, vous pouvez utiliser n’importe quel nom pour les balises, le XML ne décrivant alors que la syntaxe générale, les règles d’imbrication. Et ensuite, c’est votre application qui doit faire le travail de décodage et de mise en forme.
Le RSS, une forme particulière de XML
Le format RSS décrit donc une série de balises aux propriétés bien définies et normalisées. Ainsi toute application devant lire du RSS saura quoi chercher, sous quelle forme. Il a été inventé pour agréger au même endroit les contenus de différents sites. Pour prendre l’exemple de ce blog, le flux RSS contient les vingt derniers articles publiés. Si on regarde le code de près, voilà ce qu’on y trouve pour un article en particulier :
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
<item> <title>ncdu, une autre façon de faire le ménage sous Linux</title> <link>https://blog.seboss666.info/2015/01/ncdu-une-autre-facon-de-faire-le-menage-sous-linux/</link> <comments>https://blog.seboss666.info/2015/01/ncdu-une-autre-facon-de-faire-le-menage-sous-linux/#comments</comments> <pubDate>Thu, 22 Jan 2015 17:00:35 +0000</pubDate> <dc:creator><![CDATA[seboss666]]></dc:creator> <category><![CDATA[Astuces]]></category> <category><![CDATA[Sysadmin]]></category> <category><![CDATA[espace disque]]></category> <category><![CDATA[linux]]></category> <category><![CDATA[ncdu]]></category> <category><![CDATA[nettoyage]]></category> <category><![CDATA[serveur]]></category> <guid isPermaLink="false">https://blog.seboss666.info/?p=1308</guid> <description><![CDATA[J’ai parlé il y a quelques temps des méthodes pour faire le ménage sur votre ordinateur sous Linux. Bien, sauf que 99% du temps, si c’est un serveur que vous avez à nettoyer, point d’interface graphique, et donc point de GDmap pour vous venir en aide. qu’à cela ne tienne, il existe aussi un utilitaire […]]]></description> <wfw:commentRss>https://blog.seboss666.info/2015/01/ncdu-une-autre-facon-de-faire-le-menage-sous-linux/feed/</wfw:commentRss> <slash:comments>0</slash:comments> </item> |
On retrouve le titre, le lien, la date de publication, le début du texte (celui que je met avant la balise « more » dans WordPress), les catégories, le nombre de commentaires… La plupart des mêmes éléments sont disponibles dans le flux Clubic :
1 2 3 4 5 6 7 |
<item> <title>Le CNC lance un moteur de recherche de VOD légale, sans Netflix</title> <link>http://www.clubic.com/mag/culture/actualite-751931-cnc-moteur-recherche-vod-legale-snobe-netflix.html</link> <description>Le Centre national du cinéma a décidé de mettre son grain de sel dans l'offre VOD et SVOD française, en proposant un moteur de recherche qui permet de chercher des uvres dans les catalogues des diffé [...]<img width='1' height='1' src='http://com.clubic.feedsportal.com/c/33464/f/581979/s/42d53b64/sc/17/mf.gif' border='0'/><br clear='all'/><br/><br/><a href="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/rc/1/rc.htm" rel="nofollow"><img src="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/rc/1/rc.img" border="0"/></a><br/><a href="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/rc/2/rc.htm" rel="nofollow"><img src="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/rc/2/rc.img" border="0"/></a><br/><a href="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/rc/3/rc.htm" rel="nofollow"><img src="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/rc/3/rc.img" border="0"/></a><br/><br/><a href="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/a2.htm"><img src="http://da.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/a2.img" border="0"/></a><img width="1" height="1" src="http://pi.feedsportal.com/r/218611189045/u/427/f/581979/c/33464/s/42d53b64/sc/17/a2t.img" border="0"/></description> <pubDate>Thu, 29 Jan 2015 14:15:58 GMT</pubDate> <guid isPermaLink="false">751931</guid> </item> |
On retrouve donc les mêmes balises.
L’usage du RSS
Si comme moi vous multipliez les sources d’informations, visiter chaque site un par un pour parcourir les titres reste fastidieux, même avec Internet. Imaginez vous rendre dans un magasin de presse et devoir feuilleter chaque journal et chaque magazine un par un. C’est vite l’enfer.
Utiliser un agrégateur de flux RSS permet de regrouper les contenus, du moins les titres et le début des articles (certains publient l’article complet), en un seul endroit, rendant plus rapide le parcours. La récupération locale de tous les contenus permet aussi de les lire même si votre machine n’est pas connectée en permanence au réseau. Vous faites un scan, vous avez les textes, et la plupart du temps, ça suffit. Si vous n’avez que le résumé, ou si les images ne s’affichent pas, vous avez le lien vers l’article original pour finir le travail. Et vous pouvez lire ensuite quand vous voulez.
Comment savoir si un flux existe sur un site ?
Parfois, le site sera gentil, et vous mettra un joli bouton orange de la forme de l’image qui illustre l’article. Parfois, le flux RSS sera déclaré dans le code de la page, et il faudra demander à votre navigateur de vous afficher le ou les flux. Sous Firefox, il faut cliquer sur l’icône en forme de planète à côté de l’URL dans la barre d’adresse, de cliquer sur le bouton « Plus d’informations… », et dans la fenêtre qui s’ouvre, si vous avez une section RSS en haut, c’est bon :
La plupart des moteurs de gestion de contenus permettent de générer un flux RSS pour vos publications. Pratiquement tous les sites d’informations en proposent aussi, parfois découpés en fonction des catégories d’articles. Plus spécifiquement, le site Yahoo Météo permet de récupérer les prévisions météo dans ce format, en interrogeant une adresse qui contient un identifiant de ville (c’est qu’on utilise dans Domohouse). Bref, le flux RSS permet de transmettre de l’information formatée de manière régulière.
Le flux RSS a un avantage technique : c’est un format texte, facilement compressible, et donc est très léger à transmettre, même sur une connexion lente.
Dans quoi enregistrer les flux ?
Firefox permet de créer un « marque-page dynamique » à partir d’un flux. Il se présentera alors comme un dossier constamment mis à jour. Personnellement j’utilise un agrégateur externe, Leed, sous la forme d’une application PHP à héberger comme un site web, pour y avoir accès quelque soit l’appareil que j’ai sous la main. Des applications dédiées existent sur les différentes plateformes mobiles ainsi que sous nos systèmes d’exploitation « de bureau » (faites une recherche avec le terme RSS dans votre store d’application). Certains services en ligne (comme feu Google Reader, ou feedly), vous propose de les gérer pour vous, avec parfois des fonctions sociales : découvertes de flux/sites, partage avec des « amis », ce genre de choses très pratique pour vous pister et vous profiler (puisqu’ils savent énormément de choses sur vos lectures). Étant des services Web, ils sont accessibles sur énormément de plateformes.
Tous ces outils permettent surtout de marquer chaque lien comme Lu/Non Lu. C’est un moyen supplémentaire de garder des articles qui pourraient être long pour un moment ou vous avez du temps. Un meilleur moyen de vous organiser, et de pouvoir absorber efficacement des informations de différentes provenances. Ainsi, rangés en catégories, mes flux me permettent à la fois d’avoir des informations spécialisées ou plus généralistes, d’avoir les dernières sorties sur plusieurs blogs, d’être alerté des dernières mises à jour de sécurité de plusieurs applications…
Un format toujours d’actualités
Même si Google a décidé de fermer son service Reader, parce qu’il ne gagnait pas d’argent avec, le format est toujours d’actualité, car très répandu, et surtout très bien pris en charge par beaucoup d’applications. Les outils pour manipuler du RSS existent dans de nombreux langages de programmation, il est très bien documenté, bref, même avec l’omniprésence des réseaux sociaux, cette « vieille » technologie est fiable, robuste, vous pouvez vous lancer sans peine 🙂
Pour l’occasion j’ai décidé de passer le flux RSS en mode complet, histoire de pouvoir profiter pleinement de ce format, et j’ai ajouté un bouton dans la barre de menu pour le trouver plus facilement. Mais pour commenter, il faudra toujours venir ici 😉
Rendez-nous GReader ! 🙂
Personnellement, je ne sais absolument pas ce qu’il pouvait avoir de particulier. Au début j’utilisais les marque-pages dynamiques. Mais passé 3/4 flux, c’est ingérable. Est venu Sage, l’extension Firefox où j’ai commencé à grossir mes sources. Quand j’ai monté mon serveur avec sa vm « web » en plus, j’ai cherché une solution « universelle » qui permettait de se passer d’une autre application qu’un navigateur, ce qui est plus que répandu de nos jours, jusque dans nos poches. Et c’est Leed, avec le thème Greeder dont il est dit qu’il ressemble à feu Google Reader. Et il me convient parfaitement. Il avait quoi… Lire la suite »
Il était gratuit, accessible de partout sans avoir un serveur perso, et les plugins étaient bons, surtout celui-là http://blogmotion.fr/internet/veille-information-google-reader-aiderss-2452
Salut Seboss excellent mais n’aurais tu pas une application ou un service à recommander à part Leed ? Je viens de l’installer mais pas trop mon gout ! Merci .
freshrss, tt-rss, pour citer deux webapps à installer soi-même. Quant aux services en ligne, je suis moins renseigné, mais je connais de nom feedly, netvibes, flipboard aussi a un service d’agrégation, mais j’en sais pas beaucoup plus, je prêche d’abord une certaine indépendance en matière de services, et ça passe nécessairement par un auto-hébergement 🙂 En service « libre », Framasoft propose Framanews, qui utilise justement tt-rss (Tiny Tiny RSS). Un moyen de se mettre dans le bain de l’auto-hébergement 🙂
Merci de ta réponse . Donc pour toi les autres services qui sont hébergé par d’autres personnes qui ne motionnent pas la « liberté » sont à éviter ?
Les services sur lesquels tu ne peux pas avoir un certain contrôle généralement. Sans verser dans la paranoïa, il suffit de rappeler le programme PRISM, qui commandes aux sociétés US de laisser la NSA piller les données. Feedly, Flipboard, Netvibes… sont TOUS des services américains. Donc forcément peu dignes de confiance. Sans aller jusque dans la paranoia, un service qui t’es fourni gratuitement mais qui à côté fournit des options payantes est toujours tendancieux : à quand l’obligation de payer pour des fonctions de base ? C’est pour ça que je préfère un service plus indépendant. Et donc au pire… Lire la suite »
Merci pour la réponses claire et précise je vais faire le choix de fresh à installer sur mon serveur .
Je voulais aussi savoir même si cela est hors sujet si tu hébergeais ton serveur mail ?
Ah, le mail… euh non, c’est un dossier assez gros, et pour l’instant, je préfère attendre d’avoir ma propre « machine » (comprendre, pas de l’hébergement partagé, ni à la maison, avec sa connexion pas fiable). Donc c’est OVH qui gère ma boite mail @sebosss.info (je n’en ai qu’une avec le domaine).
Certains outils permettent de gagner du temps plutôt que de tout faire soi-même (souvent des distributions comme Yunohost), et je pense que je passerais par là à ce moment-là.