SPIP-Contrib

SPIP-Contrib

عربي | Deutsch | English | Español | français | italiano | Nederlands

289 Plugins, 197 contribs sur SPIP-Zone, 94 visiteurs en ce moment

Accueil > Outils pour plugins > Plugin Readability > Readability

Readability

10 mars 2011 – par Fil

12 votes

Extraire le contenu pertinent d’une page Web.

Readability est au départ un javascript développé par la société arc90 qui permet de retirer tout le superflu d’une page Web, et d’en afficher le contenu essentiel, sans la navigation, la pub etc.

Ce script a depuis été porté par ses auteurs sous forme de service Web (www.readability.com). Apple l’a également installé en standard dans son navigateur Safari. Il en existe un portage en PHP, développé par Keyvan Minoukadeh. C’est ce dernier que nous incluons dans ce plugin.

Utilisation dans un plugin

Ce plugin offre au programmeur la fonction readability($url), laquelle renvoie la page web demandée, mais débarrassée du superflu.

Exemple d’usage :

<?php
$url = 'http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html';
include_spip('inc/readability');
$html = readability($url);
echo $html;
?>

À noter : dans le résultat renvoyé par la fonction, le titre de la page figure dans un <h1> au dessus du contenu.

Il existe aussi une fonction readability_html($html) si l’on veut passer un contenu en HTML (par exemple un fichier local).

Dans un squelette

La fonction est également disponible sous forme de filtre |readability.

Exemples d’utilisation :

1. afficher le contenu d’un article distant dont l’URL a été obtenu par syndication :

<BOUCLE_s(SYNDIC_ARTICLES){id_article}>
[(#URL_ARTICLE|readability)]
</BOUCLE_s>

L’article ainsi « téléchargé » depuis le site distant s’affichera sur notre site (attention aux conditions de réutilisation du contenu initial).

2. récupérer le contenu d’une page précise et lui appliquer un filtre avant de l’afficher dans son propre site.

[(#VAL{http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html}
  |readability
  |supprimer_tags|mb_strlen) caractères]
[(#VAL{http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html}
  |readability
  |extraire_balise{img})]

L’exemple 2. affichera le nombre de caractères de l’article, et la première grande image appartenant à son contenu (et pas une petite image de l’interface du site ZZZ).

TODO

1. Un modèle pourrait certainement être pratique, pour « piker » un article directement dans un autre.

On peut imaginer <readability|url=....> mais aussi <readability_title|url=....> qui n’afficherait que le title de la page, et <readability_content|url=....> qui n’afficherait que le contenu.

2. Les surtitre, sous-titre, chapo et notes de bas de page de SPIP sont perdus quand on applique readability, qu’il s’agisse de la version JS, de la version Apple ou de cette version PHP. Il faut donc trouver comment modifier les squelettes de la dist pour éliminer ce problème. D’après https://www.readability.com/publishers/guidelines/ si on veut contrôler le résultat, il faut passer en HTML5 et/ou utiliser le microformatage hNews.

Voir en ligne : http://plugins.spip.net/readability

Dernière modification de cette page le 11 juin 2012

Retour en haut de la page

Répondre à cet article

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici Les choses à faire avant de poser une question (Prolégomènes aux rapports de bugs. )
Ajouter un document

Retour en haut de la page

Ça discute par ici

  • SPIP chez « Free.fr »

    10 avril 2017 – 22 commentaires

    Spip sur free.fr c’est possible, mais compte-tenu des configurations serveurs très « serrées » (et du fait que tous les serveurs ne sont pas identiques semble-t-il), c’est à vos risques et périls que vous vous lancerez dans l’aventure. N’oubliez pas, par (...)

  • Menus

    18 août 2009 – 998 commentaires

    Créez enfin vos menus facilement !

  • Bouquinerie V2

    6 octobre 2017 – 19 commentaires

    Voici la version pour SPIP 3.x du plugin Bouquinerie. Cette nouvelle version permet de gérer des livres et le ou les auteurs associés. Elle n’est pas compatible avec la précédente version. Cet article est une présentation générale et un guide pour (...)

  • oEmbed

    4 décembre 2013 – 148 commentaires

    C’est quoi ce truc ? oEmbed est un protocole ouvert qui permet d’insérer le contenu d’une page web dans une autre page. Le contenu inséré peut être de plusieurs types : photo, vidéo, URL ou extrait HTML. L’échange d’information a lieu entre un site (...)

  • ScolaSPIP 4

    19 janvier 2016 – 326 commentaires

    ScolaSPIP est plugin-squelette responsive personnalisable pour sites Web d’établissements scolaires basé sur SPIPr Présentation de ScolaSPIP Ce plugin pour SPIP 3 est développé par la Dane de l’académie de Versailles pour les webmestres de cette (...)