SPIP-Contrib

SPIP-Contrib

عربي | Deutsch | English | Español | français | italiano | Nederlands

288 Plugins, 197 contribs sur SPIP-Zone, 175 visiteurs en ce moment

Accueil > Outils pour plugins > Plugin Readability > Readability

Readability

10 mars 2011 – par Fil

12 votes

Extraire le contenu pertinent d’une page Web.

Readability est au départ un javascript développé par la société arc90 qui permet de retirer tout le superflu d’une page Web, et d’en afficher le contenu essentiel, sans la navigation, la pub etc.

Ce script a depuis été porté par ses auteurs sous forme de service Web (www.readability.com). Apple l’a également installé en standard dans son navigateur Safari. Il en existe un portage en PHP, développé par Keyvan Minoukadeh. C’est ce dernier que nous incluons dans ce plugin.

Utilisation dans un plugin

Ce plugin offre au programmeur la fonction readability($url), laquelle renvoie la page web demandée, mais débarrassée du superflu.

Exemple d’usage :

<?php
$url = 'http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html';
include_spip('inc/readability');
$html = readability($url);
echo $html;
?>

À noter : dans le résultat renvoyé par la fonction, le titre de la page figure dans un <h1> au dessus du contenu.

Il existe aussi une fonction readability_html($html) si l’on veut passer un contenu en HTML (par exemple un fichier local).

Dans un squelette

La fonction est également disponible sous forme de filtre |readability.

Exemples d’utilisation :

1. afficher le contenu d’un article distant dont l’URL a été obtenu par syndication :

<BOUCLE_s(SYNDIC_ARTICLES){id_article}>
[(#URL_ARTICLE|readability)]
</BOUCLE_s>

L’article ainsi « téléchargé » depuis le site distant s’affichera sur notre site (attention aux conditions de réutilisation du contenu initial).

2. récupérer le contenu d’une page précise et lui appliquer un filtre avant de l’afficher dans son propre site.

[(#VAL{http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html}
  |readability
  |supprimer_tags|mb_strlen) caractères]
[(#VAL{http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html}
  |readability
  |extraire_balise{img})]

L’exemple 2. affichera le nombre de caractères de l’article, et la première grande image appartenant à son contenu (et pas une petite image de l’interface du site ZZZ).

TODO

1. Un modèle pourrait certainement être pratique, pour « piker » un article directement dans un autre.

On peut imaginer <readability|url=....> mais aussi <readability_title|url=....> qui n’afficherait que le title de la page, et <readability_content|url=....> qui n’afficherait que le contenu.

2. Les surtitre, sous-titre, chapo et notes de bas de page de SPIP sont perdus quand on applique readability, qu’il s’agisse de la version JS, de la version Apple ou de cette version PHP. Il faut donc trouver comment modifier les squelettes de la dist pour éliminer ce problème. D’après https://www.readability.com/publishers/guidelines/ si on veut contrôler le résultat, il faut passer en HTML5 et/ou utiliser le microformatage hNews.

Voir en ligne : http://plugins.spip.net/readability

Dernière modification de cette page le 11 juin 2012

Retour en haut de la page

Répondre à cet article

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici Les choses à faire avant de poser une question (Prolégomènes aux rapports de bugs. )
Ajouter un document

Retour en haut de la page

Ça discute par ici

  • Japibas, squelette responsive

    11 octobre 2013 – 95 commentaires

    Japibas est un squelette responsive, multilingue (français, anglais et espagnol), dont l’habillage conviendrait à un site de type blog ou webzine. Le graphisme est inspiré du template Wordpress Japibas réalisé par Jesper Johansen et distribué sous (...)

  • GIS 4

    11 août 2012 – 1417 commentaires

    Présentation et nouveautés La version 4 de GIS abandonne la libraire Mapstraction au profit de Leaflet. Cette librairie permet de s’affranchir des librairies propriétaires tout en gardant les mêmes fonctionnalités, elle propose même de nouvelles (...)

  • Plugin Domlang : Domaines par secteur de langue

    4 septembre – commentaires

    Domlang est un plugin qui permet d’associer un nom de domaine ou un sous-domaine à un secteur de langue. Ce plugin convient pour un site qui utilise des secteurs de langues. En configuration, pour chaque secteur, vous pourrez définir une URL (...)

  • Menu de langues sous forme de liens

    30 novembre 2009 – 121 commentaires

    Par défaut, le menu de langue de SPIP s’affiche : Sous la forme d’une liste déroulante ; En affichant toutes les langues du site, qu’elles soient utilisées ou non (c’est à même si elles ne sont pas affectées à au moins un article ou une rubrique) ; Sans (...)

  • Agenda 2.0

    3 novembre 2008 – 1098 commentaires

    Voici la version pour SPIP 2.0 du Plugin Agenda pour SPIP 1.9.2, avec une interface remaniée pour encore plus de plaisir. Pour une documentation concernant l’utilisation d’Agenda 3 pour SPIP 3, veuillez pour l’instant vous référer à SPIP 3, Agenda (...)