SPIP-Contrib

SPIP-Contrib

عربي | Deutsch | English | Español | français | italiano | Nederlands

286 Plugins, 197 contribs sur SPIP-Zone, 266 visiteurs en ce moment

Accueil > Outils pour plugins > Plugin Readability > Readability

Readability

10 mars 2011 – par Fil

12 votes

Extraire le contenu pertinent d’une page Web.

Readability est au départ un javascript développé par la société arc90 qui permet de retirer tout le superflu d’une page Web, et d’en afficher le contenu essentiel, sans la navigation, la pub etc.

Ce script a depuis été porté par ses auteurs sous forme de service Web (www.readability.com). Apple l’a également installé en standard dans son navigateur Safari. Il en existe un portage en PHP, développé par Keyvan Minoukadeh. C’est ce dernier que nous incluons dans ce plugin.

Utilisation dans un plugin

Ce plugin offre au programmeur la fonction readability($url), laquelle renvoie la page web demandée, mais débarrassée du superflu.

Exemple d’usage :

<?php
$url = 'http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html';
include_spip('inc/readability');
$html = readability($url);
echo $html;
?>

À noter : dans le résultat renvoyé par la fonction, le titre de la page figure dans un <h1> au dessus du contenu.

Il existe aussi une fonction readability_html($html) si l’on veut passer un contenu en HTML (par exemple un fichier local).

Dans un squelette

La fonction est également disponible sous forme de filtre |readability.

Exemples d’utilisation :

1. afficher le contenu d’un article distant dont l’URL a été obtenu par syndication :

<BOUCLE_s(SYNDIC_ARTICLES){id_article}>
[(#URL_ARTICLE|readability)]
</BOUCLE_s>

L’article ainsi « téléchargé » depuis le site distant s’affichera sur notre site (attention aux conditions de réutilisation du contenu initial).

2. récupérer le contenu d’une page précise et lui appliquer un filtre avant de l’afficher dans son propre site.

[(#VAL{http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html}
  |readability
  |supprimer_tags|mb_strlen) caractères]
[(#VAL{http://zzz.rezo.net/Utiliser-CouchDB-avec-SPIP.html}
  |readability
  |extraire_balise{img})]

L’exemple 2. affichera le nombre de caractères de l’article, et la première grande image appartenant à son contenu (et pas une petite image de l’interface du site ZZZ).

TODO

1. Un modèle pourrait certainement être pratique, pour « piker » un article directement dans un autre.

On peut imaginer <readability|url=....> mais aussi <readability_title|url=....> qui n’afficherait que le title de la page, et <readability_content|url=....> qui n’afficherait que le contenu.

2. Les surtitre, sous-titre, chapo et notes de bas de page de SPIP sont perdus quand on applique readability, qu’il s’agisse de la version JS, de la version Apple ou de cette version PHP. Il faut donc trouver comment modifier les squelettes de la dist pour éliminer ce problème. D’après https://www.readability.com/publishers/guidelines/ si on veut contrôler le résultat, il faut passer en HTML5 et/ou utiliser le microformatage hNews.

Voir en ligne : http://plugins.spip.net/readability

Dernière modification de cette page le 11 juin 2012

Retour en haut de la page

Répondre à cet article

Qui êtes-vous ?

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici Les choses à faire avant de poser une question (Prolégomènes aux rapports de bugs. )
Ajouter un document

Retour en haut de la page

Ça discute par ici

  • Mailsubscribers

    16 janvier 2013 – 274 commentaires

    Ce plugin permet de gérer les inscriptions (ou abonnements) à la diffusion de contenu par email. Mailsubscribers permet de gérer les inscriptions par Opt-in simple ou double et la désinscription par URL. Ce plugin gère également plusieurs listes (...)

  • noiZetier v2

    9 novembre 2012 – 36 commentaires

    Le noiZetier offre une interface d’administration permettant d’insérer au choix des éléments modulaires de squelettes (noisettes) et de les ajouter ainsi à ses squelettes. Compatibilité La version 2 du noizetier fonctionne sous SPIP 3. Elle est (...)

  • cirr : plugin « rédacteur restreint »

    29 octobre 2010 – 60 commentaires

    Ce plugin « cirr : rédacteur restreint » permet d’affecter des rubriques aux rédacteurs et modifie les droits afin qu’un rédacteur restreint (ou un administrateur restreint) voit dans l’espace privé uniquement les rubriques qui lui sont affectées (et leur (...)

  • Un retour d’expérience d’utilisation de Formidable

    26 octobre – commentaires

    Il s’agissait de créer un formulaire d’inscription à un évènement modérer les inscriptions dans le privé publier les inscriptions dans le public Nous avons discuté de cette présentation lors de l’apéro SPIP du 15 février 2016 à la Cantine (...)

  • Métas +

    3 décembre – 14 commentaires

    Améliorez l’indexation de vos articles dans les moteurs et leur affichage sur les réseaux sociaux grâce aux métadonnées Dublin Core, Open Graph et Twitter Card. Installation Activer le plugin dans le menu dédié. Dans le panel de configuration, (...)

Ça spipe par là