SPIP-Contrib

SPIP-Contrib

عربي | Deutsch | English | Español | français | italiano | Nederlands

286 Plugins, 197 contribs sur SPIP-Zone, 266 visiteurs en ce moment

Accueil > Navigation > Recherche > Indexer > Indexer : Introduction

Indexer : Introduction

29 juin 2015 – par cam.lafit, Fil, Matthieu Marcillaud, RastaPopoulos

3 votes

Pour les gens pressés

La configuration et l’installation du plugin est expliqué dans l’article suivant : Indexer : Installation et Configuration
L’usage de la recherche une fois configuré et installé :
Indexer : Rechercher
Le fonctionnement de la boucle SPHINX :
Indexer : La boucle SPHINX

Présentation de SPHINX

Le logiciel SPHINX est un moteur dédié qui indexe et range un ensemble d’informations multiple pour permettre une recherche rapide.
Sphinx est un logiciel dédié à l’indexation d’informations textuelles. Cette spécialisation offre une finesse et des temps de réponses plus rapide et précis qu’un moteur de recherche intégré comme celui de Mysql.

La source des documents indexés peut être n’importe quoi, une base de données, un flux d’informations, un tas de fichiers, des courriels ... Sphinx est neutre vis-à-vis du contenu, ce qui importe c’est de fournir des documents textuels.

Sphinx indexe à la demande diverses informations telles que l’occurrence de mot, la similarité entre synonymes, proximité entre mots. Cela permet de lancer des recherches par mot unique ou séquence de mots.
Sphinx ne se contente pas de noter l’occurrence mais aussi la place dans le texte (mot n°1, n°2, etc) ce qui permet de chercher des proximités ou des séquences (guillemets).

Facettes

Pour affiner les résultats de recherche, Sphinx propose aussi une notion de facettes. Ce sont des critères complémentaires aux informations indexées.
Dans le cadre de SPIP, actuellement nous avons 3 facettes :

  • dates de publication
  • auteurs
  • mots clefs

On peut considérer ces facettes comme des options de filtrage du résultat retourné. On peut ainsi affiner, restreindre le résultat obtenu par l’une ou l’autre des facettes.

Intégration avec SPIP

Le plugin « indexer » transmet à Sphinx l’intégralité du contenu des articles saisis et modifiés dans SPIP en temps réel (mode RT). Cela signifie qu’une fois un article publié celui est directement disponible dans les résultats de recherche.

Sphinx traite ensuite les informations fournies afin de les classer, trier, ordonner, rapprocher et définir des ratios de pertinence. Dans le même temps les facettes sont actualisées.

Sphinx fournis différents connecteurs pour communiquer, parmi ceux ci, il fournit un mode SQL. C’est ce mode que le plugin « Indexer » utilise, Sphinx est considéré comme une base de donnée externe, dédiée à la recherche.

Exemple avec Le Monde diplomatique

Le Monde diplomatique indexe environ 49000 articles. Contrairement au mode standard, on peut noter que le site ré-indexe l’intégralité du site à chaque publication. Pour le moment l’indexation complète des publications prend environ 2 minutes.

Exemple avec le secours catholique

Le secours catholique utilise le moteur de recherche en interne. Le site référence environ 5500 articles et 25000 documents. Par rapport à la recherche native ou la fonctionnalité full text, les résultats sont plus rapides et pertinents.

La capture montre un résultat de recherche SPHINX pour le mot clef « plaidoyer ». 157 résultats sont disponibles, ils sont filtrés par ordre de pertinence. Le titre de l’article ainsi qu’un extrait du texte est affiché pour chaque résultat.
Sur le coté droit, se trouve les facettes. Dans notre exemple nous voyons une partie de la facette auteurs. Pour chaque auteur est précisé le nombre de résultats disponibles pour la recherche effectuée.

Dernière modification de cette page le 17 septembre 2015

Retour en haut de la page

Répondre à cet article

Qui êtes-vous ?
  • [Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici Les choses à faire avant de poser une question (Prolégomènes aux rapports de bugs. )
Ajouter un document

Retour en haut de la page

Ça discute par ici

  • Mailsubscribers

    16 janvier 2013 – 274 commentaires

    Ce plugin permet de gérer les inscriptions (ou abonnements) à la diffusion de contenu par email. Mailsubscribers permet de gérer les inscriptions par Opt-in simple ou double et la désinscription par URL. Ce plugin gère également plusieurs listes (...)

  • noiZetier v2

    9 novembre 2012 – 36 commentaires

    Le noiZetier offre une interface d’administration permettant d’insérer au choix des éléments modulaires de squelettes (noisettes) et de les ajouter ainsi à ses squelettes. Compatibilité La version 2 du noizetier fonctionne sous SPIP 3. Elle est (...)

  • cirr : plugin « rédacteur restreint »

    29 octobre 2010 – 60 commentaires

    Ce plugin « cirr : rédacteur restreint » permet d’affecter des rubriques aux rédacteurs et modifie les droits afin qu’un rédacteur restreint (ou un administrateur restreint) voit dans l’espace privé uniquement les rubriques qui lui sont affectées (et leur (...)

  • Un retour d’expérience d’utilisation de Formidable

    26 octobre – commentaires

    Il s’agissait de créer un formulaire d’inscription à un évènement modérer les inscriptions dans le privé publier les inscriptions dans le public Nous avons discuté de cette présentation lors de l’apéro SPIP du 15 février 2016 à la Cantine (...)

  • Métas +

    3 décembre – 14 commentaires

    Améliorez l’indexation de vos articles dans les moteurs et leur affichage sur les réseaux sociaux grâce aux métadonnées Dublin Core, Open Graph et Twitter Card. Installation Activer le plugin dans le menu dédié. Dans le panel de configuration, (...)

Ça spipe par là