SPIP-Contrib

SPIP-Contrib

عربي | Deutsch | English | Español | français | italiano | Nederlands

286 Plugins, 197 contribs sur SPIP-Zone, 481 visiteurs en ce moment

Accueil > Navigation > Recherche > Recherche Fulltext > Fulltext

Fulltext

14 mars 2009 – par Fil, Gaël Chareyre, Nicolas Hoizey, scaron – 210 commentaires

52 votes

Ce plugin permet d’une part d’exploiter le mode de recherche FULLTEXT de MySQL et d’améliorer ainsi énormément les recherches par rapport au fonctionnement natif de SPIP, et d’autre part d’indexer le contenu de certains documents.

Ce plugin permet d’une part d’exploiter le mode de recherche FULLTEXT de MySQL en améliorant ainsi énormément les recherches par rapport au fonctionnement natif (et naïf) de SPIP, et d’autre part d’étendre l’indexation au contenu textuel des documents joints aux articles et/ou rubriques [1].

Indexation FULLTEXT

Performance

Sur une base de test comportant 200 000 articles, la vitesse de la recherche (hors rendu de la page, qui se fait à temps constant) passe de 5 secondes à 10 millisecondes ; sur deux mots, on passe de 15 secondes à 0,1 seconde.

Pertinence

Les résultats sont beaucoup plus pertinents, puisque si on tape deux mots (ou plus), le moteur FULLTEXT va trouver comme avant l’ensemble des articles contenant ces deux mots, mais attribuera un score plus important à ceux qui disposent de ces deux mots consécutifs. Ce score est comptabilisé par la balise #POINTS.

Fonctionnalité

Outre la recherche basique, le mode FULLTEXT permet d’utiliser des opérateurs logiques :

La casse (minuscule/majuscule) des mots recherchés est indifférente.
Les accents ne sont pas pris en compte (« déjà » ou « deja », retourneront à l'identique « déjà », « dejà », « déja »...)
Exemples d'utilisation
  ⇢ Retourne les textes qui contiennent SOIT « enfant », SOIT « étranger », SOIT « enfant » ET « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » ET « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » mais présente en premier les textes qui contiennent aussi « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » mais PAS « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » ET « étranger » ou bien « enfant » ET « Asie » mais présente en premier les textes qui contiennent « enfant » ET « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant », « enfants », « enfance », « enfanter », « enfantillage ».... (L'astérisque * doit être terminale ; ainsi « *fant » ne retournera rien.)
  ⇢ Retourne les textes qui contiennent exactement la séquence de mots « enfant étranger ».

Remarque : ce tableau constitue le contenu de l’aide fournie dans ce plugin par la balise #AIDE_RECHERCHE.

Principe de fonctionnement

Concernant uniquement la partie mettant en œuvre l’indexation FULLTEXT, le plugin utilise ces deux fichiers :

-  inc/rechercher.php est une amélioration du fichier du même nom livré avec SPIP. À chaque recherche sur une table, ce fichier vérifie la présence d’un ou plusieurs index FULLTEXT sur la table en question (ainsi que sur les tables qui lui sont liées par une jointure, voir ci-dessous).

-  exec/fulltext.php vous propose de créer des index FULLTEXT sur la plupart des tables de SPIP. C’est une proposition, qui correspond aux usages les plus « normaux » de SPIP (pour aller plus loin, cf. ci-dessous, configuration avancée).

Jointures

Le moteur natif de SPIP gère les jointures entre les tables. Avec FULLTEXT on les gère aussi, mais à condition qu’il existe au moins un index FULLTEXT sur chacune des tables liées.

Ainsi par exemple, si vous avez un FULLTEXT sur spip_articles, un autre sur spip_mots, mais aucun sur spip_auteurs, une recherche sur les articles avec le terme « Italie » renverra les articles liés au mot-clé « Italie », mais une recherche sur le terme « Robespierre » ne renverra pas les articles signés par cet auteur.

Autrement dit, sauf application particulière, vous avez tout intérêt à passer l’ensemble des tables en mode FULLTEXT.

Indexation du contenu textuel des documents

Ce plugin propose en outre l’indexation (optionnelle) du contenu textuel des documents joints aux articles et/ou rubriques.

Il stocke pour cela dans la table spip_documents une version texte du document, obtenue à l’aide d’un « extracteur ». Cet extracteur peut être un exécutable système lancé depuis le plugin, ou du code purement PHP.

Les formats supportés à partir de la version 0.6.2 du plugin sont :

  • Le PDF, à condition que le fichier ne soit pas protégé contre la copie
  • Le DOC, PPT, et XLS
  • Le DOCX, PPTX et XLSX (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip)
  • Le ODT (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip)

Installation

Mise en place de l’indexation FULLTEXT

Une fois le plugin installé dans le répertoire plugins/ et activé à partir de la page « Gestion des plugins », la recherche fonctionne exactement comme avant. Pour l’installation proprement dite, il faut créer des index FULLTEXT sur les tables ; pour cela, il suffit de se rendre sur la page ecrire/?exec=fulltext, et de valider les opérations proposées.

On peut aussi, alternativement, les créer « à la main » à partir de n’importe quel client MySQL, avec les commandes suivantes :

ALTER TABLE spip_articles ADD FULLTEXT `titre` (`titre`);
ALTER TABLE spip_articles ADD FULLTEXT `tout`
  (`surtitre`,`titre`,`soustitre`,`chapo`,`texte`,`nom_site`,`url_site`,`descriptif`);

Le mode FULLTEXT n’étant disponible que sur les tables au format MyISAM, il faut parfois au préalable convertir les tables dans ce format :

ALTER TABLE spip_articles ENGINE=MyISAM;

La page ecrire/?exec=fulltext permet aussi de faire cela.

Indexation du contenu textuel des documents

Pour l’indexation des documents, il faut installer certains logiciels additionnels, et indiquer leur présence au plugin via des constantes à définir dans le fichier mes_options.php ou en utilisant le panneau de configuration de l’indexation des documents sur la page ecrire/?exec=fulltext_document.

Le panneau de configuration de l’indexation des documents permet de gérer la configuration (extracteurs et options éventuels) pour les fichiers PDF, DOC, PPT, XLS, ODT, DOCX, PPTX et XLSX et d’activer ou non l’indexation de ceux. ceci remplace la définition des constantes dans le fichier mes_options.php.

Certaines constantes sont génériques, non liées au type de fichier :

  • _FULLTEXT_TAILLE : Taille maximum conservée (en nombre de caractères) pour la version texte des fichiers (50000 par défaut). Cette configuration est également disponible dans panneau de configuration de l’indexation des documents.
  • De même, il est possible de définir l’intervalle (en seconde) entre deux passages du Spip-CRON et le nombre de document traités par itération.

Pour indexer un type de document, il est obligatoire de définir une constante non-nulle de type _FULLTEXT_EXT_EXE (où EXT est l’extension de ces documents) ou d’activer l’indexation via le panneau de configuration.
Il faut également qu’un « extracteur » pour ce type de document soit disponible.

Pour les PDF

  • Installer Xpdf
  • Définir ces constantes :
    • _FULLTEXT_PDF_EXE (par exemple /usr/bin/pdftotext) : Chemin vers l’exécutable pdftotext de Xdpf afin de transformer les fichiers PDF en texte brut
    • _FULLTEXT_PDF_CMD_OPTIONS (par exemple -enc UTF-8) : Options d’appel de l’exécutable

Pour les DOC, PPT et XLS

  • Installer Catdoc
  • Définir les constantes correspondantes (_FULLTEXT_DOC_EXE, _FULLTEXT_DOC_CMD_OPTIONS, etc.) ou utiliser le panneau de configuration de la même manière que pour les PDF.
    • Exemples pour les DOC :
      • Exemple pour utilisation en local sous Windows define("_FULLTEXT_DOC_EXE","C:\catdoc\catdoc.exe");
      • Exemple pour utilisation sous Linux : define("_FULLTEXT_DOC_EXE","/usr/bin/catdoc");
      • Exemple d’option pour extraction de DOC au format « Windows » vers format ISO-8859-1 : define("_FULLTEXT_DOC_CMD_OPTIONS","-s cp1252 -d 8859-1 ");
    • Exemples pour les XLS :
      • Exemple pour utilisation en local sous Windows define("_FULLTEXT_XLS_EXE","C:\catdoc\xls2csvt.exe");
      • Exemple pour utilisation sous Linux : define("_FULLTEXT_XLS_EXE","/usr/bin/xls2csvt");
      • Exemple d’option pour extraction de .XLS au format « Windows » vers format ISO-8859-1 : define("_FULLTEXT_XLS_CMD_OPTIONS","-s cp1252 -d 8859-1 ");
    • Exemples pour les PPT :
      • Exemple pour utilisation en local sous Windows define("_FULLTEXT_PPT_EXE","C:\catdoc\catpp.exe");
      • Exemple pour utilisation sous Linux : define("_FULLTEXT_PPT_EXE","/usr/bin/catpp");

Pour les ODT, DOCX, PPTX, XLSX

  • Les « extracteurs » utilisent des fonctions et des classes PHP fournit avec le plugin (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip).
  • Définir les constantes correspondantes (_FULLTEXT_ODT_EXE, _FULLTEXT_DOCX_EXE, etc.) ou utiliser le panneau de configuration pour autoriser l’indexation. Il n’y a pas de binaire ou d’option à définir (mais si vous n’utilisez pas le panneau de configuration, une constante non-nulle doit être définie).

Documents protégés

Les documents PDF et XLS protégés ne seront pas indexé et se verront affecter le statut "ptg" dans la base de données.
Une page ecrire/?exec=fulltext_document_ptg permet d’obtenir la liste de ceux-ci.
Les documents PPT et PPTX protégés ne seront pas indexés et seront renvoyés comme erreur (statut "err").

Les documents DOC, DOCX, ODT et XLSX protégés semblent être indexés.

Suivi

Analyse des recherches

Le plugin fait un suivi de ses opérations liées à la recherche dans tmp/recherche.log ; on voit les index FULLTEXT utilisés, le temps mis pour chaque recherche et le nombre de résultats, etc.

Exemple de log :

Mar 13 15:28:42 1.2.3.4 (pid 21184) fulltext article: titre, full2
Mar 13 15:28:42 1.2.3.4 (pid 21184) fulltext auteur: nom
Mar 13 15:28:42 1.2.3.4 (pid 21184) fulltext mot: titre
Mar 13 15:28:42 1.2.3.4 (pid 21184) MATCH(t.`titre`) AGAINST ('fluor dans l\'eau \"fluor dans l\'eau\"') * 3.1
  + MATCH(t.`surtitre`,t.`titre`,t.`soustitre`,t.`chapo`,t.`descriptif`) AGAINST ('fluor dans l\'eau \"fluor dans l\'eau\"') * 1.4
  + SUM(MATCH(obj1.`nom`) AGAINST ('fluor dans l\'eau'))
  + SUM(MATCH(obj2.`titre`) AGAINST ('fluor dans l\'eau'))
   AS score
Mar 13 15:28:42 96.21.135.101 (pid 21184) recherche article (fluor dans l'eau) : 500 resultats 1.187s

Ce log indique que la table article a deux index FULLTEXT nommés titre et full2 ; que la recherche portant sur « fluor dans l’eau » donne un poids de 3,1 à la présence de ces mots dans le titre, 1,4 dans l’ensemble des champs, et 1 pour le nom d’un auteur ou d’un mot-clé lié par une jointure.

Analyse des extractions

Le plugin fait aussi le suivi des extractions de version texte des fichiers, dans tmp/extract.log.

La page de configuration du plugin ecrire/?exec=fulltext indique le nombre de documents indexés, en attente d’indexation, protégés ou en erreurs.

Configuration avancée des index FULLTEXT

Avec n’importe quel client MySQL (ou phpMyAdmin) vous pouvez aller modifier la structure des index pour affiner les réponses, en incluant ou en excluant des champs, selon vos usages.

Ceci est notamment à faire si vous utilisez Extras2 pour ajouter de nouveaux champs : il faut alors créer un index incluant ces champs, pour qu’ils soient cherchables.

Notre recommandation : supprimer le précédent index FULLTEXT de tous les champs standards, et recréer un index FULLTEXT intégrant les champs standards et les champs extras pertinents. Seuls les champs de type TEXT (ou LONGTEXT etc) peuvent faire partie d’un index FULLTEXT.

Il est aussi possible d’aller bidouiller à l’intérieur du fichier pour, par exemple :

Ajouter des pondérations aux différents index

Le code consiste en une somme des scores donnés aux articles par les différents index. La pondération par défaut est une fonction décroissante du nombre d’éléments dans l’index. Ainsi, si on a deux index sur une table, l’un portant sur le titre, et l’autre sur l’ensemble des champs texte de la table, les termes de recherche présents dans le titre auront un poids de 4 environ, tandis que les mêmes termes trouvés dans le texte ne vaudront que 1 point.

Si l’on veut modifier ces poids il est possible :
— soit de modifier cette fonction pour qu’elle soit plus (ou moins) fortement décroissante ;
— soit d’ajouter un système encore plus compliqué avec des options de configuration ;
— soit d’ajouter un index. Par exemple, pour survaloriser les champs surtitre, sous-titre et chapo par rapport au champ texte, créer un index FULLTEXT supplémentaire avec la commande ci-dessous :

ALTER TABLE spip_articles ADD FULLTEXT `titrailles`
  (`surtitre`,`titre`,`soustitre`,`chapo`);

Cela dit, les réglages proposés par défaut marchent très bien pour nous, essayez-les :-)

Éliminer de la recherche tout un ensemble d’éléments

Scénario : notre base de données comporte toutes les archives d’un journal depuis 1920. Si l’on veut faire une recherche qui limite aux seuls articles récents, il n’est pas raisonnable de demander à inc/rechercher.php de ramener suffisamment d’articles pour ensuite en éliminer 90 % avec un critère {date>1980} dans la boucle. On peut alors envisager d’ajouter « en dur » un critère WHERE supplémentaire au niveau de la requête MySQL de inc/rechercher.php.
-  pour ce faire, on pourra, par exemple, réduire le corpus de recherche pour la table spip_articles, en ajoutant dans mes_options.php une ligne :

 define('_FULLTEXT_WHERE_article', ' t.date>"1980" ');


bien noter qu’il ne faut pas le ’s’ final dans le nom de la table, ainsi que l’utilisation des 2 types de quotes (’ et ") dans la définition de la clause WHERE.

Permettre à l’utilisateur de déterminer le corpus de recherche

On peut vouloir donner la possibilité à l’utilisateur de fixer la date de départ de sa recherche (lui permettre de ne chercher qu’à partir d’une date qu’il fixe lui-même).
Rien de plus simple.

-  Commençons par ajouter un input dans notre formulaire de recherche (formulaires/recherche.html) :

 <input type="text" class="text" size="5" name="recherche_date" id="recherche_date"[ value="(#ENV{recherche_date})"] />


-  Puis, dans notre fichier recherche_fonctions.php :

 if ( _request('recherche_date') && preg_match('/\d{4}/', _request('recherche_date')) ) {
   $limite = _request('recherche_date');
   define('_FULLTEXT_WHERE_article', 't.date>"' . $limite . '"');
   define('_FULLTEXT_WHERE_rubrique', 't.date>"' . $limite . '"');
   define('_FULLTEXT_WHERE_document', 't.date>"' . $limite . '"');
}

Ceci limitera le corpus de recherche (l’ensemble des données dans lequel s’effectuera la recherche) pour les articles, rubriques et documents aux seuls éléments dont la date (en l’occurence l’année de publication) est strictement supérieure à celle fournie par l’utilisateur.

Étendre la recherche aux mots de 3 lettres

Par défaut MySQL FULLTEXT indexe les mots de quatre lettres ou plus. Pour étendre la recherche aux mots de 3 lettres ou plus, il faut modifier la config du serveur (/etc/mysql/my.cnf sous Debian), et ajouter les deux éléments suivants :

[mysqld]
ft_min_word_len=3
[myisamchk]
ft_min_word_len=3

Attention après avoir effectué cette manipulation il est impératif de reconstruire tous les index FULLTEXT de toutes les bases de données présentes sur le serveur, cf. http://dev.mysql.com/doc/refman/5.1....
Une méthode en ligne de commande (il faut être root) :

# /etc/init.d/mysql stop
Stopping MySQL database server: mysqld.
# myisamchk --recover /var/lib/mysql*/*MYI
... (quelques secondes ou minutes) ...
# /etc/init.d/mysql start

Exemples d’utilisation

Suggérer des réponses aux questions sur forum.spip.org

Lire l’article « Forum.spip.org comme base de connaissances » sur spip.blog.

et aussi

... à vous de jouer !

Voir en ligne : http://plugins.spip.net/fulltext

Notes

[1Uniquement les PDF, DOC, PPT, XLS, ODT, DOCX, PPTX et XLXS dans un premier temps.

Dernière modification de cette page le 5 avril 2015

Retour en haut de la page

Tout afficher

Vos commentaires

  • Le 16 mai à 11:37, par ADB En réponse à : Fulltext

    Bonjour

    Je viens d’installer Fulltext. Tout fonctionne bien sauf... qu’il ne trouve jamais Olympic marina (ou olym* ou toute autre combinaison) sur mon site

    guidemediterranee.com

    Olympic marina est en chapo et « dépend » de Lavrion.

    Il existe un Lavrion (titre) et un Lavrion - Olympic marina (titre + chapo)

    Une recherche sur Lavrion ne donne que Lavrion et pas les deux entrées.

    Je ne comprend vraiment pas pourquoi (alors que Athenes donne bienb tous les Athènes)

    Merci d’un essai d’explication

    ADB

    • Le 16 mai à 12:19, par ADB En réponse à : Fulltext

      Je me réponds à moi-même...

      Désolé pour le bruit : il s’agissait simplement d’un problème de mot clé dans le fichier Recherche.html.

      Tout est parfait

      Merci pour ce plugin

    Répondre à ce message

  • Le 3 février à 14:42, par Syd En réponse à : Fulltext

    Bonjour

    Gros problème de restauration de la base, ça semble venir du plugin Fulltext.
    Ma base est en mysql.

    Lorsque je veux restaurer la base sauvegardée via le menu maintenance de Spip, toutes les tables sont en échec.
    Lorsque j’exporte, puis réimporte via phpmyadmin, j’ai l’erreur suivante :
    #1064 - You have an error in your SQL syntax ; check the manual that corresponds to your MySQL server version for the right syntax to use near ’TYPE=MyISAM AUTO_INCREMENT=558’ at line 44

    Ma config :
    SPIP 3.0.16
    Fulltext 1.1.8 à jour.

    Merci pour votre aide.

    Répondre à ce message

  • Le 8 décembre 2014 à 11:45, par peetdu En réponse à : Fulltext

    Avec SPIP 3.0.17 et Fulltext 1.0.2 la recherche sur le mot « this » ne donne rien.
    Ce mot fait référence à un auteur qui s’appelle « Hervé This ».

    J’arrive bien à trouver des auteurs dont le nom est en 4 lettres par ailleurs.

    Avez-vous une idée sur l’origine du problème ?

    • Le 2 décembre 2015 à 13:11, par peetdu En réponse à : Fulltext

      Sur SPIP 3.0.21 avec Fulltext 1.1.8, testé sur deux sites

      la recherche ne prend pas en compte certains mots comme

      -  this
      -  the
      -  new

      Cela ressemble à des mots clés qui ne seraient pas pris en compte ?
      Des idées ?

    • Le 2 décembre 2015 à 13:13, par peetdu En réponse à : Fulltext

      je précise que j’ai bien activé l’astuce pour étendre la recherche sur 3 lettres.

    • Le 3 décembre 2015 à 17:34, par peetdu En réponse à : Fulltext

      Solution trouvée par Nicod_

      Il existe un dictionnaire de mots ignorés par défaut (stop words).
      La requête…

      SQL SHOW VARIABLES LIKE ’ft_stopword_file’ ;

      … doit afficher ’built-in’

      La liste par défaut (built-in) est celle-ci :
      http://dev.mysql.com/doc/refman/5.5/en/fulltext-stopwords.html

      Il faut alors modifier la config du serveur Mysql ( my.cnf) et lui indiquer dans la section [mysqld] :

      1. ft_stopword_file = ""

      À utiliser si c’est vraiment nécessaire, car cela peut augmenter le « bruit » dans les résultats.

    Répondre à ce message

  • Le 24 septembre 2015 à 18:40, par Arthur En réponse à : Fulltext

    Bonjour,

    Je voulais juste signaler que le plug-in ne fonctionne pas quand la base de données du site a été conçu en Sqlite !

    Merci !

    • Le 3 novembre 2015 à 12:57, par DD En réponse à : Fulltext

      Bonjour,

      Je pense que j’ai le même problème mais je ne sais pas ou trouver le format de ma base.
      Le plugin me dit de convertir en UTF8 mais lorsque je clique sur ce lien j’ai l’erreur : « Fichier convert_sql_utf8 introuvable »

      dd

    • Le 3 novembre 2015 à 13:02, par Fil En réponse à : Fulltext

      Ce fichier est dans le plugin « grenier ».

    • Le 4 novembre 2015 à 12:23, par DD En réponse à : Fulltext

      Trouvé, merci.

      Pour un site cela a fonctionné, pour un autre non je me retrouvais avec du contenu invisible dans l’espace public ET privé dès lors qu’il y avait un caractère accentué. J’avais déjà essayé avec Fusion de convertir sqlite en mysql sans succès. Je réessaierai un jour.

      dd

    • Le 4 novembre 2015 à 14:25, par Arthur En réponse à : Fulltext

      Re,
      Pour ceux que ca intéresse, j’ai publié sur un autre forum une solution assez simple pour convertir une base de donnée sqlite vers mysql :
      http://forum.spip.net/fr_213057.html
      J’espère que ca aidera.

    Répondre à ce message

  • Le 23 juin 2015 à 10:48, par Stanislas En réponse à : Fulltext

    Bonjour,

    Merci pour ce plugin. J’ai juste 1 remarque et 1 bidouille.

    Il me semble qu’il y a une différence entre le fonctionnement avec et sans index sur le pluriel des mots. Sans index la recherche sur « enfant » apportera aussi les articles avec le pluriel « enfants ». Ce n’est pas le cas avec fulltext. Y-a-t-il moyen de systématiquement faire ajouter à la requête une astérisque à la fin des termes sauf si l’on a mis des guillemets, pour une recherche sur un mot ou une expression précise ?

    Je n’ai pas réussi à faire fonctionner l’extraction de texte des pdf. Je suis sur un Windows, SPIP et plugin à la dernière mode. Comme je ne publie pas chaque jour des brassées de pdf, j’ai contourné en le faisant à la main. J’ai ajouté avec le plugin champ_extra un champ à la table document et j’y fais un copier coller du texte en allant le chercher sur le pdf sans autre manoeuvre que CRTL+A puis CRTL+C. C’est pas cher et ça fonctionne... :-)

    • Le 26 juin 2015 à 14:50, par Stanislas En réponse à : Fulltext

      Bon, c’est le même comportement sur contrib.spip et spip.net.

      Sur contrib, si on cherche « fulltex » cela ne retourne rien, il faut ajouter l’astérisque pour avoir des résultats.

      Le tableau d’exemples devrait illustrer ce point (ou plutôt cette étoile :) ).

    Répondre à ce message

  • Le 17 octobre 2014 à 11:34, par Fred_O En réponse à : Fulltext

    Bonjour.

    Impossible pour moi de faire une extraction de PDF, le plugin m’indiquant que pdftotext n’est pas disponible sur le serveur (CentOS 6.5), alors que le binaire est présent (testé également en indiquant en dur le chemin du binaire dans mes_options.php).
    pdftotext provient du paquet poppler.x86_64. Je précise que l’extraction fonctionne en console (loggué sur le serveur, user non root).
    Les droits d’éxécution (sudoers) ont été vérifiés et ne semblent pas poser problème
    Les logs extract.log et prive_extract.log ne sont pas très explicites et indiquent juste une erreur d’extraction, ex :


    Oct 02 15:16:45 une_adresse_ip (pid 21566) Indexation de pdf/16_mai_2013.pdf
    Oct 02 15:16:45 une_adresse_ip (pid 21566) Extraction PDF avec /usr/local/bin/pdftotext -enc Latin1 IMG/pdf/16_mai_2013.pdf
    Oct 02 15:16:45 une_adresse_ip (pid 21566) Erreur extraction IMG/pdf/16_mai_2013.pdf (code 127) :

    SPIP - v2.1.26
    Plugin FullText - v0.8.2

    Merci d’avance de votre aide.

    • Le 7 avril 2015 à 20:03, par cherif En réponse à : Fulltext

      Moi je pense que l’auteur aurait du utiliser le fonction File_exists de php. Ca sert à rien de lancer un exec sur un fichier par exemple dans windows Ca ne fonctionne pas la majorité du temps.

    Répondre à ce message

  • Le 23 janvier 2015 à 12:42, par Manu En réponse à : Fulltext

    Fixer une date de départ (cf §Permettre à l’utilisateur de déterminer le corpus de recherche)
    Sur un SPIP 3.0.17, il semble qu’il y ait un problème avec la fonctionnalité décrite (limiter la recherche aux « objets » dont la date est postérieure à l’année saisie)

    J’ai modifié le formulaire recherche de la dits tel que décrit.

    • L’input date est présent.
    • Après soumission, l’argument recherche_date est bien pris en compte
      (ici : spip.php ?page=recherche&recherche=semis+direct&recherche_date=2015
    • recherche_date est récupéré par la page recherche.html mais n’est pas correctement transmis au /compris par le formulaire de recherche
      voir copie d’écran (j’ai mis des [<pre>#SQUELETTE : (#ENV**|unserialize|print_r{1})</pre>] dans le squelette appelant et en tête du fichier du formulaire de recherche pour voir ce qu’il se passait)

    Bien sûr, la limitation de date souhaitée ne fonctionne pas.

    Quelque chose que j’ai mal fait ? Un oubli dans la doc ?… Un bug ?

    GIF - 37 ko

    Répondre à ce message

  • Le 19 janvier 2015 à 14:21, par Mel En réponse à : Fulltext

    Le plugin marche très bien avec SPIP v3.0.15. J’ai juste eu la petite surprise de constater que les recherches sur un seul mot ne donnaient parfois pas les mêmes résultats suivant la syntaxe de la recherche :
    -  un seul mot de de 3 lettres (j’ai étendu la recherche aux mots de 3 lettres tel qu’indiqué dans la documentation) : abc se comporte comme abc*. « abc » et +abc ont le comportement attendu. Pour corriger ce problème, j’ai rajouté des guillemets avant l’appel du plugin dans ce cas. Ça marche, mais s’est franchement sale :)

    -  un seul mot de 1 ou 2 lettres : même soucis que précédemment sauf que ce n’est pas vraiment gênant. « ab » et +ab ne sortent aucun résultat, ce qui est attendu.

    -  le ranking pour les mots de 4 à 7 lettres est différent que la recherche soit mon_mot ou +mon_mot (ou « mon_mot »). Je n’ai pas analysé en détails mais il me semble à première vue que le résultat attendu est obtenu avec le + ou les guillemets.

    De plus n’y aurait-il pas un soucis avec le caractère ’è’ ? La recherche est indépendante des accents (et marche même avec ’œ’) mais le ’è’ semble devoir être présent dans le champ de recherche pour qu’elle aboutisse correctement. Ce n’est pas dramatique en pratique car de toutes façons les utilisateurs tapent les accents dans le champ de recherche. C’est juste bizarre...

    Enfin, une petite requête : ne serait-il pas judicieux que la recherche ait un « mega-boost » lorsque le champ entier indexé est égal à la requête ? Par exemple, je rêve que si la base contient un article dont le titre est Fulltext et que la requête est fulltext, la recherche le sorte premier haut la main devant d’autres articles dont le titre est Fulltext marche très bien ou La recherche fulltext est active. Ce n’est peut-être pas possible, mais ce serait pratique.

    Répondre à ce message

  • Le 30 octobre 2014 à 17:03, par DD En réponse à : Fulltext

    Bonjour,
    Sur un site en SPIP 3.0.17 [21515] avec Fulltext Version :
    0.8.2 SVN [82959] activé

    j’ai une erreur lors de la recherche sur le site public :

    1 Erreur SQL 1146
    Table ’site.spip_giss_articles’ doesn’t exist
    SELECT t.id_article, t.surtitre, t.titre, t.soustitre, t.chapo, t.texte, t.ps, t.nom_site, t.url_site, t.descriptif, MATCH(t.`titre`) AGAINST (’ssr*’ IN BOOLEAN MODE) * 8 +
    ...
    / /
    2 Erreur SQL 1146
    Table ’isite.spip_giss_rubriques’ doesn’t exist

    je vois qu’il y a un « s » en trop à gis mais je ne sais pas où le corriger

    merci
    dd

    • Le 14 novembre 2014 à 10:11, par pascal En réponse à : Fulltext

      Bonjour

      Même problème depuis la maj du plugin. Quelqu’un a-t-il trouvé l’origine du bug ?

    Répondre à ce message

  • Le 20 octobre 2014 à 15:03, par denkam En réponse à : Fulltext

    Bonjour,

    tout d’abord merci pour votre plugin.

    J’ai bien intégré les éléments mais une chose curieuse se produit.

    Quand je recherche des termes ainsi qu’a partir d’une date (comme le cite votre explication), cela fonctionne mais si je change la date à nouveau, ça ne le prend plus en compte. Par précaution, j’ai désactivé le cache. C’est très aléatoire. je n’ai plus d’idées.

    Avez vous déjà constaté ce comportement ?
    merci d’avance.

    Répondre à ce message

Répondre à cet article

Qui êtes-vous ?
  • [Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici Les choses à faire avant de poser une question (Prolégomènes aux rapports de bugs. )
Ajouter un document

Retour en haut de la page

Ça discute par ici

  • Rainette v1, la méteo au quotidien

    31 juillet 2009 – 193 commentaires

    Ce plugin permet d’afficher les conditions et les prévisions météorologiques d’une ville donnée à partir du flux xml fourni par le site weather.com(r).

  • Simple Calendrier v2

    25 février – commentaires

    Il s’agit de la version pour SPIP 3 du plugin Simple Calendrier. Le plugin « simple calendrier » permet de gérer des évènements en ajoutant un nouvel objet éditorial dans l’administration de votre site SPIP. Il peut constituer une alternative au plugin (...)

  • Article PDF

    9 juin 2007 – 333 commentaires

    Présentation d’un plugin fournissant une version PDF de l’article en cours

  • Albums 3

    8 août 2014 – 201 commentaires

    Le plugin « Albums » évolue dans une version 3 pour SPIP 3. Avant d’effectuer une mise à jour depuis la version 1 ou 2, consultez les notes sur la rétro-compatibilité. Les modèles, notamment, on reçut quelques changements pour la bonne cause. En (...)

  • spiPDF : générer des contenus sur mesure en PDF

    16 février 2011 – 198 commentaires

    Le plugin spiPDF génère des fichiers au format PDF d’article ou de tout autre élément SPIP, simplement à partir d’un squelette construit au format HTML 4 et facile à modifier. Présentation Le plugin génère des fichiers PDF à partir d’un squelette (...)