Fulltext

Ce plugin permet d’exploiter le mode de recherche FULLTEXT de MySQL et d’améliorer la pertinence des recherches dans SPIP. Il permet aussi d’indexer le contenu de certains documents.

Ce plugin permet d’une part d’exploiter le mode de recherche FULLTEXT de MySQL en améliorant ainsi énormément les recherches par rapport au fonctionnement natif (et naïf) de SPIP, et d’autre part d’étendre l’indexation au contenu textuel des documents joints aux articles et/ou rubriques [1].

Indexation FULLTEXT

Performance

Sur une base de test comportant 200 000 articles, la vitesse de la recherche (hors rendu de la page, qui se fait à temps constant) passe de 5 secondes à 10 millisecondes ; sur deux mots, on passe de 15 secondes à 0,1 seconde.

Pertinence

Les résultats sont beaucoup plus pertinents, puisque si on tape deux mots (ou plus), le moteur FULLTEXT va trouver comme avant l’ensemble des articles contenant ces deux mots, mais attribuera un score plus important à ceux qui disposent de ces deux mots consécutifs. Ce score est comptabilisé par la balise #POINTS.

Fonctionnalité

Outre la recherche basique, le mode FULLTEXT permet d’utiliser des opérateurs logiques :

La casse (minuscule/majuscule) des mots recherchés est indifférente.
Les accents ne sont pas pris en compte (« déjà » ou « deja », retourneront à l'identique « déjà », « dejà », « déja »...)
Exemples d'utilisation
  ⇢ Retourne les textes qui contiennent SOIT « enfant », SOIT « étranger », SOIT « enfant » ET « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » ET « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » mais présente en premier les textes qui contiennent aussi « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » mais PAS « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant » ET « étranger » ou bien « enfant » ET « Asie » mais présente en premier les textes qui contiennent « enfant » ET « étranger ».
  ⇢ Retourne les textes qui contiennent « enfant », « enfants », « enfance », « enfanter », « enfantillage ».... (L'astérisque * doit être terminale ; ainsi « *fant » ne retournera rien.)
  ⇢ Retourne les textes qui contiennent exactement la séquence de mots « enfant étranger ».

Remarque : ce tableau constitue le contenu de l’aide fournie dans ce plugin par la balise #AIDE_RECHERCHE.

Principe de fonctionnement

Concernant uniquement la partie mettant en œuvre l’indexation FULLTEXT, le plugin utilise ces deux fichiers :

-  inc/rechercher.php est une amélioration du fichier du même nom livré avec SPIP. À chaque recherche sur une table, ce fichier vérifie la présence d’un ou plusieurs index FULLTEXT sur la table en question (ainsi que sur les tables qui lui sont liées par une jointure, voir ci-dessous).

-  exec/fulltext.php vous propose de créer des index FULLTEXT sur la plupart des tables de SPIP. C’est une proposition, qui correspond aux usages les plus « normaux » de SPIP (pour aller plus loin, cf. ci-dessous, configuration avancée).

Jointures

Le moteur natif de SPIP gère les jointures entre les tables. Avec FULLTEXT on les gère aussi, mais à condition qu’il existe au moins un index FULLTEXT sur chacune des tables liées.

Ainsi par exemple, si vous avez un FULLTEXT sur spip_articles, un autre sur spip_mots, mais aucun sur spip_auteurs, une recherche sur les articles avec le terme « Italie » renverra les articles liés au mot-clé « Italie », mais une recherche sur le terme « Robespierre » ne renverra pas les articles signés par cet auteur.

Autrement dit, sauf application particulière, vous avez tout intérêt à passer l’ensemble des tables en mode FULLTEXT.

Indexation du contenu textuel des documents

Ce plugin propose en outre l’indexation (optionnelle) du contenu textuel des documents joints aux articles et/ou rubriques.

Il stocke pour cela dans la table spip_documents une version texte du document, obtenue à l’aide d’un « extracteur ». Cet extracteur peut être un exécutable système lancé depuis le plugin, ou du code purement PHP.

Les formats supportés à partir de la version 0.6.2 du plugin sont :

  • Le PDF, à condition que le fichier ne soit pas protégé contre la copie
  • Le DOC, PPT, et XLS
  • Le DOCX, PPTX et XLSX (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip)
  • Le ODT (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip)

Installation

Mise en place de l’indexation FULLTEXT

Une fois le plugin installé dans le répertoire plugins/ et activé à partir de la page « Gestion des plugins », la recherche fonctionne exactement comme avant. Pour l’installation proprement dite, il faut créer des index FULLTEXT sur les tables ; pour cela, il suffit de se rendre sur la page ecrire/?exec=fulltext, et de valider les opérations proposées.

On peut aussi, alternativement, les créer « à la main » à partir de n’importe quel client MySQL, avec les commandes suivantes :

ALTER TABLE spip_articles ADD FULLTEXT `titre` (`titre`); 
ALTER TABLE spip_articles ADD FULLTEXT `tout`
   (`surtitre`,`titre`,`soustitre`,`chapo`,`texte`,`nom_site`,`url_site`,`descriptif`); 

Le mode FULLTEXT n’étant disponible que sur les tables au format MyISAM, il faut parfois au préalable convertir les tables dans ce format :

ALTER TABLE spip_articles ENGINE=MyISAM;

La page ecrire/?exec=fulltext permet aussi de faire cela.

Indexation du contenu textuel des documents

Pour l’indexation des documents, il faut installer certains logiciels additionnels, et indiquer leur présence au plugin via des constantes à définir dans le fichier mes_options.php ou en utilisant le panneau de configuration de l’indexation des documents sur la page ecrire/?exec=fulltext_document.

Le panneau de configuration de l’indexation des documents permet de gérer la configuration (extracteurs et options éventuels) pour les fichiers PDF, DOC, PPT, XLS, ODT, DOCX, PPTX et XLSX et d’activer ou non l’indexation de ceux. ceci remplace la définition des constantes dans le fichier mes_options.php.

Certaines constantes sont génériques, non liées au type de fichier :

  • _FULLTEXT_TAILLE : Taille maximum conservée (en nombre de caractères) pour la version texte des fichiers (50000 par défaut). Cette configuration est également disponible dans panneau de configuration de l’indexation des documents.
  • De même, il est possible de définir l’intervalle (en seconde) entre deux passages du Spip-CRON et le nombre de document traités par itération.

Pour indexer un type de document, il est obligatoire de définir une constante non-nulle de type _FULLTEXT_EXT_EXE (où EXT est l’extension de ces documents) ou d’activer l’indexation via le panneau de configuration.
Il faut également qu’un « extracteur » pour ce type de document soit disponible.

Pour les PDF

  • Installer Xpdf
  • Définir ces constantes :
    • _FULLTEXT_PDF_EXE (par exemple /usr/bin/pdftotext) : Chemin vers l’exécutable pdftotext de Xpdf afin de transformer les fichiers PDF en texte brut
    • _FULLTEXT_PDF_CMD_OPTIONS (par exemple -enc UTF-8) : Options d’appel de l’exécutable

Pour les DOC, PPT et XLS

  • Installer Catdoc
  • Définir les constantes correspondantes (_FULLTEXT_DOC_EXE, _FULLTEXT_DOC_CMD_OPTIONS, etc.) ou utiliser le panneau de configuration de la même manière que pour les PDF.
    • Exemples pour les DOC :
      • Exemple pour utilisation en local sous Windows define("_FULLTEXT_DOC_EXE","C:\catdoc\catdoc.exe");
      • Exemple pour utilisation sous Linux : define("_FULLTEXT_DOC_EXE","/usr/bin/catdoc");
      • Exemple d’option pour extraction de DOC au format « Windows » vers format ISO-8859-1 : define("_FULLTEXT_DOC_CMD_OPTIONS","-s cp1252 -d 8859-1 ");
    • Exemples pour les XLS :
      • Exemple pour utilisation en local sous Windows define("_FULLTEXT_XLS_EXE","C:\catdoc\xls2csvt.exe");
      • Exemple pour utilisation sous Linux : define("_FULLTEXT_XLS_EXE","/usr/bin/xls2csvt");
      • Exemple d’option pour extraction de .XLS au format « Windows » vers format ISO-8859-1 : define("_FULLTEXT_XLS_CMD_OPTIONS","-s cp1252 -d 8859-1 ");
    • Exemples pour les PPT :
      • Exemple pour utilisation en local sous Windows define("_FULLTEXT_PPT_EXE","C:\catdoc\catpp.exe");
      • Exemple pour utilisation sous Linux : define("_FULLTEXT_PPT_EXE","/usr/bin/catpp");

Pour les ODT, DOCX, PPTX, XLSX

  • Les « extracteurs » utilisent des fonctions et des classes PHP fournit avec le plugin (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip).
  • Définir les constantes correspondantes (_FULLTEXT_ODT_EXE, _FULLTEXT_DOCX_EXE, etc.) ou utiliser le panneau de configuration pour autoriser l’indexation. Il n’y a pas de binaire ou d’option à définir (mais si vous n’utilisez pas le panneau de configuration, une constante non-nulle doit être définie).

Documents protégés

Les documents PDF et XLS protégés ne seront pas indexé et se verront affecter le statut « ptg » dans la base de données.
Une page ecrire/?exec=fulltext_document_ptg permet d’obtenir la liste de ceux-ci.
Les documents PPT et PPTX protégés ne seront pas indexés et seront renvoyés comme erreur (statut « err »).

Les documents DOC, DOCX, ODT et XLSX protégés semblent être indexés.

Suivi

Analyse des recherches

Le plugin fait un suivi de ses opérations liées à la recherche dans tmp/recherche.log ; on voit les index FULLTEXT utilisés, le temps mis pour chaque recherche et le nombre de résultats, etc.

Exemple de log :

Mar 13 15:28:42 1.2.3.4 (pid 21184) fulltext article: titre, full2
Mar 13 15:28:42 1.2.3.4 (pid 21184) fulltext auteur: nom
Mar 13 15:28:42 1.2.3.4 (pid 21184) fulltext mot: titre
Mar 13 15:28:42 1.2.3.4 (pid 21184) MATCH(t.`titre`) AGAINST ('fluor dans l\'eau \"fluor dans l\'eau\"') * 3.1
   + MATCH(t.`surtitre`,t.`titre`,t.`soustitre`,t.`chapo`,t.`descriptif`) AGAINST ('fluor dans l\'eau \"fluor dans l\'eau\"') * 1.4
   + SUM(MATCH(obj1.`nom`) AGAINST ('fluor dans l\'eau'))
   + SUM(MATCH(obj2.`titre`) AGAINST ('fluor dans l\'eau'))
    AS score
Mar 13 15:28:42 96.21.135.101 (pid 21184) recherche article (fluor dans l'eau) : 500 resultats 1.187s

Ce log indique que la table article a deux index FULLTEXT nommés titre et full2 ; que la recherche portant sur « fluor dans l’eau » donne un poids de 3,1 à la présence de ces mots dans le titre, 1,4 dans l’ensemble des champs, et 1 pour le nom d’un auteur ou d’un mot-clé lié par une jointure.

Analyse des extractions

Le plugin fait aussi le suivi des extractions de version texte des fichiers, dans tmp/extract.log.

La page de configuration du plugin ecrire/?exec=fulltext indique le nombre de documents indexés, en attente d’indexation, protégés ou en erreurs.

Configuration avancée des index FULLTEXT

Avec n’importe quel client MySQL (ou phpMyAdmin) vous pouvez aller modifier la structure des index pour affiner les réponses, en incluant ou en excluant des champs, selon vos usages.

Ceci est notamment à faire si vous utilisez Extras2 pour ajouter de nouveaux champs : il faut alors créer un index incluant ces champs, pour qu’ils soient cherchables.

Notre recommandation : supprimer le précédent index FULLTEXT de tous les champs standards, et recréer un index FULLTEXT intégrant les champs standards et les champs extras pertinents. Seuls les champs de type TEXT (ou LONGTEXT etc) peuvent faire partie d’un index FULLTEXT.

Il est aussi possible d’aller bidouiller à l’intérieur du fichier pour, par exemple :

Ajouter des pondérations aux différents index

Le code consiste en une somme des scores donnés aux articles par les différents index. La pondération par défaut est une fonction décroissante du nombre d’éléments dans l’index. Ainsi, si on a deux index sur une table, l’un portant sur le titre, et l’autre sur l’ensemble des champs texte de la table, les termes de recherche présents dans le titre auront un poids de 4 environ, tandis que les mêmes termes trouvés dans le texte ne vaudront que 1 point.

Si l’on veut modifier ces poids il est possible :
— soit de modifier cette fonction pour qu’elle soit plus (ou moins) fortement décroissante ;
— soit d’ajouter un système encore plus compliqué avec des options de configuration ;
— soit d’ajouter un index. Par exemple, pour survaloriser les champs surtitre, sous-titre et chapo par rapport au champ texte, créer un index FULLTEXT supplémentaire avec la commande ci-dessous :

ALTER TABLE spip_articles ADD FULLTEXT `titrailles`
   (`surtitre`,`titre`,`soustitre`,`chapo`); 

Cela dit, les réglages proposés par défaut marchent très bien pour nous, essayez-les :-)

Éliminer de la recherche tout un ensemble d’éléments

Scénario : notre base de données comporte toutes les archives d’un journal depuis 1920. Si l’on veut faire une recherche qui limite aux seuls articles récents, il n’est pas raisonnable de demander à inc/rechercher.php de ramener suffisamment d’articles pour ensuite en éliminer 90 % avec un critère {date>1980} dans la boucle. On peut alors envisager d’ajouter « en dur » un critère WHERE supplémentaire au niveau de la requête MySQL de inc/rechercher.php.
-  pour ce faire, on pourra, par exemple, réduire le corpus de recherche pour la table spip_articles, en ajoutant dans mes_options.php une ligne :

define('_FULLTEXT_WHERE_article', ' t.date>"1980" ');


bien noter qu’il ne faut pas le ’s’ final dans le nom de la table, ainsi que l’utilisation des 2 types de quotes (’ et ") dans la définition de la clause WHERE.

Permettre à l’utilisateur de déterminer le corpus de recherche

On peut vouloir donner la possibilité à l’utilisateur de fixer la date de départ de sa recherche (lui permettre de ne chercher qu’à partir d’une date qu’il fixe lui-même).
Rien de plus simple.

-  Commençons par ajouter un input dans notre formulaire de recherche (formulaires/recherche.html`) :

<input type="text" class="text" size="5" name="recherche_date" id="recherche_date"[ value="(#ENV{recherche_date})"] />


-  Puis, dans notre fichier recherche_fonctions.php :

if ( _request('recherche_date') && preg_match('/\d{4}/', _request('recherche_date')) ) {
    $limite = _request('recherche_date');
    define('_FULLTEXT_WHERE_article', 't.date>"' . $limite . '"');
    define('_FULLTEXT_WHERE_rubrique', 't.date>"' . $limite . '"');
    define('_FULLTEXT_WHERE_document', 't.date>"' . $limite . '"');
}

Ceci limitera le corpus de recherche (l’ensemble des données dans lequel s’effectuera la recherche) pour les articles, rubriques et documents aux seuls éléments dont la date (en l’occurence l’année de publication) est strictement supérieure à celle fournie par l’utilisateur.

Étendre la recherche aux mots de 3 lettres

Par défaut MySQL FULLTEXT indexe les mots de quatre lettres ou plus. Pour étendre la recherche aux mots de 3 lettres ou plus, il faut modifier la config du serveur (/etc/mysql/my.cnf sous Debian), et ajouter les deux éléments suivants :

[mysqld]
ft_min_word_len=3
[myisamchk]
ft_min_word_len=3

Attention après avoir effectué cette manipulation il est impératif de reconstruire tous les index FULLTEXT de toutes les bases de données présentes sur le serveur, cf. http://dev.mysql.com/doc/refman/5.1....
Une méthode en ligne de commande (il faut être root) :

# /etc/init.d/mysql stop
Stopping MySQL database server: mysqld.
# myisamchk --recover /var/lib/mysql*/*MYI
... (quelques secondes ou minutes) ...
# /etc/init.d/mysql start

Fulltext et le plugin champs extras

Si vous avez crée des champs extras indexés.
Pensez à supprimer les index existants sur les tables où vous avez créés les champs pour ensuite les régénérer en incluant les champs nouvellement crées.

Exemples d’utilisation

Suggérer des réponses aux questions sur discuter.spip.net

Lire l’article « Forum.spip.org comme base de connaissances » sur SPIP Blog

et aussi

... à vous de jouer !

Notes

[1Uniquement les PDF, DOC, PPT, XLS, ODT, DOCX, PPTX et XLXS dans un premier temps.

Discussion

106 discussions

  • 1

    Bonjour.

    Impossible pour moi de faire une extraction de PDF, le plugin m’indiquant que pdftotext n’est pas disponible sur le serveur (CentOS 6.5), alors que le binaire est présent (testé également en indiquant en dur le chemin du binaire dans mes_options.php).
    pdftotext provient du paquet poppler.x86_64. Je précise que l’extraction fonctionne en console (loggué sur le serveur, user non root).
    Les droits d’éxécution (sudoers) ont été vérifiés et ne semblent pas poser problème
    Les logs extract.log et prive_extract.log ne sont pas très explicites et indiquent juste une erreur d’extraction, ex :


    Oct 02 15:16:45 une_adresse_ip (pid 21566) Indexation de pdf/16_mai_2013.pdf
    Oct 02 15:16:45 une_adresse_ip (pid 21566) Extraction PDF avec /usr/local/bin/pdftotext -enc Latin1 IMG/pdf/16_mai_2013.pdf
    Oct 02 15:16:45 une_adresse_ip (pid 21566) Erreur extraction IMG/pdf/16_mai_2013.pdf (code 127) :

    SPIP - v2.1.26
    Plugin FullText - v0.8.2

    Merci d’avance de votre aide.

    • Moi je pense que l’auteur aurait du utiliser le fonction File_exists de php. Ca sert à rien de lancer un exec sur un fichier par exemple dans windows Ca ne fonctionne pas la majorité du temps.

    Répondre à ce message

  • Fixer une date de départ (cf §Permettre à l’utilisateur de déterminer le corpus de recherche)
    Sur un SPIP 3.0.17, il semble qu’il y ait un problème avec la fonctionnalité décrite (limiter la recherche aux « objets » dont la date est postérieure à l’année saisie)

    J’ai modifié le formulaire recherche de la dits tel que décrit.

    • L’input date est présent.
    • Après soumission, l’argument recherche_date est bien pris en compte
      (ici : spip.php ?page=recherche&recherche=semis+direct&recherche_date=2015
    • recherche_date est récupéré par la page recherche.html mais n’est pas correctement transmis au /compris par le formulaire de recherche
      voir copie d’écran (j’ai mis des [<pre>#SQUELETTE : (#ENV**|unserialize|print_r{1})</pre>] dans le squelette appelant et en tête du fichier du formulaire de recherche pour voir ce qu’il se passait)

    Bien sûr, la limitation de date souhaitée ne fonctionne pas.

    Quelque chose que j’ai mal fait ? Un oubli dans la doc ?… Un bug ?

    Répondre à ce message

  • Le plugin marche très bien avec SPIP v3.0.15. J’ai juste eu la petite surprise de constater que les recherches sur un seul mot ne donnaient parfois pas les mêmes résultats suivant la syntaxe de la recherche :
    -  un seul mot de de 3 lettres (j’ai étendu la recherche aux mots de 3 lettres tel qu’indiqué dans la documentation) : abc se comporte comme abc*. « abc » et +abc ont le comportement attendu. Pour corriger ce problème, j’ai rajouté des guillemets avant l’appel du plugin dans ce cas. Ça marche, mais s’est franchement sale :)

    -  un seul mot de 1 ou 2 lettres : même soucis que précédemment sauf que ce n’est pas vraiment gênant. « ab » et +ab ne sortent aucun résultat, ce qui est attendu.

    -  le ranking pour les mots de 4 à 7 lettres est différent que la recherche soit mon_mot ou +mon_mot (ou « mon_mot »). Je n’ai pas analysé en détails mais il me semble à première vue que le résultat attendu est obtenu avec le + ou les guillemets.

    De plus n’y aurait-il pas un soucis avec le caractère ’è’ ? La recherche est indépendante des accents (et marche même avec ’œ’) mais le ’è’ semble devoir être présent dans le champ de recherche pour qu’elle aboutisse correctement. Ce n’est pas dramatique en pratique car de toutes façons les utilisateurs tapent les accents dans le champ de recherche. C’est juste bizarre...

    Enfin, une petite requête : ne serait-il pas judicieux que la recherche ait un « mega-boost » lorsque le champ entier indexé est égal à la requête ? Par exemple, je rêve que si la base contient un article dont le titre est Fulltext et que la requête est fulltext, la recherche le sorte premier haut la main devant d’autres articles dont le titre est Fulltext marche très bien ou La recherche fulltext est active. Ce n’est peut-être pas possible, mais ce serait pratique.

    Répondre à ce message

  • 1

    Bonjour,
    Sur un site en SPIP 3.0.17 [21515] avec Fulltext Version :
    0.8.2 SVN [82959] activé

    j’ai une erreur lors de la recherche sur le site public :

    1 Erreur SQL 1146
    Table ’site.spip_giss_articles’ doesn’t exist
    SELECT t.id_article, t.surtitre, t.titre, t.soustitre, t.chapo, t.texte, t.ps, t.nom_site, t.url_site, t.descriptif, MATCH(t.titre) AGAINST (’ssr*’ IN BOOLEAN MODE) * 8 +
    ...
    / /
    2 Erreur SQL 1146
    Table ’isite.spip_giss_rubriques’ doesn’t exist

    je vois qu’il y a un « s » en trop à gis mais je ne sais pas où le corriger

    merci
    dd

    • Bonjour

      Même problème depuis la maj du plugin. Quelqu’un a-t-il trouvé l’origine du bug ?

    Répondre à ce message

  • Bonjour,

    tout d’abord merci pour votre plugin.

    J’ai bien intégré les éléments mais une chose curieuse se produit.

    Quand je recherche des termes ainsi qu’a partir d’une date (comme le cite votre explication), cela fonctionne mais si je change la date à nouveau, ça ne le prend plus en compte. Par précaution, j’ai désactivé le cache. C’est très aléatoire. je n’ai plus d’idées.

    Avez vous déjà constaté ce comportement ?
    merci d’avance.

    Répondre à ce message

  • obiwanriko

    Merci à Leam ! Effectivement lorsque l’on fait comme dit : « En créant tous les index (à la fin de la page configuration) le problème » Le bug table spip_paquets_plugins doesn’t exist (et autres tables... suivant le splugins installés) disparait de l’admin ! ouf !

    Répondre à ce message

  • 5

    Bonjour ,

    Je voudrais pouvoir faire une recherche sur les albums, plugin albumV2.

    j’ai ajouté dans inc/rechercher.php : pipeline(’rechercher_liste_des_champs’ ... ’album’ => array( ’titre’ => 8, ’descriptif’ => 5

     ?exec=fulltext ,
    PhpMyAdmin : j’ai donc une table blop_albums (pas spip_albums) en MyIsam ,
    a été créé un index fulltext sur le champ titre :
    NomIndex|Type|Unique|Compressé|Colonne|...
    titre|FULLTEXT|Non|Non|titre|1| |Non|

    mais le type du champ texte est varchar(255) ! et non pas « text » est-ce cela qui peut bloquer ?
    La doc disant « Seuls les champs de type TEXT (ou LONGTEXT etc) peuvent faire partie d’un index FULLTEXT » j’imagine que de de là peut venir le problème !
    si oui, est-ce que je peux convertir sans risque pour le fonctionnement du plugin album ?

    • j’ai passé le champ titre de la table _albums en type TEXT , mais ça n’a aucun effet, pas de recherche sur les albums ... vous auriez une idée ?

    • point étonnant (si lier...) : c’est que la recherche sur les albums dans l’espace privé est maintenant parfaitement opérante et efficace. Mais du côté public, niet.

    • pour préciser le pb :
      -  sur ecrire/ ?exec=fulltext j’ai bien album (22262) , l’index ’titre’ créé
      -  rien dans tmp/recherche.log pour album
      j’ai essayé de supprimer recréer les index fulltext via phpmyadmin et ecrire/ ?exec=fulltext sans résultat. Si qcq’un avait une idée à me suggérer ...

    • il suffisait d’ajouter dans le squelette recherche.html :

      [(#REM) Albums trouves ]
      	<B_albums>  ...
      	<BOUCLE_albums(ALBUMS) {recherche} {!par points}>
      etc.

       ;o)
      8 mois que je (re)cherche la solution du pb dans recherche.php, les pipelines, les fct° php, phpmyadmin ...
      Pour les nuls comme moi ... ça vaut sans doute le coup de le mettre dans la doc

    • La Recherche en SPIP est expliquée dans la doc. officielle,
      mais d’après ce que je comprends de ta recherche,
      c’est http://spippourlesnuls.fr/ ?rechercher-dans-un-site-spip que tu aurais voulu ?

      N’hésite pas a me renvoyer des demandes plus précises..
      Cdlt
      YannX

    Répondre à ce message

  • 2

    Bonjour,
    J’ai un petit souci avec Fulltext, j’ai créé un objet éditorial (via le plugin Fabrique), cet objet me permet d’étendre les auteurs SPIP (en ajoutant un tas de champs), je souhaite donc effectuer des recherches sur cet objet éditorial, malheureusement le formulaire de recherche ne remonte que ce qu’il trouve dans la table auteurs en ignorant la jointure sur profils

    -  Dans mon theme (un plugin), j’ai bien ajouté dans paquet.xml un « utilise » sur Fulltext
    -  J’ai bien créé l’indexation de mon plugin via ?exec=fulltext
    -  j’ai surchargé inc/rechercher.php en ajoutant ma table et les pondérations sur les champs
    -  J’ai bien ajouté ces mêmes champs dans mon plugin dans base/profil.php > fonction profil_declarer_tables_objets_sql dans « rechercher_champs »

    Visiblement ma recherche tape toujours dans la table auteurs mais pas dans profils...

    Any idea ?

    Merci d’avance !

    • Bonjour,
      je rencontre la même difficulté pour le plugin album V2
      -  j’ai pour album l’index ’titre’ créé via ?exec=fulltext
      -  j’ai surchargé inc/rechercher.php en ajoutant album et les pondérations sur les champs
      par contre
      -  j’ai pas ajouté dans le paquet.xml de album un « utilise » sur Fulltext (je peux essayer si vous me précisez ce qu’il faut ajouter)
      -  j’ai pas ajouté dans base/profil.php > fonction profil_declarer_... (?..) (idem ...)

      dans l’espace privé la recherche est parfaitement opérationnelle
      sur le site public pas de recherche sur les albums !

      recherche.log :
      dans espace privé :

      Jun 26 21:42:32 81.57.179.103 (pid 19185) :Pri:info: fulltext album: titre
      Jun 26 21:42:32 81.57.179.103 (pid 19185) :Pri:info: 
      Jun 26 21:42:32 81.57.179.103 (pid 19185) :Pri:info: fulltext mot: titre
      Jun 26 21:42:32 81.57.179.103 (pid 19185) :Pri:info: (MATCH(t.<span class="base64" title="PGNvZGUgY2xhc3M9InNwaXBfY29kZSBzcGlwX2NvZGVfaW5saW5lIiBkaXI9Imx0ciI+dGl0cmU8L2NvZGU+"></span>) AGAINST ('gargamel')) * 8 + IF(SUM(o1.score) IS NULL,0,SUM(o1.score)) AS score
      Jun 26 21:42:32 81.57.179.103 (pid 19185) :Pri:info: recherche album (gargamel) : 1 resultats 222.351 ms

      sur site public :

      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: fulltext article: titre
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: 
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: fulltext auteur: nom
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: 
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: 
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: fulltext mot: titre
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: (MATCH(t.<span class="base64" title="PGNvZGUgY2xhc3M9InNwaXBfY29kZSBzcGlwX2NvZGVfaW5saW5lIiBkaXI9Imx0ciI+dGl0cmU8L2NvZGU+"></span>) AGAINST ('gargamel')) * 8 + IF(SUM(o1.score) IS NULL,0,SUM(o1.score)) + IF(SUM(o3.score) IS NULL,0,SUM(o3.score)) AS score
      Jun 26 23:16:33 81.57.179.103 (pid 4198) :Pub:info: recherche article (gargamel) : 0 resultats 32.487 ms
      ...

      etc. (30 ligne aucune album)

    • Bonjour,
      venant de résoudre mon pb je me demande s’il pourrait éclairer le votre.
      Ajouter comme je l’ai fait une boucle pour auteurs ou pour profils dans recherche.html n’est sans doute pas la solution. Un problème de jointure ...
      je vois dans le plugin albums dans base/albums.php ces lignes en plus dans fonction albums_declarer_tables_objets_sql :

      // jointures sur les albums pour tous les objets
      // passe apres id_auteur=>auteurs_liens et evite de le casser
      $tables[]['tables_jointures'][]= 'albums_liens';
      $tables[]['tables_jointures'][]= 'albums';

      si ça vous « parle » et peut vous aider

    Répondre à ce message

  • Bonjour,

    Ma configuration :
    -  spip 3.0.17 en utf-8
    -  plugin fulltext 0.8.2
    -  mysql 5.5.38 utf-8

    Après avoir indexé tous les index suggérés, j’obtiens le message en bas de la page :

    Une incohérence entre le charset de votre site et celui des tables de votre base de données risque de fausser les recherches avec caractères accentués :convertir en UTF-8 pour restaurer la cohérence

    Quand je clique sur le lien « convertir en UTF-8 pour restaurer la cohérence », il m’envoie à la page ecrire/?exec=convert_sql_utf8 qui n’existe pas.

    J’obtiens le message d’erreur :

    Fichier convert_sql_utf8 introuvable

    Alors j’ai installé le plugin grenier qui propose le script ecrire/?exec=base_convert_sql_utf8 (et non ecrire/?exec=convert_sql_utf8).

    Il faudrait peut-être adapter le plugin fulltext pour spip3.0 :

    1. mettre une dépendance vis-à-vis du plugin grenier
    2. lancer le script ecrire/?exec=base_convert_sql_utf8 en cas d’incohérence

    bien à vous,

    Répondre à ce message

  • 2

    bonjour

    idem,

    la recherche ne se fait plus que sur le champ titre malgré la reconstruction des index. Je ne sais pas depuis quelle version c’est comme celà

    Répondre à ce message

Ajouter un commentaire

Avant de faire part d’un problème sur un plugin X, merci de lire ce qui suit :

  • Désactiver tous les plugins que vous ne voulez pas tester afin de vous assurer que le bug vient bien du plugin X. Cela vous évitera d’écrire sur le forum d’une contribution qui n’est finalement pas en cause.
  • Cherchez et notez les numéros de version de tout ce qui est en place au moment du test :
    • version de SPIP, en bas de la partie privée
    • version du plugin testé et des éventuels plugins nécessités
    • version de PHP (exec=info en partie privée)
    • version de MySQL / SQLite
  • Si votre problème concerne la partie publique de votre site, donnez une URL où le bug est visible, pour que les gens puissent voir par eux-mêmes.
  • En cas de page blanche, merci d’activer l’affichage des erreurs, et d’indiquer ensuite l’erreur qui apparaît.

Merci d’avance pour les personnes qui vous aideront !

Par ailleurs, n’oubliez pas que les contributeurs et contributrices ont une vie en dehors de SPIP.

Qui êtes-vous ?
[Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Ajouter un document

Suivre les commentaires : RSS 2.0 | Atom