Levenshtein

Proposition de mots lors de la recherche.

La principale vocation du plugin Levenshtein est de proposer des corrections de mots lors de la recherche.

Dépendance

Pour fonctionner le plugin a besoin d’un lexique dans lequel faire les recherches et comparaisons.

Pour cela, il dispose du pipeline levenshtein_calculer.

Ce pipeline fournit 2 paramètres :

  • mot : les mots qui sont candidats à être des corrections du mot.
  • term : le mot à rechercher.

Exemple dans le plugin Vocabulaire :

function vocabulaire_levenshtein_calculer($flux) {
	$get_lev = sql_allfetsel('mot', 'spip_vocabulaires', 'SOUNDEX(mot) = SOUNDEX('.sql_quote($flux['term']).')');
	$flux['mot'] = array_merge($flux['mot'], $get_lev);
	return $flux;
}

Ensuite, le plugin va calculer la distance de levenshtein et filtrer pour ne garder que les mots les plus proches.

L’affichage

L’affichage des propositions de correction se fait via la balise #LEVENSHTEIN. Si aucun paramètre n’est passé à la balise, elle utilisera automatiquement le contenu de la recherche (_request(’recherche’)).

Si un paramètre est passé à la balise, il sera utilisé à la place de ’recherche’ (_request(’mon_truc’))

Les SOUNDEX

L’utilisation des SOUNDEX de mysql est un précieux allié quand on travaille sur les corrections de mots.
Le plugin Vocabulaire référence 336531 mots français. Impossible de tester chaque mots avec la distance de Levenshtein, les serveurs classiques ne le supporteraient pas.

C’est là qu’interviennent les SOUNDEX, cela filtre les mots d’une base de donnée pour renvoyer les mots qui « sonne » comme les autres. Cela fait directement moins de mots à tester.

Ce plugin est installé sur le moteur de recherche de mon site personnel. N’hésitez pas à jouer avec !

Un merci spécial à Vladimir Levenshtein pour sa découverte mathématique et à PHP pour offrir une fonction levenshtein out of the box.

Discussion

Une discussion

  • 3

    Bonjour,

    J’obtiens cette erreur sur la page de configuration en spip3.1 :

    1 Filtre levenshtein_spip non défini ../plugins/auto/levenshtein/v1.0.1/prive/squelettes/contenu/configurer_levenshtein.html

    ainsi qu’un string(8) « broeutte »

    Je réinstalle pour voir si dès fois...

    Répondre à ce message

Ajouter un commentaire

Avant de faire part d’un problème sur un plugin X, merci de lire ce qui suit :

  • Désactiver tous les plugins que vous ne voulez pas tester afin de vous assurer que le bug vient bien du plugin X. Cela vous évitera d’écrire sur le forum d’une contribution qui n’est finalement pas en cause.
  • Cherchez et notez les numéros de version de tout ce qui est en place au moment du test :
    • version de SPIP, en bas de la partie privée
    • version du plugin testé et des éventuels plugins nécessités
    • version de PHP (exec=info en partie privée)
    • version de MySQL / SQLite
  • Si votre problème concerne la partie publique de votre site, donnez une URL où le bug est visible, pour que les gens puissent voir par eux-mêmes.
  • En cas de page blanche, merci d’activer l’affichage des erreurs, et d’indiquer ensuite l’erreur qui apparaît.

Merci d’avance pour les personnes qui vous aideront !

Par ailleurs, n’oubliez pas que les contributeurs et contributrices ont une vie en dehors de SPIP.

Qui êtes-vous ?
[Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Ajouter un document

Suivre les commentaires : RSS 2.0 | Atom