odt2spip : création d’articles à partir de fichiers OpenOffice Writer

Ce plugin permet de générer un article SPIP à partir du téléchargement d’un fichier au format .ODT (OpenOffice ou LibreOffice Writer). Il gère la majorité des raccourcis typographiques, détecte les différents niveaux de titre et fait l’intégration des images automatiquement.

Voir aussi la documentation de la version 3
odt2spip v3+ : création d’articles à partir de fichiers textes

Important :
La transformation des fichiers ODT impose que l’extension XSL de PHP soit active sur le serveur web

Installation

  • téléchargez le zip du plugin correspondant à votre version de SPIP
  • pour l’installation et l’activation, suivez la procédure standard : cf la documentation officielle

Utilisation

Rien que de très simple : une fois le plugin activé, dans la page de gestion d’une rubrique vous trouverez une boite de dialogue qui permet de choisir le fichier à télécharger depuis votre ordinateur : « Créer un article à partir d’un fichier ODT ».

De la même manière, si vous souhaitez remplacer le contenu d’un article existant par celui d’un fichier odt, dans les pages des articles vous trouverez la boite de dialogue « Remplacer l’article par le contenu d’un fichier ODT ».

Une fois validé l’article est automatiquement créé avec le statut « proposé à la publication », si nécessaire le fichier ODT original est attaché comme document à l’article et le plugin vous bascule sur la page de cet article.

La transformation opérée par le plugin

Ce plugin ne fait qu’une transformation du contenu du fichier en code SPIP : il n’assure aucun miracle si votre fichier initial est construit de façon non-conforme aux règles de l’utilisation d’un traitement de texte et ne fera rien que vous ne puissiez reproduire avec les raccourcis typographiques de SPIP...

Un exemple de page générée à partir d’un fichier « type » : http://tice.espe.univ-amu.fr/demo/s...

Plus de précisions :

  • il est nécessaire d’avoir utilisé les styles pour définir les titres dans le fichier OpenOffice si vous voulez que le plugin les détecte. La conversion se fait selon les règles suivante (que les puristes passent leur chemin, il n’y a ici aucun respect des aspects sémantiques habituellement liés à l’utilisation des raccourcis typographiques !) :

    • si il existe au moins un paragraphe avec le style Titre, son contenu est utilisé pour générer le titre de l’article. Sinon c’est le Titre de niveau le plus important qui est utilisé : Titre 1 > Titre 2 > Titre 3... .
    • Le premier niveau de Titres est transformé en intertitres SPIP {{{Titre niveau 1 intertitre}}}(si Titre 1 n’existe pas, Titre 2 est utilisé à sa place, Titre 3 à la place de Titre 2, et ainsi de suite)
    • le deuxième niveau est mis en gras et séparé du restant par des sauts de lignes {{Titre niveau 2 en gras}}
    • tous les autres niveaux de titre sont passés en italique et séparés par des sauts de ligne {Titres de niveau 3, 4, 5... en italique}
  • si d’aventure vous aviez décidé d’utiliser le plugin Enluminure typographique ou le plugin Intertitres hiérarchisés qui définissent et utilisent des niveaux de titres supplémentaires (vade retro satanas !), odt2spip détecte leur présence et, automatiquement, utilise les raccourcis « enrichis » tels que {2{titre niveau deux}2} ou {4{titre niveau quatre}4} (ces raccourcis sont interprétés par ces 2 plugins).
  • Le plugin récupère les images intégrées dans le fichier d’origine à condition qu’elles soient au format jpg ou png ou gif (n’espérez rien si vous avez des fichier BMP ou TIFF intégrés !), les retaille pour approximer du mieux possible la taille qu’elles avaient dans le texte, les intègre comme documents SPIP et les place avec un raccourci de la forme <imgXXX|left> ou <imgXXX|right> ou <imgXXX|center> en fonction de la position à laquelle se trouvait l’image dans le texte d’origine.
    Attention ! pour que cette fonctionnalité soit opérationnelle, il faut que les images aient été intégrées dans le texte en utilisant les fonctions d’insertion d’image (menu « Insertion » > « Image » > « A partir d’un fichier... ») et non pas via un copié/collé du contenu de l’image dans le texte (qui génère un bitmap non récupérable).
  • Les formules mathématiques (rédigées à l’aide de l’éditeur d’équation natif d’OOo Writer ou des outils complémentaires tels l’excellent Cmath) sont en principe complètement gérées : le plugin génère le code LateX et le place dans une balise math : <math>$\frac{\sqrt{2x+9}}{4y-6}=\frac{\alpha 3}{\beta 2}$</math>
  • Les notes de bas de page sont gérées sans problèmes ni restrictions.
  • Pour les tableaux, pas de problème tant que vous n’essayez pas de faire des tableaux imbriqués (c’est à dire un tableau dans une cellule de tableau) : les fusions de cellules horizontales et verticales sont gérées en principe correctement.
  • Les listes à puce et numérotées, imbriquées ou non, sont en principe correctement gérées tant qu’elles ne sont pas interrompues par d’autres éléments (donc pas de reprise de numérotation d’une liste à la suivante).

Eléments non-gérés ou supprimés

  • Pour les tableaux et les listes le plugin ne gère pas les contenus ayant un style de Titre.
  • Les fioritures de style de texte sont limitées à celles autorisées par les raccourcis typographiques : gras et italique donc pas de texte de couleur ni avec des fonds colorés (beurk !), pas de variations de police ni de taille de texte (ce qui évitera que les rédacteurs pourrissent la charte graphique du site !)
  • Les en-têtes, pieds de page, index ou table des matières sont purement et simplement supprimés.
  • Les dessins (flêches, bulles et autres formes crées avec l’outil de dessin d’OOo Writer) ne sont pas (encore ?) supportés.

Utilisation de fichiers Word :

Pour passer d’un fichier Word (format .doc ou .docx) à un fichier odt utilisable par ce plugin, il est conseillé de faire la conversion (« enregistrer sous... » au format ODT) dans LibreOffice (ou OpenOffice) et non pas dans Word (vous avez déja vu un logiciel Microsoft respecter correctement des spécifications de format standard ???)

TO DO

  • Comme d’habitude, piètre graphiste que je suis, si quelqu’un avait le courage de faire un logo moins crasseux, il est le bienvenu ! Merci popojcb !
  • Ajouter la gestion des dessins SVG intégrés dans le fichier texte (avec une version jpg obtenue par conversion automatique pour les navigateurs qui supportent pas svg..)
  • Ajouter la gestion des équations mathématiques qui sont en MathML dans le fichier texte (si vous connaissez un convertisseur MathML -> LaTeX écrit en PHP et open-source, merci de me prévenir !) Merci Amaury Adon pour m’avoir trouvé la référence de la librairie XSLT « MathML 2.0 to LaTeX »
  • Ajouter une interface de configuration pour rendre paramétrable les conversion « imposées » pour les niveaux de titre...

Notes techniques

Le moteur de transformation du fichier odt est basé sur une feuille de style XSLT (/odt2spip/inc/odt2spip.xsl) qui opère sur le fichier content.xml extrait du fichier odt envoyé et dézippé dans un répertoire temporaire /tmp/odt2spip/XXX où XXX représente l’id_auteur en cours . Cette transformation permet de produire le titre et le texte de l’article. Les images sont également extraites du fichier dézippé et intégrées comme documents attachés à cet article (après un éventuel redimensionnement). Le répertoire temporaire de l’auteur (/tmp/odt2_spip/XXX) est effacé à la fin de l’opération.

Si vous souhaitez participer au développement de ce plugin ou faire des modifications du convertisseur XSLT, le répertoire /tests de ce plugin comprend le fichier ODT « type » ainsi que le fichier xml correspondant pour réaliser vos tests.

Si vous êtes sur un SPIP mutualisé, il se peut que vous ayez des problèmes de chemins vers les fichiers lors de la transformation xslt : voir ce fil de discussion pour une éventuelle solution (pour PHP 5) problème réglé avec la version [0.14].

Versions

[version 0.11] support des formules mathématiques

[version 0.12] choix du mode d’intégration des images (img / doc)

[version 0.13] choix de la langue de publication de l’article généré

[version 0.14] compatibilité avec la mutualisation du noyau SPIP 2.0

[version 0.15] compatibilité avec la barre typo V3 (cf #forum435614) et correction de l’incompatibilité des fonctions de révision du plugin snippets avec la version 2.1 de SPIP (cf #forum434725)

[version 2.0] compatibilité SPIP 3.0

[version 2.1] permettre la mise à jour d’un article à partir d’un fichier odt (cf #forum474504)

Ce plugin existe en 2 version :

  • La version « historique » (0.15.3, fichier odt2spip_19_20_21.zip) assure un maximum de compatibilité PHP / SPIP : php5 + spip 2.* , php5 + spip 1.9.2*, php4 + spip 2.*, php4 + spip 1.9.2*.
  • la version « actuelle » : (2.1.*, fichier odt2spip_30.zip) exclusivement PHP 5 + SPIP 3.*

Mille mercis à popojcb pour le logo, à mmmxvvv et D. Bard pour les fichiers de langue.

Librairie XSLT utilisée pour la conversion des formules MathML d’OOo vers LateX : MathML 2.0 to LaTeX de Vasil Yaroshevich http://www.raleigh.ru/MathML/mmltex...

Pour ce qui est du traitement des sauts de lignes/sauts de paragraphes, merci de lire http://contrib.spip.net/odt2spip-cr... avant de poster une réclamation ! : merci à dreline pour avoir réglé ce problème !

Discussion

69 discussions

  • 2

    Bonjour,
    Ce plugin est effectivement très utile mais celui qui fait l’opération inverse existe-t-il ? Spip2Odt ? Ça m’intéresserait pour récupérer un milliers d’articles sur un site SPIP... :-/
    Cordialement,
    Philippe

    Répondre à ce message

  • lilibaba83

    Bonjour,

    Depuis quelques temps j’ai cette erreur pour chaque image contenue dans le fichier odt :

    Warning : preg_replace() : Compilation failed : invalid range in character class at offset 7 in /home/www/unesecondevie/vues/ecrire/inc/documents.php on line 122
    HTTP 302

    Que ce passe t il ?

    merci de votre aide.

    Répondre à ce message

  • Bonjour,
    Une petite correction de forme dans le formulaire : le texte « Aucun fichier sélectionné » déborde du cadre. Voir fichier joint ;-)

    Répondre à ce message

  • 2

    Comme c’est bientôt Noël et qu’on ne sait jamais j’en profite pour faire une demande supplémentaire.

    Serait-il envisageable que le plugin récupère automatiquement dans les champs Descriptif et Chapo les paragraphes de style « descriptif » et « chapo » (ou d’autres noms mais fixés par le plugin) ? De cette façon non seulement les articles seraient écrits correctement, mais en plus les champs seraient tous remplis ce qui serait formidable pour tous ceux qui utilisent ces champs de SPIP (ce que je conseille très fortement) et du coup, le retravail sur un article serait voisin du zéro hormis les images (je préfère intégrer les images à la main parce que je ne supporte pas les noms avec des longs chiffres mais c’est personnel).

    Au besoin, on pourrait même ajouter un modèle de saisie d’article donc au format odt, ici ou ailleurs, pour faciliter le travail des rédacteurs qui ne sont pas des paresseux mais qui préfèrent travailler sur la qualité du texte plutôt que de se concentrer que l’aspect technique (je peux même le concevoir si on veut et le mettre en ligne aussi sur le site des modèles de LibreOffice voire sur celui d’OpenOffice).

    En tous cas moi, ça m’arrangerait bien.

    Encore merci pour ce plugin.

    • oui, on pourrait imaginer arriver à quelque chose d’automatique à partir de paragraphes ayant des styles fixés (basiquement on pourrait prendre le nom du champ comme nom de style : « descriptif », « chapo », « surtitre », « ps »...). Ca me semble d’ailleurs complémentaire avec la demande de ton message du 11/09.
      Alors je ne promet rien mais comme il va falloir que je fasse le passage en SPIP 3.1 ça pourrait être une occase si il s’avère que ça ne demande pas des journées complètes de débogage des XSLT...

    • Eh eh eh, c’était une commande pour le père Noël, si ça peut aboutir à quelque chose et bien tant mieux, sinon tant pis.
      De toute façon, là j’ai déjà pondu un modèle pour article SPIP qui va me servir à moi, c’est pas tout perdu :-).
      Il est en ligne pour quelques temps ici :
      http://www.numericoach.net/?-Divers-docs-
      ou bien : http://www.numericoach.net/?Titre-1-titre-de-l-article-suivi

      Login : odt2
      Mot de passe : plugin.

      à toute fins utiles .

      Et oui, l’article a été généré avec odt2spip.

      En tous cas merci de toute façon.

    Répondre à ce message

  • 6

    Bonjour,

    J’utilise odt2spip pour faire des tableaux à partir de fichiers pdf en copier-coller, corrigés manuellement sur un fichier Libre office.

    Ca marche bien sauf que les textes ne sont pas alignés (que j’ajoute ou non des photos).

    Merci pour toute aide.

    Spip 3.0.17

    • à priori ça c’est un problème indépendant de odt2spip : la mise en page du tableau (donc l’alignement) étant du ressort de la feuille de style qui lui est appliqué...

    • Rebonjour,

      Dans mon tableau de base Libre office version 4.3.1.2 les paragraphes de chaque colonne sont bien alignés, sans couleur. C’est ce que je voudrais obtenir dans les articles de mon site.

      Tu parles de feuille de style appliquée. Ça se trouve où ?

    • oui, les « symptômes » que tu décris semblent liés à une feuille de style CSS appliquée par ton squelette SPIP. Pour aller plus loin il faudrait l’URL d’une page ayant un tableau avec cette mise en page.

    • Merci de t’intéresser à mon problème.
      Voici un exemple :
      http://franc-parler.jp/spip.php?article537&lang=fr

    • ce « problème » d’alignement est lié à la feuille de style general.css du squelette Escal : en effet à la ligne 1012 de cette feuille de style on trouve :
      table.spip td { ... vertical-align: middle; ...}
      qui provoque l’alignement des blocs de texte à mi-hauteur des cellules du tableau.

      Selon la documentation de ce squelette, la solution la plus élégante serait de créer un fichier squelettes/styles/perso.css dans votre SPIP et d’y mettre cette simple ligne :
      table.spip td { vertical-align: top; }

    • Mille mercis !

      Mon petit souci est résolu.

    Répondre à ce message

  • 2

    C’est encore plus puissant que ce que je pensais.
    Je viens d’intégrer, pour tester, un CV avec une partie en deux colonnes, mais fait dans les règles de l’art (avec des styles et tout le toutim) : tout a été intégré très proprement et le texte mis en deux colonnes remis sur une seule et correctement (pas de gloubilgoulba de textes).
    Cela dit, personnellement j’utilise des styles pour tout, donc mes gras et italiques sont en style accentuation forte et accentuation (ceux par défaut de LibreOffice). Serait-il envisageable que le plugin récupère les gras et les italiques à partir de là ? C’est d’une importance mineure cela dit.

    • A priori ça ne semble pas une mauvaise idée : je note pour une prochaine version (sous réserve que la récupération du style dans le fichier ODT ne soit pas problématique...)

    • Wordpress interprète ça comme des balises « strong ». A priori ces notions devraient pouvoir passer aussi dans SPIP qui fait mieux. Mais effectivement, on ne sait jamais.

    Répondre à ce message

  • 1

    Il y a un petit bug très mineur depuis, je pense, la dernière mise à jour : le message « Installation réussie » reste affiché sur la page de gestion des plugins, même si on clique sur la croix pour le désafficher, il revient systématiquement dès qu’on réaffiche cette page.

    Ça n’empêche pas de travailler, ça n’a aucun impact sur le fonctionnement, c’est donc tout à fait mineur et pas gênant. Mais si cela devenait une mode que tous les plugins se mettaient à suivre, on serait mal barrés :-)

    Répondre à ce message

  • 3

    si nécessaire le fichier ODT original est attaché comme document à l’article

    Ajouter une interface de configuration pour rendre paramétrable les conversion « imposées » pour les niveaux de titre...

    Serait-il possible dans cette future interface de configuration de pouvoir choisir le comportement par défaut d’odt2spip quant à l’attachement ou non du fichier ODT d’origine ?

    Dans plusieurs sites ont je m’occupe, le comportement pas défaut qui m’intéresse est de ne pas attacher le fichier ODT.

    En attendant une telle interface de configuration, quel est le fichier du plugin à modifier pour avoir un tel comportement par défaut et quelle est la modification du code à opérer dans ce cas ?

    merci d’avance

    • bonne idée : la version 2.1.1 propose donc une option de configuration pour ce comportement (cf http://zone.spip.org/trac/spip-zone...)

    • Merci de cette réactivité !

      Si j’avais su, j’aurais fait cette suggestion plus tôt.

      Une autre suggestion :
      Ajouter une phrase de méthode à appliquer quand le texte d’origine était un document MS Word :
      exemple :
      -  Si le texte d’origine vient d’un document MS Word, évitez les copier-coller directement de Word vers OpenOffice ou LibreOffice Writer.
      -  Passer par l’intermédiaire d’un éditeur de texte simple, mais gérant le .RTF (pour ne par perdre gras italique et liens)
      -  Vous éviterez ainsi des temps de calcul parfois interminables à l’importation par odt2spip et un texte truffé de métadonnées issues de MS Word et réduisant à néant le temps gagné par l’importation.
      -  Exemple : < !—[if gte mso 9]>< !—StartFragment—>

      À rédiger de façon, sans doute, plus simple.

    • J’ai bien fait de lire cette page. Hop, aussitôt lu, aussitôt fait.

      Merci.

    Répondre à ce message

  • 3

    Bonjour,
    Je viens d’utiliser ce plugin sur un site externe (SPIP 2.1.8) et je m’aperçois qu’il ne prend pas en charge les liens.
    C’est amusant car en 2004 il y avait un petit logiciel (en exe, pour windows, et en freeware...) spipedit qui le faisait.
    Est-ce que c’est que techniquement ce n’est pas possible ou bien trop compliqué que ce n’est pas implémenté ?
    Merci.

    • En ce qui me concerne la version 0.15.2 de ce plugin + SPIP 2.1.25 fonctionne très bien pour ce qui est des liens : cf http://mutu.i-climb.com/spip.php?ar... avec le fichier ODT original et l’article résultant de son intégration.
      Peut être un petite mise à jour de ton plugin et de ton SPIP (2.1.8 c’est pas très sécurit comme version...)
      Quand à spipédit, le dev à décidé d’arrêter le développement et comme ça n’était pas du libre, ce logiciel n’est plus disponible si ce n’est pour ceux qui en ont précieusement gardé une version de côté !

    • Si seulement je pouvais.... J’utilise SPIP sur un site dont je n’ai aucune maîtrise...
      Je suis donc ravie de voir que ce n’est qu’un problème de version ou d’installation, et je vais tenter (pas gagné) de les convaincre de mettre à jour !
      Par ailleurs, ce fichier modèle qui contient les raccourcis de SPIP pour test est disponible quelque part ?
      Merci beaucoup.

    • disons que ça n’est qu’une hypothèse à vérifier... Pour cela tu trouvera le fichier de test test_complet.odt soit en téléchargement sur l’article cité dans mon message précédent soit dans le répertoire « tests » du plugin.

    Répondre à ce message

  • 2

    Salut cy_altern et merci (encore) pour ce beau plugin, je l’emploie de plus en plus (les users deviennent paresseux...).

    Deux idées :
    -  permettre de màj un article via le plugin (ou forcer un id_article ?)
    -  Pour le titre d’article, récupérer « Titre principal » en priorité s’il existe (c’est le style que je trouve le plus souvent en LO quand le user met le titre dans l’entête avec m$ wOrd)

    Je les mets là pour discussion et mémoire (je sais que personne ne s’ennuye ;-) )

    • Etant donné la réécriture de ce plugin faite pour la version SPIP 3, le premier point ne semble pas trop compliqué à coder pour une fonctionnalité qui sera largement utilisée : c’est donc intégré avec la version 2.1.0

    • Oh ! Super merci !

      1. Je vais apprendre des trucs sur SPIP en regardant le code
      2. Gros gain de temps quand l’import se passe « mal »/l’article n’est pas propre (les urls, les images dupliquées...Jusque là je créais un nouvel article si correction)

      Je reviens après tests... !

       :-*

      Suske

    Répondre à ce message

Ajouter un commentaire

Avant de faire part d’un problème sur un plugin X, merci de lire ce qui suit :

  • Désactiver tous les plugins que vous ne voulez pas tester afin de vous assurer que le bug vient bien du plugin X. Cela vous évitera d’écrire sur le forum d’une contribution qui n’est finalement pas en cause.
  • Cherchez et notez les numéros de version de tout ce qui est en place au moment du test :
    • version de SPIP, en bas de la partie privée
    • version du plugin testé et des éventuels plugins nécessités
    • version de PHP (exec=info en partie privée)
    • version de MySQL / SQLite
  • Si votre problème concerne la partie publique de votre site, donnez une URL où le bug est visible, pour que les gens puissent voir par eux-mêmes.
  • En cas de page blanche, merci d’activer l’affichage des erreurs, et d’indiquer ensuite l’erreur qui apparaît.

Merci d’avance pour les personnes qui vous aideront !

Par ailleurs, n’oubliez pas que les contributeurs et contributrices ont une vie en dehors de SPIP.

Qui êtes-vous ?
[Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Ajouter un document

Suivre les commentaires : RSS 2.0 | Atom