Compatibilité Google Actualités : utiliser des nombres de quatre chiffres dans ses URLS

Ceci est une ARCHIVE, peut-être périmée. Vérifiez bien les compatibilités !

Pour que votre site puisse se joindre aux milliers de sites visités chaque jour par Google Actualités (Google News), les URLs des pages à indexer doivent contenir un nombre de quatre chiffres qui n’est pas une date. Avec cette contrib, les URLs générés par Spip pourront avoir autant de zéros qu’il est nécessaire pour avoir atteindre ce minimum de quatre chiffres.

Comment faire ?

Note : Les pressés trouveront en bas de cet article une archive .zip contenant les fichiers « inc-urls-standard.php3 » et « inc-urls-html.php3 » modifiées tel que décrit ici. Vous n’avez qu’à les placer à la racine de votre site (en prenant soins de garder une copie de secours de vos fichiers originaux).

Pour faire en sorte que les articles aient des URLs (adresse) du type www.votresite.com/article.php3?id_article=0004, il suffit de modifier le fichier « inc-urls-standard.php3 » qui se trouve à la racine de votre site en ajoutant le code suivant juste avant la ligne function generer_url_article($id_article) {

function generer_url_article($id_article) {

	//Ajoute autant de zéros que nécessaire pour composer un numéro d'article de quatre chiffres
	$id_article=sprintf("%04.4d",$id_article) ;

	return "article.php3?id_article=$id_article";
}

Merci à Yannig pour avoir suggéré d’utiliser la fonction sprintf(), ce qui a simplifié considérablement le script.

Il est ensuite relativement facile de modifier le code pour les adresses de rubriques et de brèves en ajoutant le même code après les lignes function generer_url_rubrique($id_rubrique) { et function generer_url_breve($id_breve) { en prenant soin de remplacer les variables $id_article par $id_rubrique ou $id_breve.

Pour que Spip génère des URLs du type www.votresite.com/article0004.html il faut alors placer modifier le fichier « inc-urls-html.php3 » (en ayant pris soin de modifier inc-urls.php3 tel qu’expliqué dans le manuel).

FAQ

Qu’est-ce que ça va changer dans mon site ?

Une fois ces modification faites, toutes les adresses d’articles, de rubriques ou de brèves générées automatiquement sur vos pages par le moteur de Spip contiendront autant de zéros qu’il est nécessaire pour avoir un nombre de quatre chiffre. Cela inclus les balises dans les squelettes (ex. #URL_ARTICLE) et les adresses crées par des raccourcis durant la rédaction du texte de la page (ex. lien.

L’ajout des zéros n’a aucun impact sur l’interprétation des adresses par Spip car 0003 est tout à fait égal à 3. Donc il n’y a pas de différence entre article.php3 ?id_article=3 et article.php3 ?id_article=0003 en ce qui concerne Spip.

Mais pourquoi ne pas modifier aussi les adresses pour les mots-clefs, le forum et les documents ?

Pourquoi pas, justement ? Je ne l’ai pas mais vous pouvez le faire vous-même si cela est pertinent dans le contexte de votre site.

Comment ajouter mon site à Google Actualités ?

Tiré de la FAQ de Google Actualités :

« Pour nous communiquer les nouvelles sources d’informations dont vous souhaitez bénéficier, envoyez-nous un courrier électronique à l’adresse news-feedback-fr@google.com. Bien que nous ne puissions pas vous garantir que nous ajouterons toutes les nouvelles sources qui nous sont proposées, nous étudierons toutes les suggestions avec attention. »

Combien de temps avant qu’un site proposé soit ajouté dans Google Actualité ou Google News ?

Ma soumission fut traitée avec grande attention et une rapidité époustouflante de la part des éditeurs de Google Actualités (moins d’une semaine !!). Une fois que le site proposé fut accepté (et que mes URLS aient été modifiées selon la formule proposée ci-haut), j’ai dû attendre environ deux mois avant de voir des résultats dans Google Actualités.

Note : Il faut s’attendre à ce que ces délais rallongent au fur et à mesure que le nombre de soumissions augmente (ce que cet article contribuera probablement à faire).

Où est-ce qu’il est écrit que les URLs doivent contenir quatre chiffres pour être élligibles ?

À l’écriture de cet article, le service Google Actualité est encore en Beta et la nécessité d’avoir un nombre de quatre chiffres dans les URLs n’est mentionnée nulle part sur le site de Google. C’est une information qui m’a été transmise par courriel par un éditeur de Google Actualités suite à la soumission d’un de mes sites.

Dernière modification de cette page le 11 juin 2005

Discussion

11 discussions

  • edouard

    Merci pour les informations nous allons pouvoir l’ajouter à notre client pour qu’il puisse sortir sur google actu.

    A+
    Edouard

    Répondre à ce message

  • 54622LALALA

    comment faire le nombre 24 en utilisant uniquement les chiffres : 5 ;5 ;5 ;1 ?
    CES CHIFFRES DOIVENT ÊTRES UTILISES QU’UNE SEUL FOIS !!!!!!!!!!!

    Répondre à ce message

  • Bonjour,

    j’utilise la redirection propre qui fonctionne impecablement sur mon site. J’aimerai savoir s’il est possible d’avoir un
    comportement à quatre chiffres sur une seule rubrique événementielle.

    C’est à dire ajouter les quatres chiffres pour
    Google actualité sur mes articles présent dans mon agenda. Les autres rubriques fonctionneraient avec un Url rewriting propre plus classique.

    Répondre à ce message

  • Salut,

    Il y a également une contrainte concernant la présentation du contenu des articles si l’on veut que son site soit accepté. Pour le site dont je suis administrateur la réponse suivante :
    « Merci pour votre suggestion. Nous avons examiné http://www.petiteceinture.org, mais nous ne sommes pas en mesure de
    l’ajouter sur Google Actualités pour l’instant car plusieurs articles
    sont affichés par page.

    Google Actualités est compilé uniquement par des algorithmes
    informatiques et les articles sont réunis à l’issue d’une analyse
    automatique des sites Web d’information. Pour que ce processus fonctionne
    correctement, chaque page contenant le texte complet d’un article doit
    être associée à une URL distincte. Nous ne pouvons pas ajouter sur
    Google Actualités de sites présentant plusieurs articles sur une même
    URL.

    Exemple de site que nous pouvons analyser : http://english.chosun.com.
    N’hésitez pas à nous contacter si vous avez des questions ou si vous
    décidez d’adopter un schéma d’attribution d’une URL par page sur votre
    site.

    Cordialement,
    L’équipe Google
     »

    Donc une contrainte à prendre en compte, à laquelle on ne pense pas toujours ;-)

    Répondre à ce message

  • Quelle fonction doit on ajouter pour que les impressions des articles en PDF puisse obtenir également 4 chiffres.

    Merci d’avance pour l’aide ;-)

    Répondre à ce message

  • 6

    Bonjour ;)

    mais comment affecter ces modifications à la balise #ID_ARTICLE ?

    MERCI !

    • Je n’ai pas testé, mais peut-être que ce filtre ferait l’affaire...

      Dans le squelette :
      (#ID_ARTICLE

      Dans mes_fonctions :
      function google($texte)
      $texte = sprintf(« %04.4d »,$id_article) ;

      Idéalement, il faudrait tester si le $texte est bien un chiffre, etc. pour éviter les erreurs. Mais bon. C’est un point de départ !

    • il n’exsite pas un moyen de faire ça sans modifier les squelettes ?

      en modifiant le code de spip par exemple ? ou en procédant à partir de mes_fonctions.....

    • Je ne recommende pas d’intervenir dans le code de Spip, surtout pour quelque chose qui peut se changer si facilement dans un squelette. Ça peut paraître plus simple de changer une ou deux lignes de code pour échapper de changer ses squelettes, mais la perte en flexibilité (et le potentiel d’erreurs) lors des mises à niveau de Spip n’en vaut pas la peine.

    • je suis bien d’accord avec vous......
      il faudrais déjà totallement définnir la fonction....

      là a votre avis ça marcherais déjà ?

      MERCI !

    • j’utilise ce code dans mes fonctions et il marche parfaitement :

      function google($texte) {
      $texte = sprintf("%04.4d",$texte);
      return $texte;
      }
    • après il suffit de l’adapter dans le squelette : (#ID_ARTICLE, (#ID_AUTEUR, ...

    Répondre à ce message

  • 1

    Je viens d’essayer de faire une petite bricole dans la base de donnée et ça a l’air de marcher.

    -  Créer un nouvel article sans le mettre en ligne, ce dernier possède par exemple le n° 168.

    -  Edition de la base de donnée, bdd_articles -> afficher. L’article qui vient d’être créé apparaît, modifier l’id de l’article et le mettre à 1000 par exemple.

    -  Le prochain article créé se verra attribuer le numéro 1001, le tour est joué.

    En fait la variable id_article est en auto-increment et lorsque l’on crée un article l’incrémentation doit se faire à partir de la valeur la plus élevée.

    Cela m’ennuyerait d’avoir à modifier l’adresse de tous les articles et brèves existants pour des raisons de référencement. Cette méthode à l’avantage de ne faire apparaître un id_article à 4 chiffres que sur les prochains articles et brèves qui seront rédigés.

    Je n’y connais pas grand chose en base de données. Pensez-vous que cette méthode est fiable ? Ne va-t-elle pas générer des bugs ?

    • Puisque Google News n’affiche que les tout derniers articles seulement, il n’est pas nécessaire de rendre les anciens articles compatibles. Si cette astuce vous va, et que le site fonctionne bien, pourquoi pas !

    Répondre à ce message

  • 1
    Yannig

    Bonjour, je me permet d’écrire à propos de la solution pour l’alignement sur 4 chiffres. Il serait plus judicieux d’écrire la chose suivante :

    $id_article=sprintf(« %04.4d »,$id_article) ;

    Ainsi, pas de souçi, l’alignement se fait tout seul.

    • En effet, ça marche au poil ! Le texte et les squelettes de la contrib ont été ajustés en conséquence.

      Merci infiniment de m’avoir fait découvrir cette fonction fort intéressante. :)

    Répondre à ce message

  • Effectivement si vous souhaitez apparaitre dans google news, il est impératif d’utiliser ce script !

    Répondre à ce message

  • 1

    avez vous testé, chez moi les forums ne tournent plus...

    • c’était un autre problème, désolé pour le bruit

    Répondre à ce message

Ajouter un commentaire

Qui êtes-vous ?
  • [Se connecter]

Pour afficher votre trombine avec votre message, enregistrez-la d’abord sur gravatar.com (gratuit et indolore) et n’oubliez pas d’indiquer votre adresse e-mail ici.

Ajoutez votre commentaire ici

Ce champ accepte les raccourcis SPIP {{gras}} {italique} -*liste [texte->url] <quote> <code> et le code HTML <q> <del> <ins>. Pour créer des paragraphes, laissez simplement des lignes vides.

Ajouter un document

Suivre les commentaires : RSS 2.0 | Atom