Comment TOM indexe-t-il le contenu du site ?

TOM indexe automatiquement tout le contenu public publié sur le site WordPress : pages, articles, et produits WooCommerce. Les brouillons, contenus privés et contenus en attente de relecture ne sont jamais indexés.

Le contenu minimum pour qu’une page soit indexée est de 50 caractères. En dessous de ce seuil, la page est ignorée.

Pour chaque page indexée, TOM stocke dans sa propre table de base de données (wp_tom_index) les informations suivantes : l’identifiant du post, le type de contenu (page, article, produit), le titre, le contenu texte nettoyé de tout code HTML, l’URL, les termes de taxonomie (catégories, tags), un texte de recherche enrichi, un score de page hub, et la date d’indexation.

Le texte de recherche enrichi attribue un poids triple au titre (car il est le signal le plus fort), un poids double aux taxonomies (catégories et tags), puis le contenu et l’extrait.

Pour les produits WooCommerce, le contenu est automatiquement enrichi avec le prix, la référence SKU, le type de produit, le statut de stock, les catégories et les attributs du produit.

L’indexation se lance manuellement depuis WordPress → TOM → Indexation → Réindexer tout le contenu. Cette opération vide puis reconstruit entièrement l’index.

Retour en haut