Quand un visiteur pose une question, TOM applique un processus de recherche en plusieurs étapes pour trouver les pages les plus pertinentes.
Première étape : décomposition de la question en mots-clés. Les mots de moins de 3 caractères sont ignorés. Chaque mot est ensuite étendu à ses synonymes grâce à un dictionnaire français intégré. Par exemple, le mot « prix » est automatiquement étendu aux synonymes « coût », « tarif », « montant », « combien », « euros », « payer ». Le mot « contacter » est étendu à « contact », « joindre », « appeler », « téléphone », « email », « adresse », « coordonnées ».
Deuxième étape : recherche dans l’index. TOM cherche tous les documents dont le texte de recherche contient au moins un des mots ou synonymes de la question.
Troisième étape : calcul d’un score de pertinence pour chaque document trouvé. La formule de scoring fonctionne ainsi :
- Présence d’un mot original dans le titre : coefficient 15
- Présence d’un mot original dans les taxonomies : coefficient 20
- Présence d’un mot original dans le contenu : coefficient 2
- Présence d’un synonyme dans le titre : coefficient 8
- Présence d’un synonyme dans les taxonomies : coefficient 10
- Présence d’un synonyme dans le contenu : coefficient 1
- Score de page hub : coefficient 0,5
- Bonus type page : +10 points
- Bonus type article : +5 points
Les documents sont triés par score décroissant. TOM retient les 5 premiers par défaut (configurable jusqu’à 10) et les transmet à Mistral AI comme sources.
