L'indexation |
|
|
|
L'indexation: le modus operandi des moteurs de recherches
Surfer sur la ToileLes robots indexeurs des moteurs de recherches sont utilisés par ceux-ci pour surfer sur la toile (balayer le Web), enregistrer les URL, classer les mots-clés et le texte de chaque page qu'il trouvent. Ces programmes automatisés, appelés « bot » ou « spiders » en anglais, utilisent la structure d'hyperliens du Web pour surfer ou « ramper » (crawl) au travers des pages et des documents qui composent le Web. On estime que le web mondial est composé d'approximativement 20 milliards de pages et documents, les moteurs de recherche en auraient découvert 8 à 10 milliards. Indexation (classement) des documentsUne fois qu'une page a été balayée, son contenu peut « être indexé » - entreposé dans la base de données des documents qui compose l'index des moteur de recherche. Cet index doit être habilement conçu, de façon à ce que les demandes de recherches des internautes, parmi les milliards de documents, soient accomplies en quelques centièmes de seconde. |





