Les facteurs qui empêchent une bonne indexation des sites Web Certains éléments dans votre site Web peuvent gêner ou empêcher entièrement les moteurs de recherche d'atteindre les contenus de celui-ci.
Lors de leur recherche sur le Web, les robots d'indexation des moteurs de recherche se fient à l'architecture des liens hypertextes pour trouver de nouveaux documents à indexer et pour revisiter ceux qui ont pu avoir changé. Des liens complexes et des structures de sites compliquées et profondes avec peu de contenu unique seront difficiles à indexer. Les données qui ne peuvent carrément pas être consultées par des liens hypertextes se qualifient en tant que contenu invisible. Facteurs limitant une bonne indexation - Des URLs avec plus de deux paramètres dynamiques, c.-à-d. des pages du type de : http://www.exemple.com/page.php?id=9&PR=66rr&Ur=lou (les robots indexeurs sont en général peu disposés à indexer les URLs complexes comme ceci parce qu'elles ont souvent comme conséquence des erreurs avec les visiteurs non humains).
- Des pages avec plus de 100 liens uniques vers d'autres documents Web (les robots indexeurs peuvent ne pas les suivre tous).
- Des pages situées à plus de 3 clics/liens de la page d'accueil d'un site web (à moins qu'il n'y ait beaucoup d'autres liens externes se dirigeant vers cet emplacement, les araignées-spiders ignoreront souvent les pages éloignées).
- Les pages qui nécessitent un identifiant de session (Session ID) ou un cookie pour permettre la navigation (les robots indexeurs risquent de ne pas pouvoir maintenir ces éléments comme le ferait un navigateur Web).
- Les pages qui sont découpées en « Frames » peuvent gêner l'indexation et causer de la confusion au sujet de quelles pages sont à positionner dans les résultats.
|