

 |
 |
Annuaire
(voir aussi : soumission payante)
Un annuaire est un serveur dont les bases de données sont structurées par thèmes. Des analystes
visitent les sites, les classent et valident ou créent des résumés de leur contenu.
Parmi les annuaires généralistes : Yahoo, Guide de Voilà, Nomade, Dmoz/Open directory.
Balise (Meta-tag)
Une balise (meta-tag) fournit des informations sur les caractéristiques de la page. Les balises
sont placées dans la partie en-tête <HEAD> du code HTML. Certaines balises <META> sont plus ou moins exploitées par les moteurs de recherche, dont:
- Le titre (TITLE) : synthèse du contenu de la page
- La description (DESCRIPTION) : synthèse du contenu de la page qui apparaitra
avec certains moteurs.
- Les mots clés (KEYWORDS) : mots-clés pertinents de la page
- ROBOT : indique au moteur de prendre (ou non) cette page en compte (paramètre 1 = index ou noindex) et de suivre
(ou non) les liens de cette page (paramètre 2 = follow ou nofollow).
La syntaxe est la suivante:
<TITLE>Titre de la page</TITLE>
<META NAME="description" CONTENT="...">
<META NAME="keywords" CONTENT="..., ...">
<META NAME="robots" CONTENT="paramètre 1,paramètre 2">
D'autre balises facultatives fournissent des informations sur l'auteur, la plateforme de développement etc...
Flash
Flash est un logiciel de la Société Macromedia (r) qui permet de construire des pages web comportant des animations complexes. Les textes et les liens en flash ne sont pas exploités par les moteurs de recherche.
Frame (cadre)
Technique qui consiste à découper l'affichage en plusieurs zones. Une page HTML spécifie la taille et la position de ces zones (balise FRAMESET). Dans chaque zone, une page en HTML est chargée. Certains moteurs ne traitent pas correctement les liens et n'analysent donc pas toutes les pages du site.
Garantie de présence
C'est la garantie qu'un site est indexé par un outil, c'est à dire qu'il est possible de le faire apparaître dans la liste des résultas d'une requête relative à son nom de domaine, quelle qu'en soit sa position.
Garantie "Top 20"
Garantie qu'un nombre minimum de positions "Top 20" sont obtenues pour un ensemble de requêtes et d'outils de recherche.
HTML
HyperText Markup Language : langage informatique avec lequel sont composées la plupart des pages disponibles sur le Web. Il permet la création et l'utilisation de liens hypertextes.
Indice de popularité
Cet indice est calculé à partir du nombre de liens qui pointent vers une page ou un site: en
partant de l'idée que plus grand est le nombre de liens vers un site, ces liens étant issus
de sites traitant du même thème, plus ce site a de bonnes chances de correspondre à la demande de l'internaute.
Les liens internes, c'est à dire les liens entre les pages d'un même domaine, ont
moins de poids que les liens de sites externes.
Parmi les liens, ceux venant d'annuaires importants sont particulièrement valorisés.
Moteur de recherche
Un moteur de recherche dispose d'un robot (spider, crawler...) qui parcourt le web, prend
des copies de pages et analyse l'ensemble des mots et expressions qu'il y trouve.
Un algorithme propre à chaque moteur construit alors des bases de données valorisant la
relation entre les mots-clés et l'adresse (URL) de la page indexée.
Cette valorisation peut prendre en compte des facteurs externes aux pages (Par exemple, l'indice de
popularité).
Les adresses des pages sont classés en fonction de cette valorisation.
Noframe
Cette balise peut se trouver dans la page décrivant les "frames" (cf. frame) pour contenir du texte de contenu en HTML avec des liens hypertextes. Ce texte sera alors exploité par les moteurs de recherche.
Noembed
Cette balise sera utilisée lorsque la page est en animation "flash" et permet
d'insérer un texte (fonction comparable à "NOFRAME").
Page de contenu
Une page " contenu " est une page web HTML visible spécifique, créée en fonction de vos phrases " instinctives ", c'est à dire d'un texte dans lequel seront mis en valeur les mots clés et requêtes que vous voulez privilégier.
Les pages de "contenu" font parties de la structure du site.
Ces documents sont créés spécifiquement pour le référencement.
Cette technique permet d'apporter un maximum de pertinence lors du passage du robot spider des différents moteurs de recherche.
Portail
Site ou première page d'un site qui offre aux internautes une large palette d'informations et de services : outils de recherche (annuaires, moteurs, catalogues, agents...), communication (e-mail, forums, messagerie...), informations (bourse, météo, actualité, TV, sports,
mode...), commerce en ligne (voyages, boutiques, comparaisons de prix...)
Position payante
Le positionnement payant permet à votre site d'apparaître dans les premières positions d'une liste mise en valeur sur la première page de réponses. Soit achat pour une catégorie d'un annuaire
ou achat d'un mot-clé (annuaire ou moteur).
Le coût peut être fonction du nombre d'apparitions (CPM) ou fonction du nombre de clicks (CPC) sur le lien de votre site.
L'achat se fait directement auprès de l'outil de recherche ou par un système
d'enchères (Espotting ou Overture) ayant passé des accords avec les outils de recherche.
Robot
Voir Moteur de recherche. Synonymes: spider, crawler
Robots.txt
Le fichier robots.txt fournit des instructions aux robots des moteurs sur ce qu'il peut lire et
"aspirer" ou sur ce qui lui est interdit (une page, toutes les pages d'un répertoire).
Ce fichier doit placé à la racine du site et son nom, robots.txt, doit être écrit en minuscules. Ce sera le premier fichier recherché et lu par un robot.
Soumission payante - Annuaires
Les soumissions gratuites sont de moins en moins prises en compte par les annuaires et
particulièrement pour les catégories "Commerce et économie".
Le paiement de la soumission implique qu'un analyste étudie votre site, mais celui-ci
ne sera pas forcément indexé, s'il ne correspond pas aux critères de l'annuaire.
Il semble que les annuaires ne se limiteront pas au seul paiement à la première soumission
et s'orientent vers une redevance annuelle d'indexation du site.
Spamdexing
Contraction de "spamming" et d'"indexing" qui caractérise les techniques utilisées pour tromper les
algorithmes d'analyse et d'indexation des moteurs de recherche, afin d'obtenir de meilleures positions. Ces techniques sont dangereuses car combattues par les moteurs de recherche qui
n'hésitent pas à bannir un site en le mettant sur une "liste noire".
Spider
Voir "Moteur de recherche". Synonymes: robot, crawler
Top 20
Pour une requête donnée, un site est dans les "Top 20" s'il se trouve dans les 20 premières positions de la liste des résultats fournis par un outil de recherche (moteur ou annuaire).
|