Le référencement Web 3.0 web sémantique et SEO
Référencement 3.0 web sémantique. Les changements des moteurs de recherche et web sémantique, la trilogie du référencement SEO
Dans la série de la trilogie du référencement, nous allons voir l’évolution récente des moteurs et les changements induits par le Web sémantique. Le Web Sémantique n’est pas une expression qui peut se suffire d’une simple définition de dictionnaire. C ‘est une notion complexe en plein développement.
Le Web sémantique désigne un ensemble de technologies visant à rendre le contenu des ressources du World Wide Web accessible et utilisable par les programmes et agents logiciels, grâce à un système de métadonnées formelles, utilisant notamment la famille de langages développés par le W3C. En fait, Il est basé sur le RDF (Resource Description Framework).
La sémantique définit l’étude du langage et des signes linguistiques (mots, expressions, phrases) du point de vue du sens (du grec "semantikos", "qui signifie"). L’objectif premier du balisage hypertextuel depuis le SGML, au HTML, puis au XHTML en passant par le XML a toujours été de structurer le contenu d’un document afin d’en marquer, d’en souligner ou d’en révéler le sens : un titre, un intertitre, un paragraphe, une citation ou un encart, une emphase mise sur un passage, une liste, un tableau de données, etc… (edu.ca.edu, 2004). Le (X)HTML définit de nombreuses balises. Chacune de ces balises est destinée à indiquer la nature du contenu qu'elle encadre. C'est ce qu'on appelle la sémantique XHTML.
RDF pour sa part est un modèle conceptuel permettant de décrire des choses, simplement et sans ambigüité. RDF est normalisé par le W3C. Ses applications visent initialement le web sémantique mais elles peuvent s'étendre plus largement à l'ingénierie des connaissances.
La recherche en temps réel :
La recherche web basée sur les fichiers index des moteurs semble dépassée. Bing, le moteur de recherche de Microsoft, a été le premier à annoncer la mise en ligne d'un tel service. Yahoo annonçait se mettre également à la recherche en temps réel en Décembre 2009. Enfin, Google a présenté fin 2009 les améliorations de son moteur de recherche pour apporter des réponses «en temps réel», grâce à des résultats croisés avec les sites de socialisation Facebook, MySpace et Twitter.
Les changements sont considérés par Google et donc réindexés selon plusieurs critères. Il faut aussi considérer son positionnement personnalisé par usager (Google Caféine). Pour vérifier son positionnement de façon proactive, des outils permettent de prédire la position potentielle d’un site sur un terme (eCordia). Pour une indexation en temps réel, des actions supplémentaires sont recquises :
1. Mettre à jour les plans de site XML en en utilisant les champs de priorité.
2. Recourir aux fils RSS et les outils de ping (comme Pingomatic).
3. Ajouter "autodiscovery" dans le fichier robots.txt.
4. Utiliser un gestionnaire d'agents (Firefox ou seo-browser.com..) pour les diagnostiques, et Webmaster tool pour "voir le site comme Google le voit".
5. Recourir aux outils de SEO Scoring (grader) et se concentrer sur méta title.
6. Les web analytiques en temps réel : etracker propose une soltution alternative à l'évaluation faite par les fichiers journaux des serveurs web.

Google de plus en plus sémantique
Le choix de Twitter comme partenaire de Google pour la recherche en temps réel n’est pas fortuit. Les interrelations qui font la force de Twitter (échanges entre les utilisateurs sur un sujet), Intéressent particulièrement Google pour une exploitation future dans ses résultats de recherches. En effet, Google travaille sur la recherche sémantique qui cherche justement à connecter les sujets et rendre la recherche plus pertinente. Le potentiel d’apprentissage machine à partir des micro-messages est énorme.
Ainsi, en mai 2009, Google venait d'annoncer qu'il utilisait les 2 principaux formats de marquage de données structurées (les microformats et le standard RDFa) pour afficher certains résultats de manière enrichie : note moyenne et nombre d'avis par les consommateurs, adresse d'une entreprise, etc. Un petit pas vers le web sémantique… . Google divulguait alors sur son blog une variété de techniques utilisées pour créer des extraits de code afin de donner aux utilisateurs des informations pertinentes sur ce qu'ils vont trouver lorsqu'ils cliquent pour visiter un site. Pour afficher les Rich Snippets (résumés textuels), Google cherche des formats de balisage (microformats, RDFa) dans les pages Web à afficher. Google annonce en outre que cette fonctionnalité sera déployée progressivement et qu’elle allait être étendue à d’autres sites. De même, Google expérimente des balises pour les entreprises et les données de localisation. Chaque entreprise peut avoir un certain nombre de propriétés différentes, telles que son nom, l'adresse, l'URL et le numéro de téléphone. Google propose d’étiqueter ces propriétés grâce au balisage par microformats ou RDFa. Le RDFa trouve son application également dans l’indexation par Google des images, et aussi pour les vidéos .
Incidences sur le référencement
Contrairement aux pratiques usuelles qui consistent à optimiser le site avec une forte densité de mots clés, désormais il faut identifier les synonymes et alternatifs des mots pour enrichir le contenu, les métas et les liens du site web.
Le LSI (Latent Semantic Indexing) est un algorithme utilisé par les moteurs de recherche pour évaluer le contenu d’un site en fonction des mots clés utilisés. Google l’exploite dans son programme d’annonces contextuelles AdSense, pour afficher des annonces liées au contenu d’une page. Google annonce sur son blog que le recours à cette méthode est déterminant et que celle-ci va être de plus en plus utilisée sur ses serveurs. En référencement on parle alors de Keyword Clustering, une technique qui permet d’optimiser le site pour une requête assez concurrentielle au moyen d’une grappe de mots proches sémantiquement et rattachés à l’expression clé. Outre le contenu, les métas et les attributs, les liens textes doivent reprendre les termes du corpus.
Un autre défi s’impose au référenceur avec l’avènement du web sémantique : le langage de balisage HTML migre actuellement vers le HTML5, et le CSS3 est en gestation. Le W3C doit finaliser ses recommandations courant 2010 et continue de réviser ses rapports. Toutefois, il est possible d’utiliser la sémantique HTML5 en production de sites pour en mesurer la portée.Le HTML5 devrait améliorer le référencement. Son code est simplifié et apporte aux conteneurs des pages une valeur sémantique. À retenir les balises article, aside et nav, en plus de l’attribut role, hérité du XHTML2 et qui permet d'ajouter de la sémantique aux éléments, notamment les ARIA. Il est intéressant de noter que Google est derrière cette initiative, ce qui rend le passage au HTML5 obligé.
Pour étayer ces propos, la conférence Confoo.ca a lieu à Montréal et Mark Pilgrim de Google y fera le point sur l’usage du HTML5 . Cependant, les attributs RDFa sont d'ores et déjà à utiliser en référencement que ce soit pour Google, le référencement multimédia et le référencement des flux de syndication au format RDFa.
Tags : Référencement 3.0, web sémantique, web 3.0
Toutes les actualités de Web marketing RSM Montréal
Les news de RSM à sa création en Juin 2009
- Maîtrise commerce électronique (27 Mai 2009)
- Hébergement Web RSM à Montréal (01 Juin 2009)
- Lancement version bêta RSM Référencement (12 Juin 2009)