Qu’est-ce que le web sémantique ?
Dans un objectif d’amélioration des échanges d’informations sur Internet, le Web sémantique voit le jour. Il s’agit d’une nouvelle version du World Wide Web qui contient des informations enrichies de métadonnées sémantiques que les machines peuvent lire et comprendre. Les implications, les enjeux et les perspectives du Web sémantique sont colossaux. Explications.
Web sémantique et évolution du World Wide Web
Le World Wide Web repose sur la syntaxe de l’information. Les programmes informatiques se basent donc sur des algorithmes en vue d’analyser les index des données, les mots-clés, etc. En fonction des termes de la requête, ils fournissent des résultats.
Avec le Web sémantique, les programmes sont capables de traiter également les intentions de recherche des internautes. La recherche en ligne n’est plus seulement basée sur les mots de la requête, mais aussi sur les valeurs de sens des caractères utilisés. L’analyse de sens porte sur les textes, les images, les sons, les chiffres, les vidéos et tous les objets porteurs d’une signification.
Ainsi, le Web sémantique repose sur une base du Web qui a évolué en quelques décennies. Le net désormais « traditionnel » est composé de normes HTML, URL et HTTP (un balisage, un descripteur d’adresse et un protocole de transmission). Dans ces éléments de structuration, les métadonnées sémantiques sont naturellement utilisées mais leur valeur informative est très limitée. Les programmes recherchent donc des adresses de contenu sans être capables de déterminer la signification de l’information.
Avec le Web sémantique, si on cherche sur un moteur de recherche : « Quelle est la date de l’armistice de la Seconde Guerre mondiale ? », les moteurs de recherche livrent encore à ce jour des résultats liés au sujet : biographie des dirigeants, pays impliqués, grandes batailles, etc. Avec le web sémantique, la machine comprend l’intention en plus d’analyser les caractères et livrera la date précise : 8 mai.
Terminologie du Web sémantique
La sémantique est une discipline scientifique qui appartient à la linguistique et qui analyse la signification des caractères. Dans cette veine, le Web 3.0 ajoute des informations sémantiques au contenu en ligne et dote les machines de la capacité de les décrypter (et d’en comprendre le sens). On utilise des normes de formulation des métadonnées sémantiques afin qu’elles soient lisibles par la machine.
Le web sémantique désigne la dernière évolution du WWW. Il est synonyme de :
- Web 3.0, terme inventé par John Markoff, journaliste, afin de décrire une version du net plus avancée que le web 2.0 : un Internet interactif, collaboratif et avec des données lisibles par les machines.
- Le GGG, expression utilisée par Tim Berners-Lee, qui inventa le WWW. Le Giant Global Graph se réfère à la structure de l’information sémantique des métadonnées.
- Le Linked Open Data : conçu comme la base du Web sémantique, il s’agit des routines d’interrogation et d’exploitation des données sémantiques en réseau.
- Le Web des données : le World Wide Web Consortium propose l’expression en 2013 en vue de désigner à la fois l’interconnexion syntaxique et sémantique des données échangées en ligne.
Principe de fonctionnement du Web sémantique
Il permet de considérablement améliorer la recherche en ligne. Les analyses des moteurs de recherche porteront sur des informations qui ne sont pas directement présentes sur les pages indexées ou qui n’y apparaissent pas explicitement. La recherche fournira à l’internaute les résultats les plus pertinents, liés par des grandes catégories thématiques.
Le Web sémantique s’appuie sur des entités et des ontologies permettant aux machines de donner du sens à une information. Le concept d’entité est également issu de la sémantique. C’est une unité de sens qui est composée de plusieurs éléments : l’identifiant et ses attributs associés. Par exemple, Elon Musk est l’identifiant d’une entité et ses attributs des données descriptives comme : Milliardaire, Américain, Tesla, Space X, Twitter, etc.
Quand les entités sont liées entre elles par un contexte commun, on parle d’ontologie. Ce sont donc des ensembles ordonnés d’informations et de déclarations formulés de manière intelligible pour les humains, ainsi que pour les machines.
Les programmes se basent sur les entités et leur lien ontologique en vue de comprendre les relations entre les mots, les syntaxes ou mieux filtrer les termes polysémiques, éviter le duplicate content, etc.
Web sémantique : enjeux pour les entreprises
Le Web sémantique dispose de très nombreux atouts pour les professionnels du e-marketing et du e-business. L’analyse du comportement des utilisateurs s’enrichit considérablement et offre plus d’informations, ce qui permet de générer plus de trafic.
La publicité en ligne évolue également : si elle est axée sur le Web sémantique, elle s’adapte mieux aux attentes des consommateurs en proposant des résultats adaptés aux produits et aux services véritablement désirés.
Par ailleurs, le référencement des sites Internet se trouve aussi modifié en raison des potentialités du Web sémantique. On travaille le SEO de sa plateforme au moyen des mots-clés pertinents, mais aussi d’informations sémantiques qui viennent structurer les contenus. Ces métadonnées donnent aux machines une architecture d’information lisible et compréhensible.
Pour proposer des contenus mieux optimisés et plus attractifs pour les moteurs de recherche du Web sémantique, il faut apprendre à utiliser ses outils :
- Le RDF (Ressource Description Framework) qui est le langage utilisé pour l’échange de données.
- L’OWL, qui est un langage permettant de représenter des informations complexes à propos des objets et de leurs relations (les ontologies).
- FOAF qui est un projet de relations entre les utilisateurs et les informations en ligne.
En maîtrisant les outils du Web sémantique, les professionnels du marketing digital peuvent mieux s’afficher sur les réseaux sociaux, lier entre les données de leurs sites pour enrichir les entités sémantiques, collecter des données hétérogènes et créer des ontologies pertinentes, etc.
Les étudiants de l’ECITV peuvent profiter des formations supérieures en digital, web et audiovisuel de l’établissement pour tout comprendre de ce qu’est le Web sémantique et apprendre à piloter les stratégies numériques des entreprises.
On voit déjà les géants du net exploiter les potentialités du Web sémantique. Google lance son algorithme RankBrain, qui affecte les recherches à des grands thèmes. La recherche d’image Google, reconnaît également les intentions des utilisateurs en fournissant des visuels proches thématiquement de la recherche.