Cet article est la suite de Du Web 2.0 ...

En dehors de cette orgie de widgets et autres javascripteries, (enfin, au moins, on a réussi à assassiner les FRAMES, on a pas tout perdu), il y a des types sérieux qui ont une vision un peu moins bling bling du web, et, Tim Berners-Lee en tête (le Gutemberg du web), envisagent un web qui sera initialement appelé le web sémantique, et que beaucoup, essaient simplement d'appeler maintenant le web des données.

En gros, le web que l'on connait actuellement présente des informations, mais sans vraiment les structurer. Enfin, surtout, sans les modéliser.

Pour prendre un exemple, les webs 1 et 2, écrivent "matys est le garçon de stéphane". Le web sémantique utilise un modèle de description de données (RDF) pour faire des phrases dont le vocabulaire est défini par des dizaines d'ontologies. Le web sémantique écrira plutôt un truc du genre :

<foaf:Person rdf:about="http://matys.karmaos.com">
  <rel:childOf rdf:ressource="http://stephane.karmaos.com"/>
</foaf:Person>

La syntaxe est sans doute fausse, j'ai jamais rien compris à leur soupe de tags de toute façon. Mais ce qui compte, c'est le principe : les informations vont être modélisées de façon à être compréhensibles par des machines, qui pourront les collecter et les analyser, et comprendre que si Matys est le fils de Stéphane, et que Stéphane est le fils de Gérard, alors Matys est le petit-fils de Gérard.

Ca semble complètement fouareux comme exemple, mais le nuance est de taille : actuellement, lorsque vous allez sur Google, vous ne pouvez faire que des recherches sur des mots-clés. Tappez indochine, et vous aurez des résultats sur le groupe de rock, et l'ancienne colonie. Google est un imbécile, il a juste une prodigieuse mémoire, et un index formidable.

Le futur Google sémantique, pourra être interrogé autrement. Vous pourrez lui demander :

  • quand et où seront les prochains concerts d'Indochine ?
  • qui sont les patrons des entreprises françaises de plus de 2000 salariés ?
  • quelles sont les adresses des blondes célibataires habitant Paris aimant The Cure, Stanley Kubrick et Franck Herbert ?

La meilleure approche de ceci est actuellement le site dbpedia, qui a "sémantisé" les informations de wikipedia.

Les informations structurées, seront bientôt aussi nombreuses que les soupes textuelles qui constituent le web. Ou bien sous forme de fichiers à part, ou bien incrusté subtilement dans les pages web classiques (RDFa, micro-formats, ...), ou alors sous forme de bases interrogeables en utilisant le langage SPARQL (le SQL sémantique).

En parallèle de ce web sémantique, le besoin d'identité numérique se fait de plus en plus sentir. OpenID devrait être le standard qui percera ... dès que les gens auront compris ce que c'est.

Identités numériques cohérentes + données structurées = voici les ingrédients de ce que certains commencent à appeler Web 3.0, non pas pour se faire mousser auprès des investisseurs, mais comme appelation un peu moins pompeuse que web sémantique, et avec une certaine envie de prendre une revanche sur la frivolité du web 2.0.