|
Le web sémantique
: une base de données mondiale unique ou de multiples
communautés d'informations mondialisées
?
Intervention de Alain MICHARD,
directeur de recherche à l'INRIA Rocquencourt.
Aujourd'hui, Internet donne
essentiellement accès à des informations
qui ne sont pas destinées à être exploitées
par des ordinateurs, mais par des personnes, qui vont commencer
par devoir les lire.
Le Web lui même, en
tant que réseau de centaines de millions d'ordinateurs,
ne comprend pas le sens, la "sémantique" des
milliards de pages de textes qu'il met à disposition
de chacun.
Comme l'ordinateur est pour
longtemps encore incapable de comprendre le langage naturel,
la seule solution est de lui "mâcher le travail" en
lui confiant des informations artificiellement structurées.
C'est ce que l'on appelle le "web sémantique".
Dans ces conditions, des
opérations de recherche et d'exploitation de ces
informations pourront être effectuées non
plus seulement par des personnes, mais aussi de manière
automatisée par des programmes (que l'on qualifie
alors parfois d'"agents intelligents").
C'est merveilleux, mais d'un autre côté cela revient à considérer
le Net comme une immense fédération d'applications informatiques,
comparables aux applications internes à une entreprise.
Et quand l'on connaît les difficultés à "urbaniser" les
seules informations propres à une entreprise, il y a de quoi avoir des
inquiétudes sur la généralisation à tout l'univers
de cette idée...
Une raison d'espérer
est que, face à l'ampleur de la tâche, l'humanité entière
s'accorde sur la nécessité d'adopter une
norme unique pour la représentation et l'échange
des informations, à travers le langage de structuration
XML (Extended Markup Language), et ses extensions (RDF
- Resource Description Framework- en particulier), le tout étant
orchestré sans contestation par le W3C.
Une autre perspective réaliste
est de réaliser une osmose entre le Web et les structurations
déjà existantes au sein des systèmes
d'information d'entreprise. Le coeur du référentiel
de description des pages du Web sera constitué à partir
des données déjà codifiées
dans l'entreprise (noms d'employés, de projets,
de produits, de clients). Ainsi, le travail le plus difficile
pour mettre en marche une communauté de partage
d'informations, qui est de se mettre d'accord sur le sens
des mots, partira sur des bases existantes solides.
|