L'Institut | Mission insertion de Bull   | Groupes de réflexion | Publications | Livres adaptés pour aveugles
  Accueil> Publications> Lettre N°3
Contact |Plan du site 

Lettre N° 1
Lettre N° 2
Lettre N° 3
. Editorial
. L'informatique vue...
. Risques et complexité
. Les services Web
. Cerveaux et machines
. Technologie pour...
. Ethique et technique
Lettre N° 4
Lettre N° 5
Lettre N° 6
Lettre N° 7
Lettre N° 8
Lettre N° 9
Lettre N° 10
 
Archives de la Lettre de l'Institut
Sommaire n°3 juin 2002
 Editorial  Cerveaux et machines
 L'informatique vue par l'entreprise  Technologie pour l'informatique
 Risques et complexité  Ethique et technique
 Les services Web  
 
Tehnologie pour l'informatique
 

Le web sémantique : une base de données mondiale unique ou de multiples communautés d'informations mondialisées ?

Intervention de Alain MICHARD, directeur de recherche à l'INRIA Rocquencourt.

Aujourd'hui, Internet donne essentiellement accès à des informations qui ne sont pas destinées à être exploitées par des ordinateurs, mais par des personnes, qui vont commencer par devoir les lire.

Le Web lui même, en tant que réseau de centaines de millions d'ordinateurs, ne comprend pas le sens, la "sémantique" des milliards de pages de textes qu'il met à disposition de chacun.

Comme l'ordinateur est pour longtemps encore incapable de comprendre le langage naturel, la seule solution est de lui "mâcher le travail" en lui confiant des informations artificiellement structurées. C'est ce que l'on appelle le "web sémantique".

Dans ces conditions, des opérations de recherche et d'exploitation de ces informations pourront être effectuées non plus seulement par des personnes, mais aussi de manière automatisée par des programmes (que l'on qualifie alors parfois d'"agents intelligents").
C'est merveilleux, mais d'un autre côté cela revient à considérer le Net comme une immense fédération d'applications informatiques, comparables aux applications internes à une entreprise.
Et quand l'on connaît les difficultés à "urbaniser" les seules informations propres à une entreprise, il y a de quoi avoir des inquiétudes sur la généralisation à tout l'univers de cette idée...

Une raison d'espérer est que, face à l'ampleur de la tâche, l'humanité entière s'accorde sur la nécessité d'adopter une norme unique pour la représentation et l'échange des informations, à travers le langage de structuration XML (Extended Markup Language), et ses extensions (RDF - Resource Description Framework- en particulier), le tout étant orchestré sans contestation par le W3C.

Une autre perspective réaliste est de réaliser une osmose entre le Web et les structurations déjà existantes au sein des systèmes d'information d'entreprise. Le coeur du référentiel de description des pages du Web sera constitué à partir des données déjà codifiées dans l'entreprise (noms d'employés, de projets, de produits, de clients). Ainsi, le travail le plus difficile pour mettre en marche une communauté de partage d'informations, qui est de se mettre d'accord sur le sens des mots, partira sur des bases existantes solides.