BUSQUEDA:
DEL ARCHIVO A LA RED
Richard
Benjamins
La Futura Web: la Web Semántica
Director
R&D
iSOCO
El inventor de la Word Wide Web (WWW) –Tim Berners Lee- ha sido
galardonado con el premio Príncipe de Asturias 2002. Actualmente
Berners-Lee está promocionando la próxima Web: la Web Semántica,
que añade significado a la actual haciéndola entendible para los
ordenadores. Los empresarios y académicos españoles están tomando
posiciones para jugar un importante papel en esta prometedor área.
En sus comienzos, la WWW se ceñía al ámbito científico, dando lugar
a un número abordable de páginas. Las personas encontraban fácilmente
la información que deseaban sin gastar muchos recursos. El crecimiento
en el número de usuarios, pasamos de los 1000 en 1990 a mas de 500
millones del año 2002 (Asociación de Usuarios de Internet: www.aui.es
) y el crecimiento exponencial del contenido en la web en los años
sucesivos originó el desarrollo de buscadores software que buscaran
en la web por nosotros. Estos buscadores (Yahoo, Lycos, Altavista
o Google, que es el campeón, con el 40% de las 375 millones de búsquedas
diarias en la red) localizan palabras en documentos mediante algoritmos
sofisticados de búsqueda, y con un despliegue desmesurado de maquinaria
(Google usa más de 10.000 ordenadores). Una vez que han encontrado
las páginas que nos pueden interesar, nos presentan abreviadamente
una relación de páginas que estaban relacionados con la consulta
realizada. Dichas páginas se caracterizan por contener grandes cantidades
de texto, imágenes y sonidos que un ordenador no puede entender,
quedando reservado para los humanos la extracción de información
relevante y su interpretación.
El comercio florece en la Web. Hoy en día podemos adquirir muchos
productos o servicios sin salir de casa. Encontrar un conjunto de
portales web para comprar un producto y el hecho de comprar en sí
ya no son problemas para el cliente. El problema se encuentra en
comparar las ofertas existentes y decidir cuál es la que más nos
interesa en cada momento. Asimismo, las empresas que venden en internet
se ven obligadas a contemplar sus oportunidades perdidas: el no
ser capaces de integrar productos y catálogos de sus socios y proveedores,
o las dificultades para inspeccionar de manera automática catálogos
de sus competidores, aún siendo estos, información pública presente
en Internet.
El gran visionario de la Web, Tim Berners-Lee, premio Príncipe de
Asturias 2002, y director del consorcio WWW (W3C), está promoviendo
una solución para abordar esta explosión de contenido en la web
actual: dejar que los programas informáticos busquen, analicen,
comparen y manejen la información presente en internet por nosotros.
A esta web, que es una extensión de la web actual, la ha bautizado
con el nombre de Web Semántica. En la Web Semántica se pueden delegar
las tareas que hacemos los humanos a programas (agentes) software
que son mucho más rápidos y eficientes que el más hábil de los humanos.
El problema que se plantea es que la Web, tal y como la conocemos
hoy, fue concebida para humanos, contando con nuestra capacidad
que entender el lenguaje natural, las imágenes y los sonidos. Los
agentes software tardarían muchos años en alcanzar estas capacidades
si la web se mantiene tal cual está. Por este motivo, el contenido
de la Web, tal y como la conocemos ahora, debe ser adaptado para
ellos. Esto son las bases de la futura web, concebida tanto para
humanos como para agentes software. En palabras más técnicas: la
Web actual se basa en HTML, un lenguaje que define cómo visualizar
texto e imágenes en una pantalla, mientras la Web Semántica se basa
en XML y sus derivados que definen mediante el uso de ontologías
el significado de los textos e imágenes que vemos en las pantallas,
permitiendo así su comprensión por agentes de software.
La Web Semántica está siendo apoyada por DARPA (agencia de investigación
del departamento de defensa de los EEUU), los mismos que patrocinaron
en su tiempo el nacimiento de internet. DARPA ha decidido dedicar
80 millones de dólares para el desarrollo de la web semántica. La
Comunidad Europea en sus programas de investigación (en el V Programa
Marco, 1999-2002) ha destinado un presupuesto de 40 millones de
Euros para subvencionar unos 20 consorcios europeos (proyectos de
I+D) para construir la infraestructura tecnológica de la web semántica.
Con el VI programa Marco (2003-2006), la CE seguirá invirtiendo
en esta tecnología para construir la Sociedad de la Información
inteligente.
En el mundo industrial se están tomando diferentes posiciones. Grandes
corporaciones como IBM dicen que la Web Semántica es el futuro y
que ellos participarán como empresas claves del sector. Microsoft,
mientras tanto, considera que la Web Semántica es prometedora, sin
realizar ninguna investigación en el área. Prefieren esperar y ver,
y cuando esto se convierta en un éxito se involucrarán (fuente:
Information Week, Oct. 14, 2002). La empresa del buscador Google
Inc. también está expectante. Algunas empresas más pequeñas, pero
importantes como Autonomy o Verity sostienen que ellos ya proveen
algunos de los beneficios que la Web Semántica promete, aunque con
otra tecnología. Existe un grupo de compañías pequeñas y jóvenes
que, con la colaboración de universidades y organismos de investigación,
realizar proyecto de investigación y desarrollo para construir la
tecnología que debe hacer realidad la Web Semántica. En España,
entre los principales participantes en esta área se encuentran la
Universidad Politécnica de Madrid (UPM) e Intelligent Software Components
S.A. (iSOCO) que cuentan con varios proyectos de investigación (nacionales
e internacionales) para la construcción de tecnología para la Web
Semántica. Otras organizaciones españolas participantes en este
tipo de proyectos son: Residencia de Estudiantes, CIDEM, Meta4,
Indra, VICOMTech, UDSC, IIIA/CSIC, Fundación Labein, Fundación Tekniker
(fuente: http://www.cordis.lu/ist/ka3/iaf/iaf_workshop.htm).
Una gran participación de empresas, universidades y centros de investigación
del país nos posiciona a España, como uno de los importantes miembros
en la nueva sociedad de la información.
Información Complementaria:
Portal de la Web Semántica: http://www.semanticweb.org/
Proyectos Europeos sobre la Web Semántica en ejecución: http://www.ercim.org/publication/Ercim_News/enw51/stork.html
Web Semántica en la prensa
Scientific American (The Semantic Web: A new form of Web content
that is meaningful to computers will unleash a revolution of new
possibilities)
http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21
Information Week (The Semantic Web, the next step in the Web's evolution,
promises even more dramatic changes) http://www.informationweek.com/story/IWK20021010S0016
Business Week (The Web's Weaver Looks Forward Tim Berners-Lee, chief
architect of the World Wide Web, explains his vision of the next
stitch in the process: The Semantic Web) http://www.businessweek.com/bwdaily/dnflash/mar2002/nf20020327_4579.htm
Cincodias (Una Red ideada para máquinas) http://www.5dias.com/articulo.html?d_date=20021026&xref=20021026cdscnrpor_5&type=Tes&anchor=cdscnrpor
IEEE Spectrum online (Weaving A Web of Ideas) http://www.spectrum.ieee.org/WEBONLY/publicfeature/sep02/sem.html
Informes de investigación sobre Web Semántica
Semantic Web Technologies Take Middleware to Next Level (Gartner,
20 August 2002 http://www3.gartner.com/DisplayDocument?doc_cd=109295
)
How The X Internet Will Communicate (Forrester Research, December
2001, http://www.forrester.com/ER/Research/Report/Summary/0,1338,13387,00.html
)
V. Richard Benjamins (iSOCO)
Jesús Conteras (iSOCO)
Asunción Gómez-Pérez (UPM)
© Intelligent Software Components, S.A., UPM
|