De La Web Sintatica A La Web Semantica

Aunque no es sencillo calcular el tamaño total de la web, se estima que hay alrededor de unos 4 * 109 documentos disponibles en red, lo que viene a equivaler a unos 28 millones de libros, teniendo en cuenta que la American Research Libraries, que agrupa un total de 100 bibliotecas de EEUU tiene unos 3.7 millones de libros y que la biblioteca de Harvard (la mayor de EEUU) tiene catalogados 15 millones de libros, podemos hacernos una idea del tamaño que tiene la Web.

Resulta entonces que en la Web actual, tenemos un sistema que almacena, podríamos decir, prácticamente toda la información del mundo, y que presenta un acceso casi instantáneo a la misma desde cualquier lugar del planeta con una conexión a Internet. Por otro lado, la información disponible no es solamente de manera textual, sino que hay que sumar los documentos formados por imágenes, videos, presentaciones, etc. Además cualquier persona puede, al menos en teoría, añadir más información a la Web (mediante la creación de un nuevo sitio web por ejemplo). Pues bien, el conjunto de todas estas características es lo que viene a definir a la Web actual con el nombre de Web Sintáctica.

En la Web Sintáctica, nos vamos a encontrar con un conjunto de recursos enlazados entre si. Para movernos por esta gran cantidad de información, han aparecido numerosos buscadores que enlazan con ellas (Google, por ejemplo, indexa cerca de 9.000 millones de páginas), sin embargo, a pesar de la potencia que demuestran, aun quedan lejos de poder proporcionar al usuario las respuestas adecuadas a las preguntas que realizan, fundamentalmente por tres motivos:

  • no enlazan con la totalidad de páginas existentes, se hace necesaria la actualización constante de los índices mediante robots de búsqueda automáticos.
  • la escasa precisión de los resultados, algunas consultas devuelven varios millones de resultados distintos.
  • y la alta sensibilidad al vocabulario empleado en la búsqueda, es decir, un documento que busquemos debe estar descrito con las mismas palabras que nosotros introduzcamos al buscar.

Por otro lado, tenemos también los problemas de interoperabilidad de aplicaciones, que se deben por falta de entendimiento técnico, sintáctico y semántico.
Estos problemas, conllevan que las aplicaciones no puedan hablar entre ellas, lo que repercute en el coste de los servicios que las empresas proporcionan y relentiza la implantación de nuevos servicios útiles para el usuario.


Supongamos que la Web tiene la capacidad de construir una base de conocimiento sobre las preferencias de los usuarios y que, a través de una combinación entre su capacidad de conocimiento y la información disponible en Internet, sea capaz de atender de forma exacta las demandas de información por parte de los usuarios en relación, por ejemplo, a reserva de hoteles, vuelos, médicos, libros, etc.

Si esto ocurriese así en la vida real, el usuario, en su intento, por ejemplo, por encontrar todos los vuelos a Praga para mañana por la mañana, obtendría unos resultados exactos sobre su búsqueda. Sin embargo la realidad es otra. La figura 1 muestra los resultados inexactos que se obtendrían con el uso de cualquier buscador actual, el cual ofrecería información variada sobre Praga pero que no tiene nada que ver con lo que realmente el usuario buscaba. El paso siguiente por parte del usuario es realizar una búsqueda manual entre esas opciones que aparecen, con la consiguiente dificultad y pérdida de tiempo. Con la incorporación de semántica a la Web los resultados de la búsqueda serían exactos.

Buscador Actual
Resultados de la búsqueda:

2398021383_ceae4048ec.jpg?v=0

La figura 2 muestra los resultados obtenidos a través de un buscador semántico. Estos resultados ofrecen al usuario la información exacta que estaba buscando. La ubicación geográfica desde la que el usuario envía su pregunta es detectada de forma automática sin necesidad de especificar el punto de partida, elementos de la oración como "mañana" adquirirían significado, convirtiéndose en un día concreto calculado en función de un "hoy". Algo semejante ocurriría con el segundo "mañana", que sería interpretado como un momento determinado del día. Todo ello a través de una Web en la que los datos pasan a ser información llena de significado. El resultado final sería la obtención de forma rápida y sencilla de todos los vuelos a Praga para mañana por la mañana.

Buscador Semántico
Resultados de la búsqueda:

2398850828_c2ea10ab53.jpg?v=0

Web semántica y Agentes inteligentes

La Web Semántica es la Web de los datos. Hay muchos datos que usamos cada día y que no son parte de la Web. Podemos ver mis apuntes bancarios en la web, e incluso nuestras fotografías y citas en el calendario. Pero ¿podemos ver las fotos en un calendario para ver que es lo que estaba haciendo cuando las hice? ¿Puedo ver mis apuntes bancarios en el calendario?
La respuesta a estas preguntas es no. Y ¿porqué no? La respuesta es porque no tenemos una Web de datos. Y esto es debido a que los datos están controlados por las aplicaciones, y cada una los guarda y trata de manera particular.

La Web Semántica trata sobre dos cosas. Sobre formatos comunes para el intercambio de datos, donde la Web original solamente se intercambian documento. Y trata sobre los lenguajes que representan los datos como objetos del mundo real.

La Web Semántica trata de resolver todos estos problemas, añadiendo a la Web Sintáctica la semántica que le falta para crear un entorno en donde podamos acceder a la información que necesitamos de un modo exacto y completo a la vez que se facilita el procesado de la misma y se resuelven los problemas de interoperabilidad entre aplicaciones que hemos resumido anteriormente.

Dicho de otro modo, la Web Semántica se fundamenta en el hecho de que las máquinas comprendan el significado de la información disponible, pero desde un punto de vista diferente al humano. Estamos diciendo entonces que la Web Semántica es pura Inteligencia Artificial, aunque a las máquinas aun les queda un largo camino por recorrer para poder llegar a comprender siguiendo un esquema de razonamiento como el que hacemos los humanos, si que son capaces de llegar a conclusiones (deducciones o inferencia) mediante procesos de lógica-matemática.

ejemplo de posible aplicacion semantica ( agentes inteligentes IKEA )

empresa de agentes virtuales

Para finalizar este epígrafe vamos a ver una situación de ejemplo que podría resolverse con la implantación de la Web Semántica, este ejemplo es original de Tim Berners-Lee y fue publicado en la revista Scientific American en 2002:

  • Los Beatles cantan “We can work it out” en el equipo de sonido de Bob cuando el teléfono suena…
  • El teléfono avisa a todos los dispositivos que tienen “control de volumen” para que lo bajen automáticamente…
  • Es su hermana Lucy al teléfono. Su madre va a necesitar sesiones de fisioterapia y tienen que turnarse para acompañarla. Acuerdan que sus agentes (que residen probablemente en algún móvil o PDA) hagan los arreglos necesarios.
  • El agente de Lucy recoge la prescripción de los sistemas del médico, busca clínicas en un área de 20 millas que tengan un nivel de confianza por parte de organismos fiables de “alto” o “muy alto”, y que su rango de precios esté en un margen determinado.
  • Una vez escogida la clínica, el agente de Lucy contacta con el de su hermano. Cotejan sus agendas personales, y fijan las fechas en las que cada uno acompañará a su madre.
  • Los agentes plantean las opciones a sus usuarios. A Lucy le parece bien, pero a Bob no. A la hora a la que son las sesiones, hay mucho tráfico desde su casa al hospital escogido. Así que Bob especifica a su agente criterios más estrictos de hora y localización.
  • El agente de Bob busca otras opciones y las encuentra siempre que cambie un par de citas de su agenda. Bob lo acepta.
  • El nuevo plan es enviado al agente de Lucy, quién lo acepta.

la Web semántica busca catalogar la información de los recursos web –páginas HTML, documentos PDF, vídeos, archivos de sonido– mediante ontologías (esto es, mediante el significado de las palabras), no mediante palabras clave.

Guía Breve de Web Semántica W3C

Tim Berners Lee - The Future of Internet

Part 1

Part 2

transcripción de la conferencia

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License