Lenguajes de Recuperacion Web
Recuperación y organización de la información
XQL
Introducción
XML se utiliza de tres maneras diferentes. En primer lugar, XML se utiliza como
lenguaje de marcas, donde los documentos se consideran árboles que representan
la estructura del documento.
En segundo lugar, XML se utiliza como un formato
de intercambio para los datos estructurados. Aquí, un documento se considera
como un conjunto de campos, cada uno de los cuales tiene un tipo de datos
específico.
El tercer aspecto es utilizar XML para representar el texto, donde
un documento consiste en las palabras y frases que lo forman.Obviamente, un
solo documento de XML puede representar más de uno de estos aspectos, así que
para un query XML necesitamos un lenguaje de interrogación que considere todos
estos aspects.
XQL [ Robie et el al. 98 ] es un lenguaje de interrogación para
los documentos de XML que es una extensión natural del W3C XPath estándar
[ Clark y DeRose 99 ].
Por lo tanto, XQL es un comienzo prometedor para
diseñar un lenguaje de interrogación de XML para los sistemas de la
recuperación de información. Sin embargo, las características siguientes son
deseables, aún no disponibles con XQL:
- La carga.
La investigación ha demostrado que el término del documento que carga así como cargar del término de la pregunta es herramientas necesarias para la recuperación eficaz en documentos textuales.
- Tipos de datos y predicados vagos.
Los predicados vagos son la generalización natural de cargar a otros tipos de datos. Con cargar, una medida de la semejanza se define para el texto, pero claramente, los usuarios desean buscar para los nombres que suenan como un nombre específico, o para la semejanza con respecto a una clasificación (ACM, MSC...), o para geográficamente cerca lugares. De hecho, la semejanza es útil para casi todos los tipos de datos.
- Búsqueda relevante.
Considere un documento estructurado, dividido en los capítulos, las secciones y las subdivisiones. Los usuarios pueden desear buscar para un contexto que conteste a una pregunta específica, sin saber de antemano las respuestas que deben ser devueltas. Para un documento, una subdivisión puede ser la mejor respuesta a una pregunta, porque otro documento que puede ser que sea un capítulo.
- Relativismo semántico.
XQL está muy cerca a la sintaxis de XML, pero es posible utilizar un XML sintácticamente diverso para expresar la misma clase de significado. Por ejemplo, una información particular se podría codificar como cualidad de XML o como elemento de XML. O un valor de la fecha se podría codificar como sola secuencia, o como tres secuencias separadas por año, mes y día.
Inglés Español
![Validate my RSS feed [Valid RSS]](valid-rss.png)


