Lenguajes de Recuperacion Web
Recuperación y organización de la información
Lenguajes de Recuperación Web
La parte más importante de un buscador es el lenguaje de búsqueda, mediante
el cual el usuario puede expresar, mejor o peor, su necesidad de
información,establecer diversos filtros o condiciones, limitar el número de
respuestas, revisar la pregunta, navegar por la lista de resultados,
etc.
Un buscador puede ser muy exhaustivo y tener así bien localizado el
90% o más de los documentos publicados en la Red, pero si la base de datos
guarda poca información respecto a esos documentos o el lenguaje de recuperación
es poco flexible, el conjunto como un todo proporcionará un rendimiento bajo.
Como en una cadena de audio, la calidad final será la del peor de los
componentes.
Por ejemplo, uno de los servidores más exhaustivos, Lycos,
es al mismo tiempo el que peor lenguaje de recuperación proporciona, mientras
que uno de los que menos documentos reseña, WebCrawler, es el que tiene uno de
los lenguajes más flexibles, lo que, en este contexto, equivale a ser uno de los
más potentes.
En definitiva, un lenguaje de recuperación es un conjunto
de órdenes, operadores y estructuras que, organizados según unas normas lógicas,
permiten la consulta de recursos de información electrónica.
Elementos de una ecuación
Tras los keywords, las ecuaciones están formadas por operadores, que definirán la relación existente entre las palabras de búsqueda introducidas.
- Operadores booleanos (OR/AND/NOT)
El operador AND obliga al buscador a encontrar resultados que contengan las dos palabras a las que afecta.
El operador OR acepta todas las posibilidades que tegan al menos una de las dos palabras.
El operador NOT excluye aquellos resultados de la búsqueda que contengan la palabra a la que hace referencia.
- Operadores posicionales
La utilización de operadores posicionales pretende superar algunas de las limitaciones que ofrecen los operadores booleanos. Toman como punto de partida la consideración del valor del término dentro del contexto, es decir, que la posición de ese término en relación con otros, o dentro del propio registro, es significativa para valorar su pertinencia a los objetivos buscados. Los operadores posicionales pueden dividirse en dos tipos:
- Posicionales absolutos
Son aquellos que permiten buscar un término en un lugar dado del documento o registro. Por regla general, son operadores de campo, es decir, permiten al usuario fijar en que campo o campos presentes en la estructura de base de datos debe aparecer el término buscado. La presencia del término en un campo dado (por ejemplo, en el campo título), puede ser una garantía de la adecuación del documento a los objetivos, en la mayor parte de las situaciones.
- Posicionales relativos
También llamados de proximidad, se trata de operadores que permiten establecer la posición de un término respecto a otro dado. Se considera que la cercanía entre los dos términos puede reflejar una íntima relación entre los conceptos reflejados por los mismos. Estos operadores permiten definir el nivel de proximidad entre los términos (mismo campo, línea, frase, número de términos significativos que los separa...).
- Posicionales absolutos
- Operadores de comparación.
Especifican el rango de búsqueda, fijando unos límites para la misma. Estos límites pueden ser tanto numéricos como alfabéticos, correspondiendo los operadores a formas del tipo "mayor que", "menor o igual que". Se utilizan principalmente en documentos que pueden contener datos numéricos.
- Operadores de truncamiento.
Pueden darse situaciones en las cuales sea necesario utilizar no un término simple, sino también sus derivados, fijados por prefijación o sufijación, mínimas variantes léxicas, etc. Para facilitar la búsqueda de este tipo se han introducido operadores de truncamiento, a los que también se llama máscaras. Se trata de operadores (normalmente símbolos como *, $), cuya presencia puede sustituir a un carácter o a un conjunto de caracteres, situados a la izquierda, dentro o a la derecha del término en cuestión.
Inglés Español
![Validate my RSS feed [Valid RSS]](valid-rss.png)


