Lenguajes de Recuperacion Web

Recuperación y organización de la información

Lenguajes de Recuperación Web

        La parte más importante de un buscador es el lenguaje de búsqueda, mediante el cual el usuario puede expresar, mejor o peor, su necesidad de información,establecer diversos filtros o condiciones, limitar el número de respuestas, revisar la pregunta, navegar por la lista de resultados, etc.

        Un buscador puede ser muy exhaustivo y tener así bien localizado el 90% o más de los documentos publicados en la Red, pero si la base de datos guarda poca información respecto a esos documentos o el lenguaje de recuperación es poco flexible, el conjunto como un todo proporcionará un rendimiento bajo. Como en una cadena de audio, la calidad final será la del peor de los componentes.

        Por ejemplo, uno de los servidores más exhaustivos, Lycos, es al mismo tiempo el que peor lenguaje de recuperación proporciona, mientras que uno de los que menos documentos reseña, WebCrawler, es el que tiene uno de los lenguajes más flexibles, lo que, en este contexto, equivale a ser uno de los más potentes.

        En definitiva, un lenguaje de recuperación es un conjunto de órdenes, operadores y estructuras que, organizados según unas normas lógicas, permiten la consulta de recursos de información electrónica.


Elementos de una ecuación


        La parte más importante de una una ecuación son los keywords introducidos por el usuario, es decir, las palabras que guiarán al motor de búsqueda.

        Tras los keywords, las ecuaciones están formadas por operadores, que definirán la relación existente entre las palabras de búsqueda introducidas.

  • Operadores booleanos (OR/AND/NOT)

    El operador AND obliga al buscador a encontrar resultados que contengan las dos palabras a las que afecta.
    El operador OR acepta todas las posibilidades que tegan al menos una de las dos palabras.
    El operador NOT excluye aquellos resultados de la búsqueda que contengan la palabra a la que hace referencia.

  • Operadores posicionales

    La utilización de operadores posicionales pretende superar algunas de las limitaciones que ofrecen los operadores booleanos. Toman como punto de partida la consideración del valor del término dentro del contexto, es decir, que la posición de ese término en relación con otros, o dentro del propio registro, es significativa para valorar su pertinencia a los objetivos buscados. Los operadores posicionales pueden dividirse en dos tipos:

    • Posicionales absolutos

      Son aquellos que permiten buscar un término en un lugar dado del documento o registro. Por regla general, son operadores de campo, es decir, permiten al usuario fijar en que campo o campos presentes en la estructura de base de datos debe aparecer el término buscado. La presencia del término en un campo dado (por ejemplo, en el campo título), puede ser una garantía de la adecuación del documento a los objetivos, en la mayor parte de las situaciones.

    • Posicionales relativos

      También llamados de proximidad, se trata de operadores que permiten establecer la posición de un término respecto a otro dado. Se considera que la cercanía entre los dos términos puede reflejar una íntima relación entre los conceptos reflejados por los mismos. Estos operadores permiten definir el nivel de proximidad entre los términos (mismo campo, línea, frase, número de términos significativos que los separa...).

  • Operadores de comparación.

    Especifican el rango de búsqueda, fijando unos límites para la misma. Estos límites pueden ser tanto numéricos como alfabéticos, correspondiendo los operadores a formas del tipo "mayor que", "menor o igual que". Se utilizan principalmente en documentos que pueden contener datos numéricos.

  • Operadores de truncamiento.

    Pueden darse situaciones en las cuales sea necesario utilizar no un término simple, sino también sus derivados, fijados por prefijación o sufijación, mínimas variantes léxicas, etc. Para facilitar la búsqueda de este tipo se han introducido operadores de truncamiento, a los que también se llama máscaras. Se trata de operadores (normalmente símbolos como *, $), cuya presencia puede sustituir a un carácter o a un conjunto de caracteres, situados a la izquierda, dentro o a la derecha del término en cuestión.


     Inglés      Español

Lenguajes de recuperación


Más información

Valid XHTML 1.0 Strict CSS V�lido! [Valid RSS] [Valid RSS]

RSS 1.0 RSS 2.0 Valid FOAF

report phishingreport abuse