Unidad 4
LENGUAJES DE INTERROGACIÓN PARA BUSCADORES
El lenguaje de interrogación (query language) transforma una necesidad de información que es algo intangible, en una fórmula bien formada que un robot (un motor de búsqueda o una base de datos) pueda interpretar.
Es un término técnico heredado de las primeras bases de datos, cuando el usuario debía explicar de forma detallada qué quería encontrar usando lógica booleana, en qué campos quería encontrarlo, cómo quería que fuera la respuesta, por qué campos quería que se ordenase esa respuesta, de forma que un sistema de búsqueda era tan bueno como su lenguaje de interrogación.
Actualmente, el uso de sistemas de relevancia, antes inexistentes, es lo que hace que los lenguajes de interrogación hayan dejado de existir o de tener importancia para el aficionado a nivel de usuario.
El lenguaje de interrogación responde a la siguiente idea:
-
Usuario que tiene una necesidad de información, entendido como estado mental carente de información.
-
El usuario, si tiene un buen conocimiento del lenguaje de interrogación o por medio de un intermediario (documentalista o asistente del propio sistema de búsqueda) transforma esa necesidad en una fórmula bien formada (fbf) del lenguaje de interrogación. Ello permitirá entender el motor de búsqueda y donde la respuesta serán documentos que cumplan la condición expresada de forma precisa por el usuario usando una sintaxis concreta del lenguaje de búsqueda del sistema.
La lógica booleana (Georges Boolepo, Siglo XIX) parte de los operadores AND, OR y NOT para operar con proposiciones. Por ejemplo, para tomar una proposición (caso de NOT) y obtener su negación o para aplicarlos a dos proposiciones (caso de AND y NOT) y obtener una tabla de verdad donde, a partir de la verdad o falsedad de las proposiciones simples se pudiera deducir la verdad o falsedad de la proposición compuesta.
Actualmente, la lógica booleana, además de como lógica matemática, se utiliza para el diseño de circuitos digitales, a partir del momento en que se descubrió que los elementos con los que tratan los operadores booleanos pueden ser de clases o conjuntos, lo que ha permitido diseñar las puertas lógicas que componen los microchips de los ordenadores.
En sistemas de información, tales como buscadores o bases de datos, se utiliza para representar necesidades de información con la fórmula “T1 Operador T2=(dv)”, donde T1 y T2 son términos de búsqueda (palabras clave) y Operador es un operador booleano (AND, OR, NOT) y (dv) representa al conjunto de los documentos verdaderos (cumplen la condición) en relación con la ecuación booleana, o dicho de otro modo, conjunto de documentos recuperados, aunque el conjunto pueda estar vacío.
La mayor parte de buscadores y de bases de datos documentales incluyen tipos de búsquedas como: simples, frase, booleana simple, booleana compleja. Además existen algunas variaciones, que se pueden combinar con las anteriores: genérica y acotada. Algunos motores (Google y Yahoo) ofrecen una gran variedad de posibilidades que a veces tiene poco que ver con la recuperación de información. El lenguaje de interrogación de Google actúa también como calculadora aritmética si entramos expresiones de suma, resta, (p.e. 9* 670/8). Podemos encontrar un sistema de respuestas directas, es decir, no un sistema que busca documentos que contengan la respuesta, sino un sistema que responde a la pregunta formulada.
La principal ventaja de las búsquedas booleanas es su capacidad para expresar con casi total exactitud las características concretas de la necesidad e información del usuario. Para su comprobación basta comparar una búsqueda con varios términos expresados sin uso de operadores booleanos explícitos, en cuyo caso el buscador los combinará todos con un AND y una búsqueda expresada con operadores (AND, OR, NOT), resultando que sólo la fórmula booleana es capaz de evitar tanto el ruido (información no deseada) como el silencio (información no recuperada).
El principal inconveniente es que el álgebra booleana es, de facto, anti intuitiva e intimidatoria para el usuario final.
A modo de resumen podemos fijar las siguientes conclusiones en relación con las búsquedas booleanas:
-
En el contexto de las bases de datos referenciales y en la base de datos de imágenes y vídeo, el uso de búsquedas booleanas es imprescindible, porque las referencias y las imágenes tienen poco texto comparado con el documento completo, y las bases de datos referenciales no suelen utilizar ningún tipo de ordenación por relevancia.
-
En las bases de datos de texto completo, el uso de búsquedas booleanas puede ser útil en función de la complejidad de la consulta y la calidad del sistema de relevancia de la base de datos.
-
En motores de búsqueda, la utilidad de las búsquedas booleanas ha quedado cuestionada debido a dos factores. En primer lugar gracias a los sistemas de cálculo de relevancia de los motores que han minimizado la necesidad de expresar de forma tan estricta las necesidades de información. En segundo lugar, porque la enorme abundancia de información de cualquier tipo hace cada vez menos importante la exhaustividad y más importante la precisión. Por ello para el usuario aficionado ha perdido peso no sólo el uso de búsquedas booleanas explícitas, sino la misma necesidad de aprender la sintaxis de un lenguaje de interrogación o incluso la necesidad de acudir al sistema avanzado de búsqueda. En cambio, los profesionales deben tener un buen conocimiento de las características completas de los lenguajes de interrogación por su propio prestigio profesional.
-
El conocimiento de las búsquedas booleanas es imprescindible en contextos donde no existe el documento completo (base de datos referenciales), donde el documento no es textual (base de datos multimedia) o donde no pueden aplicarse ordenaciones de relevancia basadas en enlaces (base de datos de texto completo.