Unidad 8
Archivística y Web Semántica: capturando el contexto
La gestión de documentos digitales se lleva a cabo desde plataformas web. Es imprescindible trabajar con nuevos estándares para la representación de la información, como los basados en el metalenguaje XML (marcado de recursos mediante etiquetas), y disponer de mecanismos eficaces para la gestión, reutilización y recuperación de documentos. Esta filosofía de representación de la información la asume el proyecto Web semántica, el cual pretende convertir la Web en una plataforma universal para el intercambio de información.
La Web semántica se apoya en dos pilares básicos:
-
El etiquetado semántico de recursos: la información puede ser interpretada tanto por humanos como por máquinas.
-
La creación de agentes software inteligentes capaces de operar a nivel semántico con los recursos web utilizando las ontologías, esquemas de organización del conocimiento.
Las ontologías provienen del ámbito de la inteligencia artificial y permiten representar e interrelacionar, por ejemplo, conceptos, procesos, objetos o personas para poder realizar diferentes operaciones de razonamiento con ellos. Podemos hablar de ontologías en los archivos con los cuadros de clasificación que permiten estructurar un fondo lógicamente a partir del análisis funcional de las actividades de una institución, y así describir, localizar y acceder a la documentación de una manera más eficaz.
En un archivo podemos encontrar diferentes divisiones y subdivisiones que permiten la organización lógica de la documentación de una institución: fondo, sección, subsección y series. Gracias a estos elementos y a una serie de principios la archivística desarrolla herramientas que facilitan la localización y el acceso a los documentos del fondo: los cuadros de clasificación.
Origen funcional de una serie documental
Las ontologías se componen a su vez de una serie de elementos estructurales: los conceptos e ideas que queremos representar; las relaciones que definen entre sí; las instancias o individuos que se pueden englobar en un concepto (“persona”); y los asertos, que expresan una pieza de conocimiento en la que aparecen diferentes conceptos interrelacionados entre sí.
El OWL (Web Ontology Language) es un lenguaje orientado al desarrollo de ontologías web y está recomendado por el W3C. Permite describir conceptos de un dominio determinado y las relaciones que estos establecen entre sí, de tal manera que puedan ser procesados por programas capaces de realizar razonamientos más o menos complejos a partir de estas relaciones.
El modelo de datos que propone OWL consiste en representar la realidad mediante entidades (o recursos) que vienen definidas por un identificador único, una serie de propiedades, y una clase (agrupación de entidades con características comunes).
Representación básica de una entidad
Para definir el código de las ontologías, OWL utiliza generalmente la sintaxis XML. Pero también es posible representar su estructura mediante grafos en los que las tripletas RDF aparecen representadas de la siguiente manera:
-
Los conceptos y clases se representan mediante elipses.
-
Las propiedades se representan como flechas que conectan conceptos con otros conceptos o con literales. Junto a la flecha aparece el nombre de la propiedad.
-
Los literales se representan como rectángulos.
Ejemplo de grafo RDF orientado
Un procedimiento sencillo para definir una ontología puede realizarse con el editor ontológico Protégé, que permitir generar estructuras de organización del conocimiento de una manera intuitiva a través de un interfaz gráfico y sin necesidad de teclear algún código. Podemos seguir estos pasos:
-
Antes de utilizar el editor, intentar expresar lo que queremos representar utilizando el lenguaje natural, con frases simples con la estructura sujeto-predicado-complemento. Estas frases se transcribirán más tarde a la estructura de tripletas RDF sujeto-propiedad-objeto.
-
Cuando tenemos clara la estructura a representar, hay que trasladar el grafo al editor de ontologías Protégé, definiendo las clases, propiedades de objetos, propiedades de datos e instancias en los apartados correspondientes.
-
El resultado es un fichero con extensión .owl donde se ve la traducción de la estructura que hemos definido en Protégé a código OWL expresado en XML.
Ejemplo de código de ontología OWL expresado en XML