Recetario para Infraestructuras de Datos Espaciales

(Traducción del Cookbook SDI v.2)

Un servicio de MERCATOR + Proyecto INFRAESTRUCTURA / METADATOS


Este trabajo ha sido financiado parcialmente por el PN de I+D+I del MCyT y está hospedado en RedGeomática (una Red Temática de RedIRIS)


CAPÍTULO

1

2

3

4

5

6

7

8

9

10


Capítulo tres

Tabla de Contenidos del Recetario


Capítulo 3:
Metadatos - Descripción de datos geoespaciales

Editor: Mark Taylor, Reino Unido, NGDF
Este documento ha sido desarrollado a partir de datos de FGDC, EUROGI, ANZLIC y NGDF y se basa predominantemente en las varias fuentes que se citan al final del capítulo

Introducción

Con frecuencia oímos la frase "la información es poder", sin embargo, con la creciente cantidad de datos que se crean y almacenan (aunque a menudo no bien organizados), hay una necesidad real de documentarlos para su uso en el futuro -para que sean tan accesibles como sea posible a un "público" tan amplio como sea posible. Hacerlo así tiene beneficios significativos:

Una serie de estudios ha establecido que, aunque el valor de los datos geoespaciales es reconocido por el gobierno y la sociedad, su uso limitado es debido al escaso conocimiento que se tiene de su existencia, a la información pobremente documentada sobre los conjuntos de datos y a la inconsistencia de éstos. Una vez creados, los datos geoespaciales pueden ser utilizados por múltiples sistemas "software" y para diferentes propósitos. Dada la naturaleza dinámica de los datos geoespaciales en un entorno de red, los metadatos son consecuentemente, un requisito esencial para localizar y evaluar los datos disponibles. Los metadatos pueden ayudar al ciudadano interesado, al planificador urbano, al estudiante graduado en Geografía o al gestor forestal, a encontrar y utilizar los datos geoespaciales, pero los metadatos también benefician al creador originario de los datos, al mantener el valor de los mismos y poder asegurar su continuo uso a lo largo de un lapso de varios años. Hace veinticinco años el hombre aterrizó en la luna. Todavía hoy se están usando datos de aquella época, y es razonable asumir que los datos geoespaciales de hoy puedan usarse en el año 2020 ó más, para estudiar el cambio climático, los ecosistemas y otros procesos naturales. Los estándares para metadatos harán aumentar el valor de tales datos al facilitar su participación a través del tiempo y del espacio. Así, cuando un gestor lance un nuevo proyecto, la inversión de una pequeña cantidad de recursos y tiempo al principio pagará dividendos en el futuro.


Arriba

Concepto y Fundamento

La palabra metadatos contiene la misma raíz griega que la palabra metamorfosis. "Meta" implica cambio y metadatos, o "datos de datos", describe los orígenes y sigue la pista de los cambios en los datos. Esta definición, muy general, incluye un espectro casi ilimitado de posibilidades, abarcando desde la descripción textual de un recurso generado por el hombre hasta datos generados por máquina que pueden ser útiles en aplicaciones "software".

El término metadatos ha venido usándose ampliamente en los últimos 15 años y ha llegado a ser particularmente generalizado con la popularidad de Internet, pero los conceptos subyacentes han estado en uso durante todo el tiempo que se han organizado colecciones de información. Los catálogos, en las bibliotecas, representan una variedad establecida de metadatos que, durante décadas, han servido como gestión de la colección y como instrumento para el descubrimiento de recursos. El concepto de metadatos también es familiar a la mayoría de aquéllos que manejan temas espaciales. La leyenda de un mapa es una representación de metadatos, que contiene información sobre el editor del mapa, la fecha de publicación, el tipo de mapa, su descripción, referencias espaciales, su escala y su exactitud, entre otras cosas. También metadatos son estos tipos de información descriptiva aplicada a un archivo geoespacial digital. Son una serie común de términos y definiciones para ser usados al documentar y utilizar datos geoespaciales. La mayoría de los archivos geoespaciales digitales tienen hoy en día algunos metadatos asociados. En el área de información geoespacial o de información con algún componente geográfico, esto normalmente significa el "qué", quién", "dónde", ¨por qué", "cuándo" y cómo" de los datos. Por consiguiente, la única diferencia importante que existe entre los conjuntos de muchos otros metadatos que se recogen en librerías, entorno académico, profesiones y otros, es el énfasis en el componente espacial -o el elemento "dónde"-.


Arriba

Los Beneficios de los Metadatos

Los metadatos ayudan a los que usan datos geoespaciales a encontrar los que necesitan y a determinar cómo utilizarlos mejor. También benefician a la organización productora de datos. Cuando una organización cambia de personal, los datos no documentados van a perder su valor. Los trabadores que vengan después pueden no comprender bien el contenido y los usos de una base de datos digital y pueden encontrar que los resultados generados por estos datos no son fiables. Falta de conocimiento sobre los datos de otra organización puede conducir a duplicación de esfuerzos. Puede parecer oneroso el coste de generar metadatos añadido al coste de la colección de datos, pero a la larga el valor de los datos depende de su documentación.

Metadatos es uno de esos términos que se ignora o evita convenientemente. Sin embargo, se observa un creciente reconocimiento de los beneficios y necesidad de metadatos para nuestros datos, conforme continuamos aumentado la utilización de éstos. En tanto que los cartógrafos daban metadatos rígidamente dentro de la leyenda del mapa de papel, la evolución de los ordenadores y el SIG ha sido testigo de la decadencia de esta práctica. Ahora que las organizaciones comienzan a reconocer el valor de esta información auxiliar, con frecuencia consideran incorporar una colección de metadatos al proceso de gestión de datos.

Planteamiento Organizativo

Niveles de Metadatos

Los metadatos pueden usarse para diferentes niveles:

Cada uno de estos propósitos, aunque complementarios, requiere diferentes niveles de información. De por sí las organizaciones deben mirar a sus necesidades de conjunto antes de generar sus sistemas de metadatos. Para las agencias, el aspecto importante es establecer sus requisitos empresariales primeramente, en segundo lugar las especificaciones de contenido y finalmente la tecnología y los métodos de ejecución.

Esto no quiere decir que estos niveles de metadatos sean únicos. Hay un alto grado de reutilización de los metadatos para cada nivel y cada organización diseñará el esquema de metadatos y su ejecución en base a sus necesidades empresariales para acomodar esos tres requisitos.

Los metadatos de descubrimiento son un mínimo de información que se necesita para transmitir la naturaleza y el contenido de la fuente de datos. Esto pertenece a las amplias categorías de las preguntas "qué, por qué, cuándo, quién, dónde y cómo" de los datos geoespaciales.

Las grandes categorías son sólo unas pocas; se reduce así el esfuerzo necesario para recoger la información, mientras que se sigue respetando el requisito de transmitir al usuario la naturaleza y el contenido de la fuente de datos.

Los sistemas "online" para manejo de metadatos tienen que contar con que éstos sean previsibles en forma y contenido. El nivel de detalle de los metadatos que se va a documentar depende del tipo de datos que se tengan y de los métodos para el acceso y uso. Diferentes tipos de datos (p. ej. vector, "raster", textual, imágenes, temáticos, límites, polígono, atributos, puntos, etc.) van a necesitar colecciones de diferentes niveles y formas de metadatos. Sin embargo, todavía hay un alto grado de compatibilidad entre la mayoría de los elementos de los metadatos requeridos.

Similarmente las organizaciones gestionarán sus datos de manera a cumplir propósitos determinados. Algunas organizaciones gestionan la información como un conjunto de datos, o bien gestionan la información hasta llegar a nivel de característica. De nuevo, hay todavía un alto grado de compatibilidad entre los niveles de los metadatos que se requieren, particularmente cuando los datos caen en forma de cascada desde el nivel de característica al nivel de conjunto o serie de datos.

Así pues, no solamente puede el contenido de los metadatos variar de acuerdo con su cometido, sino que también puede cambiar de acuerdo con el campo de acción de los datos que se están definiendo. Habitualmente, aunque no exclusivamente, los metadatos de descubrimiento tienen que ver con colecciones de fuentes de datos o series de conjuntos de datos que teniendo características similares, están relacionados con extensiones geográficas o tiempos diferentes. El ejemplo más habitual es una serie de mapas, pero igualmente puede aplicarse a estudios estadísticos. Metadatos más detallados pueden aplicarse a una colección o serie, pero también a un conjunto individual de datos (p.ej. un mosaico de mapas). De aquí el término metadatos de transferencia.

Los metadatos de exploración dan la suficiente información para permitir al usuario estar seguro de que existen datos apropiados para un propósito dado, valorar sus propiedades y poder hacer referencia a algún punto de contacto para obtener más información. Así pues, después del descubrimiento, se necesita más detalle sobre los conjuntos individuales de datos, y por tanto se requieren metadatos de mayor amplitud y también más específicos. Si se transfieren los datos como un conjunto único, entonces se necesitan metadatos bastante específicos y detallados, llegando posiblemente hasta el nivel de características, objeto o registro. Los metadatos de exploración incluyen aquellas propiedades necesarias para permitir al usuario final saber si los datos van a satisfacer los requisitos generales de un problema dado.

Los metadatos de explotación incluyen aquellas propiedades necesarias para el acceso, transferencia, carga, interpretación y uso de datos en la aplicación final, en donde van a ser explotados. Esta clase de metadatos con frecuencia incluye detalles de un diccionario de datos, la organización o esquema de los mismos, proyección y características geométricas y otros parámetros útiles al hombre y a la máquina para el uso apropiado de los datos geoespaciales.

Estas funciones forman un "continuum", en el cual el usuario cae en una cascada a través de una pirámide de opciones con el fin de determinar qué datos son disponibles, valorar su aptitud para el uso, acceso, transferencia y procesamiento de los mismos. El orden exacto en el que los elementos de los datos son valorados y su importancia relativa no van a ser los mismos para todos los usuarios.


Arriba

Vínculos entre datos geoespaciales y metadatos

Hasta hace poco los metadatos habían sido creados o derivados con poca o ninguna automatización. En efecto, solamente con el reciente desarrollo de los estándares para metadatos y la aparición del "software" correspondiente, basado en esos estándares, los que recogen datos geoespaciales han comenzado a considerar una gestión sólida de los metadatos. Con el creciente enfoque de incorporar los datos geoespaciales en los sistemas corporativos de información, con el desarrollo de un estándar internacional para metadatos y con las especificaciones del servicio de catálogo del "OpenGIS" (Sistema de Información Geográfica o SIG), nuevas versiones de "software" comercial SIG están ahora facilitando un vínculo estrecho entre los datos geoespaciales y los metadatos.

Sin tener en cuenta el estilo de los metadatos, hay nominalmente una colección de propiedades o metadatos asociados con un conjunto de datos dado o con una colección de características. La regla 1:1 expresa la noción de que un recurso discreto debería tener un registro de metadatos discreto. Aunque parezca suficientemente simple, no siempre es tan sencillo, porque los recursos con frecuencia no son tan discretos. Por ejemplo, ¿debería cada fotografía de un artículo tener su propio registro? ¿Cómo tratar las colecciones de artículos? ¿Puede ser concebida la colección como un recurso? ¿Y los objetos multimedia? De esta manera, una de las primeras tareas en la gestión de metadatos es la identificación de los datos o de la entidad que ha de ser documentada.

Los metadatos pueden existir a nivel de colección (p.ej. serie de satélites), de producto de datos (un mosaico de imágenes), de unidad de datos (un conjunto de datos vectoriales), un grupo de características de un determinado tipo (ciertas carreteras), o, incluso, hasta el ejemplo de una característica específica (una sola carretera). Sin tener en cuenta el nivel de abstracción, estas asociaciones de metadatos a objetos de datos debiera mantenerse.

En la práctica, la mayoría de los metadatos se coleccionan actualmente a nivel de conjunto de datos, y un registro de entrada en un catálogo indica al usuario su localización para acceso. Proveedores de datos geoespaciales cada vez más sofisticados están incluyendo metadatos a otros niveles de detalle, de tal manera que se preserve la riqueza de la información. Los estándares de metadatos, tales como ISO 19115, permiten diferentes niveles de abstracción en metadatos, y los servicios de catálogos también necesitarán acomodarse a esta riqueza, sin confundir al usuario con su complejidad.

Estándares de metadatos

¿Por qué usar estándares?

Idealmente las estructuras y definiciones de metadatos deben tener su referencia en un estándar. Un beneficio de los estándares es que se han generado a través de un proceso de consulta (con otros "expertos") y ofrecen una base a partir de la cual pueden desarrollarse perfiles nacionales u orientados de acuerdo con materias. Cuando los estándares se adopten dentro de la comunidad más ampliamente, se generarán programas de "software" para asistir a la industria a realizar el estándar. Se recomienda la solidez en contenido y estilo de los metadatos para asegurarse de que los usuarios puedan establecer comparaciones rápidamente sobre la conveniencia de los datos provenientes de diferentes fuentes. Esto quiere decir, por ejemplo, cuando se comparan metadatos sobre propiedad o desperdicios peligrosos, que hay una indicación de las fechas a las que la información se refiere o, si se comparan metadatos sobre fuentes diferentes de mapas, se muestran las escalas relevantes. Sin estandarización, comparaciones que tengan un sentido son más difíciles de establecer sin leer y aprender muchos estilos de gestión de metadatos.

También se estimula la previsibilidad sometiéndose a los estándares. (* N.del T. En el original esta frase está incompleta. No ha sido traducida) ... Estándares para metadatos detallados, que llevan consigo una definición exhaustiva de todos los aspectos de varios tipos de datos geoespaciales, están siendo preparados en la actualidad por una serie de instituciones, como también perfiles de estos estándares como modelos de referencia para ser adoptados internacionalmente.


Arriba

Estándares de metadatos geoespaciales

Un debate considerable en todo el mundo se está centrando sobre los metadatos y aquellas características que deben elegirse para describir mejor el conjunto de datos. Existen grupos de discusión, seminarios y conferencias y una gran cantidad de papel escrito sobre el tema. Una serie de organizaciones ha generado estándares, todos diseñados para asegurar que exista un grado de solidez dentro de una comunidad de aplicación en particular.

Existen tres estándares principales de metadatos (o se están desarrollando) que son amplios en su alcance y uso y proveen detalle para todos los niveles de metadatos antes mencionados:

En los EE.UU. El Comité Federal de Datos Geográficos ("Federal Geographic Data Committee -FGDC-) aprobó su Estándar de Contenidos en 1994. Este es un estándar de metadatos espacial y nacional generado para apoyar el desarrollo de la IDE nacional. Ha sido adoptado y ejecutado en los EE.UU., Canadá y el Reino Unido a través del Marco Nacional de Datos Geográficos ("National Geographic Data Framework" -NGDF-). También lo usan el Órgano Sudafricano de Descubrimiento de Datos Espaciales y la Red Interamericana de Datos Geoespaciales de doce países latinoamericanos e, igualmente, en Asia.

En 1992 el Comité Européen de Normalisation (CEN) creó el comité técnico 287, con responsabilidad para estándares de información geográfica. Una familia de pre-estándares europeos ha sido ahora adoptada, incluyendo "ENV (Euro.Norme Voluntaire) 12657 Información geográfica Descripción de datos-Metadatos".

Un estándar ISO está ahora en fase de borrador y es de esperar que vaya a ser ratificado a principios de 2001 (httpp://www.statkart.no/isotc211/welcome.html). En 1994 la Organización Internacional de Estándares (International Standards Organisation) creó el comité técnico 211 (ISO/TC211) con responsabilidad para Geoinformación/Geomática. Están preparando una familia de estándares; este proceso involucra un grupo de trabajo, un comité, un anteproyecto de estándar internacional y finalmente el estándar internacional. ISO ha publicado ya el borrador del comité "ISO 19115-GI-Metadata". Es de esperar que todos los estándares existentes converjan gracias a la iniciativa de ISO. Verdaderamente, la mayoría de los estándares existentes tienen ya mucho en común, y una vigorosa discusión internacional ha asegurado que el estándar ISO haya acomodado la mayoría de los diferentes requisitos internacionales. El estándar ISO se ha beneficiado igualmente de las experiencias de varias instituciones nacionales y las ejecuciones de sus respectivos estándares, asistidas por "oftware" de metadatos.

Los metadatos también forman una parte inportante del "OpenGIS Abstract Specification". El OpenGIS Consortium (OGC) http://www.opengis.org es una organización internacional comprometida en un esfuerzo cooperativo para crear especificaciones informáticas abiertas en el área de geoprocesamiento. Como parte de su borrador "OpenGIS Abstract Specification", OGC dedica una sección al registro de metadatos para datos espaciales. OGC está colaborando estrechamente con FGDC e ISO/TC211 para generar estándares de metadatos espaciales globales. En su reunión plenaria en Viena, Austria, en marzo de 1999, ISO/TC211 recibió con satisfacción la realización del acuerdo de cooperación entre el "OpenGIS Consortium" e ISO/TC 211 y aceptó los términos de referencia para un grupo de coordinación ISO/TC211/OGC.

Estos estándares han tenido diferentes ideas acerca de qué características hay que incluir. El proveedor de datos necesita un gasto considerable de tiempo y recursos si quiere hacerse con la información y para el usuariao de datos, el detalle puede ser mayor del que necesita para una investigación incial. Por consiguiente, en muchas situaciones se necesitan definir diferentes niveles de metadatos, con capacidad para llegar a niveles crecientes de detalle. Así pues, los metadatos deben variar de acuerdo con el propósito.

Hay una serie de iniciativas nacionales y regionales que también han generado estándares de metadatos. Incluyen iniciativas gestionadas por el Consejo de Información de la Tierra de Australia y Nueva Zelanda (The Australian and New Zealand Land Information Council" -ANZLIC-) y dos proyectos financiados por la Comisión Europea (La CLEF y ESMI). Estas iniciativas han seguido planteamientos similares al promover una serie limitada de metadatos (descritos como "Core Metadatos" o metadatos-foco o "Discovery Metadatos" o metadatos de descubrimiento) que las organizaciones deben usar como un mínimo para mejorar el conocimiento y accesibilidad de los recursos de datos geoespaciales disponibles.

Cada una de las iniciativas fomenta los estándares y el uso de metadatos de descubrimiento como base para una guía de metadatos. Los metadatos de descubrimiento proporcionan suficiente información para permitir al usuario asegurarse de que existen datos adecuados para su propósito y de que puede hacer alguna referencia a un punto de contacto para obtener más información. Si, después del descubrimiento, se necesita más detalle de los conjuntos de datos individuales, entonces se requerirán metadatos más generales y más específicos. Es posible que las organizaciones deseen generar metadatos a niveles diferentes pero complementarios -metadatos de descubrimiento para uso externo y, para uso interno, ("dentro de casa") metadatos más detallados-. Y para evitar duplicidad de esfuerzos, serán señalados aquellos elementos comunes a ambos. Estas pautas se han desarrollado reconociendo la importancia de metadatos más extensivos para la gestión de datos. Cada organización está fomentando la adopción de un estándar ISO de metadatos.


Arriba

Estándares de metadatos generales

En el amplio tema de los metadatos existen otros estándares que no se aplican específicamente a la información geoespacial. Estas convenciones se enumeran aquí con propósito informativo. Pueden ser referencias útiles para enlazar o integrar recursos no geoespaciales en un marco geoespacial.

El "Dublin Core" es un conjunto de elementos de metadatos que pretende facilitar la localización de recursos electrónicos. Concebido originalmente para la descripción (generada por autor) de recursos en la red, ha atraído la atención de comunidades que describen recursos formales, tales como museos, bibliotecas, agencias gubernamentales y organizaciones comerciales.

El "Dublin Core Workshop Series" ha reunido en una serie de talleres a invitados participantes del mundo de las bibliotecas, comunidades de investigación bibliotecaria digital y en red y una variedad de especialistas de contenido. La característica central del "Dublin Core" es la creación de un consenso interdisciplinario internacional alrededor de un conjunto de elementos centrales o focales ("core"). El progreso representa el surgimiento de sensatez y experiencia colectiva de muchos usuarios beneficiarios en la arena de la descripción de recursos. Los metadatos del "Dublin Core" pretenden específicamente apoyar el descubrimiento de recursos para objetivos generales. Los elementos representan un concepto de elementos centrales o focales ("core elements") que es verosímilmente útil para apoyar el descubrimiento de recursos. Desgraciadamente el uso formal del modelo de metadatos del "Dublin Core" no reconoce la inclusión de elementos cualificados, tales como "cobertura". Así pues, este elemento de metadatos puede contener texto que representa fecha o tiempo, una descripción del nombre de un lugar o un período de tiempo o coordenadas, sin poder especificar qué tipo de contenido está presente en el elemento textual. Como tal, los elementos no cualificados del "Dublin Core" son inadecuados incluso para una descripción y descubrimiento de recursos geoespaciales básicos, aunque pueden aplicarse a recursos de red y de biblioteca con vaga definición geoespacial.

El "Spatial Data Transfer Standard" (SDTS) y el "Vector Product Format (VPF) Digital Exchange Standard" (DIGEST) se desarrollaron para permitir la codificación de conjuntos de datos espaciales digitales para transferencia a "software" de datos espaciales. Los dos prestan apoyo a la inclusión de elementos de metadatos en intercambio pero, notablemente hasta hace poco, no han considerado respaldar la codificación de estándares de metadatos geoespaciales relevantes, en sus formatos de exportación o de archivo.

Aunque existen estándares de metadatos para objetivos generales, se recomienda que se utilice un estándar de metadatos geoespaciales para documentar datos geoespaciales. Es fácil producir metadatos simplificados a partir de una colección de metadatos más consistente, pero es imposible hacer lo contrario. Con el tiempo, la integración del contenido de los datos y los estándares de intercambio van a converger con aquéllos en contenido e intercambio de metadatos, así que los esfuerzos de codificación de los datos espaciales van a ofrecer una solución global para el archivo y la documentación.

Planteamiento de ejecución

¿Quién debe crear metadatos?

Los gestores de datos tienden a ser científicos técnicamente letrados o especialistas de ordenador científicamente letrados. Crear metadatos correctos es como hacer catalogación en una biblioteca, excepto que el creador necesita saber más sobre la información científica que hay tras los datos, con el fin de documentarlos apropiadamente. No debe asumirse que todo profesional necesita ser capaz de crear metadatos apropiados. Pueden quejarse de que es demasiado difícil y puede que no reconozcan los beneficios. En esta caso hay que asegurarse de que hay buena comunicación entre el productor de metadatos y el productor de datos; el primero puede tener que hacer preguntas al segundo para colaborar al desarrollo de documentación adecuada.

La forma de mantener metadatos dependerá de varios factores:

Si las posesiones de metadatos son bastante modestas, se ha hecho un hábito convencional almacenar los metadatos en documentos discretos, usando cualquier "software" disponible (p.ej. un procesador de textos, hoja de cálculo y una simple base de datos). Históricamente, las organizaciones han creado carpetas de documentos únicos que pueden estar en formatos digitales o de papel. Muchas organizaciones comenzarán a investigar el uso de sistemas más complejos, cuando se den cuenta del beneficio de los metadatos y cuando se hagan con posesiones mayores de datos y comiencen a asegurar un acceso más amplio a ellos.

Efectivamente, muchas organizaciones comenzarán con una revisión básica de sus posesiones de datos que les alertará de la inmensa riqueza que poseen y en dónde se usa, se repite o se mejora en toda la organización. Cuando las posesiones de datos se hacen mayores y el acceso se agranda, entonces, las organizaciones considerarán métodos más avanzados para mantener los metadatos de sus posesiones. Estas herramientas avanzadas pueden consistir en sistemas comerciales o basados en formas autogeneradas, que pueden también formar parte de los sistemas IG operativos, para extraer aspectos de los metadatos automáticamente de los mismos datos.

¿Qué podemos hacer con auéllos que se quejan de que es demasiado difícil? En la mayoría de los casos la solución está en volver a diseñar el caudal de trabajo antes que desarrollar nuevas herramientas o insistir en el aprendizaje. Con frecuencia se asume que los productores de datos tienen que generar sus propios metadatos. Desde luego que debieran proveer documentación informal, no estructurada, pero no necesariamente tienen que pasar por los rigores de metadatos formales totalmente estructurados. Para científicos o especialistas SIG que producen uno o dos conjuntos de datos al año, puede no merecerles la pena pasar tiempo aprendiendo todo sobre un estándar de metadatos complejo. En su lugar, se les puede pedir que completen una forma o plantilla menos complicada, que será entregada en el formato apropiado por un gestor de datos o catalogador, que esté familiarizado (no necesariamente tiene que ser un experto), con la materia y con el estándar de metadatos. Si veinte o treinta científicos están pasando datos al gestor todos los años, merecerá la pena que éste se tome el tiempo de aprender este complejo estándar de metadatos. Con buena comunicación, esta estrategia complementa la combinación existente de "software" y formación.


Arriba

El estándard de Metadatos

El primer conjunto de datos documentados es siempre el peor. El otro aspecto de "es demasiado difícil" es que para documentar completamente un conjunto de datos, se requiere una mirada (a veces) incómodamente minuciosa a los datos, que lleva a la comprensión de lo poco que realmente se sabe sobre su historia de procesamiento.

"Tiempo insuficiente" para documentar los conjuntos de datos es también una queja habitual. Situación esta en la que los gestores que aprecian el valor de los conjuntos de datos SIG, pueden establecer sus prioridades para proteger su inversión en los datos, asignando tiempo para documentarlos. Pasar uno o dos días documentando un conjunto de datos, que puede haber requerido meses o años en generar, con un coste de miles de dólares, apenas podría decirse que es una cantidad excesiva de tiempo.

Estas preocupaciones de "dolor" y "tiempo" son algunas veces legítimas, especialmente en el caso de agencias que pueden tener un patrimonio de cientos de conjuntos de datos que podrían ser documentados, pero para los que el tiempo que ha de gastarse en documentarlos hay que restarlo de los proyectos en curso. Llegados a este punto, parece mucho más útil tener muchos metadatos "atajo", que una pequeña cantidad de metadatos "con todas las de la ley". Así pues, ¿qué recomendaciones se pueden hacer a estas agencias en lo referente a "metadatos mínimos" o qué se puede hacer para reducir el volumen de documentación?.

En algunas operaciones se recogen esporádicamente cantidades pequeñas de metadatos, o "notas", durante el curso del procesamiento de datos. Estas indicaciones pueden ensamblarse después más fácilmente dentro de una relación clara de la historia y procesamiento del conjunto de datos. Esto puede llevar consigo menos desaliento en el trabajo al final del proyecto, puesto que la mayoría de los detalles se han documentado ya poco a poco. Cada vez más el SIG y el "software" de procesamiento de imágenes son capaces de recoger y documentar metadatos cuantitativos que se añaden para el usuario, en lugar de que sea éste el que tenga que intervenir. Estos procedimientos pueden significar ahorros significativos en el tiempo y esfuerzo de conjunto sobre un proceso único de preparación manual de metadatos al final del proyecto.

No invente su propio estándar. Siempre que sea posible, elija un estándar internacional. Trate de mantenerse dentro de sus estructuras. Cambios sutiles de un estándar internacional tal como un colapso de sus elementos compuestos puede, a la larga, costar caro -no podrá usar herramientas estándar y sus metadatos pueden no ser directamente intercambiables o analizables por "software".

No confunda la presentación (vista) de los metadatos con los metadatos mismos. Existe la tentación de amontonar forma y contenido en el mismo cajón (p.ej. "Lo que veo en mi base de datos es lo que imprimo"). Sin embargo, la aptitud para diferenciar los contenidos de la base de metadatos (las columnas de campos) de su presentación (informes formateados) es ahora un lugar común en los paquetes de "software" de base de datos de escritorio. Esto permite a los usuarios considerar más flexiblemente qué información presentar y cómo.

Existeen tres formas típicas de metadatos que deben ser reconocidas y mantenidas en sistemas: la forma de ejecución (dentro de una base de datos o un sistema de "software"), el formato de exportación o codificación (una forma legible por máquina, diseñada para transferencia de metadatos entre ordenadores) y la forma de presentación (un formato conveniente para ser visto por el usuario). Reconociendo las conexiones entre estas disposiciones de metadatos, se pueden crear sistemas que se adapten a los requisitos de la misión, se puede llevar a cabo una codificación para intercambio, y además se pueden facilitar muchas "vistas-informe" de los metadatos, para satisfacer las necesidades y experiencia de diferentes clases de usuarios.

El "Extensible Markup Language" (XML) da dos soluciones a este problema de metadatos. En primer lugar, incluye un lenguaje de refuerzo con reglas estructurales consolidadas por medio de un archivo de control para validar la estructura del documento. En sengundo lugar, por medio de otro estándar acompañante ("XML Style Language", o XSL), se puede usar un documento XML junto con una hoja de estilo para producir presentaciones estandarizadas de contenido, permitiendo al usuario remover el orden del campo, cambiar etiquetas o mostrar nada más que ciertos campos de información. El uso de XML, junto con hojas de estilo, permite un formato de intercambio estructurado y una presentación flexible. De esta manera, una entrada de metadatos puede producirse de muchas maneras a partir de la misma y única dodificación estructurada.

XML es una metodología de codificación ampliamente aceptada, con soporte internacional de "software", tanto gratuito como comercial. Sin embargo, la comunidad productora de metadatos todavía no tiene mucha experiencia en su uso para solucionar problemas. A través de realizaciones de "software" de referencia y de experimentación, las IDE pueden compartir sus éxitos y fracasos en la aplicación de esta nueva tecnología para mayor beneficio de la comunidad.

Considere el granulado de los datos. ¿Puede documentar muchos de sus conjuntos de datos (o mosaico) en un agrupamiento de origen común? Establezca un orden de prioridad en sus datos. Comience documentando aquellos conjuntos de datos que tienen un uso actual o anticipado en el futuro, conjuntos de datos que forman el marco sobre el cual se basan otros, y conjuntos de datos que representan el mayor compromiso de su organización en términos de esfuerzo y coste.

Documente a un nivel que preserve el valor de los datos dentro de su organización. Considere lo mucho que le gustaría saber acerca de sus conjuntos de datos si uno de sus operadores SIG más antiguos se marchara de repente, atraído por un estilo de vida primitiva, a una isla tropical.


Arriba

¿Cómo creo metadatos?

En primer lugar, se deben entender los datos que se están tratando de describir y el estándar mismo. Luego, se debe decidir cómo codificar la información. Tradicionalmente se viene creando, se crea un único archivo de texto por cada registro de metadatos; es decir, un archivo de disco por conjunto de datos. Típicamente se usa un progrma de "software" para asistir la entrada de información, de manera que los metadatos se conformen al estándar.

Específicamente:

Haremos aquí un circunloquio sobre adaptabilidad e interoperabilidad.

Los diferentes estándares de metadatos son en realidad estándares de contenido. No dictan la disposición de los metadatos en los archivos del ordenador. Puesto que el estándar es tan complejo, el efecto práctico es que casi cualesquiera metadatos se conforman conceptualmente al estándar; el archivo que contiene los metadatos sólo tiene que contener la información apropiada, y esa información no necesita ser fácilmente interpretable o accesible por una persona o incluso un ordenador.

Esta noción bastante amplia de adaptabilidad no es muy útil. Desafortunadamente es bastante común. Para ser verdaderamente útiles, los metadatos tienen que ser con toda evidencia comparables con otros metadatos, no sólo en un sentido visual, sino también para "software" que clasifica, busca y recupera documentos en Internet. Para realizar esto, hay varios estándares de codificación que especifican el contenido de una entrada de metadatos para intercambio entre ordenadores. Para tener valor real, los metadatos tienen que ser analizables, es decir, legibles por máquina, e interoperables, es decir que funcionan con "software" utilizado en servicios tales como el "FGDC Clearinghouse" a través de los servicios de catálogo del OpenGIS. El FGDC e ISO 19115 tienen estándares de codificación para asistir en este esfuerzo.

 

Analizables

Quiere decirse que se analiza la información desmontándola y reconociendo sus componentes. Los metadatos que son analizables separan nítidamente la información asociada con cada elemento de la de otros elementos. Es más, los valores de los elementos no sólo son separados uno de otro, sino que son además claramente relacionados con los nombres de los elementos correspondientes, y éstos son relacionados recíprocamente tal como son en el estándar.

En la práctica esto significa que los metadatos están habitualmente ordenados siguiendo una jerarquía, precisamente como están los elementos en el estándar, y tienen que utilizar nombres estándar para los elementos como manera de identificar la información contenida en los valores de los elementos.

Interoperables

Para operar con "software" de servicio para metadatos, éstos tienen que ser legibles para el "software". Generalmente esto quiere decir que tienen que ser analizables y que tienen que identificar los elementos de la manera que se espera del "software".

Hay un consenso general sobre el hecho de que los metadatos deben ser intercambiados en "Extensible Markup Language" (XML) en conformidad con un "Document Type Declaration" (DTD). En el Consorcio de Internet se está progresando en el desarrollo de un sucesor del DTD, conocido como "XML-Schema".

El apoyo a XML en análisis y soluciones de presentación está muy difundido en la red. Se supone este apoyo en los estándares de ISO TC 211 y en las especificaciones del "OpenGIS"


Arriba

¿De qué "software" se dispone para crear y validar metadatos?

Ninguna herramienta puede verificar la exactitud de los metadatos. Por otra parte, ninguna herramienta puede determinar si los metadatos incluyen elementos designados por el Estándar como condicionales o como "obligatorios en caso de ser aplicables". En consecuencia, se requiere algún nivel de revisión humana. Pero ésta debe ser más simple en aquellos casos en que se sabe que los metadatos tienen una estructura sintáctica correcta.

No se puede decir que el "software" se adapte al estándar. Solamente se puede decir que los registros de metadatos en una forma dada de codificación se adaptan o no. Un programa que pretendía adaptarse al Estándar tendría que ser incapaz de rendir una producción que no se adaptara. Una herramienta tal tendría que anticipar todos los conjuntos de datos posibles. En su lugar, las herramientas deben asistir en la entrada de los metadatos, y los registros de salida deben ser verificados en pasos separados, en lo que se refiere a adaptabilidad y precisión. En el mejor de los casos se puede describir o anticipar una prueba de compatibilidad entre los componentes del "software".

Cuestiones sobre implementación

Vocabularios, diccionarios geográficos y tesauros.

Cuando está buscando información, el interesado puede no encontrar referencia alguna basada en las palabras usadas para describir la información deseada. Este problema puede salvarse usando un tesauro. En el contexto de metadatos y otros documentos electrónicos, un tesauro es una herramienta para la organización y recuperación de información en materiales electrónicos. Permite clasificar y recuperar datos de una manera consistente. Permite la exhibición de jerarquía de conceptos e ideas, dirigiendo al usuario, bien como clasificador o como buscador de información, a definir su búsqueda en términos que, con mayor probabilidad, van a llevarle a la recuperación de información relevante.

Por ejemplo, se podrá recuperar mejor la información al disponer de una búsqueda de sinónimos con éxito -si el usuario introduce el término "granjero", el diccionario encontrará "agricultor"-. Se pueden mostrar jerarquías de significado: el término "Gran Bretaña" puede hacer recuperar datos clasificados con ese término, pero podría también extender la búsqueda para recuperar datos sobre Inglaterra, Gales y Escocia, que han sido clasificados bajo esos tres términos. Una palabra determinada, aunque en la jerarquía de términos está relacionada primero con una cierta categoría general, pudiera también vincularse con conceptos relacionados con otra categoría diferente, y el usuario puede querer seguir y recuperar estos términos(*). Se podrá conseguir una búsqueda consistente de metadatos si todos los que los preparan usan el mismo diccionario.

(*) N.del T.: En el original, se utiliza como ejemplo el término "meals on wheels", es decir, "comidas sobre ruedas", servicio social en países anglosajones , con el que pueden no estar familiarizados los lectores castellano-parlantes. Se explica cómo, aunque esa expresión está primariamente relacionada con "comida", también puede ser vinculada a "servicios sociales".

Colaboración mínima con los usuarios durante las fases de definición y ejecución: es preciso hacer énfasis en la amistad hacia los usuarios en general.

Para un usuario no profesional es muy difícil encontrar la información que se quiere. Incluso si en algunos servicios de metadatos se puede encontrar "Help" o "Tutorial", no es muy fácil comprender qué hay que hacer o en dónde escribir. Se debe hacer un esfuerzo para explicar qué hay que pedir. Hay que desarrollar interfaces multilingües y de amigables al usuario. Si lleva demasiado tiempo comprender cómo reaccionar a los servicios de metadatos, los usuarios no estarán ahí mucho tiempo y se quejarán inmediatamente. Un tesauro multilingüe o catálogo con palabras clave deberá estar al servicio de los usuarios para asegurar que se usa el mismo vocabulario. Una de las cosas más importantes es desarrollar servicios que no dependan de la tecnología o estén conducidos por ella. Los proyectos deben hacerse en colaboración con los usuarios (que tienen que ser identificados primero).


Arriba

Contenido esperado por los usuarios

Dado el despliegue y la complejidad de los modelos de metadatos, podemos estar razonablemente seguros que los que ahora se presentan en los servicios de catálogo van a ser casi siempre más de lo que los usuarios esperan. Parece que la tendencia actual es proponer una base de datos compleja, planteamiento que estaría claramente orientado a los productores de datos. Se puede uno imaginar que los usuarios están más interesados en ejemplos y en beneficios de cómo usar los conjuntos de datos propuestos que en una descripción detallada de su estructura y contenido, la cual puede llevarse a cabo por medio de presentaciones especiales de metadatos.

Es importante separar el contenido de los metadatos espaciales de sus medios de presentación. Por medio de aplicaciones tales como el "Extensible Mark Language" (XML), se pueden ofrecer documentos con gran detalle a través de diferentes hojas de estilo, desde una fuente de contenido hasta muchas formas de presentación, covenientes a audiencias diferentes. Es necesario trabajar más en el desarrollo de metodologías de presentación, con objeto de simplificar la pesada carga que significa para todos entender los metadatos.

Metadatos para aplicaciones

Hay una tendencia a adaptar la estructura y contenido de los metadatos a aplicaciones, por ejemplo, comercio electrónico o gestión de datos en el seno de una organización. Los metadatos que se crean para satisfacer una necesidad real en lugar de aquéllos que se crean porque se ven como algo que debe hacerse en el interés general, van a estar, más probablemente, mejor escritos y mantenidos.

El "OpenGIS Consortium" está desarrollando estructuras y campos de metadatos para describir interfaces de "software" que se revelan como "servicios" para uso externo. Estos metadatos de servicios ayudarán al "software" inteligente, a través de agentes conocidos como catálogos de servicios, a descubrir servicios disponibles que podrían finalmente enlazarse para formar nuevas operaciones compuestas. Los servicios también están necesariamente vinculados a clases y casos de datos.

El campo de Prueba de la Cartografía en Red, del OGC (Web Mapping Testbed) está documentando esta interacción, como contribución a los metadatos en el ISO 19115.

Mecanismo de identificación del producto de información geográfica

En la actualidad no hay ningún mecanismo que dé números de identificación a los diferentes productos de IG producidos y ofrecidos a los usuarios. La ausencia de este elemento es una cuestión muy importante para aquéllos que están realizando un servicio de metadatos en paralelo con una solución de comercio electrónico.

Para hacer realidad el comercio electrónico de la IG, debe llevarse a cabo un estudio sobre cómo un sistema de numeración de la IG pudiera organizarse y realizarse y quién podría hacerlo. Este sistema podría ser similar al que se usa para otros productos, por ejemplo libros. Sería extraordinariamente provechoso que la IGDE pudiera dar asesoramiento inicial en las cuestiones técnicas y políticas que conlleva el establecimiento de un sistema de identificación de los productos (datos) que vaya a funcionar globalmente en la información geoespacial digital y no digital.


Arriba

Incentivos para el desarrollo de metadatos

La lista impresionante de incentivos, incluyendo recursos financieros, conocimiento y competencia, estándar e instrumentos, dados por el Comité Federal de Datos Geográficos (Federal Geographic Data Committee -FGDC- http://www.fgdc.gov), todo ello para estimular la creación y mantenimiento del contenido y servicio de metadatos, siguiendo la concepción de la Agencia Distribuidora de los EE.UU. (US Clearinghouse), pareció ser un factor clave de éxito en la iniciativa estadounidense de metadatos. Es importante que los gobiernos nacionales y regionales valoren, reconozcan y provean tales incentivos a los creadores y gestores de metadatos. Algunos países como Francia, Canadá, Australia y los EE.UU. han comenzado a crear y proporcionar "software" libre de gastos a los creadores de metadatos. Se espera que la adopción generalizada del estándar de metadatos ISO 19115 estimulará aún más el desarrollo de una base internacional de herramientas gratuitas y comerciales, siguiendo un estándar común.

Concebir legislación para el contenido de metadatos en el sector público

En países en los que la legislación es el motor principal para crear nuevas actividades de sector público o adaptar las existentes, pueden necesitarse nuevas leyes para que el sector público de IG y las empresas comerciales que recogen datos geoespacilales para aquél, alienten y soliciten la colección y distribución de metadatos basados en estándares.

Recomendaciones

Es muy caro crear estándares y ejecutarlos. Se deben adoptar los estándares nacionales, con la intención de corroborar el estándar de contenido ISO 19115, cuando éste llegue. Ello dará como fruto la recompensa de la mayor interoperabilidad en un entorno global.

Empiece por documentar aquellos conjuntos de datos que tienen uso en la actualidad o se anticipa que lo tengan en el futuro, conjuntos de datos que forman el marco en el que otros están basados, y conjuntos de datos que representan el mayor compromiso de su organización en términos de esfuerzo y coste. Para uso dentro y fuera de su organización, debe documentar de forma adecuada estratos marco y estratos especiales o únicos de gran interés. Desde luego que todos los datos publicados justifican documentación de esta manera, pero estableciendo prioridades sabrá qué trabajo tiene usted por delante.

Para metadatos detallados como los de FGDC e ISO, se puede recoger una enorme cantidad de información. Aunque nunca se rellenan todos los campos, hay una oportunidad para almacenar propiedades específicas en su correcta situación dentro de la estructura estándar. Esto facilita su almacenamiento y descubrimiento en catálogos (véase capítulo 4). Si se recogen ciertos tipos de metadatos durante el proceso de colección de datos, como parte del trabajo en curso, entonces muchas notas de 20 segundos pueden significar más adelante una substanciosa trama.

El Grupo de Trabajo Técnico de la IGDE con la asistencia del Comité Directivo, en cuanto a normas se refiere, debe dar asesoramiento inicial en cuestiones técnicas y políticas que conlleva el establecimiento de un sistema de identificación del producto (datos) que ha de funcionar globalmente en la información geoespacial digital y no digital.

Mientras que ISO TC 211 está desarrollando especificaciones y metodologías generales y el OpenGIS Consortium está creando interfaces de "software", no se sabe que se haya convocado ninguna organización global para coordinar un sistema de clasificación común para datos geoespaciales. Como consecuencia, el uso de diccionarios temáticos competitivos dificulta la búsqueda.


Arriba

Direcciones de Enlaces

 


CAPÍTULO

1

2

3

4

5

6

7

8

9

10

Tabla de Contenidos del Recetario


Comentarios a mab. Ultima Revisión 8 Mayo 2001