Recetario para Infraestructuras de Datos Espaciales

(Traducción del Cookbook SDI v.2)

Un servicio de MERCATOR + Proyecto INFRAESTRUCTURA / METADATOS


Este trabajo ha sido financiado parcialmente por el PN de I+D+I del MCyT y está hospedado en RedGeomática (una Red Temática de RedIRIS)


CAPÍTULO

1

2

3

4

5

6

7

8

9

10

Capítulo Cuatro (4.2)

Tabla de Contenidos


Planteamiento Organizativo

¿Quiénes son los individuos o actores involucrados en la publicación y descubrimiento (localización) de información geoespacial? Definiendo los papeles y responsabilidades que todos estos actores juegan, se pueden comprender las funciones esenciales que los servicios, humanos o asistidos por ordenador, deberían ser capaces de llevar a cabo en interés del descubrimiento de recursos para la IGDE

Terminología

Funciones

La figura 4.2 muestra las acciones entre actores, las funciones que desempeñan y los objetivos con los que actúan recíprocamente. La ilustración utiliza anotación del Lenguaje Modelo Unificado ( UML Unified Modeling Language) para representar los procesos desde un punto de vista funcional.

Figura 4.2.- Diagrama de interacción que muestra el uso de Servicios de Catálogo y los elementos de IDE relacionados.

Utilizando los actores de la figura 4.2 como se describe en el texto, las secciones que siguen expondrán los requisitos de gestión organizativa u operativa para Servicios de Catálogo Distribuído, compatibles con una IGDE, basándose en las siguientes áreas de interés:

Cada sección incluirá un ejemplo para dar énfasis a las funciones y acciones que deben considerarse al crear un componente de descubrimiento en la IDE en cuestión


Arriba

Servidor de Catálogo / Desarrollo de servicio

Los Servicios de Catálogo Distribuído asumen algún grado de copropiedad y participación compartida. Actividades similares en Internethan optado por un planteamiento al tratamiento de metadatos de plena centralización, poniéndolos en el índice de un servidor o en varios servidores repetidos. En un entorno de gestión de metadatos cada vez más dinámico, la sincronización entre metadatos detallados y un índice tal se hace cada vez más difícil. Este problema se experimenta a diario cuando se realizan búsquedas en los motores de la red y se obtiene el error "404: archivo no encontrado" cuando un documento se ha movido o cambiado. Además, estamos viendo una tendencia a tratar los metadatos y los datos como interrelacionados e incluso a gestionarlos conjuntamente dentro de una única base de datos. Duplicar estos metadatos en un índice externo puede ser costoso e induce a problemas de sincronización de los datos (con sus metadatos) y los metadatos clasificados externamente. Las organizaciones que ya gestionan datos espaciales y están interesadas en publicarlos, son con frecuencia los aspirantes más capaces para publicar y mantener los metadatos. Estos, cuando se hallan junto con los datos en un servidor, tienden a ser más actuales y detallados que los metadatos publicados en un índice externo (cosechados y clasificados a distancia).

La creación de una aptitud para dotarse de un servicio de catálogo para información geoespacial se construye con el compromisode recoger y gestionar algún nivel de metadatos geoespaciales dentro de la organización. El siguiente ejemplo describe la publicación de una entrada de metadatos:

  1. Un Colaborador de Metadatos recibe de otro profesional la descripción de un nuevo conjunto de datos espaciales. Los metadatos se generan en un formato codificado transferible para prmitir su intercambio sin pérdidas de contexto o contenido de la información.
  2. Esta entrada de metadatos se pasa a un Administrador del Catálogo para su consideración y adición al mismo.
  3. El Administrador del Catálogo aplica los criterios de aceptación de acuerdo con la calidad de los metadatos, como requiere la organización. Si son aceptados, se insertan en el catálogo.
  4. Ahora, el Administrador del Catálogo lo actualiza para que se refleje la nueva entrada, que va a estar disponible para el acceso público.
  5. Este conjunto de datos se considera ahora publicado, porque sus metadatos proporcionan un registro de su información general susceptible de ser preguntado, navegado sobre su extensión temporal y espacial y sobre muchas otras características que se pueden explorar.

Hay varios modelos para la instalación de servicios de catálogo en las organizaciones o entre organizaciones. Hablando en general, un servidor de catálogo se instala en el nivel de la organización apropiado a la naturaleza de los datos y metadatos, el contexto o mandato que tiene esa organización y el nivel al que el catálogo puede ser sustentado operativamente.


Arriba

Planteamientos alternativos

El diseño operativo de un catálogo distribuido, como se ha expuesto más arriba, depende en gran parte de la capacidad de los clientes para usar los servicios propuestos. Globalmente el acceso a ordenadores y redes de comunicación que hacen posibles las diferentes aplicaciones es todavía asequible a una pequeña minoría de la población. Esto está cambiando; por una parte se stán facilitando puntos de acceso público y por otra creando y subvencionando la construcción e interconexión de redees. A pesar de ello, el catálogo distribuído puede no estar bien ajustado a las condiciones en muchos países desarrollados y en vías de desarrollo, en donde el uso de Internet no es tadavía habitual o hay escasez en la anchura de banda. Hay dos soluciones que se han propuesto como prototipos que son convenientes para el acceso a la información pública en esos casos.

Para organizaciones y clientekas que tienen un acceso limitado a ordenadores o redees, los metadatos pueden volver a procesarse, imprimirse y distribuirse como catálogos en papel. Los costes de imprsión y distribución pueden ser significativos, pero se puede llegar a una gran audiencia a través de bibliotecas públicas y organizaciones interesadas en el uso de datos espaciales para la toma de decisiones. La sincronización con el contenido actual de los datos en tales catálogos de papel pueden representar también un problema. Siempre puede considerarse la distribución de esos catálogos como suplento a los métodos del servicio de información digital.

Si existe Internet y el público puede disponer de sus servicios, pero la anchura de banda dentro de la región de interés es limitada, puede ser deseable que los catálogos individuales apoyen la cosecha de metadatos, a partir de sitios muy distantes, en catálogos "espejo". Un buen ejemplo de eésto sería el apoyo al descibrimiento de datos regionales a través de servidores múltiples en diferentes sitios, cuyas conexiones son lentas. Si cada catálogo pusiera sus metadatos en una guía accesible en la red, un buscador podría recuperar y clasificar los metadatos provenientes de otros lugares en un índice regional o replicado.

En USA se ha demostrado que esta metodología proporciona un único punto sincronizado de acceso a los metadatos que se buscan desde un número pequeño o moderado de sitios. Debe hacerse notar que ésto aún sugiere que la colección combinada misma está todavía tras un servidor con una interfaz común, pero potencialmente se requerirán menos servidores permanentes en esta arquitectura. En el punto final d este diseño se podrían maginar unos cuantos almacenes de metadatos con interfaces de búsqueda comunes. Las principales preocupaciones sobre la generalización de este planteamioento incluyen el apoyo a índices sumamente grandes de metadatos y la sincronización de los índices con metadatos y datos que se mantienen en un lugar muy distante. No es probable que éste planteamiento vaya a progresar hasta llegar a una única colección glogal de metadatos, utilizando las tecnologías actuales.

En regiones donde los proveedores de datos y los clientes tienen acceso a ordenadores pero no tienen redes fiables, la creación de medios CD-ROM o DVD con metadatos investigables (y quizás incluso datos) es otro mecanismo de difusión. La creación de medios digitales con metadatos y datos será muy beneficiosa allí donde se siguen planteamientos estandarizados para éstos y puede colocarse un catálogo ("software" y datos) en los medios para minimizar el cose, cuando un catálogo exista ya.

Estas alternativas deben ser consideradas como planteamientos que suplementan las recomendaciones para servicios de catálogo descritas en este capítulo, hasta que llegue el momento en que la información se haga accesible a la mayoría de los clientes, que lo quieran ser, a través de Internet. El uso de los servicios de catálogo permitirán enseguida el uso internacional, académico, comercial y gubernamental de tal información, para temas de análisis regional.


Arriba

Portal de Entrada (Gateway) al Catálogo y desarrollo de la interfaz de acceso.

Dentro de una Comunidad Geográfica o basada en otra disciplina, va a existir la necesidad de crear una herramienta para la búsqueda que facilite también la investigación intuitiva a través de muchos servores. Este problema puede ser dividido en dos partes que tienen que relacionarse mutuamente: una interfaz de usuario (Interfaz de Búsqueda/Navegación Fig. 4.2) y un Distribuidor de Preguntas (Portal de Acceso o Gateway al Catálogo Fig. 4.2). Cuando se ejecutan en Internet, estas funciones pueden ser desplegadas lógicamente en sitios diferentes, aunque tienden a acoplarse juntas en soluciones de búsqueda con base en el servidor o en el cliente.

Figura 4.3 Opciones de configuración para las Interfaces de Usuario y de Portal de Entrada (Gateway) al Catálogo Distribuído

La figura 4.3 muestra las posibles configuraciones de un Portal de Entrada al Catálogo y la Interfaz de Usuario. El cliente A accede a una interfaz de usuario que está descargada (como formulario o como applet) desde un host de Internet, que está gestionando múltiples conexiones a servidores. El cliente B accede a una interfaz de usuario desde un sitio diferente al del Portal de Entrada, corroborando la creación de interfaces de usuario a medida para una comunidad. El cliente C es una aplicación de escritorio que es totalmente autónoma e incluye la interfaz de usuario y capacidad distribuida de preguntas con conexión directa o a servidores remotos. No es conocido en este diagrama ni la dependencia sobre o la referencia a un registro o a la Guía de servidores, como se muestra en la figura 4.2, que es explicado más adelante en la siguiente sección. Los tres estilos de interacción se conocce de su existencia en varios IDS. Debido a que todos ellos dependen de servidores de catálogo distribuidos, las tres opciones son totalmente compatibles.

Se sabe que existen dos estilos de interacción en las interfaces de búsqueda en la Red que acceden al catálogo correctamente. El primero es la pregunta. En este caso el usuario especifica los criterios para la búsqueda, utilizando interfaces simples o avanzadas. El segundo estilo es la interfaz de navegación en la que se le presentan al usuario categorías de informacióny él selecciona caminos o agrupamientos para atravesar, frecuentemente de forma jerárquica. En la interacción con catálogos distribuidos, el planteamiento de búsqueda a los usuaros avanzados les proporciona una precisión mucho mayor al seleccionar los datos espaciales de interés.Frecuentemente se lleva a cabo de forma repetitiva para descubrir qué efectos tienen las partes individuales de una pregunta en el tipo de resultados que se reciben. El planteamiento de "navegación" es muy atractivo para usuarios principaintes, que desean navegar por referencia sin saber a priori las palabras o campos apropiados para la búsqueda. El desafío de crear y mantener un mecanismo de navegación a través de una colección global de servidores es el trabajo que se requiere para construir tanto un vocabulario universal de clasificación como su jerarquía , lo que se conoce como una ontología. Cuando este servicio se halla en la intersección de muchas disciplinas de interés, la construcción de un sistema único de clasificación es una tarea extremadamente intimdante. Sistemas de clasificación inteligentes que circulan externamente en redes que utilizan redes neuronales, perobabilidades bayesianas y otros presupuestos de "contexto", podrán alcanzarse en los próximos años con objeto de ayudar a los usuarios a navegar a través de información geoespacial heterogénea.

Un ejemplo de usuario que utiliza una pregunta es el siguiente:

  1. Un usuario utiliza un software cliente, para descubrir que existe un servicio de búsqueda por catálogo distribuído.
  2. El usuario abre la interfaz (de usuario) y reúne los elementos de preguntas necesarios para limitarse a la búsqueda de información disponible.
  3. La petición de búsqueda pasa a uno o más servidores, basándose en los requisitos del usuario, a través de una función de Portal de Entrada. La búsqueda puede ser iterativa, con repetición o refinamiento de las preguntas sobre la base de nuevas iteraciones con el usuario.
  4. De cada servidor vuelven los resultados que son cotejados y presentados al usuario. Los estilos o tipos de respuesta pueden incluir: una lista de aciertos en el título con su formato "link", una información breve o una presentación completa de metadatos. También se puede obtener una visualización de resultados múltiples por medio de una exhibición de las localizaciones de un conjunto de datos en un mapa, agrupamientos temáticos o agrupación temporal.
  5. El usuario selecciona la entrada de metadatos relevantes por nombre o referencia y elige el contenido de la presentación (breve, completa, otros) y el formato (HTML, XML, texto, otros) para ser revisado.
  6. El usuario decide si quiere adquirir el conjunto de datos a través de vínculos en los metadatos. Presionando URL´s el usuario puede tener acceso directamente a órdenes on-line o recursos descargables, mientras que las listas de distribución alternan las formas de acceso.

Un ejemplo de usuario navegante es el siguiente:

  1. Un usuario uriliza un software cliente para descubri que existe un servicio de búsquedas por catálogo distribuido. Esto puede hacerse a través de una búsqueda por los recursos de la red, por los favoritos guardados, por alusión a una página de recursos o verbalmente
  2. El usuario abre el interfaz (de usuario) y selecciona los parámetros requeridos para limitarse a la búsqueda de información disponible basada en temas/objetos, organizaciones, localización geográfica u otros criterios. Los parámetros están habitualmente agrupados en jerarquías para que el usuario navegue por ellas.
  3. Se hacen peticiones a cada servidor a través de un mecanismo de petición distribuída.
  4. Los resultados provenientes de cada servidor se cotejan y se presentan al usuario. La forma de organizar los resultados está controlada por la interfaz del usuario y la colaboración del Portal de Entrada (Gateway) para presentar un espacio uniforme de resultados.
  5. El usuario selecciona la entrada relevante de metadatos por nombre o referencia y el contenido de la presentación (breve, completo, otros) y el formato (HTML, XML, texto, otros)para ser revisados.
  6. El usuario decide si quiere adquirir el conjunto de datos a través de vínculos en los metadatos. Presionando URL´s el usuario puede tener acceso directamente a órdenes on-line o recursos descargables, mientras que las listas de distribución alternan las formas de acceso.


Arriba

Registro de Servidores de Catálogo

La naturaleza de los catálogos distribuídos requiere que la existencia y propiedades de cualquier catálogo dado sea conovcidas en la Comunidad. En apoyo de los conceptos de IGDE, la necesidad de una guís dinámica de servidores de catálogo es más importante que nuna. El concepto de guía de servidores le permite a un operador individual de catálogo crear y revisar metadatos de servicio con una autoridad centralizada. Entonces el registro será un catálogo apto para la búsqueda con derecho propio, de manera que el software pueda descubrir catálogos convenientes, basados en su extensión geográfica predominate, vocablos descriptivos o clasificación, país de operación o afiliación organizativa, entre otras propiedades.

Ya se han elaborado listados nacionales de servidores de catálogo compatibles, pero la operación de una red global de servidores de catálogo dentro de la IGDE necesitará que se cree y se gestione una guía común de servidores para garantizar el contenido actualizado, propiedad distrinuída y autoridad de referencia de los servidores.

Las características de la guía de servidores incluyen:

Varias actividades nacionales de catálogo distribuído permiten los servicios de gestión de metadatos a nivel de servidor y contienen referencias a servidores fundamentalmente en su país. La IGDE tiene la responsabilidadde patrocinar una guía común de registro de servidores para uso de todos los países, con delegación de autoridad a los países participantes para gestionar y validar información para sus servidores. Esto sigue el modelo de "Domain Name Service" de Internet y si se lleva a la práctica de una manera similar podrá asegurarse la capacidad de ampliación continuada y la propiedad dentro de la comunidad global.


Arriba

Estándares Relevantes

El Catálogo Distribuido de la IGDE ha sido diseñado poniendo total confianza en las tecnologías y estándares actuales. Por ello, el "software" existente se puede vovel a utilizar o puede ser adaptado para información geoespacial., sin requerir una inversión especial en nuevas tecnologías. Esfuerzos clave en estandarización en acceso a catálogo se encuentran tanto en el Protocolo de Búsquedas y Recuperación ISO 23950, como en la Especificación de Servicios de Catálogo recientemente aprobada en el Open GIS Consortium y también en estándares relevantes o "recomendaciones " del World Wide Web Consortium (W3C).

ISO 23950, también conocido como ANSI Z39.50 es un protocolo de búsquedas y recuperación, desarrollado inicialemente en la comunidad bibliotecaria para acceso a catálogos virtuales. Los rasgos clave del protocolo ISO 23950 incluyen:

El uso de un protocolo generalizado de preguntas en ISO 23950 permite una migración desde los formularios nacionales de metadatos hacia los formularios del futuro, que se están desarrollando por medio del consenso internacional, de conformidad con el ISO Technics Commite 211 y su estándard borrador de metadatos 19115. Incluso aunque el estándard vaya a cambiar, el perfil GEO especifica el significado de los campos de búsqueda, de manera que pueden ser "mapeados" a esquemas múltimples de metadatos. Bajo el perfil GEO se puede lograr hoy la búsqueda de metadadtos internacionales a través de colecciones en Europa (Global Envirnmental Locator Service, GELOS), en USA, Canadá, Latinoamérica y Australia, en una búsqueda única, incluso aunque existan módulos subyacentes de metadatos.

El OpenGIS Consortium publicó una Especificación de Servicios de Catálogo en 1999 que proporciona un modelo general para el dscubrimiento de Datos Geoespaciales a través de un catálogo que incluye gestión, desubrimiento y servicios e acceso a los datos . Estos servicios generales se describen para su realización en los entornos de OLEDB, CORBA y WWW. Las funciones de gestión incluyen la posibilidad de especificar interfaces para creación, actualización y supresión de entradas de metadatos a un catálogo. Las funciones de localización incluyen la posibilidad de búsquedas y recuperación de entradas de metadatos formales a un acceso de datos online, allí donde esté disponible. Las funciones de acceso incluyen acceso ampliado o petición de datos espaciales, con base en las referencias establecidas en los metadatos. Sólo se juzgan obligatorias las funciones de localización en las ejecuciones de los servicios de catálogo; se prevé el asesoramiento para la ejecución de gestión opcional y acceso (en realidad, petición) en formas interoperables.

En la reunión del OGC de Southhampton, Reino Unido, en Agosto de 2000, se presentó y mostró el planteamiento de servicios de catálogo comunes, que se creó sobre el modelo esencial de búsqueda y recuperación de ISO 23950. Se indicaron especificaciones de ejecución para CORBA, OLEDB y la red. Se mostró la búsqueda distribuída paralela a través de estos protocolos diferentes por medio de una extensión del "software" de Portal de Entrada disponible comercialmente.

El Perfil de Red de la Especificación de Servicios de Catálogo del OGC incluye dos caminos de ejecución: uno permite la ejecución de los servidores (en TCP/IP) existentes (ISO 23950) y el segundo especifica el uso de codificación XML de preguntas y respuestas en HTTP. El enfoque de XML Encoding Rules (XER) se mostró en Southhampton por medio de "software" de cliente y de servidor, creado por el Centro Conjunto de Investigación de Europa. Como el servidor se realiza en HTTP, los proveedores de metadatos sólo necesitan instalar el "software" de servidor y de índice como parte de su servidor de red y como un componente o módulo. Los problemas de usar un puerto diferente, como un cortafuegos, se minimizan, puesto que todas las preguntas pueden utilizar el puerto de comunicación del servidor de la red.

Las ejecuciones de CORBA y OLEDB proveen soluciones para organizaciones que están ya usando estas dos tecnologías.

La International Standard Organization (ISO) tiene un Comité técnico, el TC211, dedicado a la estandarización de conceptos abstractos relacionados con datos geoespaciales, servicios y el campo de la Geomática en general. El borrador estándard de contenidos de metadatos (ISO 19115) proporciona una gran amplitud de vocabulario y estructura de metadatos que debe ser utilizada para caracterizar los datos geográficos. El desarrollo de perfiles nacionales de ISO 19115, orientados hacia materias concretas, facilitará el intercambio de información, usando una semántica común. ISO 19115 incluye una recomendación sobre la codificación de metadatos para intercambio, usando la recomendación de codificación de TC 211, representada en formato XML.

El World Wide Web Consortium (W3C) es un grupo de organizaciones de ejecución, interesado en trabajar en especificaciones comunes, conocidas como "recomendaciones", que sean respaldadas ampliamente en la red. Un conjunto clave de recomendaciones y temas de trabajo se centran en el Extensible Markup Langage (XML), un lenguaje de maquetación específicamente adaptado para codificar contenidos estructurados de información. Materias paralelas son la actividad del XML-Schema, trabajo que se ocupa de definir el esquema y tipos de datos para dominios XML y XML-Query que por el momento es sólo una actividad de diseño de una sintaxis de petición para documentos con estructura XML. La recomendación XML1.0 está ahora en uso generalizado y está experimentando una aplicación más amplia en el campo del "software" geográfico como un medio cada vez más potente para codificar y transferir información estructurada de todo tipo.

 


Capítulo Cuatro (4.2)

Tabla de Contenidos

CAPÍTULO

1

2

3

4

5

6

7

8

9

10


Arriba


Comentarios a mab. Ultima Revisión 2 Mayo 2001 (Fiesta de la Comunidad de Madrid, que es por cierto donde yo vivo)