Volver a Metadatos
 
  Aspectos tecnológicos de la creación de una Infraestructura Nacional Española de Información Geográfica
 
 

J.A.Bañares, M.A. Bernabé, M.Gould, P.R.Muro-Medrano, F.J.Zarazaga


Departamento de Informática e Ingeniería de Sistemas
Universidad de Zaragoza
María de Luna 3, 50015 Zaragoza
http://iaaa.cps.unizar.es/

Departamento de Ingeniería Topográfica y Cartografía
Universidad Politécnica de Madrid
Campus Sur, Km 7, Cª de Valencia. 28031- Madrid
http://nivel.euitto.upm.es/ditc/index.html


Unitat Predepartamental d'Informàtica
Universitat Jaume I
Campus de Riu Sec, 12071Castelló de la Plana
http://www.uji.es/

   
  00. Resumen
   
  En los últimos tiempos ha crecido considerablemente el interés de numerosas personas del mundo del SIG acerca de los problemas para conocer donde existen datos geográficos, que características tienen, cuales son sus posibilidades/mecanismos de distribución, etc. Para que esta información pueda ser accesible fácilmente por usuarios especializados y público en general es necesario contar con una infraestructura específica de información geográfica que aporte los servicios necesarios para su clasificación y búsqueda. En muchos países de nuestro entorno este cometido se está abordando desde un punto de vista de alcance nacional, tratando de crear los mecanismos necesarios para que toda información de carácter geográfico que se refiera al país pueda ser encontrada a través de los mismos. España no cuenta con dicho tipo de infraestructura. En este trabajo se van a presentar los pasos que se están dando por un conjunto de investigadores pertenecientes a las Universidades de Zaragoza, Jaume I (Castellón) y Politécnica de Madrid dirigidos a crear la tecnología necesaria para poner en marcha una infraestructura nacional de información geográfica. Estos pasos consistirán tanto en la creación de la tecnología informática de soporte, como en la implantación de ciertos nodos para proporcionar el servicio y que actuarán como nucleo generador de la que esperamos que sea futura red de servicios SIG a escala nacional.
   
  01. Introducción
   
 

La información geográfica, o "geodatos", es información que describe fenómenos asociados directa o indirectamente con una localización (y posiblemente un tiempo y una orientación) relativa a la superficie de la Tierra. Esta clase de datos digitales está siendo recogida desde hace más de 35 años. La velocidad de esta recolección de geodatos se incrementa rápidamente con avances en tecnologías tales como los sistemas de imágenes de satélite de alta resolución, los sistemas de posicionamiento global (GPS, Glonass), los sistemas de bases de datos, las nuevas tecnologías de software aplicables al geoprocesamiento y con el creciente número de personas y organizaciones que están recogiendo y utilizando geodatos [1]. A todo esto hay que añadir que alrededor de un 80% de las bases de datos utilizadas en la administración contienen referencias geográficas (direcciones postales, coordenadas cartográficas o distribución por municipios, sectores, barrios, secciones censales, etc.) [2], por lo que puede hacerse un tratamiento de estos datos relacionado con la localización.

En este trabajo se van a presentar los pasos que se están dando por un conjunto de investigadores pertenecientes a las Universidades de Zaragoza (Departamento de Informática e Ingeniería de Sistemas y que actúa como coordinadora del proyecto), Jaime I de Castellón (Departamento de Informática) y Politécnica de Madrid (Departamento de Ingeniería Topográfica y Cartografía), dirigidos hacia la construcción de la tecnología necesaria para la puesta en marcha de una infraestructura nacional de información geográfica. La iniciativa de este proyecto surge como reacción a la situación delicada en la que se encuentra nuestro país, dentro del ontexto europeo, en relación con las posibilidades de acceso de individuos y entidades públicas y privadas a la información geográfica (normalmente almacenada por entidades públicas), para apoyar a numerosos proyectos y, así, contribuir al desarrollo económico. A diferencia de la situación en la mayor parte de los países de nuestro entorno, en nuestro país no es posible conocer de forma práctica que geodatos existen, ni cuáles son sus características, ni cuál es la entidad responsable. Esto es más llamativo si se tiene en cuenta que muchos departamentos de la misma administración no conocen los datos geográficos disponibles en otros departamentos con la consiguiente pérdida de oportunidad y, en muchos casos, duplicidad de compra. En la mayoría de los países de nuestro entorno (destacando a Portugal) existen, lo que se ha dado en llamar, infraestructuras nacionales de información geográfica que, normalmente dirigidas por iniciativa pública, proporcionan servicios de catálogo de información geográfica y son accesibles por Internet (véase [3] para un estudio reciente sobre las políticas de información geográfica europeas en las perspectivas nacional y regional). Estas iniciativas se han visto muy empujadas por los avances que se están produciendo en las tecnologías de la información y las comunicaciones, relacionadas con la interoperabilidad de sistemas y posibilidades surgidas con el desarrollo de la red Internet. Esto ha servido a su vez de revulsivo a las empresas y organizaciones de I+D relacionadas con los sistemas de información geográfica (SIG), convirtiendo este sector en uno de los más activos en el aprovechamiento de estas tecnologías, actividad demostrada también en los procesos de estandarización.

El resto del artículo se estructura como sigue. A continuación se presenta lo que se entiende por Infraestructura nacional de información geográfica, poniendo de manifiesto su importancia y los pasos que en este sentido se están dando en otros países de nuestro entorno y en Estados Unidos. El punto 3 entra a abordar los elementos tecnológicos en los que se esta trabajando para poner en marcha la citada infraestructura nacional. El trabajo finaliza con un apartado en el que se comenta el estado actual del proyecto y los mecanismos para poder participar en el mismo.

   
  02. Necesidad de Infraestructuras Nacionales de Información Geográfica
   
 

En diferentes actividades, se requiere adquirir mapas temáticos específicos y combinarlos con otros mapas temáticos en un sistema de información geográfica (GIS) para la realización de variadas y heterogéneas tareas. Para conseguir esto es necesario, por una parte saber si existe esa información geográfica, saber donde puede conseguirla y luego disponer de mecanismos amigables para adquirirla; existen problemas añadidos como los derivados de su actualización (es un hecho contrastado de que la carga y mantenimiento de los datos geográficos supone entre el 50% y el 80% del coste total de la puesta en marcha de un SIG) [4]. Por otra parte, para conseguir los efectos comentados es preciso también compartir datos entre aplicaciones, pero esta compartición resulta una tarea engorrosa, frustrante, intimidatoria, tendente a errores y a veces totalmente impracticable debido a la heterogeneidad de los datos.

A esto se debe que gobiernos como el de Estados Unidos gasten mas de 600.000 millones de Ptas. al año en conversiones de geodatos y en la Unión Europea, más heterogénea en sus instituciones que los Estados Unidos, se enfrenta a dificultades de compartición de datos incluso más turbadoras. Adicionalmente, si los geodatos posibilitados por las nuevas tecnologías fueran fácilmente accesibles a través de redes y fueran compatibles para una gran gama de computadoras y aplicaciones empotradas, los efectos serían revolucionarios en áreas tales como respuesta a emergencias, salud y seguridad pública, comando y control militar, gestión de flotas, gestión de tráfico, agricultura de precisión, geomarketing y gestión ambiental.

Tan extendido y crítico, en el futuro inmediato, resultará el mencionado uso de la información geográfica y los Sistemas de Información Geográfica (GIS) que trabajan con ella, que su estrategia ha sido determinada por las más altas instancias gubernamentales. Así, el presidente Clinton firmó una Orden Ejecutiva (nº 12906 del 11 de Abril del 1994) para establecer una "Infraestructura de datos espaciales nacionales" (NSDI), obligando a la cooperación entre agencias federales y locales en materia de recopilación, diseminación y uso de información geográfica, y en la que se proporcionaban también los recursos necesarios para darle forma operativa y estructura de gestión que ayudara al esfuerzo combinado de instituciones públicas y privadas.

El Reino Unido recientemente ha producido legislación en esta misma línea, ha subvencionada la creación de una infraestructura de información geográfica bajo el programa "Invertir para ahorrar" de su Ministerio de Tesorería, y el gobierno promete publicar el 100% de la información pública en Internet para el año 2008 [5]. La Unión Europea también ha dado los primeros pasos en este tipo de iniciativa (European Standarization Strategies for Geographic Information dentro del 2nd Geodata For All in Europe EUROGI Workshop de Marzo del 96, documento de trabajo del GI2000 "Towards a European Policy Framework for Geographic Information" [6]), que sin embargo carece de la rotundidad y visión coordinada norteamericana. La discusión se basa completamente en el hecho de usar esta infraestructura en un sentido político-institucional.

En esta línea argumental, y de acuerdo con [7], los componentes de una infraestructura de datos espaciales deberían incluir fuentes de datos espaciales (proveedores de dicho tipo de datos), bases de datos y metadatos (catálogos), redes de información (Internet), tecnología relacionada con la gestión de colecciones de datos y sus búsquedas, acuerdos institucionales, políticas y estándares, y usuarios finales. La determinación en este aspecto se justifica en cierto modo con la financiación por la Unión Europea de numerosos proyectos por iniciativa de la Dirección General XIII-E de la Comisión Europea (ahora la Dirección General Sociedad de la Información) en el marco del programa INFO2000.

La materialización de iniciativas con los fines anteriores en los distintos países ha dado pie a la creación de lo que se ha dado en llamar las Infraestructuras Nacionales de Información Espacial. La propuesta de los Estados Unidos para la creación de su Infraestructura Nacional de Información Espacial ha sido puesta en práctica por el FGDC a través del National Geoespatial Data Clearinghouse (ver [8]). Un Clearinghouse (centralita) fue establecido como un Catálogo "en línea", distribuido, y que oferta servicios de búsqueda. El Clearinghouse permite a un usuario de Internet visitar uno de los numerosos Gateways, o puntos de entrada a un sitio web, acceder a un formulario de consulta, y efectuando una única pregunta, obtener la respuesta sobre la base de la información geoespacial que será atendida por numerosas colecciones de datos. En 1998 más de 60 sitios web de todo el mundo colaboraban con Clearinghouse (pero muy poco Europeos). En algunos casos, esta colaboración ha servido para el desarrollo de Infraestructuras Nacionales de Datos Geográficos, como es el caso de Colombia (ver [9]). Por su parte, la mayor parte de los países de la Unión Europea disponen de algún tipo de infraestructura nacional que permite el actuar como servidor de catálogo de geodatos relacionados con el país. Desde Portugal (ver [10]) hasta Finlandia (ver [11] o [12]). Desgraciadamente, España no se encuentra entre este grupo de países.

   
  03. Elementos tecnológicos integrantes de la infraestructura nacional de información geográfica
   
  03.1. Estándares abiertos para la interoperabilidad GIS: OpenGIS
 

El OpenGIS Consortium (OGC) es una organización sin ánimo de lucro, fundada en 1994 y dedicada a la promoción de nuevas aproximaciones técnicas y comerciales para geoprocesamiento abierto e interoperable, fundada por las más importantes entidades industriales, gubernamentales y académicas. Los miembros del OGC comparten una visión positiva de una infraestructura nacional y global de información, en la que los geodatos y los recursos de geoprocesamiento se mueven libremente, completamente integrados con las últimas tecnologías de computación distribuidas, accesibles a cualquiera, "geo-habilitando" una gran variedad de actividades, que se encuentran actualmente fuera del dominio del geoprocesamiento, abriendo de esta forma nuevos mercados. Su objetivo es conseguir acuerdos sobre interfaces de software estándar abiertos que posibiliten la interoperación entre sistemas de geoprocesamiento de vendedores diferentes y de diferentes tipos (GIS/SIG, teledetección, cartografía automática, gestión de instalaciones, etc.); comunicando por medio de interfaces derivadas-de-consenso, sistemas diferentes accederán a datos y funciones de procesamiento de cada uno a través de redes.

Para el OGC, el paradigma de compartición de datos se moverá así más allá de hacer FTP o enviar físicamente ficheros enteros de datos, y los geodatos y geoprocesamiento se convertirá en parte del entorno de información de cada uno. La visión de las pretensiones de futuro del OGC queda ilustrada con estos ejemplos que marcan su línea tecnológica:

Será posible poner datos en línea y tener dichos datos disponibles inmediatamente para cualquiera como una cobertura temática en su GIS.

Una pregunta que uno haga a través de la red devolverá un resultado, no una cobertura de datos que necesitaría ser interrogada utilizando su propio software.

Se tenga o no un GIS en el computador, el visualizador de web deberá cargar "applets" GIS así como geodatos de forma que se pueda realizar análisis espacial.

Nuestros aparatos de "Internet móviles" comunicarán por nosotros nuestras necesidades y nuestras coordenadas, y servicios en línea nos dirán como obtener donde vamos y donde encontrar los productos, servicios y la gente que buscamos.

En España ha habido algunas iniciativas para facilitar la interoperabilidad pero de alcance muy limitado circunscrito a proyectos de intercambio de información entre formatos internos de varios sistemas SIG. Uno de estos proyectos es MIGRA, "Mecanismo de Intercambio de información Geográfica Relacional formado por Agregación", desarrollado por la Asociación Española de Normalización y Certificación (AENOR) y la Comisión Nacional para la Cooperación entre las Administraciones Públicas en el campo de los Sistemas y Tecnologías de la Información (COAXI). El trabajo que hemos iniciado va más allá que los intercambios de datos por traductores, que no reúne los criterios necesarios ni suficientes del concepto de interoperabilidad según OpenGIS, y que suponen arreglos de alto nivel de corto plazo que no contribuyen a la construcción de un ambiente favorable, de bajo nivel, para el intercambio libre y continuo de los geodatos al beneficio de los sectores público y privado además de los usuarios finales.

Interoperabilidad, en el contexto del OGC, significa la existencia de componentes de software operando recíprocamente para vencer las tediosas tareas de conversión, obstáculos de importación / exportación y las barreras de acceso impuestas por entornos de procesamiento heterogéneos y datos heterogéneos. "Interoperatividad por medio de especificaciones" significa que los desarrolladores de software consiguen la interoperatividad escribiendo su software conforme a un común y acordado conjunto de criterios. De esta forma, una especificación expresada en varios niveles de abstracción, puede ser utilizada más ampliamente y durar más que una especificación ligada a un sistema operativo especial (UNIX, DOS, VMS, …), lenguaje de programación (Fortran, C++, VisualBasic, ...), entorno operativo (Windows, X-Windows System, …) o plataforma de computación distribuida (DCP) (CORBA, OLE/COM/DCOM, DCE, …).

   
  03.2. Metadatos
 

Cuando podamos acceder a un gran volumen de fuentes de geodatos en línea, los mecanismos de recuperación y determinación de la adecuación de datos serán tan importantes como lo son en estos momentos los motores de búsqueda en web en el mundo del hipertexto (excepto que en ese ámbito se hace búsquedas primariamente por nombres y no por la multitud de atributos asociados con los geodatos). Los catálogos geoespaciales digitales proporcionarán esta capacidad clave en las infraestructuras de datos espaciales, desde el sector privado al global.

Pero los catálogos sólo son tan buenos como los metadatos por los que están indexadas las entradas de geodatos. En el mundo del geoprocesamiento interoperable, los estándares de metadatos y los estándares de contenidos de datos continuarán siendo necesarios, y de hecho serán más importantes a medida que crece el comercio en geodatos y los datos sean más abundantes. Las tareas de gestión de metadatos deberán estar asistidas por herramientas que hagan más fácil desarrollar datos conformes. Por otra parte, otras herramientas filtrarán automáticamente a través de metadatos de cientos de lugares para ayudar a los usuarios a encontrar los mejores datos posibles para un propósito particular, incluso cuando los metadatos no sean completamente conforme o consistentes. Pero estas herramientas aumentarán, no reemplazarán la coordinación de datos.

Para que los catálogos de geodatos se puedan realizar es preciso utilizar contenidos bien definidos, y por lo tanto es preciso un estándar de metadatos. En este sentido, en 1992 el Comité Européen de Normalisation (CEN) creó el comité técnico 287 asignándole la responsabilidad de la estandarización de la información geográfica. Una familia de pre-estándares están siendo adoptados, incluyendo el ENV (Euro-Norme Voluntaire) 12657 Geographic Information - Data description Metadata. Muchos servicios de metadatos existentes en Europa están basados en el trabajo del CEN/TC 287. Esto ha llevado a proyectos Europeos como por ejemplo GDDD, Le Clef y el European Spatial Metadata Infraestructure (ESMI) a adoptar el uso de este estándar.

   
  i
  Figura 1. Interconexión de catálogos de información geográfica
 
 

También en 1992, la Organización Internacional de Estándares (ISO) creó el comité 211 (ISO/TC 211) con responsabilidades en la "geomática". En estos momentos se encuentran preparando una familia de estándares; este proceso involucra un grupo de trabajo, un comité de borrador, un borrador del estándar internacional, y finalmente el propio estándar. En estos momentos, ISO ha lanzado el comité del borrador del estándar ISO 15046-15 - GI - Metadata. CEN/TC 287 mantiene el estado de enlace con ISO/TC 211, lo que significa que los resultados del trabajo en Europa serán tenidos en cuenta cuando se desarrolle en estándar global. En los Estados Unidos, el Comité Federal de Datos Geográficos (FGDC) aprobó su Content Standard for Digital Geospatial Metadata en 1994. Este es un estándar nacional para metadatos espaciales desarrollado para dar soporte a la construcción de la Infraestructura Nacional de Datos Espaciales de los Estados Unidos. Este estándar ha sido adoptado en otros países como por ejemplo Sudáfrica o Canadá.

Por otra parte, en febrero de 1999 el Centro para la Observación de la Tierra (CEO) de la Comisión Europea publicó su Recommendations on Metadata en las que describe los datos, servicios e información que se consideran necesarios para la realización de trabajos que aborden aspectos relacionados con la observación de la tierra.

Al nivel práctico no es siempre necesario elegir entre uno u otro de estos formatos de metadatos, ya que ellos comparten hasta un 40% de los elementos (vocabulario) más fundamentales y, así, al nivel informático se puede crear sistemas informáticos que hacen comunicar varios sistemas hablando varios dialectos de metadatos, mediante pasarelas y puentes.

   
  03.3. Servicios de catálogos distribuidos
 

El catálogo de datos geoespaciales debe proporcionar los servicios necesarios para que los proveedores de información geográfica puedan publicar informaciones descriptivas de sus productos, y los consumidores de información geográfica puedan efectuar búsquedas en estos metadatos publicados tratando de encontrar los productos que mejor se acomoden a sus necesidades. Dado el actual auge de Internet, el modo más lógico para llevar a cabo la construcción de un servicio de catálogo es apoyarse en sus recursos. Esto va a permitir un mayor nivel de accesibilidad (tanto de proveedores como de consumidores), además de proporcionar la plataforma perfecta para extender el catálogo convirtiéndolo en un catálogo distribuido.

OpenGIS plantea un estándar de servicios de catálogo de datos geoespaciales que resulta especialmente relevantes a la hora de proceder a la construcción de una infraestructura de datos espaciales: Catalog Services (ver [2]). El estándar de servicios está pensado para la interoperación de una serie de nodos distribuidos a través de la red definiendo la interfaz que debe tener un catálogo que permita la domiciliación de metadatos de proveedores, así como la ejecución de búsquedas, basándose en un lenguaje estándar de consulta, y presentación de resultados mediante perfiles especiales de XML. Los proveedores domicilian sus metadatos en alguno de ellos y cuando se procede a realizar una búsqueda, ésta puede ser local al nodo en el que se está ejecutando, o puede extenderse a la totalidad de los nodos del catálogo. Esto facilita la realización de trabajo colaborativo entre grupos multidisciplinares donde cada uno de ellos puede contar con información propia en un nodo y acceder a la de los otros de manera sencilla.

Una de las características más peculiares de los catálogos de información geográfica, que los diferencia de otros tipos de catálogos, es la necesidad de ofrecer servicios de búsqueda y recuperación de información ligados a los componentes de localización de las informaciones catalogadas. En este sentido, este tipo de catálogos debe disponer de dos clases de servicios de búsqueda especializados y que podemos denominar búsquedas por Localización Geográfica y búqueda por Nombre de Lugar.

Los servicios de búsqueda por localización geográfica se encargan de ejecutar búsquedas sobre las informaciones catalogadas tratando de encontrar aquellas que se refieran a un punto geografico concreto (dado por los valores de sus coordenalas geográficas: longitud, latitud), o a un área geográfica determinada (especificada por las coordenadas geográficas de los cuatro puntos que conforman el cuadrado que encierra a esa área). Para poder trabajar con este tipo de servicio es necesario que entre los metadatos que carazterizan a una información concreta se encuentre la zona geográfica que ésta comprende. Aquí se tropieza con numerosos problemas deribados tanto del sistema de coordenadas utilizado para caracterizar unos datos, como del tipo de proyección utilizada, etc. No es un problema cuya solución sea obvia. Por ejemplo, el European Petroleum Survey Group ha publicado en su página web (http://www.epsg.org) un ámplio conjunto de parámetros que permiten realizar cambios entre numerosos sistemas de coordenadas con mínimas perdidas de información. Este recopilatorio, actualmente en la versión 5.0, se encuentra almacenado en una serie de tablas Access que ocupan casi 7Mb.

Por otra parte tenemos los servicios de búsqueda por nombre de lugar. En este caso se trata de servicios que permiten realizar búsquedas de información vinculadas a lugares geograficos identificados por un nombre (nombres de núcleos urbanos, paises, nombres de accidentes geográficos, etc.) generalmente publicados en algún tipo de atlas o mapas. Estos servicios trabajan sobre conexiones que se establecen entre estos nombres de lugar y su ubicación geográfica y área que abarcan. Un ejemplo del rango de la granularidad con la que pueden trabajar estos servicios lo podemos ver si pensamos en que se ejecuta una búsqueda de información reference al Océano Pácifico y, a continuación sobre el mismo motor de búsqueda se solicita información asociada al Puente de Piedra en Zaragoza. En ocasiones estos nombres no tienen por que estar bien definidos (nombres no completos, errores ortográficos, vulgarismos y/o cultismos para el nombrado de lugares, diferentes idiomas, etc). En estos casos, la posibilidad de disponer de técnicas de recuperación de la información como las que se describen en el siguiente punto van a permitir que los motores de búsqueda ofrezcan respuestas validas, al menos con un grado de fiabilidad bastante alto.

   
  03.4. Técnicas de recuperación de información y lenguaje natural
 

Otro de los aspectos que se quiere abordar es el relacionado con el aprovechamiento de técnicas y recursos de recuperación de información y de tratamiento del lenguaje natural (tesauros, diccionarios, etc.) que pueden aportar ventajas, tanto para la organización y búsqueda de la información, como para ir facilitando un acceso más amigable y multilingüe. No es de esperar que un usuario describa los datos que precisa utilizando las palabras exactas que se han utilizado para su clasificación. Por lo tanto, el servicio de búsqueda de un catálogo no puede limitarse a un simple reconocimiento de palabras clave. La recuperación de información trata con el problema de encontrar los documento relevantes en una colección de textos a partir de una pregunta de un usuario. Si suponemos que la pregunta está expresada en lenguaje natural, para un humano ésta tarea conlleva leer y comprender la pregunta y los documentos, y juzgar la relevancia de cada documento respecto a la pregunta. Este proceso cae dentro del ámbito de las técnicas de representación del conocimiento y el procesamiento de lenguaje natural (PLN).

En cuanto a la aplicación de técnicas de recuperación de información, aunque no estemos tratando con documentos de texto, sino con datos geográficos y descripciones de éstos mediante metadatos, las ideas que subyacen a éstas técnicas siguen siendo válidas puesto que muchas de las descripciones son lingüísticas [13]. Gran parte de la capacidad de obtener respuestas de interés para el usuario provienen de la capacidad de hacer público los datos almacenados, a la vez que se oculta los detalles técnicos de los repositorios. Para conseguir este objetivo se debe hacer uso de ontologías de forma que el usuario formule sus preguntas y el sistema tenga la responsabilidad de gestionar la recuperación basándose en los conceptos o tema involucrados en la petición [14].

En cuanto a la utilización de una interfaz en lenguaje natural para acceder a los servicios del catálogo, o a la base de datos de metadatos directamente, sus ventajas son que el usuario no precisa conocer un lenguaje de interrogación o el nombre específico de los servicios, y puede expresar sus preguntas idealmente en lenguaje natural. Una interfaz gráfica o basado en rellenar formulario es más intuitivo para un usuario ocasional, pero el lenguaje natural permite expresar preguntas que serían tediosas de plantear con esta clase de interfaz. Por ejemplo, preguntas que conllevan negación (¿Qué comunidades no tienen autovías?) o cuantificadores universales (¿Qué ríos pasan por cada comunidad?), son mejores para realizar ciertos tipos de preguntas. Otra ventaja es el uso de la anáfora o la elipsis, donde el significado de cada pregunta se complementa con el contexto del discurso. Como desventajas hay que destacar que el problema de la utilización de lenguaje natural sin restricciones para acceder a una interfaz de servicios o a una base de datos no está resuelto. Entre los principales problemas destaca que no es obvio conocer cual es el conjunto de expresiones en lenguaje natural reconocibles por el sistema, ni cuales son los datos disponibles, por lo que si no hay respuesta no se sabrá si no hay datos o no se ha entendido la pregunta. En cualquier caso el lenguaje natural es una herramienta efectiva para la interacción con una base de datos o una interfaz de servicios en un dominio restringido como son los SIGs [15]. (El sistema START del MIT en http://www.ai.mit.edu/projects/infolab/globe.html es un ejemplo de las posibilidades y limitaciones de una interfaz en lenguaje natural para interrogar una base de datos geográficos).

   
  03.5. Servidores de mapas en web
 

La posibilidad de llevar a cabo la publicación de mapas en Internet es un tema necesario desde el punto de vista de la infraestructura nacional de información geográfica. El interés de los usuarios en disponer de información geográfica en la red junto con la capacidad de obtener y representar información de diferentes fuentes, ha conseguido que el mundo empresarial esté realizando un gran esfuerzo para cubrir estas necesidades.

"Los servicios de mapas en línea para el web ofrecen nuevas formas de manipular información geográfica, posibilitando su tratamiento como datos personalizables en lugar de conjuntos de datos fijos. Tales servicios se pueden convertir en más útiles y prometedores gracias a un nuevo y amplio consenso de la industria para protocolos de mapas en web, adoptado formalmente por el Consorcio OpenGIS hace sólo unas semanas. Estos protocolos hacen que diferentes clientes y servidores de mapas puedan interoperar, esto es, ser capaces de mezclar y encajar datos geográficos, mapas, y servicios de procesamiento de muchas fuentes diferentes, independientemente del vendedor, formato, modelo de datos, o sistema de coordenadas" [16].

Actualmente existen numerosas aplicaciones comerciales que soportan el tratamiento de mapas en web pero muy pocas soportan interoperabilidad (ver [17] para una lista más exhaustiva). Organizaciones como el consorcio OpenGIS están desarrollando estándares para sistemas de información geográfica, y en concreto un estándar para que distintas aplicaciones puedan interoperar a través de Internet: la interfaz para servidores de mapas en Web [18]. Esta interfaz especifica una serie de servicios para distribuir mapas en Internet, que un servidor que quiera cumplir con esta interfaz debe implementar. Gracias a que la interfaz es bien conocida, distintos servidores de mapas que la cumplan permiten que sus usuarios obtengan información heterogénea de distintas fuentes y puedan trabajar con ella, junto con datos locales si es necesario, sin necesidad de conocer el formato de la misma. Los usuarios pueden de esta forma trabajar siempre con los datos más recientes conforme éstos se actualizan en los servidores y añadir datos provenientes de nuevas fuentes sin necesidad de cambiar métodos de trabajo ni herramientas. Muchas empresas que desarrollan aplicaciones en el ámbito de los SIG en Internet están trabajando para que sus productos sean compatibles con el estándar OpenGIS.

La interfaz de servicio de mapas propuesta por OpenGIS define una serie de peticiones relacionadas con la producción de mapas que un servidor debe ser capaz de responder. Un servidor de mapas es una aplicación que accesible desde un servidor web que puede generar mapas como respuesta a una petición concreta. Existen tres tipos principales de servicios: producción de mapas, información sobre elementos e información sobre las capacidades del servidor.

   
 
  Figura 2. Servidores de mapas en Web
   
 

Las peticiones de servicio de mapas son enviadas al servidor para obtener un mapa sobre una zona concreta. La petición incluye parámetros que determinan la zona de interés, el sistema de referencia, el tipo de información a incluir o el formato de respuesta. Se puede especificar un conjunto de las capas de datos y estilos ofertados por el servidor para que éste componga y proporcione el mapa deseado. El mapa deseado se puede devolver como un fichero de imagen, o bien en algún formato vectorial de los especificados por OpenGIS. Las peticiones de información de elementos son una extensión de las anteriores. Especificando un punto en pantalla sobre un mapa generado, el servidor responde con la descripción de los elementos geográficos bajo ese punto. Esta descripción proviene generalmente de los atributos de las coberturas vectoriales que ofrece el servidor para componer los mapas.

Las peticiones de las capacidades del servidor informan sobre los servicios, datos, formatos y sistemas de referencia ofertados por éste. Además, puesto que un servidor que cumpla con la interfaz definida por OpenGIS puede además ofrecer otros servicios complementarios, ofrece información sobre éstos.

   
  04. Estado actual del proyecto
   
 

Como se ha indicado en el punto 2 de este trabajo, son numerosos los elementos integrantes de una infraestructura de información geográfica (fuentes de datos espaciales, catálogos, Internet, tecnología para la gestión de colecciones de datos y sus búsquedas, acuerdos institucionales, políticas y estándares, y usuarios finales). En este trabajo nos hemos centrado en presentar aspectos relacionados con la creación de la tecnología para soportar esta infraestructura en un alcance nacional. En todos estos aspectos ya se están dando los pasos oportunos dirigidos a conseguir crear un primer nivel de servicio que pueda servir a la vez como banco de pruebas de esta tecnología, y como trampolín de lanzamiento de la futura infraestructura nacional.. Este primer nivel de servicio incluirá la puesta en funcionamiento de tres nodos (uno en cada una de las Universidades participantes).

El lanzamiento del servicio y la creación de la tecnología básica va a estar soportado parcialmente, en esta primera fase, por la Subdirección General de Proyectos de Investigación del Ministerio de Ciencia y Tecnología a través del proyecto coordinado TIC2000-1568.

Aunque la iniciativa está liderada por grupos de investigación de las Universidades de Zaragoza, Jaime I de Castellón y Politécnica de Madrid, ha recibido también el apoyo de numerosas empresas y órganos de las Administraciones que tendrán distintos niveles de participación en el proyecto. Está prevista también, en su momento, la participación de más empresas e instituciones interesadas y con ganas de aportar, y que por supuesto serán muy bienvenidas.

La concesión de la financiación para comenzar el proyecto nos ha sido comunidado muy recientemente, por lo que todavía nos encontramos en la fase previa al comienzo efectivo del proyecto. A medida que el proyecto vaya avanzando iremos informando oportunamente e iremos solicitando participación, colaboraciones adicionales e ideas que puedan servir para mejorar el trabajo, y estableceremos las infraestructuras y procedimientos pertinentes para canalizar estas aportaciones.

   
  Agradecimientos
   
  Este trabajo ha sido parcialmente financiado por el proyecto TIC2000-1568 de la Comisión Interministerial de Ciencia y Tecnología (CICYT).
   
  Bibliografía
   
 

1. K. Buehler, L. McKee (eds.). The OpenGIS Guide. Introduction to Interoperable Geoprocessing. Part I of the Open Geodata Interoperability Specification (OGIS). OGIS Project 6 Technical Commitee of the Open GIS Consorcium Inc. OGIS TC Document 96-001. 1996.

2. "The OpenGIS Abstract Specification. Topic13: Catalog Services (version 4)". OpenGIS Project Document 99-113. OpenGIS Consortium 1999.

3. Space Applications Institute. "Geographic Information Policies in Europe: National and Regional Perspectives". Proceedings del "EUROGI-EC Data Policy Workshop. Amersfoort, Nov 1999. http://www.ec-gis.org/

4. M. Gould, D. Llidó, R. Cirilo, A. Fuertes. "Apoyo a la administración vía la infraestructura europea de información geográfica". Actas de la XXIII Reunión de Estudios Regionales, Univ. Politécnica de Valencia, 1998.

5. Homepage del National Geospatial Data Framework (NGDF) http://www.ngdf.org.uk/

6. GI2000 (publicaciones soportados por la Comisión Europea, DG XIII-E). Repaso de cifras del mercado de la Información Geográfica ("GI & GIS Market Size Data": http://158.169.50.95:10080/gi/en/markets/gimrktfigs.html)

7. D.J.Coleman, D.D.Nebert. "Building a North American Spatial Data Infrastructure" Cartography and Geographic Information Systems. Vol. 25, No. 3, pp. 151-160. Julio1998.

8. Homepage del National Geospatial Data Clearinghouse http://www.fgdc.gov/clearinghouse/index.html

9. W. Amaya Gómez. Hacia una Infraestructura Nacional de Datos Geográficos en Colombia. GeoConvergencia, Dec. 1998, pp 10- 18.

10. Homepage del Sistema Nacional de Información Geográfica de Portugal. http://snig.cnig.pt

11. A. Rainio. "National Geographic Information Infraestructure of Finland". http://www.nls.fi/ptk/infrastructure/index.html

12. Homepage de la Infraestructura Nacional de Datos Geográficos de Finlandia. http://www.kartta.nls.fi/

13. J.A. Bañares, F.J. Zarazaga, J. Nogueras, J. Gutiérrez and P.R. Muro-Medrano. "Construction and Use of Concept Hierarchies from Word Taxonomies for Searching Geospatial Data". Geographical Domain and Geographical Information Systems, GeoInfo Series, Stephan Winter (editor), vol 19, pp 5 - 8. La Londe-les-Maures, France, 22-27 September 2000.

14. T. Gruber. "A translation aprroach to portable ontology specifications". Knowledge Acquisition, An International Journal of Knowledge Acquisition for Knowledge-Based Systems, 5(2), Junio 1993.

15. I. Andreoutsopoulos, G. D. Ritchie, P. Thanisch. "Natural Language Interfaces to Databases- An Introduction". Journal of Natural Language Engineering, Cambridge University Press. 1995. Also Available as Research paper nº 709, Department of Artificial Intelligence, University of Edinburgh, 1994.

16. John D. Evans. "The MIT OrthoServer and Interoperable Web Mapping". GIS Colloquium Lecture Series. MIT Dept. of Urban Studies and Planning. Mar. 2000. http://icg.fas.harvard.edu/~maps/hgis/lngis.htm.

17. Cliff Kottman. "Introduction to OpenGIS Consortium, Inc.". Presentación en una reunión OpenGIS, Vancouver, Canadá. Feb 7, 2000. Accesible en http://opengis.org/techno/presentations.htm.

18 OpenGIS Consortium. "OpenGIS Web Map Server Interface Specification (version 1.0)". OpenGIS Project Document 99-077r4, OpenGIS Consortium 2000.