|
Aspectos
tecnológicos de la creación de una Infraestructura Nacional
Española de Información Geográfica
|
|
|
|
J.A.Bañares, M.A.
Bernabé, M.Gould, P.R.Muro-Medrano, F.J.Zarazaga
Departamento de Informática e Ingeniería de Sistemas
Universidad de Zaragoza
María de Luna 3, 50015 Zaragoza
http://iaaa.cps.unizar.es/
Departamento
de Ingeniería Topográfica y Cartografía
Universidad Politécnica de Madrid
Campus Sur, Km 7, Cª de Valencia. 28031- Madrid
http://nivel.euitto.upm.es/ditc/index.html
Unitat Predepartamental d'Informàtica
Universitat Jaume I
Campus de Riu Sec, 12071Castelló de la Plana
http://www.uji.es/
|
|
|
|
00.
Resumen |
|
|
|
En los últimos
tiempos ha crecido considerablemente el interés de numerosas personas
del mundo del SIG acerca de los problemas para conocer donde existen
datos geográficos, que características tienen, cuales son sus posibilidades/mecanismos
de distribución, etc. Para que esta información pueda ser accesible
fácilmente por usuarios especializados y público en general es necesario
contar con una infraestructura específica de información geográfica
que aporte los servicios necesarios para su clasificación y búsqueda.
En muchos países de nuestro entorno este cometido se está abordando
desde un punto de vista de alcance nacional, tratando de crear los
mecanismos necesarios para que toda información de carácter geográfico
que se refiera al país pueda ser encontrada a través de los mismos.
España no cuenta con dicho tipo de infraestructura. En este trabajo
se van a presentar los pasos que se están dando por un conjunto de
investigadores pertenecientes a las Universidades de Zaragoza, Jaume
I (Castellón) y Politécnica de Madrid dirigidos a crear la tecnología
necesaria para poner en marcha una infraestructura nacional de información
geográfica. Estos pasos consistirán tanto en la creación de la tecnología
informática de soporte, como en la implantación de ciertos nodos para
proporcionar el servicio y que actuarán como nucleo generador de la
que esperamos que sea futura red de servicios SIG a escala nacional.
|
|
|
|
01. Introducción |
|
|
|
La información geográfica, o "geodatos", es información
que describe fenómenos asociados directa o indirectamente con una
localización (y posiblemente un tiempo y una orientación) relativa
a la superficie de la Tierra. Esta clase de datos digitales está
siendo recogida desde hace más de 35 años. La velocidad de esta
recolección de geodatos se incrementa rápidamente con avances en
tecnologías tales como los sistemas de imágenes de satélite de alta
resolución, los sistemas de posicionamiento global (GPS, Glonass),
los sistemas de bases de datos, las nuevas tecnologías de software
aplicables al geoprocesamiento y con el creciente número de personas
y organizaciones que están recogiendo y utilizando geodatos [1].
A todo esto hay que añadir que alrededor de un 80% de las bases
de datos utilizadas en la administración contienen referencias geográficas
(direcciones postales, coordenadas cartográficas o distribución
por municipios, sectores, barrios, secciones censales, etc.) [2],
por lo que puede hacerse un tratamiento de estos datos relacionado
con la localización.
En este trabajo se van a presentar los pasos que
se están dando por un conjunto de investigadores pertenecientes
a las Universidades de Zaragoza (Departamento de Informática e Ingeniería
de Sistemas y que actúa como coordinadora del proyecto), Jaime I
de Castellón (Departamento de Informática) y Politécnica de Madrid
(Departamento de Ingeniería Topográfica y Cartografía), dirigidos
hacia la construcción de la tecnología necesaria para la puesta
en marcha de una infraestructura nacional de información geográfica.
La iniciativa de este proyecto surge como reacción a la situación
delicada en la que se encuentra nuestro país, dentro del ontexto
europeo, en relación con las posibilidades de acceso de individuos
y entidades públicas y privadas a la información geográfica (normalmente
almacenada por entidades públicas), para apoyar a numerosos proyectos
y, así, contribuir al desarrollo económico. A diferencia de la situación
en la mayor parte de los países de nuestro entorno, en nuestro país
no es posible conocer de forma práctica que geodatos existen, ni
cuáles son sus características, ni cuál es la entidad responsable.
Esto es más llamativo si se tiene en cuenta que muchos departamentos
de la misma administración no conocen los datos geográficos disponibles
en otros departamentos con la consiguiente pérdida de oportunidad
y, en muchos casos, duplicidad de compra. En la mayoría de los países
de nuestro entorno (destacando a Portugal) existen, lo que se ha
dado en llamar, infraestructuras nacionales de información geográfica
que, normalmente dirigidas por iniciativa pública, proporcionan
servicios de catálogo de información geográfica y son accesibles
por Internet (véase [3] para un estudio reciente sobre las políticas
de información geográfica europeas en las perspectivas nacional
y regional). Estas iniciativas se han visto muy empujadas por los
avances que se están produciendo en las tecnologías de la información
y las comunicaciones, relacionadas con la interoperabilidad de sistemas
y posibilidades surgidas con el desarrollo de la red Internet. Esto
ha servido a su vez de revulsivo a las empresas y organizaciones
de I+D relacionadas con los sistemas de información geográfica (SIG),
convirtiendo este sector en uno de los más activos en el aprovechamiento
de estas tecnologías, actividad demostrada también en los procesos
de estandarización.
El resto del artículo se estructura como sigue.
A continuación se presenta lo que se entiende por Infraestructura
nacional de información geográfica, poniendo de manifiesto su importancia
y los pasos que en este sentido se están dando en otros países de
nuestro entorno y en Estados Unidos. El punto 3 entra a abordar
los elementos tecnológicos en los que se esta trabajando para poner
en marcha la citada infraestructura nacional. El trabajo finaliza
con un apartado en el que se comenta el estado actual del proyecto
y los mecanismos para poder participar en el mismo.
|
|
|
|
02.
Necesidad de Infraestructuras Nacionales de Información Geográfica
|
|
|
|
En diferentes actividades, se requiere
adquirir mapas temáticos específicos y combinarlos con otros mapas
temáticos en un sistema de información geográfica (GIS) para la
realización de variadas y heterogéneas tareas. Para conseguir esto
es necesario, por una parte saber si existe esa información geográfica,
saber donde puede conseguirla y luego disponer de mecanismos amigables
para adquirirla; existen problemas añadidos como los derivados de
su actualización (es un hecho contrastado de que la carga y mantenimiento
de los datos geográficos supone entre el 50% y el 80% del coste
total de la puesta en marcha de un SIG) [4]. Por otra parte, para
conseguir los efectos comentados es preciso también compartir datos
entre aplicaciones, pero esta compartición resulta una tarea engorrosa,
frustrante, intimidatoria, tendente a errores y a veces totalmente
impracticable debido a la heterogeneidad de los datos.
A esto se debe que gobiernos como
el de Estados Unidos gasten mas de 600.000 millones de Ptas. al
año en conversiones de geodatos y en la Unión Europea, más heterogénea
en sus instituciones que los Estados Unidos, se enfrenta a dificultades
de compartición de datos incluso más turbadoras. Adicionalmente,
si los geodatos posibilitados por las nuevas tecnologías fueran
fácilmente accesibles a través de redes y fueran compatibles para
una gran gama de computadoras y aplicaciones empotradas, los efectos
serían revolucionarios en áreas tales como respuesta a emergencias,
salud y seguridad pública, comando y control militar, gestión de
flotas, gestión de tráfico, agricultura de precisión, geomarketing
y gestión ambiental.
Tan extendido y crítico, en el futuro
inmediato, resultará el mencionado uso de la información geográfica
y los Sistemas de Información Geográfica (GIS) que trabajan con
ella, que su estrategia ha sido determinada por las más altas instancias
gubernamentales. Así, el presidente Clinton firmó una Orden Ejecutiva
(nº 12906 del 11 de Abril del 1994) para establecer una "Infraestructura
de datos espaciales nacionales" (NSDI), obligando a la cooperación
entre agencias federales y locales en materia de recopilación, diseminación
y uso de información geográfica, y en la que se proporcionaban también
los recursos necesarios para darle forma operativa y estructura
de gestión que ayudara al esfuerzo combinado de instituciones públicas
y privadas.
El Reino Unido recientemente ha
producido legislación en esta misma línea, ha subvencionada la creación
de una infraestructura de información geográfica bajo el programa
"Invertir para ahorrar" de su Ministerio de Tesorería, y el gobierno
promete publicar el 100% de la información pública en Internet para
el año 2008 [5]. La Unión Europea también ha dado los primeros pasos
en este tipo de iniciativa (European Standarization Strategies for
Geographic Information dentro del 2nd Geodata For All in Europe
EUROGI Workshop de Marzo del 96, documento de trabajo del GI2000
"Towards a European Policy Framework for Geographic Information"
[6]), que sin embargo carece de la rotundidad y visión coordinada
norteamericana. La discusión se basa completamente en el hecho de
usar esta infraestructura en un sentido político-institucional.
En esta línea argumental, y de acuerdo
con [7], los componentes de una infraestructura de datos espaciales
deberían incluir fuentes de datos espaciales (proveedores de dicho
tipo de datos), bases de datos y metadatos (catálogos), redes de
información (Internet), tecnología relacionada con la gestión de
colecciones de datos y sus búsquedas, acuerdos institucionales,
políticas y estándares, y usuarios finales. La determinación en
este aspecto se justifica en cierto modo con la financiación por
la Unión Europea de numerosos proyectos por iniciativa de la Dirección
General XIII-E de la Comisión Europea (ahora la Dirección General
Sociedad de la Información) en el marco del programa INFO2000.
La materialización de iniciativas
con los fines anteriores en los distintos países ha dado pie a la
creación de lo que se ha dado en llamar las Infraestructuras Nacionales
de Información Espacial. La propuesta de los Estados Unidos para
la creación de su Infraestructura Nacional de Información Espacial
ha sido puesta en práctica por el FGDC a través del National Geoespatial
Data Clearinghouse (ver [8]). Un Clearinghouse (centralita) fue
establecido como un Catálogo "en línea", distribuido, y que oferta
servicios de búsqueda. El Clearinghouse permite a un usuario de
Internet visitar uno de los numerosos Gateways, o puntos de entrada
a un sitio web, acceder a un formulario de consulta, y efectuando
una única pregunta, obtener la respuesta sobre la base de la información
geoespacial que será atendida por numerosas colecciones de datos.
En 1998 más de 60 sitios web de todo el mundo colaboraban con Clearinghouse
(pero muy poco Europeos). En algunos casos, esta colaboración ha
servido para el desarrollo de Infraestructuras Nacionales de Datos
Geográficos, como es el caso de Colombia (ver [9]). Por su parte,
la mayor parte de los países de la Unión Europea disponen de algún
tipo de infraestructura nacional que permite el actuar como servidor
de catálogo de geodatos relacionados con el país. Desde Portugal
(ver [10]) hasta Finlandia (ver [11] o [12]). Desgraciadamente,
España no se encuentra entre este grupo de países.
|
|
|
|
03. Elementos
tecnológicos integrantes de la infraestructura nacional de información
geográfica |
|
|
|
03.1. Estándares
abiertos para la interoperabilidad GIS: OpenGIS |
|
El OpenGIS Consortium (OGC) es una organización
sin ánimo de lucro, fundada en 1994 y dedicada a la promoción de
nuevas aproximaciones técnicas y comerciales para geoprocesamiento
abierto e interoperable, fundada por las más importantes entidades
industriales, gubernamentales y académicas. Los miembros del OGC
comparten una visión positiva de una infraestructura nacional y
global de información, en la que los geodatos y los recursos de
geoprocesamiento se mueven libremente, completamente integrados
con las últimas tecnologías de computación distribuidas, accesibles
a cualquiera, "geo-habilitando" una gran variedad de actividades,
que se encuentran actualmente fuera del dominio del geoprocesamiento,
abriendo de esta forma nuevos mercados. Su objetivo es conseguir
acuerdos sobre interfaces de software estándar abiertos que posibiliten
la interoperación entre sistemas de geoprocesamiento de vendedores
diferentes y de diferentes tipos (GIS/SIG, teledetección, cartografía
automática, gestión de instalaciones, etc.); comunicando por medio
de interfaces derivadas-de-consenso, sistemas diferentes accederán
a datos y funciones de procesamiento de cada uno a través de redes.
Para el OGC, el paradigma de compartición de datos
se moverá así más allá de hacer FTP o enviar físicamente ficheros
enteros de datos, y los geodatos y geoprocesamiento se convertirá
en parte del entorno de información de cada uno. La visión de las
pretensiones de futuro del OGC queda ilustrada con estos ejemplos
que marcan su línea tecnológica:
Será posible poner datos en línea y tener dichos
datos disponibles inmediatamente para cualquiera como una cobertura
temática en su GIS.
Una pregunta que uno haga a través de la red devolverá
un resultado, no una cobertura de datos que necesitaría ser interrogada
utilizando su propio software.
Se tenga o no un GIS en el computador, el visualizador
de web deberá cargar "applets" GIS así como geodatos de forma
que se pueda realizar análisis espacial.
Nuestros aparatos de "Internet móviles" comunicarán
por nosotros nuestras necesidades y nuestras coordenadas, y servicios
en línea nos dirán como obtener donde vamos y donde encontrar
los productos, servicios y la gente que buscamos.
En España ha habido algunas iniciativas para facilitar
la interoperabilidad pero de alcance muy limitado circunscrito a
proyectos de intercambio de información entre formatos internos
de varios sistemas SIG. Uno de estos proyectos es MIGRA, "Mecanismo
de Intercambio de información Geográfica Relacional formado por
Agregación", desarrollado por la Asociación Española de Normalización
y Certificación (AENOR) y la Comisión Nacional para la Cooperación
entre las Administraciones Públicas en el campo de los Sistemas
y Tecnologías de la Información (COAXI). El trabajo que hemos iniciado
va más allá que los intercambios de datos por traductores, que no
reúne los criterios necesarios ni suficientes del concepto de interoperabilidad
según OpenGIS, y que suponen arreglos de alto nivel de corto plazo
que no contribuyen a la construcción de un ambiente favorable, de
bajo nivel, para el intercambio libre y continuo de los geodatos
al beneficio de los sectores público y privado además de los usuarios
finales.
Interoperabilidad, en el contexto del OGC, significa
la existencia de componentes de software operando recíprocamente
para vencer las tediosas tareas de conversión, obstáculos de importación
/ exportación y las barreras de acceso impuestas por entornos de
procesamiento heterogéneos y datos heterogéneos. "Interoperatividad
por medio de especificaciones" significa que los desarrolladores
de software consiguen la interoperatividad escribiendo su software
conforme a un común y acordado conjunto de criterios. De esta forma,
una especificación expresada en varios niveles de abstracción, puede
ser utilizada más ampliamente y durar más que una especificación
ligada a un sistema operativo especial (UNIX, DOS, VMS, …), lenguaje
de programación (Fortran, C++, VisualBasic, ...), entorno operativo
(Windows, X-Windows System, …) o plataforma de computación distribuida
(DCP) (CORBA, OLE/COM/DCOM, DCE, …).
|
|
|
|
03.2. Metadatos
|
|
Cuando podamos acceder a un gran volumen de fuentes
de geodatos en línea, los mecanismos de recuperación y determinación
de la adecuación de datos serán tan importantes como lo son en estos
momentos los motores de búsqueda en web en el mundo del hipertexto
(excepto que en ese ámbito se hace búsquedas primariamente por nombres
y no por la multitud de atributos asociados con los geodatos). Los
catálogos geoespaciales digitales proporcionarán esta capacidad
clave en las infraestructuras de datos espaciales, desde el sector
privado al global.
Pero los catálogos sólo son tan buenos como los
metadatos por los que están indexadas las entradas de geodatos.
En el mundo del geoprocesamiento interoperable, los estándares de
metadatos y los estándares de contenidos de datos continuarán siendo
necesarios, y de hecho serán más importantes a medida que crece
el comercio en geodatos y los datos sean más abundantes. Las tareas
de gestión de metadatos deberán estar asistidas por herramientas
que hagan más fácil desarrollar datos conformes. Por otra parte,
otras herramientas filtrarán automáticamente a través de metadatos
de cientos de lugares para ayudar a los usuarios a encontrar los
mejores datos posibles para un propósito particular, incluso cuando
los metadatos no sean completamente conforme o consistentes. Pero
estas herramientas aumentarán, no reemplazarán la coordinación de
datos.
Para que los catálogos de geodatos se puedan realizar
es preciso utilizar contenidos bien definidos, y por lo tanto es
preciso un estándar de metadatos. En este sentido, en 1992 el Comité
Européen de Normalisation (CEN) creó el comité técnico 287 asignándole
la responsabilidad de la estandarización de la información geográfica.
Una familia de pre-estándares están siendo adoptados, incluyendo
el ENV (Euro-Norme Voluntaire) 12657 Geographic Information - Data
description Metadata. Muchos servicios de metadatos existentes en
Europa están basados en el trabajo del CEN/TC 287. Esto ha llevado
a proyectos Europeos como por ejemplo GDDD, Le Clef y el European
Spatial Metadata Infraestructure (ESMI) a adoptar el uso de este
estándar.
|
|
|
|
i
|
|
Figura
1. Interconexión de catálogos de información geográfica |
|
|
|
También en 1992, la Organización Internacional de
Estándares (ISO) creó el comité 211 (ISO/TC 211) con responsabilidades
en la "geomática". En estos momentos se encuentran preparando una
familia de estándares; este proceso involucra un grupo de trabajo,
un comité de borrador, un borrador del estándar internacional, y
finalmente el propio estándar. En estos momentos, ISO ha lanzado
el comité del borrador del estándar ISO 15046-15 - GI - Metadata.
CEN/TC 287 mantiene el estado de enlace con ISO/TC 211, lo que significa
que los resultados del trabajo en Europa serán tenidos en cuenta
cuando se desarrolle en estándar global. En los Estados Unidos,
el Comité Federal de Datos Geográficos (FGDC) aprobó su Content
Standard for Digital Geospatial Metadata en 1994. Este es un estándar
nacional para metadatos espaciales desarrollado para dar soporte
a la construcción de la Infraestructura Nacional de Datos Espaciales
de los Estados Unidos. Este estándar ha sido adoptado en otros países
como por ejemplo Sudáfrica o Canadá.
Por otra parte, en febrero de 1999 el Centro para
la Observación de la Tierra (CEO) de la Comisión Europea publicó
su Recommendations on Metadata en las que describe los datos, servicios
e información que se consideran necesarios para la realización de
trabajos que aborden aspectos relacionados con la observación de
la tierra.
Al nivel práctico no es siempre necesario elegir
entre uno u otro de estos formatos de metadatos, ya que ellos comparten
hasta un 40% de los elementos (vocabulario) más fundamentales y,
así, al nivel informático se puede crear sistemas informáticos que
hacen comunicar varios sistemas hablando varios dialectos de metadatos,
mediante pasarelas y puentes.
|
|
|
|
03.3. Servicios
de catálogos distribuidos |
|
El catálogo de datos geoespaciales debe proporcionar
los servicios necesarios para que los proveedores de información
geográfica puedan publicar informaciones descriptivas de sus productos,
y los consumidores de información geográfica puedan efectuar búsquedas
en estos metadatos publicados tratando de encontrar los productos
que mejor se acomoden a sus necesidades. Dado el actual auge de
Internet, el modo más lógico para llevar a cabo la construcción
de un servicio de catálogo es apoyarse en sus recursos. Esto va
a permitir un mayor nivel de accesibilidad (tanto de proveedores
como de consumidores), además de proporcionar la plataforma perfecta
para extender el catálogo convirtiéndolo en un catálogo distribuido.
OpenGIS plantea un estándar de servicios de catálogo
de datos geoespaciales que resulta especialmente relevantes a la
hora de proceder a la construcción de una infraestructura de datos
espaciales: Catalog Services (ver [2]). El estándar de servicios
está pensado para la interoperación de una serie de nodos distribuidos
a través de la red definiendo la interfaz que debe tener un catálogo
que permita la domiciliación de metadatos de proveedores, así como
la ejecución de búsquedas, basándose en un lenguaje estándar de
consulta, y presentación de resultados mediante perfiles especiales
de XML. Los proveedores domicilian sus metadatos en alguno de ellos
y cuando se procede a realizar una búsqueda, ésta puede ser local
al nodo en el que se está ejecutando, o puede extenderse a la totalidad
de los nodos del catálogo. Esto facilita la realización de trabajo
colaborativo entre grupos multidisciplinares donde cada uno de ellos
puede contar con información propia en un nodo y acceder a la de
los otros de manera sencilla.
Una de las características más peculiares de los
catálogos de información geográfica, que los diferencia de otros
tipos de catálogos, es la necesidad de ofrecer servicios de búsqueda
y recuperación de información ligados a los componentes de localización
de las informaciones catalogadas. En este sentido, este tipo de
catálogos debe disponer de dos clases de servicios de búsqueda especializados
y que podemos denominar búsquedas por Localización Geográfica y
búqueda por Nombre de Lugar.
Los servicios de búsqueda por localización geográfica
se encargan de ejecutar búsquedas sobre las informaciones catalogadas
tratando de encontrar aquellas que se refieran a un punto geografico
concreto (dado por los valores de sus coordenalas geográficas: longitud,
latitud), o a un área geográfica determinada (especificada por las
coordenadas geográficas de los cuatro puntos que conforman el cuadrado
que encierra a esa área). Para poder trabajar con este tipo de servicio
es necesario que entre los metadatos que carazterizan a una información
concreta se encuentre la zona geográfica que ésta comprende. Aquí
se tropieza con numerosos problemas deribados tanto del sistema
de coordenadas utilizado para caracterizar unos datos, como del
tipo de proyección utilizada, etc. No es un problema cuya solución
sea obvia. Por ejemplo, el European Petroleum Survey Group ha publicado
en su página web (http://www.epsg.org) un ámplio conjunto de parámetros
que permiten realizar cambios entre numerosos sistemas de coordenadas
con mínimas perdidas de información. Este recopilatorio, actualmente
en la versión 5.0, se encuentra almacenado en una serie de tablas
Access que ocupan casi 7Mb.
Por otra parte tenemos los servicios de búsqueda
por nombre de lugar. En este caso se trata de servicios que permiten
realizar búsquedas de información vinculadas a lugares geograficos
identificados por un nombre (nombres de núcleos urbanos, paises,
nombres de accidentes geográficos, etc.) generalmente publicados
en algún tipo de atlas o mapas. Estos servicios trabajan sobre conexiones
que se establecen entre estos nombres de lugar y su ubicación geográfica
y área que abarcan. Un ejemplo del rango de la granularidad con
la que pueden trabajar estos servicios lo podemos ver si pensamos
en que se ejecuta una búsqueda de información reference al Océano
Pácifico y, a continuación sobre el mismo motor de búsqueda se solicita
información asociada al Puente de Piedra en Zaragoza. En ocasiones
estos nombres no tienen por que estar bien definidos (nombres no
completos, errores ortográficos, vulgarismos y/o cultismos para
el nombrado de lugares, diferentes idiomas, etc). En estos casos,
la posibilidad de disponer de técnicas de recuperación de la información
como las que se describen en el siguiente punto van a permitir que
los motores de búsqueda ofrezcan respuestas validas, al menos con
un grado de fiabilidad bastante alto.
|
|
|
|
03.4. Técnicas
de recuperación de información y lenguaje natural |
|
Otro de los aspectos que se quiere abordar es el
relacionado con el aprovechamiento de técnicas y recursos de recuperación
de información y de tratamiento del lenguaje natural (tesauros,
diccionarios, etc.) que pueden aportar ventajas, tanto para la organización
y búsqueda de la información, como para ir facilitando un acceso
más amigable y multilingüe. No es de esperar que un usuario describa
los datos que precisa utilizando las palabras exactas que se han
utilizado para su clasificación. Por lo tanto, el servicio de búsqueda
de un catálogo no puede limitarse a un simple reconocimiento de
palabras clave. La recuperación de información trata con el problema
de encontrar los documento relevantes en una colección de textos
a partir de una pregunta de un usuario. Si suponemos que la pregunta
está expresada en lenguaje natural, para un humano ésta tarea conlleva
leer y comprender la pregunta y los documentos, y juzgar la relevancia
de cada documento respecto a la pregunta. Este proceso cae dentro
del ámbito de las técnicas de representación del conocimiento y
el procesamiento de lenguaje natural (PLN).
En cuanto a la aplicación de técnicas de recuperación
de información, aunque no estemos tratando con documentos de texto,
sino con datos geográficos y descripciones de éstos mediante metadatos,
las ideas que subyacen a éstas técnicas siguen siendo válidas puesto
que muchas de las descripciones son lingüísticas [13]. Gran parte
de la capacidad de obtener respuestas de interés para el usuario
provienen de la capacidad de hacer público los datos almacenados,
a la vez que se oculta los detalles técnicos de los repositorios.
Para conseguir este objetivo se debe hacer uso de ontologías de
forma que el usuario formule sus preguntas y el sistema tenga la
responsabilidad de gestionar la recuperación basándose en los conceptos
o tema involucrados en la petición [14].
En cuanto a la utilización de una interfaz en lenguaje
natural para acceder a los servicios del catálogo, o a la base de
datos de metadatos directamente, sus ventajas son que el usuario
no precisa conocer un lenguaje de interrogación o el nombre específico
de los servicios, y puede expresar sus preguntas idealmente en lenguaje
natural. Una interfaz gráfica o basado en rellenar formulario es
más intuitivo para un usuario ocasional, pero el lenguaje natural
permite expresar preguntas que serían tediosas de plantear con esta
clase de interfaz. Por ejemplo, preguntas que conllevan negación
(¿Qué comunidades no tienen autovías?) o cuantificadores universales
(¿Qué ríos pasan por cada comunidad?), son mejores para realizar
ciertos tipos de preguntas. Otra ventaja es el uso de la anáfora
o la elipsis, donde el significado de cada pregunta se complementa
con el contexto del discurso. Como desventajas hay que destacar
que el problema de la utilización de lenguaje natural sin restricciones
para acceder a una interfaz de servicios o a una base de datos no
está resuelto. Entre los principales problemas destaca que no es
obvio conocer cual es el conjunto de expresiones en lenguaje natural
reconocibles por el sistema, ni cuales son los datos disponibles,
por lo que si no hay respuesta no se sabrá si no hay datos o no
se ha entendido la pregunta. En cualquier caso el lenguaje natural
es una herramienta efectiva para la interacción con una base de
datos o una interfaz de servicios en un dominio restringido como
son los SIGs [15]. (El sistema START del MIT en http://www.ai.mit.edu/projects/infolab/globe.html
es un ejemplo de las posibilidades y limitaciones de una interfaz
en lenguaje natural para interrogar una base de datos geográficos).
|
|
|
|
03.5. Servidores
de mapas en web |
|
La posibilidad de llevar a cabo la publicación de
mapas en Internet es un tema necesario desde el punto de vista de
la infraestructura nacional de información geográfica. El interés
de los usuarios en disponer de información geográfica en la red
junto con la capacidad de obtener y representar información de diferentes
fuentes, ha conseguido que el mundo empresarial esté realizando
un gran esfuerzo para cubrir estas necesidades.
"Los servicios de mapas en línea para el web
ofrecen nuevas formas de manipular información geográfica, posibilitando
su tratamiento como datos personalizables en lugar de conjuntos
de datos fijos. Tales servicios se pueden convertir en más útiles
y prometedores gracias a un nuevo y amplio consenso de la industria
para protocolos de mapas en web, adoptado formalmente por el Consorcio
OpenGIS hace sólo unas semanas. Estos protocolos hacen que diferentes
clientes y servidores de mapas puedan interoperar, esto es, ser
capaces de mezclar y encajar datos geográficos, mapas, y servicios
de procesamiento de muchas fuentes diferentes, independientemente
del vendedor, formato, modelo de datos, o sistema de coordenadas"
[16].
Actualmente existen numerosas aplicaciones comerciales
que soportan el tratamiento de mapas en web pero muy pocas soportan
interoperabilidad (ver [17] para una lista más exhaustiva). Organizaciones
como el consorcio OpenGIS están desarrollando estándares para sistemas
de información geográfica, y en concreto un estándar para que distintas
aplicaciones puedan interoperar a través de Internet: la interfaz
para servidores de mapas en Web [18]. Esta interfaz especifica una
serie de servicios para distribuir mapas en Internet, que un servidor
que quiera cumplir con esta interfaz debe implementar. Gracias a
que la interfaz es bien conocida, distintos servidores de mapas
que la cumplan permiten que sus usuarios obtengan información heterogénea
de distintas fuentes y puedan trabajar con ella, junto con datos
locales si es necesario, sin necesidad de conocer el formato de
la misma. Los usuarios pueden de esta forma trabajar siempre con
los datos más recientes conforme éstos se actualizan en los servidores
y añadir datos provenientes de nuevas fuentes sin necesidad de cambiar
métodos de trabajo ni herramientas. Muchas empresas que desarrollan
aplicaciones en el ámbito de los SIG en Internet están trabajando
para que sus productos sean compatibles con el estándar OpenGIS.
La interfaz de servicio de mapas propuesta por OpenGIS
define una serie de peticiones relacionadas con la producción de
mapas que un servidor debe ser capaz de responder. Un servidor de
mapas es una aplicación que accesible desde un servidor web que
puede generar mapas como respuesta a una petición concreta. Existen
tres tipos principales de servicios: producción de mapas, información
sobre elementos e información sobre las capacidades del servidor.
|
|
|
|
|
|
Figura
2. Servidores de mapas en Web |
|
|
|
Las peticiones de servicio de mapas son enviadas
al servidor para obtener un mapa sobre una zona concreta. La petición
incluye parámetros que determinan la zona de interés, el sistema
de referencia, el tipo de información a incluir o el formato de
respuesta. Se puede especificar un conjunto de las capas de datos
y estilos ofertados por el servidor para que éste componga y proporcione
el mapa deseado. El mapa deseado se puede devolver como un fichero
de imagen, o bien en algún formato vectorial de los especificados
por OpenGIS. Las peticiones de información de elementos son una
extensión de las anteriores. Especificando un punto en pantalla
sobre un mapa generado, el servidor responde con la descripción
de los elementos geográficos bajo ese punto. Esta descripción proviene
generalmente de los atributos de las coberturas vectoriales que
ofrece el servidor para componer los mapas.
Las peticiones de las capacidades del servidor
informan sobre los servicios, datos, formatos y sistemas de referencia
ofertados por éste. Además, puesto que un servidor que cumpla con
la interfaz definida por OpenGIS puede además ofrecer otros servicios
complementarios, ofrece información sobre éstos.
|
|
|
|
04.
Estado actual del proyecto |
|
|
|
Como se ha indicado en el punto
2 de este trabajo, son numerosos los elementos integrantes de una
infraestructura de información geográfica (fuentes de datos espaciales,
catálogos, Internet, tecnología para la gestión de colecciones de
datos y sus búsquedas, acuerdos institucionales, políticas y estándares,
y usuarios finales). En este trabajo nos hemos centrado en presentar
aspectos relacionados con la creación de la tecnología para soportar
esta infraestructura en un alcance nacional. En todos estos aspectos
ya se están dando los pasos oportunos dirigidos a conseguir crear
un primer nivel de servicio que pueda servir a la vez como banco
de pruebas de esta tecnología, y como trampolín de lanzamiento de
la futura infraestructura nacional.. Este primer nivel de servicio
incluirá la puesta en funcionamiento de tres nodos (uno en cada
una de las Universidades participantes).
El lanzamiento del servicio y la
creación de la tecnología básica va a estar soportado parcialmente,
en esta primera fase, por la Subdirección General de Proyectos de
Investigación del Ministerio de Ciencia y Tecnología a través del
proyecto coordinado TIC2000-1568.
Aunque la iniciativa está liderada
por grupos de investigación de las Universidades de Zaragoza, Jaime
I de Castellón y Politécnica de Madrid, ha recibido también el apoyo
de numerosas empresas y órganos de las Administraciones que tendrán
distintos niveles de participación en el proyecto. Está prevista
también, en su momento, la participación de más empresas e instituciones
interesadas y con ganas de aportar, y que por supuesto serán muy
bienvenidas.
La concesión de la financiación
para comenzar el proyecto nos ha sido comunidado muy recientemente,
por lo que todavía nos encontramos en la fase previa al comienzo
efectivo del proyecto. A medida que el proyecto vaya avanzando iremos
informando oportunamente e iremos solicitando participación, colaboraciones
adicionales e ideas que puedan servir para mejorar el trabajo, y
estableceremos las infraestructuras y procedimientos pertinentes
para canalizar estas aportaciones.
|
|
|
|
Agradecimientos |
|
|
|
Este trabajo ha
sido parcialmente financiado por el proyecto TIC2000-1568 de la Comisión
Interministerial de Ciencia y Tecnología (CICYT). |
|
|
|
Bibliografía |
|
|
|
1. K. Buehler, L. McKee
(eds.). The OpenGIS Guide. Introduction to Interoperable Geoprocessing.
Part I of the Open Geodata Interoperability Specification (OGIS).
OGIS Project 6 Technical Commitee of the Open GIS Consorcium Inc.
OGIS TC Document 96-001. 1996.
2. "The OpenGIS Abstract
Specification. Topic13: Catalog Services (version 4)". OpenGIS Project
Document 99-113. OpenGIS Consortium 1999.
3. Space Applications
Institute. "Geographic Information Policies in Europe: National
and Regional Perspectives". Proceedings del "EUROGI-EC Data Policy
Workshop. Amersfoort, Nov 1999. http://www.ec-gis.org/
4. M. Gould, D. Llidó,
R. Cirilo, A. Fuertes. "Apoyo a la administración vía la infraestructura
europea de información geográfica". Actas de la XXIII Reunión de
Estudios Regionales, Univ. Politécnica de Valencia, 1998.
5. Homepage del National
Geospatial Data Framework (NGDF) http://www.ngdf.org.uk/
6. GI2000 (publicaciones
soportados por la Comisión Europea, DG XIII-E). Repaso de cifras
del mercado de la Información Geográfica ("GI & GIS Market Size
Data": http://158.169.50.95:10080/gi/en/markets/gimrktfigs.html)
7. D.J.Coleman, D.D.Nebert.
"Building a North American Spatial Data Infrastructure" Cartography
and Geographic Information Systems. Vol. 25, No. 3, pp. 151-160.
Julio1998.
8. Homepage del National
Geospatial Data Clearinghouse http://www.fgdc.gov/clearinghouse/index.html
9. W. Amaya Gómez.
Hacia una Infraestructura Nacional de Datos Geográficos en Colombia.
GeoConvergencia, Dec. 1998, pp 10- 18.
10. Homepage del Sistema
Nacional de Información Geográfica de Portugal. http://snig.cnig.pt
11. A. Rainio. "National
Geographic Information Infraestructure of Finland". http://www.nls.fi/ptk/infrastructure/index.html
12. Homepage de la
Infraestructura Nacional de Datos Geográficos de Finlandia. http://www.kartta.nls.fi/
13. J.A. Bañares, F.J.
Zarazaga, J. Nogueras, J. Gutiérrez and P.R. Muro-Medrano. "Construction
and Use of Concept Hierarchies from Word Taxonomies for Searching
Geospatial Data". Geographical Domain and Geographical Information
Systems, GeoInfo Series, Stephan Winter (editor), vol 19, pp 5 -
8. La Londe-les-Maures, France, 22-27 September 2000.
14. T. Gruber. "A translation
aprroach to portable ontology specifications". Knowledge Acquisition,
An International Journal of Knowledge Acquisition for Knowledge-Based
Systems, 5(2), Junio 1993.
15. I. Andreoutsopoulos,
G. D. Ritchie, P. Thanisch. "Natural Language Interfaces to Databases-
An Introduction". Journal of Natural Language Engineering, Cambridge
University Press. 1995. Also Available as Research paper nº 709,
Department of Artificial Intelligence, University of Edinburgh,
1994.
16. John D. Evans.
"The MIT OrthoServer and Interoperable Web Mapping". GIS Colloquium
Lecture Series. MIT Dept. of Urban Studies and Planning. Mar. 2000.
http://icg.fas.harvard.edu/~maps/hgis/lngis.htm.
17. Cliff Kottman.
"Introduction to OpenGIS Consortium, Inc.". Presentación en una
reunión OpenGIS, Vancouver, Canadá. Feb 7, 2000. Accesible en http://opengis.org/techno/presentations.htm.
18 OpenGIS Consortium.
"OpenGIS Web Map Server Interface Specification (version 1.0)".
OpenGIS Project Document 99-077r4, OpenGIS Consortium 2000.
|
|
|
|
|
|