jueves, 18 de febrero de 2016

LOS FORMATOS GIS RASTER Y VECTORIALES MAS COMUNES.

  • Para los no iniciados en el trabajo con Sistemas de Información Geográfica (normalmente casi todos los que se han dedicado a la ingeniería civil y/o de la edificación) es posible que alguna vez les llegue información "ininteligible" que deban emplear para "encajar, proyectar, modelar o medir" un determinado proyecto de ingeniería (dígase obra lineal de cualquier tipo).
  • Todos estos profesionales  han de ser conscientes (al menos) de que existe determinado software SIG (Propietario u Opensource) para visualizar, modificar y transformar la geoinformación a otros formatos mas standarizados e implementarlos en sus procesos técnicos.
FLUJO DE TRABAJO.
  • Existen dos formas de almacenar datos en un SIG:
  1. RASTER: Cualquier tipo de imagen digital representada en mallas (Pixels/celdas de la cuadricula). Se define el espacio geográfico como una matriz de puntos de cuadrícula cuadrados de igual tamaño dispuestos en filas y columnas. Cada punto de la cuadrícula almacena un valor numérico que representa un atributo geográfico (tales como elevación o superficie de la pendiente) para esa unidad de espacio. Cada celda de la malla se referencia por sus coordenadas x e y.
  2. VECTORIAL: Los datos están basados en la representación vectorial (común en CAD) de la componente espacial de los datos geográficos. Su representación es mediante puntos, líneas y polígonos.

SIG. DATOS RASTER & VECTOR.
  • En esta entrada vamos dar un repaso a los formatos  raster y vectoriales más populares/extendidos con los que trabajar en un proyecto GIS (para los neófitos útil; para los profesionales como recordatorio/curiosidad):
RASTER VS VECTOR
    FORMATOS GIS / RASTER MAS COMUNES:
      1.- ESRI GRID:
  • Un Esri grid es un formato de almacenamiento de datos raster nativo de ESRI. Hay dos tipos de grids: enteros y puntos flotantes. Utilizamos grids de tipo entero para representar datos discretos y grids de punto flotante para representar datos continuos. Los datos de elevación son un ejemplo de un grid de punto flotante.
  • Un Esri grid a su vez tiene dos formatos:
  • Un formato propietario binario, también conocido como ARC/INFO GRID, ARC GRID y otras variaciones. Con extensión *.adf.
  • Un formato ASCII no propietario, también conocido como ARC/INFO ASCII GRID. Con extensión *.asc.
EJEMPLO DE ASCII-GRID EDITADO. COLUMNAS + CELDAS+XY- CENTRO+TAMAÑO CELDA+ALTITUDES DE CADA PUNTO DEL GRID
  • Estos formatos fueron introducidos por ARC/INFO. El formato binario es ámpliamente utilizado dentro de los programas de Esri, como ArcGIS, mientras que el formato ASCII es usado como un formato de intercambio y exportación, debido a lo sencillo y fácil de compartir que es la estructura del archivo ASCII.
DEM/MDT05-LIDAR- IGN EN FORMATO ESRI GRID ASC.
      2.- GeoTIFF:
  • El GeoTIFF se ha convertido en un archivo de imagen estándar en la industria de los SIG y en las aplicaciones de teledetección. Casi todos los SIG y programas de procesamiento de imágenes tienen compatibilidad con GeoTIFF.
  • Un GeoTIFF puede ir acompañado de otros archivos:
  • TFW es el archivo necesario para dar geolocalización al raster.
  • XML contiene los metadatos. Es opcional.
  • AUX en este archivo se almacenan las proyecciones y otra información.
  •  En origen el formato GeoTIFF fue diseñado en el Jet Propulsion Laboratory (Laboratorio de Propulsión a Reacción) de la NASA. Es mi formato favorito para transformar los datos LIDAR en un raster "manejable".
      3.- JPEG 2000:
  • El Open Geospatial Consortium (OGC) ha definido unos metadatos para la georreferenciación de las imágenes JPEG 2000 que incorporan XML utilizando GML. Es una opción óptima para imágenes de fondo debido a la compresión sin pérdida de calidad (puede alcanzar una relación de compresión de 20:1).
  • Los formatos de archivos ráster de compresión  como JPEG 2000, ECW y MrSID, suelen tener pirámides de imágenes internas para mejorar su rendimiento y acelerar su visualización.
      4.- MrSID:
  • Son las siglas de Multi-resolution Seamless Image Database. Patentado, desarrollado y comercializado en la actualidad por la empresa LizardTech, es un estándar abierto de compresión de imágenes raster. El ratio de compresión es aproximadamente 22:1, dependiendo del contenido de la imagen y de la profundidad de color.
  • Ampliamente utilizado al permitir el manejo de imágenes masivas extremadamente grandes (imágenes de satélite, ortofotos, etc.) y permitir una rápida visualización sin apenas redundar en su calidad. Las imágenes MrSID tienen una extensión SID y son acompañados por un archivo de mundo con la extensión SDW.
    5.- ECW:
  • El formato ECW (Enhanced Compression Wavelet) es un formato de archivo propietario para almacenar datos raster, que presenta unos ratios muy altos de compresión, desde 10:1 hasta de 50:1, mediante el uso de técnicas de ondículas.
  • Como consecuencia de esto se reduce considerablemente el tamaño de los archivos, manteniendo una alta calidad gráfica y permitiendo un rápida compresión y descompresión mediante un uso escaso de memoria RAM.
  • Este formato (*.ecw) es ámpliamente utilizado en SIG y teledetección dado que, además de sus ventajas de compresión y rapidez de carga, preserva la georreferenciación de la imagen mediante un archivo de cabecera con extensión .ers.
  • El formato ECW fue desarrollado por ER Mapper, y ahora es propiedad de Intergraph, parte de Hexagon Geospatial.
ORTOFOTO DE LA PNOA MAXIMA ACTUALIDAD EN FORMATO *.ECW
    6.- ASCII:
  • ASCII utiliza un conjunto de números entre 0 y 255 para el almacenamiento y procesamiento de la información.
  • En su forma nativa, los archivos de texto ASCII almacenan datos raster en un formato delimitado: coma, espacio o formato delimitado por tabuladores. Para pasar de datos no espaciales a datos espaciales, podemos ejecutar una herramienta de conversión como ASCII to ráster.
      7.- ERDAS IMAGINE:
  • El formato ERDAS_IMG es un formato propietario para almacenar datos raster, parcialmente documentado para multicapa imágenes raster georreferenciados desarrollados originalmente para su uso con ERDAS IMAGINE software.
  • Este formato se utiliza ampliamente para el tratamiento de los datos de teledetección, ya que proporciona un marco para la integración de datos de los sensores y las imágenes de muchas fuentes. La extensión de estos archivos es .img

  • 8.- GEOPACKAGE:

  • GeoPackage es un formato de archivo universal para almacenar datos espaciales vectoriales y raster. Es abierto, basado en estándares, e independiente de plataformas o aplicaciones. Se ha construido sobre la base de SQLite, por lo que necesitarás saber SQL para utilizar GeoPackage en cualquier sistema operativo de escritorio o móvil.
  • GeoPackage es la alternativa moderna a formatos como GeoTIFF. QGIS, ArcGIS 10.3 y ArcGIS Pro soportan la lectura de GeoPackages vectoriales.
    FORMATOS GIS / VECTOR MAS COMUNES:

          1.- SHAPEFILE:
  • El shapefile es el formato más extendido y popular entre la comunidad GIS, pese al elevado número de desventajas e inconvenientes que tiene.
  • Es un formato propiedad de ESRI, pero es difícil encontrar un SIG que no lea este sistema de achivos. No es un único archivo, un shapefile se compone de varios archivos que un cliente SIG lee como uno único. El mínimo requerido es de tres: el .shp almacena las entidades geométricas, el .shx almacena el índice de las entidades geométricas y el .dbf es la base de datos, en formato dBASE. Opcionalmente puede tener un .prj, .sbn, .sbx, .fbn, .fbx .ain, .aih, .shp.xml.
  • Hace unos años, con la aparición de las bases de datos espaciales y nuevos formatos como el KML, parecía que su desaparición o uso residual era más que probable, sin embargo esto no ha ocurrido. Es un formato que se ha convertido en oficial para muchas instituciones, debido principalmente a que es fácil convertirlo a otros tipos de formatos con relativa facilidad. ESRI Shapefile Technical Description (año 1998)
SHAPEFILE + TABLA DATOS ASOCIADA
          2.- BASES DE DATOS ESPACIALES:
  • Las bases de datos espaciales (bien sea una geodatabase personal o de archivos de ESRI, PostgreSQL + PostGIS, Oracle Spatial, mySQL, etc). La combinación de soporte para usuarios múltiples, consultas complejas ad hoc, y el rendimiento con grandes conjuntos de datos son los que establecen que las bases de datos espaciales superen al tradicional shapefile como puedes ver en la entrada de MAPPINGGIS: desventajas de utilizar un shapefile frente a un sistema basado en base de datos espaciales.
          3.- CSV:
  • Un CSV (Comma-separated values) representa datos en forma de tabla. Sirve para almacenar información alfanumérica con la posibilidad de almacenar las coordenadas y posteriormente  crear una capa.
  • Cada vez más los servicios para publicar mapas en la nube admiten un CSV para crear información espacial y representar su geometría. La ventaja es que estos ficheros ocupan poco espacio y es fácil compartirlos. 
  • GeoCSV es una especificación del formato de archivo tabular CSV con una extensión opcional de geometría. Tiene dos variantes: la opción Punto X/Y o la opción WKT.
  • La opción WKT es la preferida, ya que se almacena en una única columna de tipo String el constructor, por ejemplo “POINT (-4.5454 45.2211)”, lo que significa -4.5454 oeste y 45.2211 norte (longitud/latitud). Esta opción soporta los tipos de geometría Point, LineString, Polygon, MultiPoint, MultiLineString, MultiPolygon e incluso GeometryCollection y ARCos. La opción Punto X/Y solo puede almacenar puntos.
  • En cualquier caso el sistema de coordenadas por defecto es WGS84 (EPSG:4326) y la codificación de caracteres UTF8. Al igual que el shapefile puede tener archivos auxiliares, como CSVT, PRJ, CSVZ. Lo que puede ser una desventaja para este nuevo formato, así como que solo almacene una capa por archivo o que no sea apto para grandes conjuntos de datos.
  • Es posible abrir un GeoCSV con QGIS o con OGR, así como con aplicaciones como LibreOffice, Excel, Kettle o Python. Para cargar, editar o guardar GeoCSV en QGIS, es necesario utilizar el plugin Editable GeoCSV.  
          4.- DWG/DXF/DGN:
  • El DWG es el formato de CAD (utilizado principalmente por el programa AutoCAD), para facilitar la lectura de este tipo de archivos por parte de otros programas se utilizó un archivo de intercambio: el DXF (Drawing eXchange File).
  • DGN es la competencia del formato DWG de Autodesk. DGN es el nombre que se utiliza para formatos de archivos CAD compatibles con MicroStation de Bentley Systems.
  • Basta con convertir estos archivos CAD a otro formato, como a shapefile y georreferenciarlo para tener nuestra cartografía lista.
HOJA 1:25.000. FORMATO *.DGN.
          5.- GML/XML:
  • GML (Geography Markup Language) es el estándar XML de la OGC para representar información de elementos espaciales. El formato de intercambio de los metadatos es XML (eXtensible Markup Language) – lenguaje de marcas extensible.
  • Uno de los principales problemas de este lenguaje de marcas, es que existe la imposibilidad de descargar un documento GML desde un servicio web (servidor) distinto del que la aplicación web fue descargada. Este problema se denomina Cross-Domain.
          6.- GPX:
  • GPX o GPS eXchange Format (Formato de Intercambio GPS) es un esquema XML pensado para transferir datos GPS entre aplicaciones. Se puede usar para describir puntos (waypoints), recorridos (tracks), y rutas (routes).
         7.- GEOPACKAGE:
  • GeoPackage es un formato de archivo universal para datos espaciales vectoriales y raster.
  • Es abierto, basado en estándares, e independiente de plataformas o aplicaciones. Se ha construido sobre la base de SQLite, por lo que necesitarás saber SQL para utilizar GeoPackage en cualquier sistema operativo de escritorio o móvil. GeoPackage es la alternativa moderna a formatos como GeoTIFF y especialmente Shapefile.
  • QGIS, ArcGIS 10.3 y ArcGIS Pro soportan la lectura de GeoPackages vectoriales. Otros programas que soportan GeoPackages, entre otros son: GDAL, GeoServer, GeoTools u OpenJUMP PLUS. Comparación entre GeoCSV, GeoPackage y GeoJSON.
         8.- GeoJSON/TopoJSON:
  • GeoJSON (Javascript Object Notation), un formato de texto que es muy rápido de analizar en máquinas virtuales Javascript. Es un formato de intercambio de datos geoespaciales basado en JSON.  Define la gramática basada en un estándar del OGC (WKT).
  • Este formato apareció en 2008 y puede representar una geometría, un fenómeno o una colección de fenómenos. Muy popular en las aplicaciones de WEB MAPPING, hace que nos ahorremos la parte de la base de datos y el servidor. 
  • Los navegadores web no impiden el intercambio de datos en formato JSON, por lo que estos formatos son una alternativa al formato GML, y además es más ligero. TopoJSON es una extensión de GeoJSON que codifica topología. Mucho más ligero aun que un GeoJSON, se utiliza sobre todo en visores web mapping construidos con d3.js.
          9- GeoRSS:
  • GeoRSS es un conjunto de estándares para representar información geográfica mediante el uso de capas. En las GeoRSS, el contenido consiste en puntos de interés georreferenciados y otras anotaciones y las fuentes se diseñan para generar mapas.
        10- KML/KMZ:
  • Aunque desarrollado para Google Earth, desde el año 2008 KML es estándar de la OGC (Open Geospatial Consortium) también es muy popular y ha hecho que se ha democratizado mucho. KML significa Keyhole Markup Language, y es un lenguaje de marcado basado en XML para representar datos geográficos en tres dimensiones.
  • Los ficheros KML suelen distribuirse comprimidos como ficheros KMZ.
CODIFICACIÓN DE FICHERO KML. PAISES DEL MUNDO. SIMILAR A XML.
  • Por último es interesante hablar de que existe un conversor on-line gratuito, para transformar estos formato: MyGeodata Converter, que acepta hasta 20 formatos de entrada y 8 de salida (ESRI Shapefile, Microstation DGN, MapInfo File, CSV, GML, GPX, KML y GeoJSON).
  • Como se ha indicado estos serían los formatos raster/vector  mas utilizados aunque existen muchos más. Todo el que quiera ya puede profundizar en el tema y demarcarse por los formatos de archivo/registro mas adecuados  para los trabajos o análisis que esté realizando.
  • Gracias a los compañeros de MAPPING_GIS por sus continuos aportes al mundo de la Geomatica,
  • Hasta pronto.
  • By Rah.

4 comentarios:

  1. Muy buena y descriptiva recopilación de formatos.
    Muy recomendable como manual de referencia.

    ResponderEliminar
  2. El conocimiento y contextualización de los formatos; le hace al especialista utilizarlos; para encontrar la eficiencia, el consumo de maquina,eficaz desarrollo de sus productos afines geográficos y cartográficos.

    ResponderEliminar
  3. se puede descargar imagen georreferenciada en formato geotiff de sasplanet?

    ResponderEliminar
    Respuestas
    1. Buenas:
      Pues aún no se puede descargar imágenes en formato TIFF georreferenciado...
      Lo más común son formato jpg,ecw, kmz para superponer en G.E. y otros para móviles como MBtiles..

      Un Saludo
      Rah

      Eliminar