Dữ liệu GIS (dữ liệu không gian) được lưu trữ ở 2 định dạng cơ bản là vector và raster. Ngoài ra, một số định dạng khác sẽ được thảo luận ở phần cuối bài viết.

Vector

Là dữ liệu chứa những thông tin định vị của các đối tượng không gian, cho biết vị trí, kích thước, hình dạng, sự phân bố… của các đối tượng. Các đối tượng này gồm 3 định dạng: dạng điểm, dạng đường và dạng vùng.

Dữ liệu dạng điểm (Point) được xác định bởi một cặp giá trị (x, y) hoặc (lat, long) cho biết vị trí của điểm.

Đối tượng dạng đường (Arc) được xác định bởi điểm đầu, điểm cuối và chỉ số đường. Đối tượng dạng đường có thể chỉ gồm 1 đường hoặc tổ hợp nhiều đường nối với nhau mà không tạo vùng khép kín.

Đối tượng dạng vùng (Polygon) được xác định bởi ranh giới các đường tạo thành vùng khép kín (và có thuộc tính diện tích).

Ngoài các thông tin về vị trí địa lý, các đối tượng vector còn mang thông tin thuộc tính khác.

  Tên định dạng Dạng file  Mô tả
1 Esri Shapefile

.SHP
.DBF
.SHX

.PRJ

.SHP: chứa thông tin hình học của các đối tượng

.DBF: chứa  thuộc tính của đối tượng trong cơ sở dữ liệu. Gần giống với dữ liệu dạng bảng trong excel

.SHX: chỉ số không gian, giúp hệ thống GIS nhận dạng các đối tượng trong .shp nhanh hơn

.PRJ: lưu thông tin về hệ tọa độ và hệ quy chiếu

2 Geographic JavaScript Object Notation (GeoJSON) .geoJSON
.JSON

.JSON là định dạng mặc định của dữ liệu bản đồ trên web, có kích thước nhẹ, có thể chỉnh sửa trên các text  editor.

.GeoJSON lưu trữ thêm dữ liệu địa lý của file JSON

3 Geography Markup Language (GML) .GML

.GML cho phép sử dụng phần mở rộng tọa độ địa lý của ngôn ngữ đánh dấu mở rộng (Etensible Markup Language (XML): có chức năng truyền dữ liệu và mô tả nhiều loại dữ liệu khác nhau)

GML lưu trữ các đối tượng địa lý dưới dạng văn bản. Mỗi đối tượng địa lý có một danh sách các thuộc tính, đặc điểm hình học, và một hệ quy chiếu không gian.

4 Google Keyhole Markup Language (KML/KMZ) .KML
.KMZ

Đây định dạng mặc định của Google Earth, trong đó KMZ là dạng nén của KML.

KML/ KMZ đã trở thành định dạng tiêu chuẩn quốc tế của Tổ chức Không gian Địa lý Mở vào năm 2008. Định dạng sử dụng  hệ tọa độ WGS84 ,và mô hình trọng trường EGM96 cho dữ liệu độ cao.

5 MapInfo TAB .TAB
.DAT
.ID
.MAP
.IND

Là định dạng độc quyền cho phần mềm MapInfo. Chúng bao gồm các file chứa thông tin và thuộc tính địa lý.

.TAB: định dạng ASCII liên kết các tệp ID, DAT, MAP và IND

.DAT: chứa dữ liệu dạng bảng được liên kết dưới dạng tệp DBF dBase

.ID: file chỉ mục liên kết các đối tượng đồ họa với thông tin cơ sở dữ liệu.

.MAP:  lưu trữ thông tin địa lý của các đối tượng

.IND: tệp chỉ mục cho dữ liệu dạng bảng.

6 OpenStreetMap OSM XML .OSM Là định dạng mặc định của OpenStreetMap – dự án dữ liệu GIS từ cộng đồng lớn nhất trên thế giới, gồm chủ yếu các thông tin về giao thông và công trình xây dựng. OSM được lưu trữ dưới dạng XML.

Ngoài ra còn có các định dạng vector khác như GPS eXchange Format (.GPX), Digital Line Graph (.DLG), Geographic Base File-Dual Independent Mask Encoding (GBF-DIME), ArcInfo Coverage, IDRISI Vector (.VCT, .VDC).

du lieu GIS vector raster

Raster

Dữ liệu raster (hay còn gọi là ảnh) được tạo thành từ các pixel, hay còn gọi là ô lưới. Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới. Mỗi một điểm ảnh (pixel) chứa một giá trị. Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp (layer). Một file raster có thể chứa 1 hoặc nhiều lớp (ảnh đa kênh).

Các định dạng raster phổ biến

  Tên định dạng  Dạng file  Mô tả 
  GeoTIFF .TIF
.TIFF
.OVR

GeoTIFF là định dạng tiêu chuẩn cho dữ liệu raster dùng trong các ứng dụng GIS và viễn thám. GeoTIFF có thể đi kèm với các tệp khác:

.TFW cung cấp thông tin địa lý

.XML tùy chọn đi kèm với GeoTIFF chứa metadata

. AUX lưu trữ các phép chiếu và thông tin khác

.OVR giúp cải thiện hiệu suất cho hiển thị raster

  American Standard Code for Information Interchange ASCII Grid .ASC ASCII sử dụng một tập hợp các số (bao gồm cả số thực) từ 0 đến 255 để lưu trữ và xử lý thông tin. Chúng cũng chứa thông tin tiêu đề với một tập hợp các từ khóa. Các tập hợp số được phân tách bằng dấu phẩy, dấu cách hoặc dấu tab. File ASCII có thể được chuyển đổi sang dạng file ảnh.
  Envi RAW Raster .BIL
.BIP
.BSQ

Là định dạng mặc định trong phần mềm xử lý ảnh viễn thám ENVI, lưu trữ hình ảnh vệ tinh đơn và đa băng tần.

.BIL (Band Interleaved for Line): lưu trữ thông tin các hàng cho tất cả các kênh (Hàng 1 của kênh 1 kênh 2,..; hàng 2 của kênh 1 kênh 2…). Tệp BIL bao gồm tệp tiêu đề (HDR) mô tả số lượng cột, hàng, dải, độ sâu bit và bố cục trong một ảnh.

.BIP (Band Interleaved by Pixel): lưu trữ các giá trị pixel cho từng kênh ảnh theo hàng.

.BSQ (Band Sequence): các kênh phổ được lưu tuần tự, hết kênh này đến kênh khác

  PCI Geomatics Database File (PCIDSK)

.PIX

Được phát triển bởi PCI Geomatics. Đây là một loại tệp linh hoạt lưu trữ tất cả dữ liệu hình ảnh và dữ liệu bổ trợ được gọi là “phân đoạn” trong một file. Ví dụ: các phân đoạn có thể bao gồm các kênh hình ảnh, thông tin biểu đồ, v.v.

PIX là 1 file cơ sở dữ liệu có thể chứa các kênh ảnh với các độ sâu bit khác nhau, và các phép chiếu, thông tin thuộc tính, metadata và dữ liệu vector.

  ERDAS Imagine (IMG) .IMG

Là một định dạng tệp độc quyền được phát triển bởi Hexagon Geospatial. Các tệp IMG thường được sử dụng cho dữ liệu raster để lưu trữ dữ liệu vệ tinh đơn và nhiều dải.

Tệp IMG sử dụng định dạng phân cấp (HFA) lưu trữ các giá trị dữ liệu của các kênh ảnh (bao gồm phép chiếu, số liệu thống kê, thuộc tính, v.v.) và thông tin khác như điểm kiểm soát mặt đất, loại cảm biến.

Các định dạng raster khác còn có Esri Grid, IDRISI Raster (.RST, .RDC), v.v.

Ngoài 2 loại dữ liệu cơ bản kể trên, còn có các định dạng khác như raster dạng nén (Joint Photographic Experts Group JPEG2000 .jp2), cơ sở dữ liệu địa lý (Esri File Geodatabase .gdb, OGC GeoPackage .gpkg), hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS) Enterprise (PostGIS + PostgreSQL), LiDAR File Formats (Point Cloud XYZ .xyz), Cad file format (Autodesk Drawing .DWF, .DWG, .DXF), dữ liệu độ cao (USGS DEM, Canadian CDED .DEM), web file format (GeoRSS URL .XML), Định dạng dữ liệu phân cấp (Hierarchical Data Format .hdf), GIS Software Project File Formats (QGIS 2.X Project File .QGS), Định dạng tệp bản đồ (QGIS Layer Definition File .QLR), 3D file format (Trimble Sketchup .skp), Indoor Mapping File Formats (Revit BIM .RVT, .NWD và .DWG),.v..v..

Nguồn: GisGeography