Giống như bất kỳ dữ liệu nào khác, dữ liệu GIS không hoàn hảo, nó có thể chứa lỗi hoặc không chính xác dẫn đến kết quả phân tích GIS bị ảnh hưởng.                                                                                                                                                                                      

Một số lỗi phổ biến trong dữ liệu GIS bao gồm nguồn dữ liệu không đầy đủ, dữ liệu quá cũ, hạn chế trong phương pháp thu thập dữ liệu nên dữ liệu không hoàn chỉnh, thao tác lỗi khi nhập hoặc chuyển đổi dữ liệu, các phép đo không chính xác ….

Khi làm việc với dữ liệu GIS cần hiểu rằng sai sót, thiếu chính xác và thiếu thông tin có thể ảnh hưởng đến chất lượng của các dự án. Những lỗi này có thể khiến cho các kết quả phân tích trong dự án GIS trở nên vô ích. Hiểu được thành phần, bản chất và những lỗi nội tại trong dữ liệu GIS là rất quan trọng khi phân tích dữ liệu không gian. 

Sức mạnh của GIS nằm ở khả năng kết hợp nhiều loại dữ liệu liên quan đến cùng một khu vực địa lý để tích hợp các bộ dữ liệu khác nhau vào một hệ thống, từ đó dễ dàng thao tác phân tích, xử lý và sử dụng dữ liệu hiệu quả.

Khi một tập dữ liệu mới được tải vào ứng dụng phần mềm GIS, phần mềm không chỉ nhập dữ liệu mà còn nhập cả lỗi chứa trong dữ liệu đó. Do đó, việc làm đầu tiên để giải quyết lỗi là nhận biết sự tồn tại của nó và hiểu những hạn chế của dữ liệu đang sử dụng.

Độ chính xác và chuẩn xác

Độ chính xác và độ chuẩn xác đều là những khía cạnh quan trọng của chất lượng dữ liệu GIS, nhưng có sự khác nhau giữa hai thuật ngữ này.

Độ chính xác là mức độ gần nhất mà thông tin trên bản đồ khớp với các giá trị thực tế. Do đó, khi đề cập đến độ chính xác, chúng ta đang nói về chất lượng dữ liệu và số lượng lỗi có trong một tập dữ liệu nhất định.

Trong dữ liệu GIS, độ chính xác có thể là vị trí địa lý, nhưng nó cũng có thể là độ chính xác thuộc tính hoặc khái niệm.

Sự chuẩn xác đề cập đến mức độ chính xác của mô tả dữ liệu. Dữ liệu chuẩn có thể không chính xác vì nó có thể được mô tả chuẩn nhưng được thu thập không chính xác. (Có thể người khảo sát đã nhầm lẫn hoặc dữ liệu khi được ghi vào cơ sở dữ liệu bị sai).

do chinh xac và chuan xac trong du lieu gis

Hình ảnh trên cho thấy rõ sự khác biệt về độ chuẩn xác và độ chính xác. Đường chéo của mỗi hình ảnh biểu thị giá trị thực của thực thể và các chấm màu xanh biểu thị giá trị đo.

Hiểu được cả độ chuẩn xác và chính xác là rất quan trọng để đánh giá giá trị của tập dữ liệu GIS. Khi một tập dữ liệu không chính xác nhưng có độ chuẩn xác cao, có thể thực hiện các biện pháp khắc phục để điều chỉnh tập dữ liệu sao cho chính xác hơn.

Nguyên nhân dẫn đến sự thiếu chính xác và thiếu chuẩn xác

Một số lỗi trong dữ liệu GIS rất rõ ràng, trong khi những lỗi khác có thể khó tìm ra nguồn gốc. Dưới đây là một số lỗi thường gặp với dữ liệu GIS:

Tỷ lệ của dữ liệu GIS

Tỷ lệ là ví dụ về lỗi cố hữu trong bản đồ học; tùy thuộc vào tỷ lệ được sử dụng, các loại dữ liệu khác nhau sẽ được biểu thị với số lượng và mức độ tổng quát hóa khác nhau. Người vẽ bản đồ phải luôn điều chỉnh tỷ lệ dữ liệu theo mức độ chi tiết cần thiết của dự án. 

“Tuổi” của dữ liệu GIS

Tuổi của dữ liệu có thể là một nguyên nhân gây lỗi khác, khi nguồn dữ liệu quá cũ, một số hoặc phần lớn thông tin đã thay đổi. Do đó, khi sử dụng dữ liệu cũ cho các bài toán phân tích không gian hiện tại phải hết sức lưu ý. 

Lỗi định dạng dữ liệu GIS

Có một số lỗi phát sinh trong quá trình định dạng dữ liệu trước khi xử lý. Những bước chuyển đổi về tỷ lệ, phép chiếu, nhập/xuất từ ​​raster sang vector, v.v.  là các ví dụ  lỗi định dạng có thể xảy ra.

Lỗi thuộc tính

Các lỗi về số lượng và chất lượng có thể dễ dàng xác định được. Lỗi phổ biến thường xảy ra với việc dán nhãn hoặc gắn thuộc tính cho đối tượng.

Ví dụ: một vùng đất nông nghiệp có thể bị đánh dấu không chính xác trên bản đồ là đầm lầy. Người đọc bản đồ có thể không nhận ra điều này do không quen thuộc với ký hiệu hoặc không làm việc trong lĩnh vực này.

Sai số định lượng cũng có thể xảy ra khi sử dụng thiết bị chưa được hiệu chuẩn đúng cách, tạo ra các sai số khác khó phát hiện và khiến dự án của bạn mất đi độ chính xác và độ tin cậy.

Độ chính xác vị trí của dữ liệu GIS

Cần lưu ý đến những gì đã được xác định là chính xác về vị trí, điều này phụ thuộc vào loại dữ liệu GIS. Người vẽ bản đồ có thể xác định chính xác một số đặc điểm nhất định như đường, đường ranh giới, v.v. nhưng các dữ liệu khác như loại đất, khí hậu thì khó xác định chính xác vị trí hơn, có thể chỉ là vị trí gần đúng dựa trên ước tính của người vẽ bản đồ.

Lỗi tôpô

Các lỗi tôpô thường xảy ra trong quá trình số hóa hoặc tạo dữ liệu GIS dẫn đến lỗi về các nút đa giác hoặc xuất hiện các đa giác và vòng lặp kỳ lạ, đồng thời cũng có thể có một số lỗi liên quan đến bản đồ nguồn bị hỏng.

Tổng quát hóa dữ liệu GIS

Khái quát hóa trong GIS là khi sự chi tiết bộ dữ liệu GIS bị giảm, khái quát hóa tạo ra lỗi bằng cách loại bỏ các khía cạnh của một tính năng. Một lỗi cố ý khác là việc đăng ký nhãn hiệu đôi khi được tìm thấy trong các bộ dữ liệu của các nhà cung cấp GIS thương mại. Ví dụ: nhà cung cấp dữ liệu GIS có thể chèn các đường phố hoặc tên đường giả vào tập dữ liệu. Loại lỗi cố ý này trong bộ dữ liệu GIS được gọi là “bẫy bản đồ”.

Lỗi tiềm ẩn trong bộ dữ liệu GIS

Khi cần sử dụng nhiều nguồn dữ liệu, việc thiếu chính xác, chuẩn xác và lỗi là điều khó tránh khỏi vì các lỗi nối tiếp nhau, làm tăng thêm ảnh hưởng đến việc phân tích và toàn bộ dự án.

Điều quan trọng là phải nhận ra rằng dữ liệu GIS luôn có một mức độ không chắc chắn và sai sót nhất định, đồng thời phải thực hiện các bước để giảm thiểu và giải thích những sai sót này khi tiến hành phân tích GIS. Điều này có thể cần sử dụng nhiều nguồn dữ liệu, xác thực và kiểm tra chéo dữ liệu cũng như minh bạch về những hạn chế hoặc giả định trong phân tích.

Sử dụng siêu dữ liệu là một trong những việc đầu tiên mà bất kỳ người dùng GIS nào cũng nên tham khảo để biết thêm về dữ liệu mình đang sử dụng và để tránh tạo thêm lỗi. Khi làm việc với bất kỳ tập dữ liệu nào cũng cần quan tâm đến một số thông tin cơ bản như tuổi của dữ liệu, nguồn gốc, phạm vi dữ liệu, tỷ lệ, hệ tham chiếu, độ chính xác, định dạng, v.v.

Nguồn tham khảo: https://www.geographyrealm.com/gis-data-a-look-at-accuracy-precision-and-types-of-errors/