Hệ thông tin địa lý - Chương 3: Mô hình và cấu trúc dữ liệu không gian

pdf 43 trang vanle 1850
Bạn đang xem 20 trang mẫu của tài liệu "Hệ thông tin địa lý - Chương 3: Mô hình và cấu trúc dữ liệu không gian", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfhe_thong_tin_dia_ly_chuong_3_mo_hinh_va_cau_truc_du_lieu_kho.pdf

Nội dung text: Hệ thông tin địa lý - Chương 3: Mô hình và cấu trúc dữ liệu không gian

  1. Chương 3 MÔ HÌNH VÀ CẤU TRÚC DỮ LIỆU KHÔNG GIAN
  2. 3.1. GIỚI THIỆU Dữ liệu GIS Thế giới thực -Truy vấn thơng tin -Cập nhật dữ liệu -Phân tích, mơ hình hĩa -Hiển thị, xuất dữ liệu Thực thể không gian (spatial entity) là sự vật, hiện tượng tồn tại trong thế giới thực. Đối tượng không gian (spatial object) là những thực thể không gian được biểu diễn trong máy tính. Biên soạn: GV. Phạm Thế Hùng
  3. 3.1. GIỚI THIỆU Vai trò của mô hình dữ liệu trong GIS Biên soạn: GV. Phạm Thế Hùng
  4. 3.1. GIỚI THIỆU Mô hình không gian là sự đơn giản hoá thế giới thực, là tập những phần tử biểu diễn các thực thể không gian trong thế giới thực. Mô hình dữ liệu không gian tương ứng với tập các nguyên tắc để chuyển thế giới thực thành các đối tượng không gian được miêu tả một cách logic. Biên soạn: GV. Phạm Thế Hùng
  5. 3.1. GIỚI THIỆU Dữ liệu số về các đối tượng không gian được biểu diễn trong máy tính dưới dạng nhị phân theo mô hình raster hoặc vector. - Mô hình raster biểu diễn các thực thể theo một bề mặt liên tục - Mô hình vector biểu diễn các thực thể theo một bề mặt rời rạc Biên soạn: GV. Phạm Thế Hùng
  6. 3.1. GIỚI THIỆU Mô hình raster: các đối tượng không gian được chia thành những ô lưới bằng nhau gọi là điểm ảnh (pixel), mỗi điểm ảnh chỉ có một thuộc tính. Mô hình vector: các đối tượng không gian được biểu diễn như những điểm, đường, vùng. Biên soạn: GV. Phạm Thế Hùng
  7. 3.2. MÔ HÌNH DỮ LIỆU RASTER Mô hình dữ liệu Raster sử dụng một mạng lưới các ô (hình vuông, tam giác hoặc lục giác) được gọi là các pixel để thể hiện các đối tượng không gian. The raster data model uses an array of cells, or pixels, to represent real-world objects. The cells can hold any attribute values based on one of several encoding schemes including categories, and integer and floating- point numbers. Biên soạn: GV. Phạm Thế Hùng
  8. 3.2. MÔ HÌNH DỮ LIỆU RASTER Dữ liệu Raster khu vực bán đảo Olympic, bang Washington, Mỹ. Biên soạn: GV. Phạm Thế Hùng
  9. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.1. Mô tả cấu trúc Cấu trúc dữ liệu raster có hai đặc điểm cần lưu ý: - Mỗi điểm ảnh chỉ biểu diễn một thuộc tính, xác định bởi giá trị f(x,y). - Khi thay đổi độ phân giải (kích thước điểm ảnh thay đổi), dung lượng dữ liệu thay đổi theo. Dung lượng dữ liệu tăng theo bình phương tỉ lệ gia tăng độ phân giải. Biên soạn: GV. Phạm Thế Hùng
  10. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.2. Đặc tính hình học Đối tượng điểm (Point objects): Số pixel i Số hàng j (i,j) = (5,3);(7,5);(8,2) Biên soạn: GV. Phạm Thế Hùng
  11. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.2. Đặc tính hình học Đối tượng đường (Line objects): (1,3);(2,2);(3,2) ;(4,3); (5,4) ;(6,5) ;(7,5) ;(8,4) Biên soạn: GV. Phạm Thế Hùng
  12. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.2. Đặc tính hình học Đối tượng vùng (Polygon objects): Biên soạn: GV. Phạm Thế Hùng
  13. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.3. Kỹ thuật nén dữ liệu Raster Để tăng hiệu quả trong việc lưu trữ dữ liệu Raster, nhiều kỹ thuật nén dữ liệu Raster đã được nghiên cứu và đề xuất: - Mã hóa đoạn chạy (run-length encoding) - Mã hóa khối (block encoding) - Mã hóa sóng (wavelet encoding) - Mã hóa cây tứ phân (quadtrees encoding) Biên soạn: GV. Phạm Thế Hùng
  14. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.4. Định dạng file đối với dữ liệu không gian raster Cấu trúc dữ liệu raster được thực hiện dưới nhiều định dạng số khác nhau: - GRID: Định dạng của ESRI dùng để lưu trữ và xử lý dữ liệu raster. - Định dạng công nghiệp chuẩn: JPEG, TIFF và MrSID dùng trong hiển thị nhưng không phân tích được (phải chuyển thành GRID). Biên soạn: GV. Phạm Thế Hùng
  15. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.4. Định dạng file đối với dữ liệu không gian raster Khi hiển thị đồng thời với dữ liệu vector, đòi hỏi phải có thông tin tọa độ tham chiếu (georeferencing information) - TIFF image.tiff image.tfw - Bitmap image.bmp image.bpw - BIL image.bil image.blw - JPEG image.jpg image.jpw Geotiff là định dạng chứa cả ảnh và thông tin tham chiếu trong cùng 1 file. Biên soạn: GV. Phạm Thế Hùng
  16. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.4. Định dạng file đối với dữ liệu không gian raster Cấu trúc của tập tin tham chiếu: dạng ASCII gồm 6 dòng  Dòng 1: Kích thước theo hướng x của pixel đơn vị bản đồ (A)  Dòng 2: Góc xoay quanh trục y (D)  Dòng 3: Góc xoay quanh trục x (B)  Dòng 4: Kích thước âm theo hướng y của pixel theo đơn vị bản đồ (E)  Dòng 5: Tọa độ x của tâm pixel trên trái (C)  Dòng 6: Tọa độ y của tâm pixel trên trái (F) - Công thức tính chuyển: X = Ax + By + C 1 x1, y1: tọa độ pixel theo đơn vị bản đồ Y1 = Dx + Ey + F x, y: cột và hàng của pixel trên ảnh Biên soạn: GV. Phạm Thế Hùng
  17. 3.3. CẤU TRÚC DỮ LIỆU RASTER 3.3.4. Định dạng file đối với dữ liệu không gian raster Ví dụ:  20.17541308822119 A  0.00000000000 D  0.00000000000 B  -20.17541308822119 E  424178.11472601280548 C  4313415.90726399607956 F - Với pixel trên ảnh có tọa độ (3,4) thì Pixel có tọa độ bản đồ là: (424238.640965277, 431335.20561164) Biên soạn: GV. Phạm Thế Hùng
  18. 3.4. MÔ HÌNH DỮ LIỆU VECTOR Mô hình dữ liệu vector sử dụng các đối tượng điểm, đường, vùng để biểu diễn các thực thể không gian. In the vector data model each object in the real world is first classified into a geometric type: in the 2-D case point, line, or polygon. Points (e.g., wells, soil pits, and retail stores) are recoded as single coordinate pairs, lines (e.g., roads, streams, and geologic faults) as a series of ordered coordinate pairs (also called polylines), and polygons (census tracts, soil areas, and oil license zones) as one or more line segments that close to form a polygon area. Biên soạn: GV. Phạm Thế Hùng
  19. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.1. Mô tả cấu trúc Các đối tượng không gian khi biểu diễn ở cấu trúc vector thường tổ chức dưới dạng điểm, đường và vùng trên một hệ thống tọa độ xác định. Mỗi điểm được xác định bởi một cặp toạ độ (x,y); đường được xác định bởi một chuỗi liên tiếp các điểm {(x1, y1),(x2, y2), ,(xn,yn)} và vùng được xác định bởi những đường khép kín. Hai cấu trúc dữ liệu Vector thông dụng là cấu trúc Spaghetti và cấu trúc Topology. Biên soạn: GV. Phạm Thế Hùng
  20. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.2. Đặc tính hình học Các đối tượng trong không gian được phân loại thành 3 dạng: - Đối tượng điểm: Điểm dùng cho tất cả các đối tượng không gian được biểu diễn như một cặp tọa độ (x,y). - Đối tượng đường: Đường được dùng để biểu diễn tất cả các đối tượng có dạng tuyến, được tạo nên từ hai hoặc nhiều cặp tọa độ (x,y). - Đối tượng vùng: Vùng là một đối tượng hình học hai chiều Biên soạn: GV. Phạm Thế Hùng
  21. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.2. Đặc tính hình học Điểm Vùng Đường Đường cong Biên soạn: GV. Phạm Thế Hùng
  22. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.3. Cấu trúc Spaghetti - Điểm được xác định bằng một cặp tọa độ (x,y), - Đường được biểu diễn bằng một chuỗi những cặp toạ độ (xi,yi). - Vùng được xác định bởi một cung khép kín và được biểu diễn bằng một chuỗi cặp tọa độ (xi,yi) có tọa độ đầu và tọa độ cuối trùng nhau. Biên soạn: GV. Phạm Thế Hùng
  23. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.3. Cấu trúc Spaghetti A(x ,y ) A A Đặc trưng Vị trí Điểm A (x ,y ) A A Cung AB (x ,y ), (x ,y ), . . . , (x ,y ). 1 2 A A 1 1 B B Vùng 1 (x ,y ), (x ,y ), . . . , 1A 1A 11 11 (x ,y ), (x ,y ), (x ,y ), . 1i 1i 1B 1B 1j 1j . . , (x ,y ). B(xA,yA) 1A 1A Vùng 2 (x ,y ), (x ,y ), . . . , 2A 2A 21 21 (x ,y ), (x ,y ), (x ,y ), . 2i 2i 2B 2B 2j 2j . . , (x ,y ). 2A 2A Biên soạn: GV. Phạm Thế Hùng
  24. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.3. Cấu trúc Spaghetti Cấu trúc không ghi nhận đặc trưng kề nhau của hai vùng kề nhau, nghĩa là tại đường chung của hai vùng kề nhau có hai đường độc lập. Cấu trúc Spaghetti được sử dụng để lập bản đồ số rất tốt, nhưng không thích hợp cho các bài toán phân tích GIS vì không mô tả được các quan hệ không gian. Biên soạn: GV. Phạm Thế Hùng
  25. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.4. Cấu trúc Topology Tính topology rất cần thiết trong quá trình phân tích không gian. Topology thể hiện mối quan hệ hoặc sự liên kết giữa các đối tượng trong không gian. Topology là một phương pháp toán học dùng để xác định các quan hệ không gian. Biên soạn: GV. Phạm Thế Hùng
  26. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.4. Cấu trúc Topology Cấu trúc topology còn được gọi là cấu trúc cung- nút (arc-node) với phần tử cơ bản là cung. Mỗi cung được mô tả như là một chuỗi những đoạn thẳng nối liền nhau, điểm đầu và cuối cung gọi là nút (node), những điểm giữa cung gọi là đỉnh (vertex). Nút là điểm giao nhau của hai hay nhiều cung, đối với những cung độc lập, nút là điểm cuối cùng của cung, không nối liền với bất kỳ cung nào khác. Biên soạn: GV. Phạm Thế Hùng
  27. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.4. Cấu trúc Topology Vùng là một chuỗi những cung nối liền nhau và khép kín, những cung này chính là đường biên của vùng. Một vùng có thể được giới hạn bởi hai đường cong khép kín lồng vào nhau và không cắt nhau. Các đối tượng địa lý trong cấu trúc topology được mô tả trong bốn bảng: - Ba bảng đầu lưu trữ các phần tử không gian vùng, nút, cung. - Bảng thứ tư lưu trữ tọa độ nút, nút cuối và đỉnh. Biên soạn: GV. Phạm Thế Hùng
  28. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.4. Cấu trúc Topology 70 a3 N1 a1 60 50 N2 a3 A 40 E N4 a5 30 N3 a7 B 20 D,a6,N5 a7 a7 a2 a2 C a7 N6 10 a2 0 0 10 20 30 40 50 60 70 Biên soạn: GV. Phạm Thế Hùng
  29. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.4. Cấu trúc Topology Topology cung Cung Nút đầu Nút cuối Vùng trái Vùng phải Topology vùng a1 N1 N2 E A a2 N2 N3 E B Vùng Cung a3 N3 N1 E A A a1, a5, a3 a4 N4 N1 A A B a2, a5, 0, a6, 0, a7 a5 N3 N2 A B C a7 a6 N5 N5 B B D a6 a7 N6 N6 B C E vùng ngoài Dữ liệu toạ độ cung Topology nút Cung Nút đầu Đỉnh (vertex) Nút cuối (x,y) (x,y) (x,y) Nút Cung a1 40,60 70,60 70,50 N1 a1, a3, a4 a2 70,50 70,10;10,10 10,25 N2 a1, a2, a5 a3 10,25 10,60 40,60 N3 a2, a3, a5 a4 40,60 30,50 30,40 N4 a4 a5 10,25 20,27;30,30;50,32 70,50 N5 a6 a6 30,20 30,20 N6 a7 a7 55,27 55,15;40,15;45,27 55,27 Biên soạn: GV. Phạm Thế Hùng
  30. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.4. Cấu trúc Topology 70 N4 a7 60 a1 50 A a6 F D N2 a5 a8 N6 40 N1 a3 a10 N8 N5 a9 30 a12 a4 C N7 20 B E a2 N9 10 N3 a11 0 0 10 20 30 40 50 60 70 Biên soạn: GV. Phạm Thế Hùng
  31. 3.5. CẤU TRÚC DỮ LIỆU VECTOR 3.5.5. Định dạng file phổ biến AutoCAD (.dxf): định dạng của hãng Autodesk Coverage: định dạng dữ liệu vector của ArcInfo, 1981 Shapefile: ESRI giới thiệu với ArcView, 1993, có 3 file chính: .SHP; .SHX và .DBF TAB: định dạng của MapInfo, có 4 file chính: .TAB; .DAT; .ID và .MAP Geodatabase: định dạng mới được với thiệu với ArcGIS 8.0, 2000, gồm có: Personal Geodatabase (.mdb), File Geodatabase và Enterprise Geodatabase. Biên soạn: GV. Phạm Thế Hùng
  32. 3.6. MÔ HÌNH DỮ LIỆU TIN Mô hình mạng lưới các tam giác bất đồng dạng (TIN) được dùng để thể hiện các đối tượng bề mặt trong không gian 2,5-D hoặc 3-D (bề mặt địa hình, thang tầng địa chất, ). Mô hình TIN được thành lập dựa trên mô hình dữ liệu vector thông qua 3 giá trị x,y (tọa độ) và z (độ cao). A triangulated irregular network (TIN) is a digital data structure used in GIS for the representation of a surface. A TIN is a vector-based representation of the physical land surface or sea bottom, made up of irregularly distributed nodes and lines with three-dimensional coordinates (x, y, and z) that are arranged in a network of non-overlapping triangles. Biên soạn: GV. Phạm Thế Hùng
  33. 3.6. MÔ HÌNH DỮ LIỆU TIN Cấu trúc dữ liệu mô hình TIN (Nguồn: Zeiler 1999) Biên soạn: GV. Phạm Thế Hùng
  34. 3.6. MÔ HÌNH DỮ LIỆU TIN Ứng dụng của mô hình TIN A) Bản đồ nguy cơ lở đất ở Ý; B) Sông Trường Giang ở Trung Quốc (Nguồn: Paul A. Longley, 2005) Biên soạn: GV. Phạm Thế Hùng
  35. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Tobler's first law of geography: - "Everything is related to everything else, but near things are more related than distant things." - Mọi đối tượng đều có mối quan hệ với nhau nhưng những đối tượng ở gần thì sẽ quan hệ nhiều hơn những đối tượng ở xa. Biên soạn: GV. Phạm Thế Hùng
  36. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Quan hệ điểm-điểm - “Trong giới hạn (is within)”: Nằm trong giới hạn một khoảng cách cụ thể. - “Gần nhất với (is nearest to)”: Gần nhất so với một điểm cụ thể. Ví dụ ? Biên soạn: GV. Phạm Thế Hùng
  37. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Quan hệ điểm-đường - “Nằm trên đường (on line)”: điểm nằm trên một đường. - “Gần nhất với (is nearest to)”: Điểm gần nhất so với một đường. Ví dụ? Biên soạn: GV. Phạm Thế Hùng
  38. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Quan hệ điểm-vùng - “Chứa bên trong vùng (is contained in)”: Điểm chứa bên trong vùng. - “Nằm trên biên (on border of area)”: Một điểm nằm trên đường biên của vùng. Ví dụ? Biên soạn: GV. Phạm Thế Hùng
  39. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Quan hệ đường-đường - “Giao nhau (intersects)”: Hai đường giao nhau. - “Băng qua (crosses)”: Hai đường băng qua mà không giao nhau. - “Chảy vào (flow into)”: Một nhánh sông chảy vào một dòng sông. Ví dụ? Biên soạn: GV. Phạm Thế Hùng
  40. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Quan hệ đường-vùng - “Giao nhau (intersects)”: Một đường giao (cắt) với một vùng. - “Đường biên (borders)”: Đường là một phần biên của vùng. Ví dụ? Biên soạn: GV. Phạm Thế Hùng
  41. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Quan hệ vùng-vùng - “Chồng lớp (overlaps)”: Hai vùng chồng lên nhau. - “Nằm bên trong (is within)”: Một vùng nằm bên trong một vùng khác. - “Kế cận (is adjacent to)”: Hai vùng cùng có một đường biên chung. Ví dụ? Biên soạn: GV. Phạm Thế Hùng
  42. 3.7. MỐI QUAN HỆ GIỮA CÁC ĐỐI TƯỢNG KHÔNG GIAN Biên soạn: GV. Phạm Thế Hùng
  43. 3.8. SO SÁNH GIỮA RASTER VÀ VECTOR Raster Vector Cấu trúc dữ liệu Đơn giản Phức tạp Dung lượng Lớn Bé Chất lượng đồ họa Trung bình Tốt Chồng lớp Đơn giản Phức tạp Phân tích mạng Không Dễ dàng Độ chính xác hình học Thấp Cao Topology Khó khăn Dễ dàng Phân tích không gian Đơn giản Phức tạp Biên soạn: GV. Phạm Thế Hùng