Hướng dẫn geospatial python - trăn địa không gian

Book description

Nội dung chính ShowShow

  • Book description
  • Chương 1. Giới thiệu về phân tích không gian địa lýIntroduction to Geospatial Analytics
  • Khung khái niệm cho khoa học dữ liệu không gian
  • Địa điểm là đối tượng [điểm, đường và đa giác]
  • Đánh giá và chọn dữ liệu
  • R hay Python có tốt hơn cho GIS không?
  • Là một thư viện Python được sử dụng để trực quan hóa dữ liệu không gian địa lý?
  • 3 loại dữ liệu không gian địa lý là gì?
  • Tại sao Python có giá trị để phân tích GIS?

In spatial data science, things in closer proximity to one another likely have more in common than things that are farther apart. With this practical book, geospatial professionals, data scientists, business analysts, geographers, geologists, and others familiar with data analysis and visualization will learn the fundamentals of spatial data analysis to gain a deeper understanding of their data questions.

Author Bonny P. McClain demonstrates why detecting and quantifying patterns in geospatial data is vital. Both proprietary and open source platforms allow you to process and visualize spatial information. This book is for people familiar with data analysis or visualization who are eager to explore geospatial integration with Python.

This book helps you:

  • Understand the importance of applying spatial relationships in data science
  • Select and apply data layering of both raster and vector graphics
  • Apply location data to leverage spatial analytics
  • Design informative and accurate maps
  • Automate geographic data with Python scripts
  • Explore Python packages for additional functionality
  • Work with atypical data types such as polygons, shape files, and projections
  • Understand the graphical syntax of spatial data science to stimulate curiosity

Chương 1. Giới thiệu về phân tích không gian địa lýIntroduction to Geospatial Analytics

Khung khái niệm cho khoa học dữ liệu không gian

Địa điểm là đối tượng [điểm, đường và đa giác]

Đánh giá và chọn dữ liệu

R hay Python có tốt hơn cho GIS không?

Là một thư viện Python được sử dụng để trực quan hóa dữ liệu không gian địa lý?Map of Manhattan from 1870

3 loại dữ liệu không gian địa lý là gì?

Hình 1-2. Bản đồ Manhattan đương đại được chỉnh sửaRectified contemporary Manhattan mapRectified contemporary Manhattan map

Có nhiều cơ hội cho các chuyên gia trong nhiều ngành công nghiệp bao gồm trí thông minh vị trí trong phân tích của họ. Vị trí Trí thông minh mô tả thông tin có thể hành động xuất phát từ việc khám phá các mối quan hệ không gian địa lý khi xây dựng câu hỏi dữ liệu và đánh giá các giả thuyết. Các công cụ nguồn mở đang chào đón người dùng cuối mới, và những gì chúng ta cần là một từ vựng áp dụng cho vô số lợi ích, tài nguyên và phả hệ khác nhau. Có, các giải pháp doanh nghiệp rất mạnh mẽ, nhưng nhiều người có quyền truy cập hạn chế vào các ứng dụng và công cụ dựa trên đăng ký. Có một loạt các tùy chọn trong phần mềm Hệ thống thông tin địa lý [GIS] với những ưu và nhược điểm được liên kết với tất cả chúng. Tôi sẽ đề cập đến một số ít khi họ xuất hiện, nhưng mặc dù tôi có quyền truy cập vào ArcGIS và QGIS [Qua lượng tử GIS], tôi muốn đưa QGIS vào sân khấu chính. Nó thực sự là nguồn mở, có nghĩa là bạn không cần cấp độ cấp phép khác nhau để truy cập vào tất cả các công cụ có sẵn. Vì cuốn sách này được dành cho nhiều lợi ích, tôi muốn bạn có thể khám phá tất cả các công cụ. Trong công việc chuyên nghiệp của tôi, vâng, tôi sẽ di chuyển giữa cả ArcGIS và QGIS - chủ yếu để truy cập vào danh mục dồi dào của bộ dữ liệu GIS trong ArcGIS Online. Tôi đã phải học một cách khó khăn khi mã hóa địa lý trong ArcGIS. ArcGIS sử dụng một hệ thống tín dụng, và tôi vô tình không biết đi sai của nó. Tôi đã nhận ra rằng dịch vụ được trả tiền đã khởi động khá tự động khi tôi tải lên tệp CSV với dữ liệu vị trí. QGIS, mặt khác, cung cấp hai tùy chọn chúng tôi sẽ khám phá sau - cả hai miễn phí.

Các đa giác trên bản đồ trong Hình & NBSP; 1-3 là các màu khác nhau tương ứng với các loại chủng tộc. Chúng ta có thể xác định điều gì về các cụm này nếu chúng ta cũng kiểm tra các thuộc tính khác? Hãy để ngồi với những câu hỏi này trong một thời gian. Tôi sẽ cho bạn một gợi ý: Quỷ dữ ở trong các chi tiết, hoặc tôi nên nói, là trong các lớp. Các đa giác được tô bóng dựa trên các khu vực mà một chủng tộc nhất định là dân số đa số. Đây là một nơi tốt để giới thiệu các mặc định biểu thức không nên là điểm cuối. Sự hiểu biết sâu sắc hơn về GIS sẽ cho phép bạn tránh xa các cài đặt mặc định và tạo ra những hiểu biết độc đáo và sâu sắc hơn.

Hình 1-3. Chủng tộc và sự đa dạng [ArcGIS]Race and diversity [ArcGIS]Race and diversity [ArcGIS]

Phân tích dữ liệu không gian 101 cho chúng ta biết rằng bất kỳ phân tích nào cũng yêu cầu một câu hỏi được xác định. Khi bạn đưa ra câu hỏi, bạn có thể khám phá liệu có dữ liệu sẽ giúp bạn trả lời hoặc giải quyết giả thuyết. Tôi không có nghĩa là dữ liệu được chọn anh đào, nhưng tất cả các dữ liệu bắt buộc phải định hình một giả thuyết hoặc tạo ra một cái nhìn sâu sắc. Chủng tộc nên được đối xử như một ủy quyền sinh học nghèo nàn cho một thứ khác hoặc như một cấu trúc xã hội hoặc chính trị? Chúng ta cần hiểu các biến mà chúng ta đã thu thập được để có thể quản lý sự đồng cảm, tiết lộ các lỗ hổng chính sách hoặc giải quyết các nhu cầu sức khỏe chưa được đáp ứng. Chúng ta có thể cần phải cải cách câu hỏi của mình nếu phải đối mặt với dữ liệu hoặc tài nguyên bị thiếu mà chúng ta không thể truy cập.

Khi bạn làm quen với dữ liệu điều tra dân số, bạn bắt đầu hiểu cuộc đua nặng nề đã được yêu cầu hoàn thành. Khả năng kiểm tra dữ liệu tại chỗ [nhà ở, việc làm, giao thông và giáo dục để đặt tên cho một số] làm sáng tỏ vai trò của dữ liệu không gian và đưa ra sự tích hợp của tôi về các ứng dụng không gian địa lý như ArcGIS và QGIS vào các cuộc nói chuyện của tôi về nghèo đói, sự bất công chủng tộc, các yếu tố quyết định cấu trúc sức khỏe, và một loạt các câu hỏi mới tiếp tục xuất hiện. Khi bạn dựa vào bảng tính hoặc bảng dữ liệu, tôi sẽ tranh luận trong trường hợp không có những cân nhắc về không gian, bạn có thể bỏ lỡ những hiểu biết quan trọng. Các số liệu tĩnh như nơi có một con đường có thể được đặt, hoặc tọa độ của một sự kiện cụ thể hoặc các biện pháp động như sự lây lan của một bệnh truyền nhiễm trở nên mạnh mẽ hơn khi được tích hợp với trí thông minh vị trí.

Một vấn đề được giải quyết duy nhất bằng phân tích không gian kiểm tra các mối quan hệ giữa các tính năng được xác định trong một ranh giới địa lý. Ví dụ, dữ liệu phi địa lý mô tả cách các giá trị được phân phối-và chúng ta có thể dựa vào số liệu thống kê mô tả. Nhưng điều gì sẽ xảy ra nếu chúng ta tò mò về các mối quan hệ không gian tác động có thể có đối với các giá trị này?

Thoạt nhìn, chúng ta có thể đánh giá cao các biến số cuộc đua cấp quận từ Khảo sát Cộng đồng Hoa Kỳ. Chúng ta có thể thấy các cụm biến phân loại, nhưng chúng ta có biết gì khác không? Đây là những loại chiếm ưu thế trong mỗi khu vực, nhưng chúng ta có thể muốn biết gì khác? Đây là nơi dữ liệu không gian địa lý trở nên rất có giá trị.

Ghi chú

Khảo sát Cộng đồng Hoa Kỳ hàng năm [ACS] đã thay thế hình thức dài của cuộc điều tra dân số Dec Years xuất hiện vào năm 2005 và chứa nhiều câu hỏi khác nhau để xác định nhân khẩu học thay đổi để thu thập thông tin về cộng đồng địa phương.

Điều gì sẽ xảy ra nếu chúng ta nghĩ nhiều hơn một chút bên ngoài hộp? Bản đồ này bạn thấy trong Hình & NBSP; 1-4 được tạo ra như một cuộc thám hiểm dân số nơi một trường hợp khẩn cấp bất ngờ sẽ vượt quá tài chính của một gia đình. Các quảng trường màu đỏ bây giờ cho chúng ta biết rằng đây là những gia đình có nguy cơ cao nhất và các hình vuông lớn hơn phản ánh một số lượng lớn các hộ gia đình. Để chứng minh giá trị của phân tích không gian địa lý, các hình vuông màu xanh lá cây là các địa điểm cho các địa điểm bữa ăn mùa hè vào năm 2020 trong đại dịch toàn cầu. Các địa điểm bữa ăn mùa hè là một phần của Chương trình Dịch vụ Thực phẩm Mùa hè [SFSP] phục vụ bữa ăn miễn phí cho trẻ em có thu nhập thấp khi trường học không tham gia phiên họp tại các địa điểm được phê duyệt.

Hình 1-4. Chỉ số rủi ro Bữa ăn mùa hè [ArcGIS]Risk Index Summer Meals [ArcGIS]Risk Index Summer Meals [ArcGIS]

Tài nguyên nguồn mở như API điều tra dân số mang lại dữ liệu nhân khẩu học có thể truy cập để truy xuất với một vài dòng mã trong Python. Nếu bạn không quen thuộc với API, nó là viết tắt của giao diện lập trình ứng dụng, giao diện máy tính cho phép truyền dữ liệu giữa các sản phẩm phần mềm. Vẻ đẹp nằm trong phần giao diện. API điều tra dân số là một gói cho điều tra dân số Hoa Kỳ. Bây giờ bạn có thể lấy dữ liệu cụ thể từ ACS hàng năm và điều tra dân số mà không tải xuống toàn bộ các tệp dữ liệu hài hước. Địa lý cũng được ghi lại trong dữ liệu điều tra dân số tại trang web điều tra dân số hoặc có thể tải xuống từ IPums, chính thức được gọi là loạt Microdata sử dụng công cộng tích hợp. Vẻ đẹp của IPum bao gồm dữ liệu cấp độ con người, sự hài hòa của các biến trong các cuộc khảo sát và khả năng dễ dàng tải xuống các tệp dữ liệu thô.

Ghi chú

Từ trang web IPums:

IPums cung cấp dữ liệu điều tra dân số và khảo sát từ khắp nơi trên thế giới được tích hợp theo thời gian và không gian. Tích hợp và tài liệu IPUM giúp bạn dễ dàng thay đổi, tiến hành nghiên cứu so sánh, hợp nhất thông tin qua các loại dữ liệu và phân tích các cá nhân trong bối cảnh gia đình và cộng đồng. Dữ liệu và dịch vụ có sẵn miễn phí.

Trong quá trình phát triển của tôi với tư cách là một nhà phân tích dữ liệu, tôi bắt đầu nhận ra mình có những câu hỏi lớn hơn và phức tạp hơn để xem xét, và tôi cần nhiều tài nguyên hơn. Để hướng tới việc làm việc với dữ liệu điều tra dân số, tôi đã đăng ký vào một khóa học giáo dục điều hành trực tuyến về phân tích ứng dụng được tài trợ bởi Trường Kỹ thuật Columbia. Tôi đã làm việc trong ngôn ngữ lập trình R, vì vậy có một chút lo lắng khi tôi nhận ra toàn bộ khóa học sẽ được dạy bằng Python. Tôi đã vượt qua nhưng nhớ cảm thấy một chút đánh đòn. Sau nhiều tháng hoàn thành bài tập và một dự án capstone, tôi đã chắc chắn làm thế nào để áp dụng những sự thật này vào các nhiệm vụ mới nổi trong tay. Tôi đã học được rất nhiều trong những tháng tiếp theo mà tôi ước mình được dạy song song với việc học cách viết mã. Một số ví dụ trong thế giới thực của lặp lại đệ quy là gì? Những chức năng nào sẽ đơn giản hóa công việc của tôi khi tôi vật lộn với các bộ dữ liệu lớn? Tôi làm việc độc lập và hy vọng một quy trình công việc vững chắc để hướng dẫn tôi qua các nhiệm vụ của mình. Công ty phân tích dữ liệu của tôi là nhỏ - N là 1 chính xác. Buck bắt đầu và dừng lại trên bàn của tôi.

Những gì tôi hy vọng chia sẻ ở đây không phải là mô hình mã hóa hoàn chỉnh của Python. Nhưng bằng cách học cách viết mã hành động trong một cuốn sổ tay hoặc bảng điều khiển trong QGIS, chúng ta có thể học bằng cách thực hiện. Cuốn sách chứa các ví dụ đơn giản, và chúng tôi sẽ khám phá những khái niệm này chi tiết hơn khi chúng tôi chuyển qua các chương. Đồ họa trong các chương trước được đưa vào để làm quen với cách các bản đồ hoặc mối quan hệ này có thể được hiển thị. Các chương sau khám phá mã và nền tảng trao quyền cho Python như một nguồn tài nguyên để trả lời các câu hỏi không gian địa lý.

Khi xây dựng một câu hỏi dữ liệu, tôi muốn đề cập đến Luật Địa lý đầu tiên của Tobler. Ví dụ, kiểm tra quyền truy cập vào giao thông công cộng ở cấp cộng đồng, hiểu cách giao thông và thời gian đi lại tác động đến các giá trị nhà ở bên ngoài thành phố New York là những cân nhắc quan trọng.

Mọi thứ đều liên quan đến mọi thứ khác, nhưng gần mọi thứ có liên quan nhiều hơn những thứ xa xôi.

Waldo Tobler Định luật địa lý đầu tiên

Các ngôi nhà trong một vùng đệm nhất định của Manhattan có khả năng chia sẻ nhiều thuộc tính khác nhau khi so sánh với các vùng xa hơn bên ngoài. Khả năng ánh xạ các khu vực và tập trung vào các giá trị nhà trong một bán kính nhất định có thể được xác nhận.

Dữ liệu không gian địa lý đang được thu thập ở khắp mọi nơi. Các cảm biến động với các số liệu thời gian đang tạo ra một lượng lớn dữ liệu thường được cung cấp cho công chúng. Sử dụng các giải pháp nguồn mở được tối ưu hóa cho các dự án không gian địa lý là mục tiêu chính của tôi. Python là phần còn thiếu để linh hoạt trong việc thao tác dữ liệu trong cả hệ thống nguồn mở và độc quyền. Nó khá dễ học, và có nhiều thư viện để xoay vòng và định hình lại các bảng, hợp nhất dữ liệu và tạo các sơ đồ bên trong hoặc bên ngoài môi trường máy tính để bàn.

Tích hợp Python vào phân tích không gian, cho dù đang chạy mã trong sổ ghi chép Jupyter hay dựa vào các công cụ nguồn mở như QGIS với trình cắm Python được lưu trữ, là trọng tâm của cuốn sách này.

Khi trực quan hóa dữ liệu tiếp tục trở nên phù hợp hơn, hãy nghĩ về đồ họa quen thuộc nhất: bản đồ. Mức độ thoải mái của chúng tôi trong việc xem các bản đồ tin rằng sự phức tạp của các lớp thông tin, tính tương tác của nhiều bộ dữ liệu và thậm chí cách chúng tôi truyền đạt các phát hiện. Khả năng truy cập vào dữ liệu và nền tảng nguồn mở mở rộng khoa học dữ liệu không gian cho không chỉ các chuyên gia mà còn cho những người có sở thích và các nhà phân tích cá nhân. Nhưng chúng ta cũng cần phải thận trọng. Sự quen thuộc không giống như độ chính xác hoặc năng lực.

Các nền tảng nguồn mở như OpenStreetMap cho phép chúng tôi phóng to một mức độ chi tiết, tiết lộ các cấu trúc trong cảnh quan và thêm các thuộc tính vào phân tích của chúng tôi. Có các gói Python như OSMNX cho phép tải xuống OpenStreetMap vào sổ ghi chép Jupyter độc lập với một ứng dụng hoặc công cụ cụ thể [xem ghi chú gần đó để biết thêm].

OSMNX là gói Python cho phép bạn tải xuống dữ liệu không gian từ OpenStreetMap và Model, Project, Visualize và Phân tích các mạng đường phố trong thế giới thực. Bạn có thể tải xuống và mô hình các mạng đô thị có thể đi bộ, có thể lái được hoặc có thể đi xe đạp với một dòng mã Python duy nhất, sau đó dễ dàng phân tích và trực quan hóa chúng. Bạn có thể dễ dàng tải xuống và làm việc với các loại cơ sở hạ tầng khác, tiện nghi/điểm quan tâm, xây dựng dấu chân, dữ liệu độ cao, vòng bi/định hướng đường phố và thời gian tốc độ/du lịch.

Khung khái niệm cho khoa học dữ liệu không gian

Hành tinh Trái đất không hoàn hảo hình cầu. Điều đó có ý nghĩa khi bạn nghĩ về bản chất hóa học của hành tinh và làm thế nào lực ly tâm gây ra bởi sự quay vòng trong không gian sẽ có xu hướng đẩy ra giữa, dẫn đến hình dạng hình cầu. Về mặt kỹ thuật, hình dạng của trái đất là một hình elip, chu vi xung quanh các cực ngắn hơn chu vi xung quanh đường xích đạo, gần giống như hành tinh đã được vắt từ trên xuống dưới. Khi chúng tôi cố gắng ánh xạ bề mặt, chúng tôi lấy một hệ tọa độ địa lý và dịch nó thành một hệ tọa độ dự kiến ​​- cho một bản đồ phẳng. Việc thiết lập một graticule, khung đường vĩ độ và kinh độ của bản đồ, được QGIS và các ứng dụng GIS khác tiến hành. Các hệ thống phối hợp cố gắng hiển thị dữ liệu vị trí theo những cách có ý nghĩa gần với một nguồn sự thật duy nhất. Những hình chiếu khác nhau được gọi là hình nón, phương vị và hình trụ. Mỗi người để lại một biến dạng phải được xử lý. Tùy thuộc vào hệ tọa độ đã chọn, chúng ta có thể có biến dạng về diện tích, khoảng cách, hướng và kích thước. Bạn sẽ rất vui khi biết rằng chúng tôi không cần phải vật lộn với những thỏa hiệp này - phần mềm quản lý phần lớn toán học phức tạp. Hình & NBSP; 1-5 cho thấy một hệ tọa độ địa lý.

Hình 1-5. Hệ tọa độ địa lý.Geographic coordinate system.

Nếu bạn sử dụng OpenStreetMap hoặc Google Maps, bạn sẽ quen thuộc với hệ thống tọa độ Web Mercator. Sự quen thuộc với các biến thể của các bản đồ này sẽ cho phép bạn chọn phép chiếu tối ưu vì các thỏa hiệp sẽ cần phải được thực hiện. Ví dụ, trong công việc của tôi về sức khỏe dân số, điều quan trọng là khu vực được duy trì trên các dự đoán. Nếu tôi ánh xạ tỷ lệ phần trăm hoặc số thô trên bản đồ và tôi muốn vô tư nhất có thể, làm cho một vị trí nhỏ trông quá lớn so với những nơi khác, thì có một thiên vị vốn có ảnh hưởng đến sự giải thích của tôi về bản đồ đó. Tôi sẽ cố gắng hết sức để xem xét các điểm yếu của người và điểm mạnh của nó và nói, tôi sẽ chọn một khu vực duy trì khu vực.

Bản đồ duy trì diện tích được gọi là dự báo diện tích bằng nhau. Các chương sau thảo luận về điều này chi tiết hơn. Tôi sẽ xem xét QGIS và ARCMAP và cho thấy cách họ chuyển đổi các dự báo cho các kết quả bản đồ tốt nhất. Bởi vì trái đất không phải là một hình cầu hoàn hảo, chúng ta phải thực hiện thỏa hiệp và chấp nhận một chút biến dạng. Nhưng nếu chúng tôi đảm bảo rằng các biện pháp phù hợp nhất với trực quan của chúng tôi được ghi lại trong hệ tọa độ mà chúng tôi chọn, chúng tôi sẽ ở đó hầu hết các cách ở đó. Đương nhiên, chúng tôi muốn các giá trị của chúng tôi kết hợp chặt chẽ các giá trị thực trong thế giới thực. Thực tế của một câu hỏi của người Viking trong một bộ dữ liệu thú vị thường là động lực cho giao tiếp trực quan. Ví dụ, hiện tượng không gian thường lặp đi lặp lại thay vì tuyến tính. Có lẽ bạn bị thu hút bởi một mức độ hoặc quy mô của một địa lý có hệ thống. Bạn bắt đầu từ đâu? Cả thế giới đã giành được sự phù hợp trên một mảnh giấy hoặc màn hình máy tính-ít nhất là không có sẵn để giải thích.

Lỗi hoặc độ lệch so với độ chính xác của một quả địa cầu [hãy nhớ rằng chúng tôi đang cố gắng thể hiện hình học elipsoid trên một bề mặt phẳng] thường được đo bằng điểm số lỗi Goldberg-Gott. Nỗ lực gần đây nhất trong việc giảm thiểu lỗi đã được nghiên cứu bởi J. Richard Gott và các đồng nghiệp. Để tham khảo, phép chiếu Mercator phổ biến [Hình & NBSP; 1-7] có điểm số lỗi là 8.296 trong khi Winkel Tripel đứng ở mức 4.563. Điểm thấp hơn phản ánh ít lỗi hoặc thỏa hiệp hơn trong kết xuất bản đồ phẳng. Bản đồ J.Richard Gott mới [0,881] có điểm số lỗi thấp nhất cho đến nay khi so sánh với một quả địa cầu [0,0].

Hình 1-6. Phép chiếu khu vực bằng nhauEqual area projectionsEqual area projections

Hình & NBSP; 1-6 cho thấy một vài dự đoán và bạn có thể thấy tác động đến trực quan của chúng tôi. Nếu bạn xem Greenland trong tất cả các dự báo khu vực bằng nhau này, bạn có thể thấy rằng nó vẫn là quy mô phù hợp.

Mặt khác, các bản đồ chiếu của Mercator, giống như bản đồ được hiển thị trong Hình & NBSP; 1-7, bị biến dạng trong khu vực gần các cực. Chúng ta có thể chứng minh sự khác biệt trong các bản đồ chúng ta tạo dựa trên trình chiếu nào chúng ta chọn. Điều này sẽ rõ ràng khi chúng tôi lựa chọn các hệ tọa độ của chúng tôi trong các chương sau.

Hình 1-7. Phép chiếu MercatorMercator projectionMercator projection

Bây giờ bạn đã được giới thiệu về các mục tiêu rộng lớn của phân tích dữ liệu không gian, hãy xem xét các thách thức đối với các cộng đồng địa phương cho đến cấp độ xã hội và toàn cầu. Nghĩ rằng môi trường, chăm sóc sức khỏe, sinh học, địa lý, kinh tế, lịch sử, kỹ thuật, chính quyền địa phương, quy hoạch đô thị và quản lý chuỗi cung ứng chẳng hạn. Ngay cả các vấn đề như tiếp cận với chăm sóc sức khỏe, quy định môi trường, quy hoạch cộng đồng và giao thông có vẻ như các ranh giới chính trị và vật lý địa phương hoặc khu vực, các khu vực sinh thái, thành phố và lưu vực sông và sở hữu một thành phần không gian. Vì bản đồ là một trong những đánh giá cao đầu tiên chúng tôi có trực quan hóa dữ liệu, nên có ý nghĩa rằng sau khi thẩm vấn dữ liệu của chúng tôi, chúng tôi có thể trở nên tò mò về vị trí.

Hệ thống thông tin địa lý [GIS] liên tục phân tích dữ liệu và cung cấp những hiểu biết thời gian thực trong nhiều ngành công nghiệp. Mặc dù có thể có sự tương đồng giữa các phân tích không gian và không không gian, số liệu thống kê không gian được phát triển đặc biệt để sử dụng với dữ liệu địa lý. Cả hai đều được liên kết với các tính năng địa lý nhưng số liệu thống kê không gian nhìn cụ thể vào dữ liệu không gian địa lý được mã hóa địa lý. Ví dụ, khi tưởng tượng dữ liệu sân bay, có số liệu thống kê phi không gian cho các biến như khu vực hoặc sử dụng [quân sự, dân sự/công cộng] hoặc đến đúng giờ và các thành phần không gian để phân tích [độ cao và tọa độ địa lý]. Không giống như các phương pháp thống kê phi không gian truyền thống, chúng kết hợp không gian [sự gần gũi, khu vực, kết nối và/hoặc các mối quan hệ không gian khác] trực tiếp vào toán học của họ. Ngoài ra, đối với các công cụ được viết bằng Python, mã nguồn có sẵn để khuyến khích bạn học hỏi, sửa đổi, mở rộng và/hoặc chia sẻ các công cụ phân tích này và các công cụ phân tích khác với những người khác. Những vấn đề phức tạp này là không gian. Đâu là những vấn đề này xảy ra và làm thế nào chúng ta có thể lập kế hoạch cho kết quả tốt hơn trong tương lai?

Ghi chú

Như đã đề cập, tôi thích mô tả những gì tôi làm như trí thông minh vị trí. Nó có ý nghĩa và rõ ràng hơn nhiều so với việc nói bạn làm việc trong GIS. Tại sao xác định một phân tích của các công cụ? Tốt hơn nhiều để tập trung vào các kết quả.

Ý tưởng về tư duy không gian, về sự gần gũi, ngăn chặn sự chồng chéo, phụ thuộc và cách đo lường không gian địa lý và mối quan hệ của các tính năng và hiện tượng với nhau. Đây là những gì chúng ta có thể học được với phần giới thiệu về kiến ​​thức không gian. Biết chữ không gian bắt đầu với kiến ​​thức nội dung và sự hiểu biết về các hệ thống và cách chúng tương tác với phạm vi ảnh hưởng của con người. Viện thay đổi toàn cầu Aspen [AGCI] xác định sáu hệ thống của trái đất:

  1. Khí quyển

  2. Phá quyển

  3. Hydrosphere

  4. Biosphere

  5. Địa quyển

  6. Anthroposphere

Anthroposphere đề cập đến sự hiện diện của con người trên trái đất. Dữ liệu không gian địa lý cho phép chúng tôi hiểu được tính liên kết của tất cả các hệ thống này và chúng tôi có dữ liệu lớn-rất nhiều dữ liệu-có thể truy cập được cho các câu hỏi dữ liệu được công nhận tốt.

Bạn không phải là một chuyên gia để giữ các kỹ năng quan trọng cho các câu hỏi lớn hơn. Nếu bạn hiểu ở cấp độ cơ bản về cách mọi thứ hoạt động trong dữ liệu và công nghệ không gian địa lý, bạn đã đang trên đường đến những ý tưởng phức tạp hơn. Bạn sẽ học cách xây dựng một câu hỏi dữ liệu và sẵn sàng xác định các bước có thể hành động để hướng tới việc phát triển ứng dụng hoặc giải pháp mới của bạn.

Các vấn đề không gian địa lý rất phức tạp và thay đổi trên không gian và theo thời gian và ngày càng ảnh hưởng đến cuộc sống hàng ngày của chúng ta. Không có gì khác ngoài các tiêu đề hiện tại để tìm ra các ví dụ về những thách thức mà chúng ta gặp phải trong những năm tới: bất bình đẳng chủng tộc, biến đổi khí hậu, yếu tố quyết định cấu trúc của sức khỏe, tư pháp hình sự, nước uống an toàn, thực hành nông nghiệp bền vững, axit hóa đại dương, nghèo đói, gây nguy hiểm cho loài và tuyệt chủng và xung đột kinh tế - để đặt tên cho một số. Làm thế nào để một vị trí cá nhân ảnh hưởng đến sức khỏe, hạnh phúc hoặc cơ hội kinh tế của họ? Các câu hỏi như thế này có thể được kiểm tra sử dụng GIS bằng cách hiển thị các mô hình giữa tỷ lệ khuếch tán bệnh, khoảng cách đến bệnh viện gần nhất, đường, đường thủy, độ che phủ của cây và khả năng đi bộ của thành phố.

Địa điểm là đối tượng [điểm, đường và đa giác]

Chúng tôi sẽ đào sâu hơn về cách khám phá dữ liệu vector trong Python, nhưng trước tiên tôi cần giới thiệu một vài khái niệm sẽ hữu ích khi chúng tôi di chuyển qua cuốn sách. Dữ liệu vector được giải thích bằng các điểm, dòng và đa giác. Chúng tôi sẽ sử dụng các tập lệnh Python và tích hợp QGIS để tải các bộ dữ liệu vào bản đồ và kiểm tra cấu trúc của dữ liệu vector. Các chương sau cũng sẽ dạy cách tùy chỉnh bản đồ với màu sắc và biểu tượng để cải thiện độ rõ và độ chính xác.

Trong kết xuất ArcGIS của Công viên Trung tâm và các tòa nhà xung quanh, chúng ta có thể thấy hình học được thể hiện dưới dạng đa giác. Thông tin bổ sung về các tính năng có thể tiết lộ loại cấu trúc, năm được xây dựng, kích thước kiến ​​trúc và các thuộc tính khác có thể truy cập trong một bảng thuộc tính. Hình dạng của một tính năng xác định cách nó được hiển thị - hoặc là một điểm, đường hoặc đa giác.

Bảo hiểm, Shapefiles và Geodatabase là một sự phát triển của các sản phẩm ESRI biểu thị các thế hệ khác nhau của các định dạng tệp của chúng. Tôi đã giành được nhiều thời gian để thảo luận về các định dạng khác nhau nhưng bạn có thể thấy các tệp dữ liệu được chỉ định là Shapefiles [.shp] hoặc Geodatabase [.GDB], vì vậy thật tốt khi biết những ưu điểm và bất lợi của chúng. So sánh các định dạng tệp của các chương trình xử lý từ như Microsoft Word với một tệp văn bản đơn giản. Nội dung [các từ trên trang] có thể giống nhau nhưng sự phức tạp và tinh vi chắc chắn ít hơn trong tệp văn bản. Điều tương tự với các định dạng tệp GIS khác nhau. Mặc dù nội dung là như nhau, các yếu tố của chức năng là khác nhau. Nếu bạn muốn chia sẻ một bài viết, tại sao bạn lại chọn một tệp văn bản? Điều gì sẽ xảy ra nếu bạn muốn tài liệu được mọi người đọc bất kể phần mềm, hoặc nếu bạn muốn dễ di động hoặc định dạng lưu trữ nhỏ hơn? Các tệp định dạng GIS khác nhau về chức năng - các tệp hình dạng không có lớp tô pô hoặc không gian, trong khi với cơ sở dữ liệu địa lý như vậy là một lớp là tùy chọn. Chúng cũng khác nhau về tính đơn giản, dự phòng, phát hiện lỗi và kích thước lưu trữ. Bạn có thể không có lựa chọn khi làm việc với bộ dữ liệu có dữ liệu vị trí, vì vậy điều quan trọng là phải biết những gì có sẵn và những gì bạn có thể nói về mặt địa lý.

Hình & NBSP; 1-8 cho thấy các loại tòa nhà ở thành phố New York. Nếu bạn đã làm việc với dữ liệu địa lý điều tra dân số, bạn có khả năng quen thuộc với chiết xuất Tiger/Line hoặc Shapefiles. Chúng được nhóm thành một tập hợp với các tệp kỹ thuật số [tọa độ vector với phần mở rộng .shp], một chỉ mục [tiện ích mở rộng .shx] và dữ liệu thuộc tính DBase [tiện ích mở rộng .dbf]. Luôn có cuộc nói chuyện về sự biến mất chậm của họ, nhưng vì chúng phổ biến trong các hệ thống nguồn mở và độc quyền, họ sẽ sớm biến mất.

Hình 1-8. Các loại xây dựng ở NYCBuilding types in NYCBuilding types in NYC

Các hệ thống địa lý có thể hoạt động với nhiều loại dữ liệu. Dữ liệu vector là những gì chúng ta đang đề cập khi chúng ta nghĩ về các điểm, đường thẳng hoặc đa giác [ví dụ như ShapeFile] và các cuộc khảo sát [phát hiện ánh sáng và phạm vi]. Ví dụ, khi kiểm tra môi trường GIS như cảnh quan, mọi thứ trong phạm vi tầm nhìn của bạn là một tính năng khi được hiển thị trong một ứng dụng như QGIS. Chi tiết về các tính năng được nắm bắt dưới dạng thuộc tính.

Khi dữ liệu vị trí xuất hiện trong một bảng tính, các cột cho vĩ độ và kinh độ tạo ra một điểm. Bảng tính chất lượng không khí được hiển thị trong Hình & NBSP; 1-9 có dữ liệu địa lý [vĩ độ và kinh độ] và dữ liệu phi địa lý [đo chất lượng không khí trong cột giá trị], cho phép ứng dụng GIS thêm thông tin liên quan đến một vị trí địa lý cụ thể. Một tính năng điểm có giá trị z x, y và [tùy chọn] z. Hệ thống chiếu tọa độ quen thuộc nhất là kinh độ và vĩ độ. Bạn có thể bị bỏ rơi ở bất cứ đâu trên thế giới và nếu bạn cung cấp kinh độ [x] và vĩ độ [y], vị trí của bạn được biết đến - đó chính xác là những gì chúng tôi muốn nói bởi một thuộc tính điểm. Tọa độ này mô tả chính xác nơi một nơi cụ thể nằm trên bề mặt Trái đất. Các thuộc tính điểm có thể là mô tả định lượng hoặc định tính.

Hình 1-9. & nbsp;  

Dữ liệu raster, chẳng hạn như trong Hình & NBSP; 1-10, là dữ liệu kỹ thuật số được hiển thị dưới dạng hình ảnh pixel, với mỗi pixel tương ứng với một vị trí địa lý cụ thể. Trong dữ liệu vector, thay vì một ma trận dữ liệu pixel được đánh dấu, chúng tôi có các điểm và dòng. Cả hai loại dữ liệu này sẽ dễ dàng hình dung hơn khi chúng tôi làm việc với dữ liệu thực tế.

Hình 1-10. Ví dụ về dữ liệu raster [QGIS]Example of raster data [QGIS] Example of raster data [QGIS]

Đánh giá và chọn dữ liệu

Có nhiều bộ dữ liệu để khám phá để sử dụng trong các hướng dẫn để học một kỹ năng mới, theo sau trong một ứng dụng mới hoặc thậm chí để khởi chạy dự án không gian địa lý độc lập của riêng bạn. Hầu hết các bộ dữ liệu bạn sẽ thấy trong cuốn sách này đã được xem xét và tìm thấy khả thi trên nhiều ứng dụng và quy trình làm việc.

Trước khi chọn bộ dữ liệu của bạn, bạn cần đánh giá dữ liệu. Thông tin về bộ dữ liệu của bạn được gọi là siêu dữ liệu. Bạn có thể học được rất nhiều bằng cách xem qua siêu dữ liệu, nhưng thông tin quan trọng nhất về dữ liệu của bạn bao gồm khu vực địa lý, thuộc tính, phép chiếu bản đồ, quy mô và liệu có phí sử dụng nó không. Bạn có thể nghĩ về siêu dữ liệu là nhãn trên một lon súp. Bạn muốn biết các thành phần có thể là gì, và quan trọng hơn, liệu súp có tốt cho bạn không. Hình & nbsp; 1-11 cho thấy một ví dụ về siêu dữ liệu.

Thường thì cũng có một tệp dữ liệu bổ sung mô tả các thuộc tính như tiêu đề trường. Đây thường được gọi là từ điển dữ liệu.

Mặc dù có thể hấp dẫn để khám phá sở thích và dữ liệu của riêng bạn, tôi khuyên bạn nên cố gắng theo dõi cùng với các tài nguyên dữ liệu được đề xuất sau đây. Một khi bạn cảm thấy tự tin, sau đó khám phá và xem những gì bạn có thể khám phá:

  • Chương trình không gian địa lý quốc gia

  • Hệ thống hỗ trợ phân tích tài nguyên địa lý [Cỏ]

  • OpenGeoportal

  • Servirglobal

  • Diva-gis

  • Trái đất tự nhiên

  • OpenStreetMap

  • Lưu trữ kỹ thuật số không gian địa lý quốc gia

  • Hệ thống thông tin địa lý lịch sử quốc gia [NHGIS]

  • Khảo sát địa lý và cộng đồng Mỹ [Điều tra dân số Hoa Kỳ]

  • Trung tâm Xuất sắc cho Khoa học Thông tin không gian địa lý [CEGIS]

R hay Python có tốt hơn cho GIS không?

Mặc dù R rất giỏi trong việc trực quan hóa và phân tích thống kê, Python đặc biệt giỏi làm việc với các hệ thống tệp, mạng, quét web và tự động hóa. Đây là lý do tại sao Python là ngôn ngữ lập trình mặc định cho QGI và ArcGIS, thay vì R.Python is particularly good at working with file systems, networks, web scraping, and automation. This is why Python is the default programming language for QGIS and ArcGIS, instead of R.Python is particularly good at working with file systems, networks, web scraping, and automation. This is why Python is the default programming language for QGIS and ArcGIS, instead of R.

Là một thư viện Python được sử dụng để trực quan hóa dữ liệu không gian địa lý?

Folium là một thư viện trực quan hóa dữ liệu mạnh mẽ trong Python được xây dựng chủ yếu để giúp mọi người trực quan hóa dữ liệu không gian địa lý.Với Folium, người ta có thể tạo ra một bản đồ của bất kỳ vị trí nào trên thế giới. that was built primarily to help people visualize geospatial data. With Folium, one can create a map of any location in the world. that was built primarily to help people visualize geospatial data. With Folium, one can create a map of any location in the world.

3 loại dữ liệu không gian địa lý là gì?

Các vectơ và thuộc tính: Thông tin mô tả về một vị trí như điểm, đường và đa giác.Mây điểm: Một bộ sưu tập các điểm biểu đồ đồng định dạng có thể được tái cấu trúc dưới dạng các mô hình 3D.Hình ảnh raster và vệ tinh: Hình ảnh độ phân giải cao của thế giới chúng ta, được chụp từ trên cao.: Descriptive information about a location such as points, lines and polygons. Point clouds: A collection of co-located charted points that can be recontextured as 3D models. Raster and satellite imagery: High-resolution images of our world, taken from above.: Descriptive information about a location such as points, lines and polygons. Point clouds: A collection of co-located charted points that can be recontextured as 3D models. Raster and satellite imagery: High-resolution images of our world, taken from above.

Tại sao Python có giá trị để phân tích GIS?

Ai trong thế giới GIS sẽ không muốn sử dụng một công cụ linh hoạt để đưa dữ liệu của họ từ một tệp hoặc cơ sở dữ liệu vào một cái gì đó có thể sử dụng?Python làm chính xác điều đó.Thật dễ dàng để giao tiếp với nó với PostgreSQL và Postgis, và các khả năng là vô tận từ đó trở đi để tự động hóa quy trình công việc với các tập lệnh.It's also easy to interface it with PostgreSQL and PostGIS, and the possibilities are endless from then on for automating workflows with scripts.It's also easy to interface it with PostgreSQL and PostGIS, and the possibilities are endless from then on for automating workflows with scripts.

Bài Viết Liên Quan

Chủ Đề