Trực quan hóa dữ liệu là một kỹ thuật mạnh mẽ để phân tích một tập dữ liệu lớn thông qua biểu diễn đồ họa. Python cung cấp các mô-đun khác nhau hỗ trợ biểu diễn dữ liệu bằng đồ họa. Các mô-đun được sử dụng rộng rãi là Matplotlib, Seaborn và Plotly. Và chúng tôi có thêm một mô-đun có tên là Squarify, được sử dụng chủ yếu để vẽ Sơ đồ cây.
Khi nào nên sử dụng Squarify?
Ở đây câu hỏi đặt ra là khi nào nên sử dụng Squarify thay vì Tại sao nên sử dụng. Vì Python đã có 2 đến 3 mô-đun trực quan hóa dữ liệu thực hiện hầu hết các tác vụ. Squarify phù hợp nhất khi bạn phải vẽ Sơ đồ cây. Treemaps hiển thị dữ liệu phân cấp dưới dạng một tập hợp các hình vuông/hình chữ nhật dựa trên hình ảnh lồng nhau.
Squarify là một sự lựa chọn tuyệt vời
- Để vẽ một lượng lớn dữ liệu
- Biểu đồ thanh không thể hiệu quả để xử lý và trực quan hóa dữ liệu lớn, do đó sơ đồ dạng cây được sử dụng và Squarify phát huy tác dụng
- Để vẽ tỷ lệ giữa từng phần và toàn bộ bằng cách cung cấp nhãn cho chúng
- Để hiển thị mô hình phân phối thước đo qua từng cấp độ danh mục trong hệ thống phân cấp
- Để hiển thị các thuộc tính sử dụng kích thước và mã màu
- Để phát hiện các mẫu, ngoại lệ, những người đóng góp quan trọng nhất và ngoại lệ
Vẽ sơ đồ cây bằng cách sử dụng Squarify
Biểu đồ Treemap là một kiểu trực quan thích hợp khi tập dữ liệu được cấu trúc theo thứ tự phân cấp với bố cục dạng cây có gốc, nhánh và nút. Nó cho phép chúng tôi hiển thị thông tin về một lượng dữ liệu quan trọng theo cách rất hiệu quả trong một không gian hạn chế.
Bây giờ chúng ta sẽ vẽ Sơ đồ cây bằng cách sử dụng Squarify. Cài đặt mô-đun bằng cách sử dụng pip install module_name.
pip install squarify
Nhập các mô-đun cần thiết.
Python3
import
squarify
import
matplotlib.pyplot as plt
Kịch bản
Cốt truyện là phương pháp mà bạn có thể tạo Sơ đồ cây bằng Squarify. Squarify lấy kích thước làm đối số đầu tiên và cũng hỗ trợ nhiều tính năng mà chúng ta sẽ xem xét từng tính năng một. Ban đầu, phương thức vẽ sơ đồ vẽ một hình vuông có kích thước 100 × 100.
Python3
squarify.plot[sizes
=
[
1
,
import
0_______9_______import
2,
import
4_______9_______1_______6import
7
import
8import
9=
squarify
1squarify
2
đầu ra
Màu
Để làm cho cốt truyện hấp dẫn hơn, chúng ta sẽ thay đổi màu sắc của cốt truyện. Có hai cách để chúng ta có thể thay đổi màu sắc của biểu đồ
- danh sách màu
- bảng màu
Phương pháp 1. Chúng tôi sẽ chuyển một danh sách có tên màu, nó có thể khớp hoặc không khớp với độ dài của dữ liệu. Nếu bạn có một danh sách màu nhỏ hơn độ dài của dữ liệu, các màu giống nhau sẽ được lặp lại.
Python3
squarify
3_______6_______ [
squarify
6_______9_______squarify
8,
import
0,
import
2,
import
4,
import
6import
7
import
8=
[
matplotlib.pyplot as plt
1_______9_______matplotlib.pyplot as plt
3,
matplotlib.pyplot as plt
5_______9_______
matplotlib.pyplot as plt
7_______4_______8_______9_______squarify
1_______9_______5_______2import
7
squarify.plot[sizes
=
squarify.plot[sizes
6=
squarify.plot[sizes
8
squarify.plot[sizes
9=
0squarify
2
đầu ra
Phương pháp 2. Chúng ta sẽ nhập mô-đun Python Seaborn và chọn một phương pháp bảng màu
cú pháp. sinh ra biển. color_palette[loại,total_colors_required]
#total_colors_required phải là số nguyên
#bạn có thể chọn bất kỳ loại nào từ danh sách này
“””
'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r', 'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2
“””
Python3
import
=
3
=
4
squarify
3_______6_______ [
squarify
6_______9_______squarify
8,
import
0,
import
2,
import
4,
import
6import
7
squarify.plot[sizes
=
1
2
import
8import
9=
1
61
71
8
1
9,
0,
1
squarify.plot[sizes
9=
0squarify
2
đầu ra
anpha
Đối số alpha được sử dụng để thay đổi độ mờ của hình ảnh. Nó có thể là một số nguyên hoặc giá trị động trong phạm vi từ 0 đến 1. Giá trị alpha gần 1 có độ mờ cao trong khi giá trị alpha gần 0 có độ mờ ít hơn
Python3
squarify
3_______6_______ [
squarify
6_______9_______squarify
8,
1_______02________9____1_______04import
7
import
8=
[
matplotlib.pyplot as plt
1_______9_______matplotlib.pyplot as plt
3,
4_______5,
matplotlib.pyplot as plt
8import
7
squarify.plot[sizes
=
import
19_______6_______import
21=
1_______23squarify
2
squarify.plot[sizes
9=
0squarify
2
đầu ra
Ở đây, chúng ta sẽ thấy giá trị alpha thấp hơn
Python3
squarify
3_______6_______ [
squarify
6_______9_______squarify
8,
1_______02________9____1_______04import
7
import
8=
[
matplotlib.pyplot as plt
1_______9_______matplotlib.pyplot as plt
3,
4_______5,
matplotlib.pyplot as plt
8import
7
squarify.plot[sizes
=
import
19_______6_______import
21=
import
56squarify
2
squarify.plot[sizes
9=
0squarify
2
đầu ra
Chia tỷ lệ biểu đồ
Tỷ lệ được sử dụng để thay đổi phạm vi của biểu đồ, theo mặc định, phạm vi của biểu đồ là 100×100. Sử dụng Norm_x bạn có thể chia tỷ lệ dữ liệu trục x trong khi Norm_y bạn có thể chia tỷ lệ trục y.
Python3
squarify
3_______6_______ [
import
64_______9__________import
66,
1_______68,
1_______70import
7
import
8=
[
matplotlib.pyplot as plt
1_______9_______squarify
1,
5_______2,
matplotlib.pyplot as plt
5import
7
squarify.plot[sizes
=
squarify.plot[sizes
6=
squarify.plot[sizes
8
đầu ra
Chia tỷ lệ với cả hai trục
Python3
squarify
3_______6_______ [
import
64_______9__________import
66,
1_______68,
1_______70import
7
import
8=
[
matplotlib.pyplot as plt
1_______9_______squarify
1,
5_______2,
matplotlib.pyplot as plt
5import
7
squarify.plot[sizes
=
squarify
12_______6_______import
701
8
import
8squarify
17=
squarify
19squarify
20=
squarify.plot[sizes
8
đầu ra
nhãn
Sơ đồ cây không có nhãn chỉ là một hộp vô nghĩa. Nhãn bổ sung ý nghĩa cho các phân chia sơ đồ cây và biểu thị những ô cụ thể đại diện. Bạn có thể tăng kích thước phông chữ của nhãn bằng cách thêm đối số phụ text_kwargs
Python3
squarify
23=
[
squarify
26_______9__________import
02,
2_______30,
2_______32_______9_______squarify
34import
7
squarify
36_______6_______ [
squarify
39,
___squarify
41,
squarify
431
8
squarify
45squarify
46,
squarify
48_______1_______7
=
4
squarify
51_______6_______squarify
53
=
4
squarify.plot[sizes
9=
0squarify
2
đầu ra
đệm
Phần đệm lấy một giá trị số nguyên được sử dụng để thêm khoảng trắng giữa các sơ đồ cây để trực quan hóa phù hợp
Python3
squarify
51=
squarify
60=
import
0squarify
2
squarify.plot[sizes
9=
0squarify
2
đầu ra
Xây dựng sơ đồ cây trên bộ dữ liệu trong thế giới thực bằng cách sử dụng Squarify
Bây giờ chúng ta sẽ xem cách triển khai Sơ đồ cây trên tập dữ liệu trong thế giới thực. Bạn có thể tải xuống bộ dữ liệu từ https. //www. kaggle. com/hamdallak/the-world-of-pokemons. Trong đoạn mã dưới đây, chúng tôi đang lấy 20 Pokemon hàng đầu và tạo Sơ đồ cây dựa trên Loại chính của 20 Pokemon hàng đầu
Python3
squarify
67
import
squarify
69
import
squarify
import
matplotlib.pyplot as plt
import
=
3
=
4
squarify
77
squarify
78=
squarify
80squarify
81squarify
2
squarify
83=
squarify
85
=
4
squarify
87
squarify
88
squarify
89=
squarify
91_______2_______92_______9_______2_______94,
squarify
96squarify
97squarify
98
squarify
99import
00=
___squarify
94_______1_______03=
1_______05import
06import
66import
7