Hướng dẫn dùng matplotlib xlim python

Vẽ biểu đồ là một trong những kỹ năng cần thiết và rất quan trọng đặc biệt là những bạn muốn phát triển sự nghiệp trong lĩnh vực Data Analyst hay Data Science. 

Hôm nay mình sẽ giới thiệu với các bạn một thư viện phổ biến nhất trong Python là Matplotlib giúp các bạn có thể trực quan hóa dữ liệu của mình. Mặc dù hiện nay có khá nhiều thư viện cũng được đánh giá tốt như Seaborn, Hiplot (của facebook) trong python hay ggplot trong R; Matplotlib tuy cũ nhưng vẫn được sử dụng rộng rãi hơn cả cho mục đích Data Visualization.

Nếu bạn có thời gian và thực sự muốn học sâu hơn về matplotlib hãy đọc cuốn sách này. Còn nếu bạn cần một hướng dẫn nhanh, nhiệm vụ đó mình sẽ làm ngay sau đây :D

Nội dung

Install & Import

1. Tạo biểu đồ đơn giản

2. Vẽ nhiều đối tượng trong cùng một biểu đồ

3. Thay đổi kích thước của biểu đồ 

4. Vẽ hai biểu đồ cạnh nhau

5. Vẽ trên nhiều biểu đồ sử dụng vòng lặp 

Tạm kết

Install & Import

Để sử dụng thư viện Matplotlib, bước đầu tiên sau khi thiết lập môi trường Python là chúng ta phải cài đặt package phải không nào. Sử dụng pip install matplotlib để cài đặt version mới nhất.

Sau đó ta import thư viện bằng dòng code : 

import matplotlib.pyplot as plt

Dưới đây là những hướng dẫn cơ bản để vẽ biểu đồ với Matplotlib.

1. Tạo biểu đồ đơn giản

Sau đây ta vẽ một biểu đồ đơn giản với phương thức plot(), mặc định nó sẽ vẽ biểu đồ đường.

Với các tham số tối thiểu là list các tọa độ x, list tọa độ y (lưu ý 2 list này phải có độ dài bằng nhau).

Ví dụ minh họa như sau:

Hướng dẫn dùng matplotlib xlim python

Để thay đổi một chút, ta có thể thêm tham số về định dạng vào 

Chẳng hạn như :

- tham số màu :  r - red, g -green, b - blue, y - yellow, …

- định dạng đường :  - (đường thẳng), -- (đường nét đứt), nếu không truyền tham số là không vẽ đường.

- định dạng đỉnh :  * (đỉnh hình bông tuyết), D (đỉnh hình thoi), s (đỉnh hình vuông), go (chấm tròn), ...

Ví dụ : Ở ví dụ này mình thêm tham số b tức là màu blue, D tức là đỉnh hình thoi và -- tức là cạnh nét đứt.

Hướng dẫn dùng matplotlib xlim python

2. Vẽ nhiều đối tượng trong cùng một biểu đồ

Ta sẽ thêm title cho biểu đồ, title cho trục tọa độ và thêm chú thích, ví dụ như sau:

Hướng dẫn dùng matplotlib xlim python

Đoạn code trong hình ta thấy : 

- tham số label trong hàm plt.plot() là để đặt tên cho một điểm, tên này sẽ xuất hiện trong chú thích.

- plt.xlabel hay plt.ylabel là để đặt tên cho trục x và trục y.

- plt.title là để đặt tên cho biểu đồ

- plt.legend sẽ đi tìm các thành phần chứa tham số label và đưa vào chú thích 

3. Thay đổi kích thước của biểu đồ 

Ta sử dụng phương thức figure() để thay đổi kích thước của biểu đồ, tham số truyền vào là figsize.

Ví dụ được mô tả như dưới đây:

Hướng dẫn dùng matplotlib xlim python

Ở ví dụ trên tham số truyền vào là figsize=(10,7) trong đó 10 là tỉ lệ độ dài trục ngang (x) và 7 là tỉ lệ độ dài trục dọc (y) 

Ta cũng thấy có plt.xlim plt.ylim. Hai phương thức này dùng để xác định hệ số chia trên trục tương ứng.

4. Vẽ hai biểu đồ cạnh nhau 

Hướng dẫn dùng matplotlib xlim python

Đầu tiên ta sử dụng phương thức subplots() để tạo ra 2 biểu đồ. Sử dụng subplots() các đối tượng Axes sẽ được trả về. Sau đó bạn có thể set các thuộc tính của từng đối tượng này sử dụng ax1.set hay ax2.set như trên (mỗi đối tượng axes định nghĩa cho một biểu đồ)

Tham số (1,2) trong hàm subplots có thể hiểu là "một hàng, hai cột" - tương ứng bạn sẽ vẽ ra 2 biểu đồ cạnh nhau. Nếu chẳng hạn bạn thay (1,2) bằng (2,2), bạn sẽ được 4 biểu đồ. 

Tham số dpi là độ phân giải của hình vẽ.

Tham số sharey = True cho phép chia sẻ thuộc tính giữa 2 trục x và y.

5. Vẽ trên nhiều biểu đồ sử dụng vòng lặp 

Hướng dẫn dùng matplotlib xlim python

Đây là một kỹ thuật khá hữu ích, nhất là khi bạn muốn vẽ biểu đồ từ một cơ sở dữ liệu hay file dữ liệu được.

Đầu tiên bạn tạo một subplot với số biểu đồ mà bạn muốn vẽ lên, sau đó các đối tượng Axes được tạo ra và bạn sẽ sử dụng các đối tượng này trong vòng lặp for để đưa dữ liệu vào các biểu đồ tương ứng. 

Tạm kết

Trên đây là một số kỹ thuật cơ bản để bạn bắt đầu tiếp cận với việc trực quan hóa dữ liệu (Data Visualization) sử dụng Matplotlib. Với mục đích giúp các bạn tiếp cận dễ dàng hơn nên ở phần này mình sẽ trình bày những kiến thức cơ bản nhất. Ở phần tiếp theo mình sẽ giới thiệu với các bạn những kỹ năng nâng cao hơn giúp bạn trở nên master hơn với matplotlib và bạn có thể làm những thứ hay ho hơn như dưới đây :D. 

Hướng dẫn dùng matplotlib xlim python

Nếu thấy bài viết này hữu ích, hãy giúp mình một đánh giá 5 sao nha <3 <3

Happy coding!!