Tìm ô trong dataframe python

Nếu bạn là nhà phân tích dữ liệu hoặc làm việc với nhiều dữ liệu, bạn có thể đã bắt gặp thư viện Pandas để thao tác dữ liệu. Trong hướng dẫn này, chúng tôi sẽ kiểm tra cách chúng tôi có thể lấy giá trị của một ô từ Khung dữ liệu Pandas

Cách lấy giá trị từ ô của khung dữ liệu Pandas


Xem video này trên YouTube

Hướng dẫn liên quan. 5 phút đến Pandas

Có 5 cách để trích xuất giá trị từ một ô của Khung dữ liệu Pandas

  1. Trích xuất dữ liệu bằng cách sử dụng
    data.head[5]
    1 hoặc lập chỉ mục
  2. Trích xuất dữ liệu bằng cách sử dụng
    data.head[5]
    2
  3. Trích xuất dữ liệu bằng cách sử dụng
    data.head[5]
    3
  4. Trích xuất dữ liệu bằng cách sử dụng
    data.head[5]
    4
  5. Trích xuất dữ liệu bằng cách sử dụng
    data.head[5]
    5

Đang tải tập dữ liệu

Chúng tôi sẽ kiểm tra các phương pháp trên bằng cách tải một tập dữ liệu mẫu. Tôi đã sử dụng bộ dữ liệu nhà ở California mà bạn có thể tải xuống từ liên kết này.  

import pandas as pd
data = pd.read_csv['sample_data/california_housing_test.csv']

Hãy cho chúng tôi xem các cột của tập dữ liệu

data.head[5]

đầu ra

Chúng ta có thể thấy 5 hàng đầu tiên của tập dữ liệu. Tập dữ liệu có 9 cột. Bây giờ chúng ta sẽ xem xét 5 phương pháp khác nhau để trích xuất giá trị hàng thứ 2 của cột vĩ độ

Phương pháp 1. Trích xuất dữ liệu bằng iloc hoặc Lập chỉ mục

Chúng ta có thể sử dụng lập chỉ mục bình thường trích xuất giá trị.  

data.iloc[1]['latitude']

Vì việc lập chỉ mục bắt đầu từ 0, nên chỉ mục đầu tiên được sử dụng để lấy nội dung cho hàng thứ 2. Khi chúng tôi trích xuất hàng, chúng tôi có thể trích xuất bất kỳ giá trị cột nào mà chúng tôi muốn. Trong trường hợp của chúng tôi, chúng tôi muốn lấy giá trị vĩ độ. Chúng tôi nhận được đầu ra sau

đầu ra

34. 26

Phương pháp 2. Trích xuất dữ liệu bằng iat

Chúng tôi sẽ không xem xét một phương pháp khác để trích xuất giá trị vĩ độ từ hàng thứ 2

Chúng ta có thể gọi phương thức

data.head[5]
6 của pandas dataframe để lấy giá trị ô. Giá trị
data.head[5]
6 được gọi bằng cách sử dụng chỉ mục hàng và chỉ mục cột làm đối số. Trong ví dụ của chúng tôi, vĩ độ là chỉ mục cột đầu tiên và đối với hàng thứ 2, chúng tôi sẽ sử dụng Chỉ mục đầu tiên.  

data.iat[1,1]

đầu ra

34.26

Phương pháp 3. Trích xuất dữ liệu bằng loc

Chúng ta có thể sử dụng phương thức loc để lấy giá trị. Phương thức loc không giống như phương thức ioc có thể được sử dụng bằng cách chuyển vào một chuỗi dưới dạng đối số nếu các giá trị chỉ mục là các chuỗi. Trong ví dụ của chúng tôi vì tất cả các chỉ mục đều là giá trị số, chúng tôi có thể thực hiện như sau

data.loc[1]['latitude']

đầu ra

34.26

Phương pháp 4. Trích xuất dữ liệu bằng cách sử dụng tại

Cách thứ tư để trích xuất một giá trị từ ô là sử dụng phương thức

data.head[5]
8. Phương thức
data.head[5]
8 lấy chỉ mục hàng làm đối số và tên cột làm đối số thứ hai.  

data.at[1,'latitude']

đầu ra

34.26

Phương pháp 5. Trích xuất dữ liệu bằng data_frame. giá trị[]

Phương pháp cuối cùng để trích xuất giá trị từ một ô cụ thể trước tiên là chuyển đổi khung thành một chuỗi bằng cách sử dụng tên cột mà chúng tôi quan tâm để lấy giá trị từ đó, sau đó chuyển đổi chuỗi thành danh sách bằng cách sử dụng thuộc tính giá trị. Sau đó, chúng tôi có thể sử dụng lập chỉ mục hàng bình thường để lấy giá trị từ một hàng cụ thể

data['latitude'].values[1]

đầu ra

34.26

👉 Hướng dẫn đề xuất. Python Tìm chuỗi dài nhất trong cột DataFrame

Tóm lược

Trong bài đăng trên blog này, chúng tôi đã thấy 5 phương pháp để trích xuất giá trị từ khung dữ liệu gấu trúc. Tùy trường hợp sử dụng mà chúng ta có thể sử dụng bất kỳ cách nào trong 5 cách trên để lấy giá trị từ một ô

Lập Trình Hài Hước

💡 Lập trình là 10% khoa học, 20% sự khéo léo và 70% để sự khéo léo làm việc với khoa học

mô-đun nhập khẩu

import pandas as pd

Tạo một số dữ liệu giả

raw_data = {'name': ['Willard Morris', 'Al Jennings', 'Omar Mullins', 'Spencer McDaniel'],
'age': [20, 19, 22, 21],
'favorite_color': ['blue', 'blue', 'yellow', "green"],
'grade': [88, 92, 95, 70]}df = pd.DataFrame[raw_data]df.head[]
agefavorite_colorgradename020blue88Willard Morris119blue92Al Jennings222yellow95Omar Mullins321green70Spencer McDaniel

Chọn hàng dựa trên giá trị cột

agefavorite_colorgradename222yellow95Omar Mullins

Chọn các hàng có giá trị cột nằm trong một mảng có thể lặp lại

agefavorite_colorgradename222yellow95Omar Mullins321green70Spencer McDaniel

Chọn hàng dựa trên nhiều điều kiện cột

agefavorite_colorgradename321green70Spencer McDaniel

Chọn các hàng có cột không bằng một giá trị

agefavorite_colorgradename020blue88Willard Morris119blue92Al Jennings321green70Spencer McDaniel

Chọn các hàng có giá trị cột không nằm trong mảng có thể lặp lại

agefavorite_colorgradename020blue88Willard Morris119blue92Al Jennings

Chủ Đề