Hướng dẫn how do i extract a column from a dataset in python? - làm cách nào để trích xuất một cột từ tập dữ liệu trong python?

Dưới đây là một bảng gian lận đơn giản của thao tác khung dữ liệu trong Python và R, trong trường hợp bạn buồn bã về việc trộn các lệnh của hai ngôn ngữ như tôi.

Ảnh của Elizabeth Kay trên unplash

Tôi đã làm việc với dữ liệu lâu dài. Tuy nhiên, đôi khi tôi vẫn cần google làm thế nào để trích xuất các hàng/cột từ khung dữ liệu trong Python/R? Khi tôi thay đổi từ môi trường ngôn ngữ này sang môi trường khác.ve been working with data for long. However, I sometimes still need to google “How to extract rows/columns from a data frame in Python/R?” when I change from one language environment to the other.

Tôi khá chắc chắn rằng tôi đã làm điều tương tự hàng ngàn lần, nhưng có vẻ như bộ não của tôi từ chối lưu trữ các lệnh trong bộ nhớ.

Bạn phải biết cảm giác của tôi nếu bạn cần làm việc với R và Python đồng thời để thao tác dữ liệu.R and Python simultaneously for data manipulation.

Do đó, tôi muốn tóm tắt trong bài viết này về việc sử dụng R và Python trong việc trích xuất các hàng/cột từ khung dữ liệu và tạo một hình ảnh bảng gian lận đơn giản cho những người cần nó.R and Python in extracting rows/columns from a data frame and make a simple cheat sheet image for the people who need it.

Để lưu ý, tôi sẽ chỉ sử dụng gấu trúc trong các chức năng Python và cơ bản trong R cho mục đích so sánh các dòng lệnh cạnh nhau. Một số thư viện toàn diện, ví dụ, dplyr, không được xem xét. Và tôi đang cố gắng hết sức để giữ cho bài viết ngắn.Pandas in Python and basic functions in R for the purpose of comparing the command lines side by side. Some comprehensive library, ‘dplyr’ for example, is not considered. And I am trying my best to keep the article short.

Hãy bắt đầu nào.

Bộ dữ liệu đồ chơi để sử dụng.

Chúng tôi sẽ sử dụng một bộ dữ liệu đồ chơi của các số liệu thống kê trò chơi Allen Iverson trong toàn bộ bài viết. Kích thước và đầu của khung dữ liệu được hiển thị bên dưới.

# R
dim(df)
head(df)
r Đầu ra 1
# Python
df.shape
df.head()
Python đầu ra 1

Trích xuất hàng/cột theo vị trí.

Đầu tiên, hãy để trích xuất các hàng từ khung dữ liệu trong cả R và Python. Trong R, nó được thực hiện bằng cách lập chỉ mục đơn giản, nhưng trong Python, nó được thực hiện bởi .iloc. Hãy để kiểm tra các ví dụ dưới đây..iloc. Let’s check the examples below.

# R
## Extract the third row
df[3,]
## Extract the first three rows
df[1:3,]
### or ###
df[c(1,2,3),]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

Đầu ra Python 2

Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.

# R
## Extract the 5th column
df[,5]
## Extract the first 5 columns
df[,1:5]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

Đầu ra Python 2

Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.

Tương tự, chúng ta có thể trích xuất các cột từ khung dữ liệu.

R Đầu ra 3____5

# R
## Extract 1999-2000 season.
df["1999-00",]
## Extract 1999-2000 and 2001-2002 seasons.
df[c("1999-00","2000-01"),]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

Đầu ra Python 2

Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.

# R
## Extract Iverson's team and minutes played in the 1999-2000 season.
df["1999-00",c("Tm","MP")]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

Đầu ra Python 2

# Python
df.shape
df.head()
0

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

Đầu ra Python 2

Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.

# Python
df.shape
df.head()
2

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

sản lượng nào,

R Đầu ra 2
# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]
## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]

Đầu ra Python 2

Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.

Tương tự, chúng ta có thể trích xuất các cột từ khung dữ liệu.

R Đầu ra 3____5

Đầu ra Python 3

Khi trích xuất cột, chúng ta phải đặt cả đại tràng và dấu phẩy vào vị trí hàng trong khung vuông, đây là một sự khác biệt lớn so với việc trích xuất các hàng.follow me on Medium. Here are some of my previous articles in data science:

Làm cách nào để trích xuất một cột cụ thể trong Python?

Lập danh sách các cột phải được trích xuất ..
Sử dụng phương thức read_csv () để trích xuất tệp CSV vào khung dữ liệu ..
In dữ liệu bị xáo trộn ..
Biểu đồ khung dữ liệu bằng phương thức Plot () ..
Để hiển thị hình, sử dụng phương thức show () ..

Làm cách nào để trích xuất một cột từ một khung dữ liệu trong Python?

Bạn có thể sử dụng các chức năng LỘC và ILOC để truy cập các cột trong khung dữ liệu gấu trúc.Hãy xem làm thế nào.Nếu chúng tôi muốn truy cập một cột nhất định trong DataFrame của chúng tôi, ví dụ như cột Lớp, chúng tôi chỉ cần sử dụng hàm LỘC và chỉ định tên của cột để lấy lại.use the loc and iloc functions to access columns in a Pandas DataFrame. Let's see how. If we wanted to access a certain column in our DataFrame, for example the Grades column, we could simply use the loc function and specify the name of the column in order to retrieve it.

Làm thế nào để bạn rút một cột ra khỏi khung dữ liệu?

Trích xuất nhiều cột từ DataFrame..
Cú pháp: biến_name = dataFrame_name [Row (s), cột (s)].
Ví dụ 1: A = DF [C (1,2), C (1,2)].
Giải thích: Nếu chúng ta muốn trích xuất nhiều hàng và cột, chúng ta có thể sử dụng c () với tên hàng và tên cột làm tham số.....
Ví dụ 2: b = df [c (1,2), c (id id, tên tên)]].

Làm thế nào để bạn nhận được một giá trị cột cụ thể từ một bộ dữ liệu trong Python?

Hàm get_value () được sử dụng để nhanh chóng truy xuất giá trị đơn trong khung dữ liệu ở cột được truyền và chỉ mục.Đầu vào của hàm là nhãn hàng và nhãn cột. is used to quickly retrieve the single value in the data frame at the passed column and index. The input to the function is the row label and the column label.