Tôi đã làm việc với dữ liệu lâu dài. Tuy nhiên, đôi khi tôi vẫn cần google làm thế nào để trích xuất các hàng/cột từ khung dữ liệu trong Python/R? Khi tôi thay đổi từ môi trường ngôn ngữ này sang môi trường khác.ve been working with data for long. However, I sometimes still need to google “How to extract rows/columns from a data frame in Python/R?” when I change from one language environment to the other. Tôi khá chắc chắn rằng tôi đã làm điều tương tự hàng ngàn lần, nhưng có vẻ như bộ não của tôi từ chối lưu trữ các lệnh trong bộ nhớ. Bạn phải biết cảm giác của tôi nếu bạn cần làm việc với R và Python đồng thời để thao tác dữ liệu.R and Python simultaneously for data manipulation. Do đó, tôi muốn tóm tắt trong bài viết này về việc sử dụng R và Python trong việc trích xuất các hàng/cột từ khung dữ liệu và tạo một hình ảnh bảng gian lận đơn giản cho những người cần nó.R and Python in extracting rows/columns from a data frame and make a simple cheat sheet image for the people who need it. Để lưu ý, tôi sẽ chỉ sử dụng gấu trúc trong các chức năng Python và cơ bản trong R cho mục đích so sánh các dòng lệnh cạnh nhau. Một số thư viện toàn diện, ví dụ, dplyr, không được xem xét. Và tôi đang cố gắng hết sức để giữ cho bài viết ngắn.Pandas in
Python and basic functions in R for the purpose of comparing the command lines side by side. Some comprehensive library, ‘dplyr’ for example, is not considered. And I am trying my best to keep the article short. Hãy bắt đầu nào. Chúng tôi sẽ sử dụng một bộ dữ liệu đồ chơi của các số liệu thống kê trò chơi Allen Iverson trong toàn bộ bài viết. Kích thước và đầu của khung dữ liệu được hiển thị bên dưới. Đầu tiên, hãy để trích xuất các hàng từ khung dữ liệu trong cả R và Python. Trong R, nó được thực hiện bằng cách lập chỉ mục đơn giản, nhưng trong Python, nó được thực hiện bởi .iloc. Hãy để kiểm tra các ví dụ dưới đây..iloc. Let’s check the examples below.Dưới đây là một bảng gian lận đơn giản của thao tác khung dữ liệu trong Python và R, trong trường hợp bạn buồn bã về việc trộn các lệnh của hai ngôn ngữ như tôi.
Ảnh của Elizabeth Kay trên unplashBộ dữ liệu đồ chơi để sử dụng.
# R
r Đầu ra 1
dim[df]
head[df]# Python
Python đầu ra 1
df.shape
df.head[]Trích xuất hàng/cột theo vị trí.
# R
## Extract the third row
df[3,]## Extract the first three rows
df[1:3,]
### or ###
df[c[1,2,3],]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
Đầu ra Python 2
Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.
# R
## Extract the 5th column
df[,5]## Extract the first 5 columns
df[,1:5]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
Đầu ra Python 2
Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.
Tương tự, chúng ta có thể trích xuất các cột từ khung dữ liệu.
R Đầu ra 3____5
# R
## Extract 1999-2000 season.
df["1999-00",]## Extract 1999-2000 and 2001-2002 seasons.
df[c["1999-00","2000-01"],]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
Đầu ra Python 2
Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.
# R
## Extract Iverson's team and minutes played in the 1999-2000 season.
df["1999-00",c["Tm","MP"]]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
Đầu ra Python 2
# Python
df.shape
df.head[]
0sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
Đầu ra Python 2
Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.
# Python
df.shape
df.head[]
2sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
sản lượng nào,
R Đầu ra 2# Python
## Extract the third row
df.iloc[2]
### or ###
df.iloc[2,]
### or ###
df.iloc[2,:]## Extract the first three rows
df.iloc[:3]
### or ###
df.iloc[0:3]
### or ###
df.iloc[0:3,:]
Đầu ra Python 2
Xin lưu ý rằng trong ví dụ về việc trích xuất một hàng từ khung dữ liệu, đầu ra trong R vẫn ở định dạng khung dữ liệu, nhưng đầu ra ở Python ở định dạng sê -ri Pandas. Đây là một sự khác biệt thiết yếu giữa R và Python trong việc trích xuất một hàng từ khung dữ liệu.
Tương tự, chúng ta có thể trích xuất các cột từ khung dữ liệu.
R Đầu ra 3____5Đầu ra Python 3
Khi trích xuất cột, chúng ta phải đặt cả đại tràng và dấu phẩy vào vị trí hàng trong khung vuông, đây là một sự khác biệt lớn so với việc trích xuất các hàng.follow me on Medium. Here are some of my previous articles in data science: