Bài viết này mô tả cách lấy số lượng hàng, cột và tổng số phần tử [kích thước] của pandas.DataFrame
và
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
0.pandas.DataFrame
- Hiển thị số lượng hàng, cột, v.v .:
2df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Nhận số lượng hàng:
3df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Nhận số lượng cột:
4df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Nhận số lượng hàng và cột:
5df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Nhận số lượng các yếu tố:
6df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Ghi chú khi chỉ định chỉ số
- Hiển thị số lượng hàng, cột, v.v .:
0df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Nhận số lượng các yếu tố:
8,df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
9df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
- Nhận số lượng các yếu tố:
Ví dụ, sử dụng dữ liệu người sống sót Titanic. Nó có thể được tải xuống từ Kaggle.
import pandas as pd
df = pd.read_csv['data/src/titanic_train.csv']
print[df.head[]]
# PassengerId Survived Pclass \
# 0 1 0 3
# 1 2 1 1
# 2 3 1 3
# 3 4 1 1
# 4 5 0 3
#
# Name Sex Age SibSp \
# 0 Braund, Mr. Owen Harris male 22.0 1
# 1 Cumings, Mrs. John Bradley [Florence Briggs Th... female 38.0 1
# 2 Heikkinen, Miss. Laina female 26.0 0
# 3 Futrelle, Mrs. Jacques Heath [Lily May Peel] female 35.0 1
# 4 Allen, Mr. William Henry male 35.0 0
#
# Parch Ticket Fare Cabin Embarked
# 0 0 A/5 21171 7.2500 NaN S
# 1 0 PC 17599 71.2833 C85 C
# 2 0 STON/O2. 3101282 7.9250 NaN S
# 3 0 113803 53.1000 C123 S
# 4 0 373450 8.0500 NaN S
Nhận số lượng hàng, cột, phần tử của pandas.DataFrame
Hiển thị số lượng hàng, cột, v.v .: df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
2
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
Nhận số lượng hàng:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
3df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
Nhận số lượng cột:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
4Nhận số lượng hàng: df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
3
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
Nhận số lượng cột:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
4Nhận số lượng hàng và cột:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
5Nhận số lượng cột: df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
4
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
Nhận số lượng hàng và cột:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
5print[len[df.columns]]
# 12
Nhận số lượng hàng và cột: df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
5
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
Nhận số lượng các yếu tố:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
6print[df.shape]
# [891, 12]
print[df.shape[0]]
# 891
print[df.shape[1]]
# 12
Ghi chú khi chỉ định chỉ số
- Nhận số lượng các yếu tố:
8,df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
9df.info[] # # RangeIndex: 891 entries, 0 to 890 # Data columns [total 12 columns]: # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64[2], int64[5], object[5] # memory usage: 83.6+ KB
row, col = df.shape
print[row]
# 891
print[col]
# 12
Nhận số lượng các yếu tố: df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
6
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
Ghi chú khi chỉ định chỉ số
print[df.size]
# 10692
print[df.shape[0] * df.shape[1]]
# 10692
Ghi chú khi chỉ định chỉ số
Nhận số lượng các yếu tố:
df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
8, df.info[]
#
# RangeIndex: 891 entries, 0 to 890
# Data columns [total 12 columns]:
# PassengerId 891 non-null int64
# Survived 891 non-null int64
# Pclass 891 non-null int64
# Name 891 non-null object
# Sex 891 non-null object
# Age 714 non-null float64
# SibSp 891 non-null int64
# Parch 891 non-null int64
# Ticket 891 non-null object
# Fare 891 non-null float64
# Cabin 204 non-null object
# Embarked 889 non-null object
# dtypes: float64[2], int64[5], object[5]
# memory usage: 83.6+ KB
9df_multiindex = df.set_index[['Sex', 'Pclass', 'Embarked', 'PassengerId']]
print[len[df_multiindex]]
# 891
print[len[df_multiindex.columns]]
# 8
print[df_multiindex.shape]
# [891, 8]
print[df_multiindex.size]
# 7128
Ví dụ, sử dụng dữ liệu người sống sót Titanic. Nó có thể được tải xuống từ Kaggle.
- Nhận số lượng hàng, cột, phần tử của
pandas.DataFrame
Phương pháp print[len[df.columns]]
# 12
2 của pandas.DataFrame
có thể hiển thị thông tin như số lượng hàng và cột, tổng số bộ nhớ, kiểu dữ liệu của mỗi cột và số lượng các phần tử không phải là NAN.
print[len[df.columns]]
# 12
Kết quả là đầu ra tiêu chuẩn và không thể thu được như một giá trị.
s = df['PassengerId']
print[s.head[]]
# 0 1
# 1 2
# 2 3
# 3 4
# 4 5
# Name: PassengerId, dtype: int64
Số lượng hàng của pandas.DataFrame
có thể thu được với hàm tích hợp Python print[len[df.columns]]
# 12
6.
print[len[df.columns]]
# 12
Trong ví dụ, nó được hiển thị bằng cách sử dụng
print[len[df.columns]]
# 12
7, nhưng print[len[df.columns]]
# 12
6 trả về giá trị số nguyên, do đó nó có thể được gán cho một biến khác hoặc được sử dụng để tính toán.Số lượng cột của pandas.DataFrame
có thể thu được bằng cách áp dụng
print[len[df.columns]]
# 12
6 cho thuộc tính print[df.shape]
# [891, 12]
print[df.shape[0]]
# 891
print[df.shape[1]]
# 12
2.print[len[s]]
# 891
print[s.size]
# 891
print[s.shape]
# [891,]
Thuộc tính
print[df.shape]
# [891, 12]
print[df.shape[0]]
# 891
print[df.shape[1]]
# 12
4 của pandas.DataFrame
lưu trữ số lượng hàng và cột dưới dạng Tuple print[df.shape]
# [891, 12]
print[df.shape[0]]
# 891
print[df.shape[1]]
# 12
6.