Hướng dẫn how do i print the number of columns in python? - làm cách nào để in số lượng cột trong python?

Bài viết này mô tả cách lấy số lượng hàng, cột và tổng số phần tử (kích thước) của pandas.DataFrame

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
0.

Show
  • pandas.DataFrame
    • Hiển thị số lượng hàng, cột, v.v .:
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      2
    • Nhận số lượng hàng:
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      3
    • Nhận số lượng cột:
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      4
    • Nhận số lượng hàng và cột:
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      5
    • Nhận số lượng các yếu tố:
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      6
    • Ghi chú khi chỉ định chỉ số
  • df.info()
    # 
    # RangeIndex: 891 entries, 0 to 890
    # Data columns (total 12 columns):
    # PassengerId    891 non-null int64
    # Survived       891 non-null int64
    # Pclass         891 non-null int64
    # Name           891 non-null object
    # Sex            891 non-null object
    # Age            714 non-null float64
    # SibSp          891 non-null int64
    # Parch          891 non-null int64
    # Ticket         891 non-null object
    # Fare           891 non-null float64
    # Cabin          204 non-null object
    # Embarked       889 non-null object
    # dtypes: float64(2), int64(5), object(5)
    # memory usage: 83.6+ KB
    
    0
    • Nhận số lượng các yếu tố:
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      8,
      df.info()
      # 
      # RangeIndex: 891 entries, 0 to 890
      # Data columns (total 12 columns):
      # PassengerId    891 non-null int64
      # Survived       891 non-null int64
      # Pclass         891 non-null int64
      # Name           891 non-null object
      # Sex            891 non-null object
      # Age            714 non-null float64
      # SibSp          891 non-null int64
      # Parch          891 non-null int64
      # Ticket         891 non-null object
      # Fare           891 non-null float64
      # Cabin          204 non-null object
      # Embarked       889 non-null object
      # dtypes: float64(2), int64(5), object(5)
      # memory usage: 83.6+ KB
      
      9

Ví dụ, sử dụng dữ liệu người sống sót Titanic. Nó có thể được tải xuống từ Kaggle.

import pandas as pd

df = pd.read_csv('data/src/titanic_train.csv')

print(df.head())
#    PassengerId  Survived  Pclass  \
# 0            1         0       3   
# 1            2         1       1   
# 2            3         1       3   
# 3            4         1       1   
# 4            5         0       3   
# 
#                                                 Name     Sex   Age  SibSp  \
# 0                            Braund, Mr. Owen Harris    male  22.0      1   
# 1  Cumings, Mrs. John Bradley (Florence Briggs Th...  female  38.0      1   
# 2                             Heikkinen, Miss. Laina  female  26.0      0   
# 3       Futrelle, Mrs. Jacques Heath (Lily May Peel)  female  35.0      1   
# 4                           Allen, Mr. William Henry    male  35.0      0   
# 
#    Parch            Ticket     Fare Cabin Embarked  
# 0      0         A/5 21171   7.2500   NaN        S  
# 1      0          PC 17599  71.2833   C85        C  
# 2      0  STON/O2. 3101282   7.9250   NaN        S  
# 3      0            113803  53.1000  C123        S  
# 4      0            373450   8.0500   NaN        S  

Nhận số lượng hàng, cột, phần tử của pandas.DataFrame

Hiển thị số lượng hàng, cột, v.v .: df.info() # # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 2

Nhận số lượng hàng:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
3

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB

Nhận số lượng cột:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
4

Nhận số lượng hàng: df.info() # # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 3

Nhận số lượng cột:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
4

Nhận số lượng hàng và cột:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
5

Nhận số lượng cột: df.info() # # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 4

Nhận số lượng hàng và cột:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
5

print(len(df.columns))
# 12

Nhận số lượng hàng và cột: df.info() # # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 5

Nhận số lượng các yếu tố:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
6

print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12

Ghi chú khi chỉ định chỉ số

  • Nhận số lượng các yếu tố:
    df.info()
    # 
    # RangeIndex: 891 entries, 0 to 890
    # Data columns (total 12 columns):
    # PassengerId    891 non-null int64
    # Survived       891 non-null int64
    # Pclass         891 non-null int64
    # Name           891 non-null object
    # Sex            891 non-null object
    # Age            714 non-null float64
    # SibSp          891 non-null int64
    # Parch          891 non-null int64
    # Ticket         891 non-null object
    # Fare           891 non-null float64
    # Cabin          204 non-null object
    # Embarked       889 non-null object
    # dtypes: float64(2), int64(5), object(5)
    # memory usage: 83.6+ KB
    
    8,
    df.info()
    # 
    # RangeIndex: 891 entries, 0 to 890
    # Data columns (total 12 columns):
    # PassengerId    891 non-null int64
    # Survived       891 non-null int64
    # Pclass         891 non-null int64
    # Name           891 non-null object
    # Sex            891 non-null object
    # Age            714 non-null float64
    # SibSp          891 non-null int64
    # Parch          891 non-null int64
    # Ticket         891 non-null object
    # Fare           891 non-null float64
    # Cabin          204 non-null object
    # Embarked       889 non-null object
    # dtypes: float64(2), int64(5), object(5)
    # memory usage: 83.6+ KB
    
    9

row, col = df.shape
print(row)
# 891

print(col)
# 12

Nhận số lượng các yếu tố: df.info() # # RangeIndex: 891 entries, 0 to 890 # Data columns (total 12 columns): # PassengerId 891 non-null int64 # Survived 891 non-null int64 # Pclass 891 non-null int64 # Name 891 non-null object # Sex 891 non-null object # Age 714 non-null float64 # SibSp 891 non-null int64 # Parch 891 non-null int64 # Ticket 891 non-null object # Fare 891 non-null float64 # Cabin 204 non-null object # Embarked 889 non-null object # dtypes: float64(2), int64(5), object(5) # memory usage: 83.6+ KB 6

Ghi chú khi chỉ định chỉ số

print(df.size)
# 10692

print(df.shape[0] * df.shape[1])
# 10692

Ghi chú khi chỉ định chỉ số

Nhận số lượng các yếu tố:

df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
8,
df.info()
# 
# RangeIndex: 891 entries, 0 to 890
# Data columns (total 12 columns):
# PassengerId    891 non-null int64
# Survived       891 non-null int64
# Pclass         891 non-null int64
# Name           891 non-null object
# Sex            891 non-null object
# Age            714 non-null float64
# SibSp          891 non-null int64
# Parch          891 non-null int64
# Ticket         891 non-null object
# Fare           891 non-null float64
# Cabin          204 non-null object
# Embarked       889 non-null object
# dtypes: float64(2), int64(5), object(5)
# memory usage: 83.6+ KB
9

df_multiindex = df.set_index(['Sex', 'Pclass', 'Embarked', 'PassengerId'])

print(len(df_multiindex))
# 891

print(len(df_multiindex.columns))
# 8

print(df_multiindex.shape)
# (891, 8)

print(df_multiindex.size)
# 7128

Ví dụ, sử dụng dữ liệu người sống sót Titanic. Nó có thể được tải xuống từ Kaggle.

  • Nhận số lượng hàng, cột, phần tử của pandas.DataFrame

Phương pháp print(len(df.columns)) # 12 2 của pandas.DataFrame có thể hiển thị thông tin như số lượng hàng và cột, tổng số bộ nhớ, kiểu dữ liệu của mỗi cột và số lượng các phần tử không phải là NAN.

Kết quả là đầu ra tiêu chuẩn và không thể thu được như một giá trị.

s = df['PassengerId']
print(s.head())
# 0    1
# 1    2
# 2    3
# 3    4
# 4    5
# Name: PassengerId, dtype: int64

Số lượng hàng của pandas.DataFrame có thể thu được với hàm tích hợp Python print(len(df.columns)) # 12 6.

Trong ví dụ, nó được hiển thị bằng cách sử dụng

print(len(df.columns))
# 12
7, nhưng
print(len(df.columns))
# 12
6 trả về giá trị số nguyên, do đó nó có thể được gán cho một biến khác hoặc được sử dụng để tính toán.

Số lượng cột của pandas.DataFrame có thể thu được bằng cách áp dụng

print(len(df.columns))
# 12
6 cho thuộc tính
print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12
2.

print(len(s))
# 891

print(s.size)
# 891

print(s.shape)
# (891,)

Thuộc tính

print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12
4 của pandas.DataFrame lưu trữ số lượng hàng và cột dưới dạng Tuple
print(df.shape)
# (891, 12)

print(df.shape[0])
# 891

print(df.shape[1])
# 12
6.