Hướng dẫn astype(str) in python - astype (str) trong python

Hàm DataFrame.astype [] được sử dụng để ép kiểu dữ liệu cột [dtype] trong đối tượng gấu trúc, nó hỗ trợ String, flat, date, int, datetime bất kỳ kiểu dữ liệu nào khác được Numpy hỗ trợ. Điều này rất hữu ích khi bạn muốn truyền cột DataFrame từ kiểu dữ liệu này sang kiểu dữ liệu khác.

Nội dung chính ShowShow

  • 1. Cú pháp DataFrame.astype []
  • 2. DataFrame.astype [] – Truyền Tất cả các Cột Kiểu dữ liệu [dtype]
  • 3. Thay đổi loại cột cụ thể
  • 4. astype [] – Truyền nhiều cột bằng cách sử dụng Dict
  • 5. astype [] với lỗi tăng hoặc bỏ qua
  • Sự kết luận
  • Người giới thiệu

Nội dung chính

  • 1. Cú pháp DataFrame.astype []
  • 2. DataFrame.astype [] – Truyền Tất cả các Cột Kiểu dữ liệu [dtype]
  • 3. Thay đổi loại cột cụ thể
  • 4. astype [] – Truyền nhiều cột bằng cách sử dụng Dict
  • 5. astype [] với lỗi tăng hoặc bỏ qua
  • Sự kết luận
  • Người giới thiệu

Nội dung chính

  1. pandas astype [] Các điểm chính –
  2. Nó được sử dụng để ép kiểu dữ liệu [dtype].
  3. Hỗ trợ thay đổi nhiều kiểu dữ liệu bằng Dict.
  • 1. Cú pháp DataFrame.astype []
  • 2. DataFrame.astype [] – Truyền Tất cả các Cột Kiểu dữ liệu [dtype]
  • 3. Thay đổi loại cột cụ thể
  • 4. astype [] – Truyền nhiều cột bằng cách sử dụng Dict
  • 5. astype [] với lỗi tăng hoặc bỏ qua
    • Sự kết luận
    • Người giới thiệu

1. Cú pháp DataFrame.astype []

Nội dung chínhDataFrame.astype[]. Chức năng này có dtype, copyerrors params.


# astype[] Syntax
DataFrame.astype[dtype, copy=True, errors="raise"]

pandas astype [] Các điểm chính –astype[].

  • Nó được sử dụng để ép kiểu dữ liệu [dtype]. – Chấp nhận kiểu numpy.dtype hoặc Python để truyền toàn bộ đối tượng gấu trúc sang cùng một kiểu. Sử dụng {col: dtype,…}, trong đó col là nhãn cột và dtype là kiểu numpy.dtype hoặc kiểu Python để truyền một hoặc nhiều cột của DataFrame.
  • Hỗ trợ thay đổi nhiều kiểu dữ liệu bằng Dict. -Default Đúng. Trả lại một bản sao khi copy=True [hãy thiết lập rất cẩn thận copy=False vì các thay đổi đối với giá trị sau đó có thể truyền sang các đối tượng gấu trúc khác].
  • Hỗ trợ tất cả các kiểu dữ liệu đi kèm với Numpy. – Tăng lương mặc định.
    • Sau đây là một cú pháp của DataFrame.astype[]. Chức năng này có dtype, copyvà errors params.
    • Sau đây là các thông số của astype[].

2. DataFrame.astype [] – Truyền Tất cả các Cột Kiểu dữ liệu [dtype]

dtype – Chấp nhận kiểu numpy.dtype hoặc Python để truyền toàn bộ đối tượng gấu trúc sang cùng một kiểu. Sử dụng {col: dtype,…}, trong đó col là nhãn cột và dtype là kiểu numpy.dtype hoặc kiểu Python để truyền một hoặc nhiều cột của DataFrame.astype[] cố gắng truyền tất cả các cột DataFrame thành được chỉ định numpy.dtype hoặc các kiểu Python [int, string, float, date, datetime]. Nếu bất kỳ cột nào không thể truyền do dữ liệu hoặc nanô không hợp lệ, điều đó sẽ gây ra lỗi ‘ValueError: chữ không hợp lệ’ và không hoạt động.

copy -Default Đúng. Trả lại một bản sao khi copy=True [hãy thiết lập rất cẩn thận copy=False vì các thay đổi đối với giá trị sau đó có thể truyền sang các đối tượng gấu trúc khác].


import pandas as pd
import numpy as np
# Create DataFrame from Dictionary
technologies = {
    'Fee' :["20000","25000","26000"],
    'Discount':["1000","2300","1500"]
              }
df = pd.DataFrame[technologies]
print[df.dtypes]

# Outputs
Fee         object
Discount    object
dtype: object

errors – Tăng lương mặc định.

Sử dụng ‘raise’ để tạo ngoại lệ khi không thể truyền do dữ liệu không hợp lệ cho loại.Số nguyên có dấu 64 bitbạn có thể dùng numpy.int64,numpy.int_, int64 hoặc int như tham số. Để truyền tới Số nguyên có dấu 32 bitsử dụng numpy.int32, int32.


# Cast all columns to int
df = df.astype[np.int64]
df = df.astype['int64']
df = df.astype['int']

print[df.dtypes] 

# All gives the same output.
Fee         int64
Discount    int64
dtype: object

Sử dụng ‘bỏ qua’ để không tăng ngoại lệ [lỗi / ngoại lệ supress]. Khi có lỗi, trả lại đối tượng ban đầu.

Theo mặc định gấu trúc astype[] cố gắng truyền tất cả các cột DataFrame thành được chỉ định numpy.dtype hoặc các kiểu Python [int, string, float, date, datetime]. Nếu bất kỳ cột nào không thể truyền do dữ liệu hoặc nanô không hợp lệ, điều đó sẽ gây ra lỗi ‘ValueError: chữ không hợp lệ’ và không hoạt động. numpy.str_ hoặc string.


# Cast all columns to string
df = df.astype['string']
print[df.dtypes]

# Outputs
Fee         string
Discount    string
dtype: object

Ví dụ dưới đây minh họa truyền tất cả các kiểu dữ liệu cột.numpy.float64, numpy.float_, float


# Cast all columns to float
df = df.astype['float']
print[df.dtypes]

# Outputs
Fee         float
Discount    flat
dtype: object

3. Thay đổi loại cột cụ thể

DataFrame.dtypes trả về tên Cột và kiểu cho tất cả các cột DataFrame. Lưu ý rằng DataFrame ở trên có các loại đối tượng cho tất cả các cột.Series.astype[]vì mỗi cột trên DataFrame là Chuỗi gấu trúc, tôi sẽ lấy cột từ DataFrame làm Chuỗi và sử dụng astype[]. Trong ví dụ dưới đây df.Fee hoặc df[‘Fee’] trả về đối tượng Dòng.


# Cast specific column type
df.Fee = df.Fee.astype['int']
[or]
df.Fee = df['Fee'].astype['int']
print[df.dtypes]

# Outputs
Fee          int64
Discount    object
dtype: object

4. astype [] – Truyền nhiều cột bằng cách sử dụng Dict

5. astype [] với lỗi tăng hoặc bỏ qua tham số của astype[] cũng hỗ trợ Từ điển ở định dạng {col: dtype,…} trong đó col là nhãn cột và dtype là numpy.dtype hoặc kiểu Python [int, string, float, date, datetime] để ép một hoặc nhiều cột DataFrame.


import pandas as pd
import numpy as np
# Create DataFrame from Dictionary
technologies = {
    'Courses':["Spark","PySpark","Hadoop"],
    'Fee' :["20000","25000","26000"],
    'Duration':['30day','40days','35days'],
    'Discount':["1000","2300","1500"]
              }

df = pd.DataFrame[technologies]
print[df.dtypes]

# Outputs
Courses     object
Fee         object
Duration    object
Discount    object
dtype: object

Sự kết luậnDataFrame.astype[]đúc Courses đến string, Fee đến intDiscount đến float.


df2 = df.astype[{'Courses':'string','Fee':'int','Discount':'float'}]
print[df2.dtypes]

# Outputs
Courses      string
Fee           int64
Duration     object
Discount    float64
dtype: object

5. astype [] với lỗi tăng hoặc bỏ qua

Sự kết luậnerrors tham số. Theo mặc định, nó sử dụng raise như một giá trị có nghĩa là tạo ra một ngoại lệ khi không thể truyền do dữ liệu không hợp lệ cho kiểu.

Người giới thiệuCoursesstring dữ liệu, hãy truyền dữ liệu này tới int và hãy xem chuyện gì xảy ra.


# Raise error when unable to cast
df.Courses = df.Courses.astype['int']

# Outputs
ValueError: invalid literal for int[] with base 10: 'Spark'

Nội dung chính


# Ignore error when unable to cast
df.Courses = df.Courses.astype['int', errors="ignore"]
print[df.dtypes]

# Outputs
Courses      string
Fee           int64
Duration     object
Discount    float64
dtype: object

Sự kết luận

Người giới thiệu

Người giới thiệu

Bài Viết Liên Quan

Chủ Đề