Cách đổi tên tên cột trong tệp CSV bằng Python mà không cần gấu trúc

Để xuất DataFrame của gấu trúc sang CSV mà không có chỉ mục (không có chỉ mục hàng), hãy sử dụng tham số index=False và để bỏ qua/xóa tiêu đề, hãy sử dụng tham số header=False trên phương thức to_csv(). Trong bài viết này, tôi sẽ giải thích cách xóa chỉ mục và tiêu đề trên tệp csv với các ví dụ. Lưu ý rằng phương thức to_csv() cũng hỗ trợ một số tham số khác để ghi DataFrame của gấu trúc vào tệp CSV

1. Pandas sang CSV không có Chỉ mục và Tiêu đề

Theo mặc định, việc xuất DataFrame của gấu trúc sang CSV bao gồm tên cột trên hàng đầu tiên, chỉ mục hàng trên cột đầu tiên và ghi một tệp có dấu phân cách được phân tách bằng dấu phẩy vào các cột riêng biệt. gấu trúc. Khung dữ liệu. phương thức to_csv() cung cấp các tham số để bỏ qua chỉ mục và tiêu đề trong khi viết

Trước tiên, hãy tạo một DataFrame với một vài hàng và cột cùng với tên chỉ mục và tiêu đề


# Create a DataFrame
import pandas as pd
import numpy as np
technologies = {
    'Courses':["Spark","PySpark","Hadoop","Python"],
    'Fee' :[22000,25000,np.nan,24000],
    'Duration':['30day',None,'55days',np.nan],
    'Discount':[1000,2300,1000,np.nan]
          }
df = pd.DataFrame(technologies)

2. Pandas sang CSV không có chỉ mục

pandas DataFrame sang CSV không có chỉ mục có thể được thực hiện bằng cách sử dụng tham số index=False của phương thức to_csv(). Với điều này, bạn có thể chỉ định bỏ qua chỉ mục trong khi ghi/xuất DataFrame sang tệp CSV


# Remover column header and index
df.to_csv("c:/tmp/courses.csv",index=False)

Viết tệp courses.csv mà không có chỉ mục


Courses,Fee,Duration,Discount
Spark,22000.0,30day,1000.0
PySpark,25000.0,,2300.0
Hadoop,,55days,1000.0
Python,24000.0,,

3. Pandas sang CSV không có tiêu đề

Để ghi DataFrame vào CSV mà không có tiêu đề cột (xóa tên cột), hãy sử dụng tham số header=False trên phương thức


# Remover column header and index
df.to_csv("c:/tmp/courses.csv",index=False)
1


# Remove header while writing
df.to_csv("c:/tmp/courses.csv",header=False)

Viết tệp courses.csv dưới dạng


0,Spark,22000.0,30day,1000.0
1,PySpark,25000.0,,2300.0
2,Hadoop,,55days,1000.0
3,Python,24000.0,,

4. Xuất không có chỉ mục và tiêu đề

Hãy kết hợp những điều này và xem cách bạn có thể sử dụng cả việc xóa tên cột và chỉ mục trên tệp CSV


# Remove header & index while writing
df.to_csv("c:/tmp/courses.csv",header=False, index=False)

Phần kết luận

Trong bài viết nhanh này, bạn đã học cách xóa tiêu đề không có tên cột và chỉ mục trong khi ghi DataFrame vào tệp CSV. Sử dụng tham số header=False để xóa các cột và sử dụng index=False để xóa chỉ mục (không có chỉ mục hàng) trên phương thức


# Remover column header and index
df.to_csv("c:/tmp/courses.csv",index=False)
1

Để đọc tệp CSV không có tiêu đề, hãy sử dụng Không có giá trị nào cho tham số tiêu đề trong hàm pandas read_csv(). Trong bài viết này, tôi sẽ giải thích các giá trị tham số tiêu đề khác nhau {int, danh sách int, Không, mặc định 'infer'} hỗ trợ cách tải CSV có tiêu đề và không có tiêu đề

1. Đọc CSV không có tiêu đề

Theo mặc định, gấu trúc coi tệp CSV có tiêu đề (nó sử dụng dòng đầu tiên của tệp CSV làm bản ghi tiêu đề), trong trường hợp bạn muốn đọc tệp CSV không có tiêu đề, hãy sử dụng tham số header=None

Cách đổi tên tên cột trong tệp CSV bằng Python mà không cần gấu trúc
CSV không có tiêu đề

Khi sử dụng header=None, nó coi bản ghi đầu tiên là bản ghi dữ liệu

________số 8_______

Sản lượng dưới sản lượng

0 1 2 3 0 Spark 25000 50 ngày 2000 1 Pandas 20000 35 ngày 1000 2 Java 15000 NaN 800 3 Python 15000 30 ngày 500 4 PHP 18000 30 ngày 800

2. Đặt tên tiêu đề

Khi tiêu đề bị bỏ qua, nó được gán các số làm tên cột. Để sửa lỗi này, hàm read_csv() cung cấp thông số names để gán tên cột tùy chỉnh trong khi đọc


columns = ['courses','course_fee','course_duration','course_discount']
df = pd.read_csv('/Users/admin/apps/courses.csv', header=None, names=columns)
print(df)

Sản lượng dưới sản lượng


   courses course_fee course_duration course_discount
0    Spark      25000         50 Days            2000
1   Pandas      20000         35 Days            1000
2     Java      15000             NaN             800
3   Python      15000         30 Days             500
4      PHP      18000         30 Days             800

3. gấu trúc Đọc CSV với Tiêu đề

Như tôi đã nói ở trên, theo mặc định, nó đọc CSV có tiêu đề (Coi hàng đầu tiên là tiêu đề). Nếu bạn muốn xem xét ở hàng thứ N, hãy sử dụng thông số header=N (thay thế N theo nhu cầu của bạn)


df = pd.read_csv('/Users/admin/apps/courses.csv')
print(df)

4. Bỏ qua bản ghi tiêu đề

Giả sử rằng bạn có một tiêu đề với tên cột là hàng đầu tiên trên tệp CSV và bạn muốn bỏ qua điều này khi đọc, để làm như vậy, hãy sử dụng skiprows=1 và gán tên cột mới như đã giải thích ở trên

Cách đổi tên tên cột trong tệp CSV bằng Python mà không cần gấu trúc


columns = ['courses','course_fee','course_duration','course_discount']
df = pd.read_csv('/Users/admin/apps/courses.csv', header=None, 
     names=columns, skiprows=1)
print(df)

Bằng cách không sử dụng skiprows=1 param, nó sẽ chuyển đổi hàng tiêu đề với tên cột thành bản ghi dữ liệu

Phần kết luận

Trong bài viết này, bạn đã học cách đọc tệp CSV gấu trúc có và không có tiêu đề, Nếu bạn không có tiêu đề, hãy sử dụng header=None. Nếu bạn có tiêu đề thì hãy sử dụng skiprows=1 và sử dụng tiêu đề=None