Hướng dẫn how do i ignore the first line of a csv file in python? - làm cách nào để bỏ qua dòng đầu tiên của tệp csv trong python?

Cách tốt nhất để làm điều này là bỏ qua tiêu đề sau khi chuyển đối tượng tệp cho mô -đun csv:

with open('myfile.csv', 'r', newline='') as in_file:
    reader = csv.reader(in_file)
    # skip header
    next(reader)
    for row in reader:
        # handle parsed row

Điều này xử lý các tiêu đề CSV đa dòng một cách chính xác.


Câu trả lời cũ hơn:

Có lẽ bạn muốn một cái gì đó như:

firstline = True
for row in kidfile:
    if firstline:    #skip first line
        firstline = False
        continue
    # parse the line

Một cách khác để đạt được kết quả tương tự là gọi readline trước vòng lặp:

kidfile.readline()   # skip the first line
for row in kidfile:
    #parse the line

Dòng 4: Bây giờ, chúng tôi in kết quả khung dữ liệu cuối cùng được hiển thị trong đầu ra ở trên mà không có hàng tiêu đề.

  1. Phương pháp 4: Sử dụng gấu trúc, hãy xóa tiêu đề của CSV bằng cách sử dụng vị trí chỉ mục
  2. Trong phương pháp này, chúng ta sẽ sử dụng các thuộc tính Pandas Read_CSV. Trong Skiprows, chúng tôi sẽ đề cập đến số vị trí chỉ số tiêu đề, rõ ràng là 0, vì vậy chúng tôi xác định giá trị của các đường bỏ qua trong dấu ngoặc vuông ([0]) như trong chương trình bên dưới. Bằng cách này, chúng ta có thể bỏ qua hàng tiêu đề từ CSV trong khi đọc dữ liệu.
  3. ImportPandAsaspd SkipHeaderDF = pd.Read_csv ('test.csv', skiprows = [0])
  4. Dòng 2: Chúng tôi đọc tệp CSV bằng mô -đun Pandas Read_CSV và trong đó, chúng tôi đã đề cập đến Skiprows = [0], có nghĩa là bỏ qua dòng đầu tiên trong khi đọc dữ liệu tệp CSV.

Bài viết này đã thấy bốn phương pháp khác nhau để bỏ qua hàng tiêu đề trong khi đọc tệp CSV. Tất cả các phương pháp trong bài viết trên là hoàn toàn tốt và được lập trình viên Python sử dụng để bỏ qua tiêu đề của tệp CSV trong khi đọc dữ liệu CSV. Phương thức thư viện PANDAS không chỉ cho phép chúng tôi xóa tiêu đề của dữ liệu tệp CSV mà còn có thể được sử dụng để xóa các hàng khác nếu chúng tôi chỉ định vị trí số hoặc chỉ mục của chúng cho Skiprows. Vì vậy, bỏ qua sẽ có thể loại bỏ tất cả các hàng có số sẽ được gán cho chúng. Vì vậy, mô -đun Pandas để bỏ qua tiêu đề là tốt nhất để sử dụng, và nó cũng rất thuận tiện để loại bỏ các hàng khác.

Các phương pháp khác sử dụng DicTreader và đầu đọc cũng có sẵn, nhưng chúng chỉ dành cho các hàng tiêu đề, vì vậy nếu chúng ta muốn xóa một số hàng khác, chúng ta cũng phải viết một số mã khác.

Trong bài viết này, chúng tôi sẽ tìm hiểu làm thế nào chúng tôi có thể xóa tiêu đề của dữ liệu tệp CSV trong khi đọc chính CSV vì đôi khi chúng tôi không cần tiêu đề của dữ liệu tệp CSV. Vì vậy, chúng tôi sẽ tìm hiểu bốn phương pháp này, được đưa ra dưới đây:

Sử dụng phương thức tiếp theo (): The below csv file (test.csv) we will be using for this blog.

Month,1958,1959,1960,1958,1959,1960

Sử dụng phương thức DicTreader (),340,360,417

Pandas bỏ qua dựa trên một số hàng cụ thể,318,342,391

Pandas bỏ qua dựa trên vị trí chỉ mục,362,406,419

Hãy để giải thích từng phương pháp trên chi tiết.,348,396,461

Sử dụng phương thức DicTreader (),340,360,417

Pandas bỏ qua dựa trên một số hàng cụ thể,318,342,391

Pandas bỏ qua dựa trên vị trí chỉ mục

Hãy để giải thích từng phương pháp trên chi tiết.("test.csv", "r") as record:    
# We are creating an object of the csv reader
csvreader_object=csv.reader(record)
# The line will skip the first row of the csv file (Header row)
next(csvreader_object)

Phương pháp 1: Sử dụng phương thức tiếp theo ()
for row incsvreader_object:
print(row)

Output:

['JAN','340','360','417']'JAN', '340', '360', '417']

['FEB','318','342','391']'FEB', '318', '342', '391']

['MAR','362','406','419']'MAR', '362', '406', '419']

['APR','348','396','461']'APR', '348', '396', '461']

['JAN','340','360','417']'JAN', '340', '360', '417']

['FEB','318','342','391']'FEB', '318', '342', '391']

MAR 362406419

Tháng 4 348396461

Dòng 10 trận11: Bây giờ, chúng tôi đang lặp lại đối tượng đầu đọc CSV và in từng hàng. Đầu ra trên cho thấy bây giờ không có hàng tiêu đề.:Now, we are iterating the csv reader object and printing each row. The above output shows that now there is no header row.

Phương pháp 2: Sử dụng phương thức DicTreader ()

Bây giờ, chúng ta sẽ xem làm thế nào chúng ta có thể đọc CSV như một định dạng từ điển. Nhưng sau khi đọc tệp CSV dưới dạng định dạng trực tiếp, chúng tôi sẽ chỉ in giá trị, không phải khóa, điều này sẽ giải quyết vấn đề của chúng tôi là in tất cả dữ liệu mà không cần hàng tiêu đề. Chúng tôi đang sử dụng cùng một tệp thử nghiệm.csv như chúng tôi đã sử dụng trước đây. Một ví dụ về phương pháp này được đưa ra dưới đây:

Nhập khẩu

withopen ("test.csv", "r") làm bản ghi:# Chúng tôi đang tạo một đối tượng của trình đọc CSV csvreader_object = csv.dictreader (bản ghi)# dòng sẽ bỏ qua hàng đầu tiên của tệp CSV (hàng tiêu đề)# Bởi vì nó hoạt động như một dict và chúng tôi chỉ in các giá trị không phải là Keys cho Row Incsvreader_Object: in (hàng ["tháng"], hàng ["1958"], hàng ["1959"], hàng ["1960"])("test.csv", "r") as record:
# We are creating an object of the csv reader
csvreader_object=csv.DictReader(record)
# The line will skip the first row of the csv file (Header row)
# because it works as a dict and we are printing only values not keys
for row incsvreader_object:
print(row["Month"], row["1958"], row["1959"],row["1960"])

Output:

Tháng 1 340360417340 360 417

Tháng 2 318342391318 342 391

MAR 362406419362 406 419

Tháng 4 348396461348 396 461

Tháng 1 340360417340 360 417

Tháng 2 318342391318 342 391

MAR 362406419

Tháng 4 348396461

Tháng 1 340360417

Dòng 1: Chúng tôi nhập mô -đun CSV.

Dòng 3 -5: Chúng tôi mở tệp test.csv ở chế độ đọc (‘r,) dưới dạng bản ghi và sau đó chúng tôi tạo một đối tượng của phương thức cSV.DicTreader ().

Dòng 8 trận9: Bây giờ, chúng tôi đang lặp lại đối tượng DicTreader CSV và in từng hàng. Nhưng dòng này tự động loại bỏ hàng đầu tiên khỏi đối tượng đầu đọc CSV vì DicTreader chuyển đổi từng hàng trong một mẫu Dict (Key và Value). Khi chúng tôi chỉ in giá trị, không phải khóa, chỉ hiển thị dữ liệu, không phải K, V, là mục tiêu chính của chúng tôi.
skipHeaderDf=pd.read_csv('test.csv', skiprows=1)

print(skipHeaderDf)(skipHeaderDf)

Output:

Tháng 1 340360417340 360 417

Tháng 2 318342391 FEB 318 342 391

MAR 362406419 MAR 362 406 419

Tháng 4 348396461 APR 348 396 461

Tháng 1 340360417 JAN 340 360 417

Dòng 1: Chúng tôi nhập mô -đun CSV. FEB 318 342 391

Dòng 3 -5: Chúng tôi mở tệp test.csv ở chế độ đọc (‘r,) dưới dạng bản ghi và sau đó chúng tôi tạo một đối tượng của phương thức cSV.DicTreader ().: We import the Pandas library as a pd.

Dòng 8 trận9: Bây giờ, chúng tôi đang lặp lại đối tượng DicTreader CSV và in từng hàng. Nhưng dòng này tự động loại bỏ hàng đầu tiên khỏi đối tượng đầu đọc CSV vì DicTreader chuyển đổi từng hàng trong một mẫu Dict (Key và Value). Khi chúng tôi chỉ in giá trị, không phải khóa, chỉ hiển thị dữ liệu, không phải K, V, là mục tiêu chính của chúng tôi.: We read the csv file using the pandas read_csv module, and in that, we mentioned the skiprows=1, which means skipping the first line while reading the csv file data.

Phương pháp 3: Sử dụng Pandas Read_CSV Skiprows Thuộc tính: Now, we print the final dataframe result shown in the above output without the header row.

Trong phương pháp này, chúng ta sẽ sử dụng các thuộc tính Pandas Read_CSV. Trong Skiprows, chúng tôi sẽ đề cập đến số hàng tiêu đề, rõ ràng là 1, vì vậy chúng tôi xác định giá trị của Skiprows là 1 như trong chương trình bên dưới. Bằng cách này, chúng ta có thể bỏ qua hàng tiêu đề từ CSV trong khi đọc dữ liệu.

ImportPandAsaspd SkipHeaderDF = pd.Read_csv ('test.csv', Skiprows = 1)

0 tháng 2 318342391
skipHeaderDf=pd.read_csv('test.csv', skiprows=[0])

print(skipHeaderDf)(skipHeaderDf)

Output:

Tháng 1 340360417340 360 417

Tháng 2 318342391 FEB 318 342 391

MAR 362406419 MAR 362 406 419

Tháng 4 348396461 APR 348 396 461

Tháng 1 340360417 JAN 340 360 417

Dòng 1: Chúng tôi nhập mô -đun CSV. FEB 318 342 391

Dòng 3 -5: Chúng tôi mở tệp test.csv ở chế độ đọc (‘r,) dưới dạng bản ghi và sau đó chúng tôi tạo một đối tượng của phương thức cSV.DicTreader ().: We import the Pandas library as a pd.

Dòng 8 trận9: Bây giờ, chúng tôi đang lặp lại đối tượng DicTreader CSV và in từng hàng. Nhưng dòng này tự động loại bỏ hàng đầu tiên khỏi đối tượng đầu đọc CSV vì DicTreader chuyển đổi từng hàng trong một mẫu Dict (Key và Value). Khi chúng tôi chỉ in giá trị, không phải khóa, chỉ hiển thị dữ liệu, không phải K, V, là mục tiêu chính của chúng tôi.: We read the csv file using the pandas read_csv module, and in that, we mentioned the skiprows=[0], which means skip the first line while reading the csv file data.

Phương pháp 3: Sử dụng Pandas Read_CSV Skiprows Thuộc tính: Now, we print the final dataframe result shown in the above output without the header row.

Conclusion:

Trong phương pháp này, chúng ta sẽ sử dụng các thuộc tính Pandas Read_CSV. Trong Skiprows, chúng tôi sẽ đề cập đến số hàng tiêu đề, rõ ràng là 1, vì vậy chúng tôi xác định giá trị của Skiprows là 1 như trong chương trình bên dưới. Bằng cách này, chúng ta có thể bỏ qua hàng tiêu đề từ CSV trong khi đọc dữ liệu.

ImportPandAsaspd SkipHeaderDF = pd.Read_csv ('test.csv', Skiprows = 1)