Hướng dẫn remove header row in dataframe python - xóa hàng tiêu đề trong khung dữ liệu python

Tôi nghĩ rằng bạn không thể xóa tên cột, chỉ đặt lại chúng bằng

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
1 với
print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
2:

print df.shape[1]
2

print range[df.shape[1]]
[0, 1]

df.columns = range[df.shape[1]]
print df
    0   1
0  23  12
1  21  44
2  98  21

Điều này giống như sử dụng

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
3 và
print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
4:

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21

Giải pháp tiếp theo với

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
5:

print df.to_csv[index=False]
A,B
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[index=False]], header=None, skiprows=1]
    0   1
0  23  12
1  21  44
2  98  21

không

spl_len [cm]

SPL_WID [CM]

Petal_len [cm]

Đoạn trích

df.columns = df.iloc[0] 

df = df[1:]

df.head[]

peral_wid [cm]

Đoạn trích

import pandas as pd

df= pd.read_csv['iris.csv', header=[0]]

df.head[]

hoa

Gấu trúc đặt hai hàng làm tiêu đề trong khi đọc CSV

Trong phần này, bạn sẽ học cách đặt hai hàng làm tiêu đề trong khi đọc dữ liệu từ tệp CSV.

  • Phương thức
    df.columns = df.iloc[0] 
    
    df = df[1:]
    
    df.head[]
    6 chấp nhận tham số
    df.columns = df.iloc[0] 
    
    df = df[1:]
    
    df.head[]
    7. Bạn có thể vượt qua
    import pandas as pd
    
    df= pd.read_csv['iris.csv', header=[0]]
    
    df.head[]
    1 để tạo hai hàng đầu tiên từ tệp CSV dưới dạng tiêu đề của DataFrame. Sử dụng theo cách này, bạn có thể tạo một DataFrame với nhiều hàng tiêu đề.
  • Sử dụng đoạn trích dưới đây để đặt hai hàng đầu tiên làm tiêu đề trong khi đọc tệp CSV để tạo DataFrame.
  • Khi bạn in DataFrame, bạn có thể thấy hai hàng đầu tiên của tệp CSV được tạo dưới dạng tiêu đề của DataFrame.
  • Gấu trúc thay thế tiêu đề bằng hàng thứ n
  • Gấu trúc đặt hàng đầu tiên làm tiêu đề trong khi đọc CSV
  • Gấu trúc đặt hai hàng làm tiêu đề trong khi đọc CSV
  • Sự kết luận
  • Bạn cũng có thể thích

Mẫu dữ liệu

Đây là khung dữ liệu mẫu được sử dụng trong suốt hướng dẫn.

Trước tiên, bạn sẽ tạo một khung dữ liệu bằng dữ liệu IRIS.

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
6 đang có một danh sách các bộ dữ liệu trong đó mỗi tuple có sepal_length, sepal_width, petal_length, petal_width và hoa_type biểu thị loại hoa dựa trên các phép đo sepal và cánh hoa.

Ở đây, các tiêu đề cột cũng có sẵn trực tiếp trong danh sách, do đó phương thức

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
7 sẽ coi nó chỉ là một hàng khác và tạo một khung dữ liệu với các số chỉ mục làm tiêu đề cột như hiển thị bên dưới.

Đoạn trích

import pandas as pd

iris = [ ['sepal_length', 'sepal_width', 'petal_length','petal_width', 'flower_type'],
             ['spl_len[cm]', 'spl_wid[cm]' , 'petal_len[cm]', 'petal_wid[cm]','flower_type'],
         [5.1,3.5,1.4,0.2,'Iris-setosa'],
[4.9,3,1.4,0.2,'Iris-setosa'],
[4.7,3.2,1.3,0.2,'Iris-setosa'],
[4.6,3.1,1.5,0.2,'Iris-setosa'],
[5,3.6,1.4,0.2,'Iris-setosa']
              ]

#Create a DataFrame object with iris Data
df = pd.DataFrame[iris] 

df.head[5]        

Khi bạn in DataFrame, bạn có thể thấy rằng các số có sẵn dưới dạng tiêu đề cột và tên cột có sẵn dưới dạng các hàng riêng biệt.

DataFrame trông giống như

0123401234
sepal_lengthSepal_widthPetal_lengthPetal_widthhoa_type
spl_len [cm]SPL_WID [CM]Petal_len [cm]Petal_wid [cm]hoa_type
5.1 3.5 1.4 0.2 spl_len [cm]
4.9 3 1.4 0.2 spl_len [cm]
4.7 3.2 1.3 0.2 spl_len [cm]

SPL_WID [CM]

Petal_len [cm]

Petal_wid [cm]

  • Iris-setosa
  • Bây giờ, bạn sẽ thấy làm thế nào để thay thế tiêu đề của gấu trúc DataFrame bằng hàng đầu tiên.

Khi các tiêu đề cột có sẵn trong hàng đầu tiên của DataFrame, bạn có thể tạo thông tin đó dưới dạng tiêu đề cột và xóa nó khỏi các hàng DataFrame.

Có hai phương pháp có sẵn cho nó.

Sử dụng toán tử cắt lát

Sử dụng ILOC

where,

  • Hãy cùng xem các phương pháp này một cách chi tiết.
  • Sử dụng toán tử cắt để thay thế tiêu đề bằng hàng đầu tiên

Toán tử cắt được sử dụng để cắt các hàng của DataFrame từ một chỉ mục cụ thể.

  • Ví dụ: nếu bạn muốn cắt các hàng bắt đầu từ chỉ mục
    print df.to_csv[header=None,index=False]
    23,12
    21,44
    98,21
    
    print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
        0   1
    0  23  12
    1  21  44
    2  98  21
    
    8, bạn có thể sử dụng câu lệnh
    print df.to_csv[header=None,index=False]
    23,12
    21,44
    98,21
    
    print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
        0   1
    0  23  12
    1  21  44
    2  98  21
    
    9.
  • print df.to_csv[header=None,index=False]
    23,12
    21,44
    98,21
    
    print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
        0   1
    0  23  12
    1  21  44
    2  98  21
    
    8 biểu thị chỉ số bắt đầu của các hàng được cắt lát
  • print df.to_csv[index=False]
    A,B
    23,12
    21,44
    98,21
    
    print pd.read_csv[io.StringIO[u""+df.to_csv[index=False]], header=None, skiprows=1]
        0   1
    0  23  12
    1  21  44
    2  98  21
    
    1 được sử dụng để biểu thị phạm vi. Nếu bạn muốn cắt lát cho đến một hàng cụ thể, bạn có thể sử dụng chỉ mục đó sau
    print df.to_csv[index=False]
    A,B
    23,12
    21,44
    98,21
    
    print pd.read_csv[io.StringIO[u""+df.to_csv[index=False]], header=None, skiprows=1]
        0   1
    0  23  12
    1  21  44
    2  98  21
    
    1. Nếu không, bạn chỉ có thể sử dụng
    print df.to_csv[index=False]
    A,B
    23,12
    21,44
    98,21
    
    print pd.read_csv[io.StringIO[u""+df.to_csv[index=False]], header=None, skiprows=1]
        0   1
    0  23  12
    1  21  44
    2  98  21
    
    1. Điều này có nghĩa là tất cả các hàng cho đến khi kết thúc sẽ được cắt lát.

Trong đoạn trích dưới đây, các hoạt động sau đây xảy ra.will not reset the index of the rows. The header row will have index 0, the first row will have index 1 and the second row will have index 2, and so on.

Đoạn trích

df.columns = df.iloc[0] 

df = df[1:]

df.head[]

Khi bạn in DataFrame, bạn có thể thấy rằng các số có sẵn dưới dạng tiêu đề cột và tên cột có sẵn dưới dạng các hàng riêng biệt.

DataFrame trông giống như

0sepal_lengthsepal_widthpetal_lengthpetal_widthflower_type12345
spl_len [cm]SPL_WID [CM]Petal_len [cm]Petal_wid [cm]hoa_type
5.1 3.5 1.4 0.2 spl_len [cm]
4.9 3 1.4 0.2 spl_len [cm]
4.7 3.2 1.3 0.2 spl_len [cm]
4.6 3.1 1.5 0.2 spl_len [cm]

SPL_WID [CM]

Petal_len [cm]

Petal_wid [cm]

Iris-setosa

Bây giờ, bạn sẽ thấy làm thế nào để thay thế tiêu đề của gấu trúc DataFrame bằng hàng đầu tiên.

Khi các tiêu đề cột có sẵn trong hàng đầu tiên của DataFrame, bạn có thể tạo thông tin đó dưới dạng tiêu đề cột và xóa nó khỏi các hàng DataFrame.will reset the index of the rows. The header row will not have an index and the first row will have an index

print df.to_csv[index=False]
A,B
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[index=False]], header=None, skiprows=1]
    0   1
0  23  12
1  21  44
2  98  21
4 and the second row will have an index
print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
8 and so on.

Đoạn trích

df.columns = df.iloc[0]

df = df.iloc[1:].reset_index[drop=True]

df.head[]

DataFrame trông giống như

sepal_lengthsepal_widthpetal_lengthpetal_widthflower_type01234
spl_len [cm]SPL_WID [CM]Petal_len [cm]Petal_wid [cm]hoa_type
5.1 3.5 1.4 0.2 spl_len [cm]
4.9 3 1.4 0.2 spl_len [cm]
4.7 3.2 1.3 0.2 spl_len [cm]
4.6 3.1 1.5 0.2 spl_len [cm]

SPL_WID [CM]

Petal_len [cm]

Petal_wid [cm]

Iris-setosa

Bây giờ, bạn sẽ thấy làm thế nào để thay thế tiêu đề của gấu trúc DataFrame bằng hàng đầu tiên.

Khi các tiêu đề cột có sẵn trong hàng đầu tiên của DataFrame, bạn có thể tạo thông tin đó dưới dạng tiêu đề cột và xóa nó khỏi các hàng DataFrame.

Sử dụng đoạn trích dưới đây để đặt hai hàng đầu tiên làm hàng tiêu đề từ DataFrame.

Đoạn trích

df.columns = [df.iloc[0], df.iloc[1]]

df = df[2:]

df.head[]

Khi bạn in DataFrame bằng phương thức

df.columns = df.iloc[0] 

df = df[1:]

df.head[]
3, bạn có thể thấy rằng Pandas DataFrame đang có hai tiêu đề cột cho mỗi cột.

DataFrame trông giống như

sepal_lengthsepal_widthpetal_lengthpetal_widthflower_type1spl_len[cm]spl_wid[cm]petal_len[cm]petal_wid[cm]flower_type23456
5.1 3.5 1.4 0.2 Iris-setosa
4.9 3 1.4 0.2 Iris-setosa
4.7 3.2 1.3 0.2 Iris-setosa
4.6 3.1 1.5 0.2 Iris-setosa
5 3.6 1.4 0.2 Iris-setosa

Gấu trúc thay thế tiêu đề bằng hàng thứ n

Nếu bạn có các tiêu đề tiềm năng tại bất kỳ hàng tiêu đề nào, bạn có thể thay thế tiêu đề bằng hàng thứ n.

Chỉ cần sử dụng chỉ số của hàng cụ thể đó ở vị trí của

df.columns = df.iloc[0] 

df = df[1:]

df.head[]
4 trong câu lệnh
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
5.

Gấu trúc đặt hàng đầu tiên làm tiêu đề trong khi đọc CSV

Trong phần này, bạn sẽ học cách đặt hàng đầu tiên làm tiêu đề trong khi đọc dữ liệu từ tệp CSV bằng phương thức read_csv.

Phương thức

df.columns = df.iloc[0] 

df = df[1:]

df.head[]
6 chấp nhận tham số
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
7. Bạn có thể vượt qua
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
8 để tạo hàng đầu tiên từ tệp CSV dưới dạng tiêu đề của DataFrame.

Sử dụng đoạn trích dưới đây để đặt hàng đầu tiên làm tiêu đề trong khi đọc tệp CSV để tạo DataFrame.

Đoạn trích

import pandas as pd

df= pd.read_csv['iris.csv', header=[0]]

df.head[]

Khi in DataFrame, bạn có thể thấy rằng hàng đầu tiên từ tệp CSV được đặt làm tiêu đề của DataFrame.

DataFrame trông giống như

Iris-setosasepal_lengthsepal_widthpetal_lengthpetal_widthflower_type01234
Gấu trúc thay thế tiêu đề bằng hàng thứ nNếu bạn có các tiêu đề tiềm năng tại bất kỳ hàng tiêu đề nào, bạn có thể thay thế tiêu đề bằng hàng thứ n.Chỉ cần sử dụng chỉ số của hàng cụ thể đó ở vị trí của
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
4 trong câu lệnh
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
5.
Gấu trúc đặt hàng đầu tiên làm tiêu đề trong khi đọc CSVTrong phần này, bạn sẽ học cách đặt hàng đầu tiên làm tiêu đề trong khi đọc dữ liệu từ tệp CSV bằng phương thức read_csv.Phương thức
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
6 chấp nhận tham số
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
7. Bạn có thể vượt qua
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
8 để tạo hàng đầu tiên từ tệp CSV dưới dạng tiêu đề của DataFrame.
1 5.1 3.5 1.4 0.2 Iris-setosa
2 4.9 3 1.4 0.2 Iris-setosa
3 4.7 3.2 1.3 0.2 Iris-setosa
4 4.6 3.1 1.5 0.2 Iris-setosa

Gấu trúc thay thế tiêu đề bằng hàng thứ n

Nếu bạn có các tiêu đề tiềm năng tại bất kỳ hàng tiêu đề nào, bạn có thể thay thế tiêu đề bằng hàng thứ n.

Chỉ cần sử dụng chỉ số của hàng cụ thể đó ở vị trí của

df.columns = df.iloc[0] 

df = df[1:]

df.head[]
4 trong câu lệnh
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
5.

Gấu trúc đặt hàng đầu tiên làm tiêu đề trong khi đọc CSV

Đoạn trích

print df.to_csv[header=None,index=False]
23,12
21,44
98,21

print pd.read_csv[io.StringIO[u""+df.to_csv[header=None,index=False]], header=None]
    0   1
0  23  12
1  21  44
2  98  21
0

Trong phần này, bạn sẽ học cách đặt hàng đầu tiên làm tiêu đề trong khi đọc dữ liệu từ tệp CSV bằng phương thức read_csv.

DataFrame trông giống như

Iris-setosasepal_lengthsepal_widthpetal_lengthpetal_widthflower_typeIris-setosaspl_len[cm]spl_wid[cm]petal_len[cm]peral_wid[cm]Gấu trúc thay thế tiêu đề bằng hàng thứ n01234
1 5.1 3.5 1.4 0.2 Iris-setosa
2 4.9 3.0 1.4 0.2 Iris-setosa
3 4.7 3.2 1.3 0.2 Iris-setosa
4 4.6 3.1 1.5 0.2 Iris-setosa
5 5.0 3.6 1.4 0.2 Iris-setosa

Gấu trúc thay thế tiêu đề bằng hàng thứ n

Nếu bạn có các tiêu đề tiềm năng tại bất kỳ hàng tiêu đề nào, bạn có thể thay thế tiêu đề bằng hàng thứ n.

Chỉ cần sử dụng chỉ số của hàng cụ thể đó ở vị trí của

df.columns = df.iloc[0] 

df = df[1:]

df.head[]
4 trong câu lệnh
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
5.

Gấu trúc đặt hàng đầu tiên làm tiêu đề trong khi đọc CSV

Trong phần này, bạn sẽ học cách đặt hàng đầu tiên làm tiêu đề trong khi đọc dữ liệu từ tệp CSV bằng phương thức read_csv.

Phương thức
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
6 chấp nhận tham số
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
7. Bạn có thể vượt qua
df.columns = df.iloc[0] 

df = df[1:]

df.head[]
8 để tạo hàng đầu tiên từ tệp CSV dưới dạng tiêu đề của DataFrame.

  • Sử dụng đoạn trích dưới đây để đặt hàng đầu tiên làm tiêu đề trong khi đọc tệp CSV để tạo DataFrame.
  • Khi in DataFrame, bạn có thể thấy rằng hàng đầu tiên từ tệp CSV được đặt làm tiêu đề của DataFrame.
  • không

Bài Viết Liên Quan

Chủ Đề