Theo mặc định, dtype của mảng được trả về sẽ là dtype NumPy phổ biến của tất cả các loại trong DataFrame. Ví dụ: nếu dtypes là
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
7 và
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
8, kết quả dtype sẽ là
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
8. Điều này có thể yêu cầu sao chép dữ liệu và ép buộc các giá trị, điều này có thể tốn kémParametersdtype str hoặc numpy. dtype, tùy chọndtype để chuyển đến
# Output:
[['Spark' '20000' '1000']
['PySpark' '25000' '2300']
['Python' '22000' '1200']]
0bản sao bool, mặc định SaiCó đảm bảo rằng giá trị trả về không phải là dạng xem trên một mảng khác hay không. Lưu ý rằng
# Output:
[['Spark' '20000' '1000']
['PySpark' '25000' '2300']
['Python' '22000' '1200']]
1 không đảm bảo rằng
# Output:
[['Spark' '20000' '1000']
['PySpark' '25000' '2300']
['Python' '22000' '1200']]
2 là bản sao. Thay vào đó,
# Output:
[['Spark' '20000' '1000']
['PySpark' '25000' '2300']
['Python' '22000' '1200']]
3 đảm bảo rằng một bản sao được tạo ra, ngay cả khi không thực sự cần thiếtna_value Bất kỳ, tùy chọnGiá trị để sử dụng cho các giá trị bị thiếu. Giá trị mặc định phụ thuộc vào dtype và dtypes của cột DataFrame
Chúng ta có thể chuyển đổi mảng Numpy thành Pandas DataFrame bằng cách sử dụng các cú pháp khác nhau. Trong bài viết này, tôi sẽ giải thích cách chuyển đổi một mảng Numpy thành Pandas DataFrame với các ví dụ
1. Ví dụ nhanh để chuyển đổi Mảng Numpy thành DataFrame
Nếu bạn đang vội, dưới đây là một số ví dụ nhanh về cách chuyển đổi mảng NumPy thành DataFrame
# Below are quick examples
# Example 1: Convert 2-dimensional NumPy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 12000]]]
df = pd.DataFrame[{'Course': array[:, 0], 'Fee': array[:, 1], 'Discount': array[:, 2]}]
# Example 2: Convert array to DataFrame using from_records[]
array = np.arange[6].reshape[2, 3]
df = pd.DataFrame.from_records[array]
# Example 4: Convert array to DataFrame
arr1 = np.arange[start = 1, stop = 10, step = 1].reshape[-1]
arr2 = np.random.rand[9].reshape[-1]
df = pd.DataFrame[]
df['col1'] = arr1
df['col2'] = arr2
# Example 5 : Convert using transpose[] function
array = np.array[[['Courses', 'Fee'], ['Spark', 'PySpark'], [20000, 25000]]]
df = pd.DataFrame[i for i in array].transpose[]
df.drop[0, axis=1, inplace=True]
df.columns = array[0]
2. Mảng Numpy là gì?
Chúng tôi biết rằng một mảng NumPy là một cấu trúc dữ liệu [thường là các số] chứa các giá trị cùng loại, tương tự như một danh sách. Nhưng mảng hiệu quả hơn danh sách Python và cũng nhỏ gọn hơn nhiều. Trong trường hợp muốn dữ liệu ở dạng mảng, bạn có thể chuyển đổi Sê-ri thành mảng hoặc Pandas DataFrame thành mảng Numpy
Vì bài viết của chúng tôi là chuyển đổi Xét nghiệm NumPy thành DataFrame, hãy tạo mảng NumPy bằng cách sử dụng np. array[] và sau đó chuyển đổi nó thành DataFrame
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
Sản lượng dưới sản lượng
# Output:
[['Spark' '20000' '1000']
['PySpark' '25000' '2300']
['Python' '22000' '1200']]
3. Khung dữ liệu là gì?
pandas DataFrame là cấu trúc dữ liệu hai chiều, cấu trúc dữ liệu dạng bảng không đồng nhất, không thay đổi với các hàng và cột trục được gắn nhãn. pandas Dataframe bao gồm ba thành phần chính, dữ liệu, hàng và cột. Pandas được xây dựng trên thư viện NumPy và được viết bằng các ngôn ngữ như
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
3,
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
4 và
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
54. Chuyển đổi mảng NumPy thành Pandas DataFrame
Hãy chuyển đổi mảng NumPy ở trên thành DataFrame bằng cú pháp bên dưới. Theo cú pháp này, tôi đang sử dụng kỹ thuật cắt NumPy để cung cấp các phần tử cột cho DataFrame
# Convert array to DataFrame
df = pd.DataFrame[{'Course': array[:, 0], 'Fee': array[:, 1], 'Discount': array[:, 2]}]
print[df]
Sản lượng dưới sản lượng
# Output:
Course Fee Discount
0 Spark 20000 1000
1 PySpark 25000 2300
2 Python 22000 1200
5. Chuyển đổi Array thành DataFrame bằng from_records[]
Trong ví dụ này, tôi sẽ tạo mảng 2-D NumPy sử dụng hàm arange[] và reshape[]. Tôi sẽ sử dụng mảng này và chuyển đổi sang DataFrame bằng hàm from_records[]
________số 8Hãy chuyển đổi DataFrame từ mảng bằng cách sử dụng hàm
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
6. Trong cú pháp này, chuyển mảng vào hàm from_records[]. Ví dụ,
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
06. Chuyển đổi nhiều mảng thành DataFrame
Nếu bạn có hai đối tượng mảng NumPy và muốn chuyển đổi chúng thành DataFrame, hãy gán mỗi mảng dưới dạng một cột cho Dataframe. Ở đây, tôi đang sử dụng sắp xếp [] và ngẫu nhiên. hàm rand[] để tạo mảng
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
1Sản lượng dưới sản lượng
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
2Hãy chuyển đổi mảng thành DataFrame, Để tạo DataFrame, chúng ta có thể đặt các mảng trên thành một cột của DataFrame mà chúng ta muốn chuyển đổi từ các mảng đã cho
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
3Sản lượng dưới sản lượng
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
07. Một ví dụ khác để chuyển đổi
Trong ví dụ này, tôi sẽ tạo mảng NumPy bằng cách sử dụng numpy. mảng [] và tôi sẽ sử dụng mảng này để chuyển đổi DataFrame
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
1Hãy chuyển đổi mảng trên thành DataFrame bằng Python cho vòng lặp và pd. chức năng chuyển vị []. Ví dụ,
# Create a 2 dimensional numpy array
array = np.array[[['Spark', 20000, 1000], ['PySpark', 25000, 2300], ['Python', 22000, 1200]]]
print[array]
print[type[array]]
28. Sự kết luận
Trong bài viết này, tôi đã giải thích cách chuyển đổi một mảng Numpy thành Pandas DataFrame bằng các cú pháp khác nhau với các ví dụ