Hướng dẫn how do i import data from databricks to excel? - làm cách nào để nhập dữ liệu từ databricks sang excel?

Bỏ qua nội dung chính

Trình duyệt này không còn được hỗ trợ.

Nâng cấp lên Microsoft Edge để tận dụng các tính năng mới nhất, cập nhật bảo mật và hỗ trợ kỹ thuật.

Làm cách nào để xuất kết quả Databricks để Excel?

  • Đầu tiên, bạn sẽ chuyển đổi khung dữ liệu pyspark của mình thành khung dữ liệu gấu trúc [topandas []] và sau đó sử dụng "to_excel" để ghi vào định dạng Excel. Lưu câu trả lời này. Hiển thị hoạt động trên bài viết này.
  • Làm cách nào để đọc dữ liệu Spark trong Excel?
  • df = tia lửa. đọc\.

định dạng ["com. creailytics. Spark. Excel"] \.

Tùy chọn ["Tiêu đề", "Đúng"] \.

Tải [input_path + input_folder_general + "test1. xlsx"].

  • Làm cách nào để xuất pyspark dataFrame sang xlsx?

  • Để viết một đối tượng duy nhất vào tệp .xlsx Excel, chỉ cần chỉ định tên tệp đích. Để ghi vào nhiều tờ, cần phải tạo một đối tượng Excelwriter với tên tệp đích và chỉ định một tờ trong tệp để ghi vào. Nhiều tờ có thể được viết bằng cách chỉ định bảng độc đáo.

  • Kết nối với Azure Databricks từ Excel, Python hoặc R

Bài báo

10/10/2022

  1. 5 phút để đọc

  2. Trong bài viết nàyConfiguration tab, click the JDBC/ODBC tab and copy the values for Server Hostname and HTTP Path. You need these values to complete the steps in this article.

  3. Trong bài viết này, bạn tìm hiểu cách sử dụng trình điều khiển ODBC của Databricks để kết nối Azure Databricks với ngôn ngữ Microsoft Excel, Python hoặc R. Khi bạn thiết lập kết nối, bạn có thể truy cập dữ liệu trong Azure Databricks từ các máy khách Excel, Python hoặc R. Bạn cũng có thể sử dụng các máy khách để phân tích sâu hơn các dữ liệu.ODBC Data Sources application [32-bit or 64-bit] depending on the application. To connect from Excel, use the 64-bit version. To connect from R and Python, use the 64-bit version.

  4. Điều kiện tiên quyếtUser DSN tab, click Add. In the Create New Data Source dialog box, select the Simba Spark ODBC Driver, and then click Finish.

  5. Trong hộp thoại Simba Spark ODBC, cung cấp các giá trị sau:Simba Spark ODBC Driver dialog box, provide the following values:

    Bảng sau đây cung cấp thông tin về các giá trị để cung cấp trong hộp thoại.

    Đồng ruộngGiá trị
    Tên nguồn dữ liệu Cung cấp một tên cho nguồn dữ liệu.
    Host[s] Cung cấp giá trị mà bạn đã sao chép từ không gian làm việc dữ liệu cho máy chủ máy chủ.
    Hải cảng Nhập 443.
    Xác thực> Cơ chế > Mechanism Chọn tên người dùng và mật khẩu.
    Tên tài khoản Nhập mã thông báo.
    Mật khẩu Nhập giá trị mã thông báo mà bạn đã sao chép từ không gian làm việc dữ liệu.

    Thực hiện các bước bổ sung sau trong hộp thoại Cài đặt DSN.

    • Nhấp vào Tùy chọn HTTP. Trong hộp thoại mở ra, dán giá trị cho đường dẫn HTTP mà bạn đã sao chép từ không gian làm việc của Databricks. Bấm OK.HTTP Options. In the dialog box that opens up, paste the value for HTTP Path that you copied from Databricks workspace. Click OK.
    • Nhấp vào tùy chọn SSL. Trong hộp thoại mở ra, chọn hộp kiểm Bật SSL. Bấm OK.SSL Options. In the dialog box that opens up, select the Enable SSL check box. Click OK.
    • Nhấp vào Kiểm tra để kiểm tra kết nối với Azure Databricks. Bấm OK để lưu cấu hình.Test to test the connection to Azure Databricks. Click OK to save the configuration.
    • Trong hộp thoại Quản trị viên nguồn dữ liệu ODBC, bấm OK.ODBC Data Source Administrator dialog box, click OK.

Bây giờ bạn đã thiết lập DSN của bạn. Trong các phần tiếp theo, bạn sử dụng DSN này để kết nối với Azure Databricks từ Excel, Python hoặc R.

Kết nối từ Microsoft Excel

Trong phần này, bạn lấy dữ liệu từ Azure Databricks vào Microsoft Excel bằng DSN bạn đã tạo trước đó. Trước khi bạn bắt đầu, hãy đảm bảo bạn đã cài đặt Microsoft Excel trên máy tính. Bạn có thể sử dụng phiên bản dùng thử của Excel từ Microsoft Excel dùng thử.

  1. Mở sổ làm việc trống trong Microsoft Excel. Từ ruy băng dữ liệu, nhấp vào Nhận dữ liệu. Nhấp vào từ các nguồn khác và sau đó nhấp vào ODBC.Data ribbon, click Get Data. Click From Other Sources and then click From ODBC.

  2. Trong hộp thoại From ODBC, chọn DSN mà bạn đã tạo trước đó và sau đó bấm OK.From ODBC dialog box, select the DSN that you created earlier and then click OK.

  3. Nếu bạn được nhắc về thông tin đăng nhập, cho tên người dùng, hãy nhập mã thông báo. Đối với mật khẩu, cung cấp giá trị mã thông báo mà bạn lấy từ không gian làm việc của Databricks.token. For password, provide the token value that you retrieved from the Databricks workspace.

  4. Từ cửa sổ Điều hướng, chọn bảng trong các dữ liệu mà bạn muốn tải để Excel, sau đó nhấp vào Tải.Load.

Khi bạn có dữ liệu trong sổ làm việc Excel, bạn có thể thực hiện các hoạt động phân tích trên đó.

Kết nối từ r

Ghi chú

Phần này cung cấp thông tin về cách tích hợp máy khách R Studio chạy trên máy tính để bàn của bạn với Azure Databricks. Để biết hướng dẫn về cách sử dụng R Studio trên bản chính Azure Databricks, xem R Studio trên Azure Databricks.

Trong phần này, bạn sử dụng IDE ngôn ngữ R để tham khảo dữ liệu có sẵn trong Azure Databricks. Trước khi bạn bắt đầu, bạn phải cài đặt các phần sau trên máy tính.

  • Một IDE cho ngôn ngữ R. Bài viết này sử dụng rstudio cho máy tính để bàn. Bạn có thể cài đặt nó từ R Studio Tải xuống.
  • Nếu bạn sử dụng rstudio cho máy tính để bàn làm IDE của bạn, cũng cài đặt Microsoft R Client từ //aka.ms/rclient/.

Mở rstudio và thực hiện các bước sau:

  • Tham khảo gói RODBC. Điều này cho phép bạn kết nối với Azure Databricks bằng DSN bạn đã tạo trước đó.
  • Thiết lập kết nối bằng DSN.
  • Chạy truy vấn SQL trên dữ liệu trong Azure Databricks. Trong đoạn sau, radio_sample_data là một bảng đã tồn tại trong Azure Databricks.
  • Thực hiện một số hoạt động trên truy vấn để xác minh đầu ra.

Đoạn mã sau thực hiện các tác vụ này:

# reference the 'RODBC' package
require[RODBC]

# establish a connection using the DSN you created earlier
conn 

Bài Viết Liên Quan

Chủ Đề