Python tách tệp thành nhiều tệp bằng dấu phân cách

Nếu bạn có các trường chuỗi trong dữ liệu chứa nhiều phần thông tin riêng biệt [ví dụ: họ và tên của khách hàng], bạn có thể tách các giá trị thành các trường riêng biệt

Bạn có thể sử dụng các tùy chọn phân tách trong Tableau Desktop để phân tách các giá trị dựa trên dấu phân cách [dấu phân cách] hoặc mẫu giá trị lặp lại có trong mỗi hàng. Trong ví dụ về Tên khách hàng, dấu phân cách phổ biến là khoảng trắng [""] giữa tên và họ

Tìm tùy chọn Tách

Tableau Desktop —nhưng không chỉnh sửa web trong trình duyệt—có tùy chọn menu để phân tách tự động hoặc tùy chỉnh. Chúng dựa trên chức năng chuỗi SPLIT, cũng có thể được sử dụng theo cách thủ công trong tính toán để kiểm soát hoàn toàn quá trình phân tách.

Không phải tất cả các nguồn dữ liệu đều hỗ trợ SPLIT. Bạn có thể biết liệu dữ liệu của mình có hỗ trợ chức năng SPLIT hay không bằng cách kiểm tra các tùy chọn menu Split và Custom Split

  • Trên trang Nguồn dữ liệu, hãy chọn menu cho Tách Tách tùy chỉnh.

  • Từ ngăn Dữ liệu trên một trang tính, hãy chọn menu cho Chuyển đổi > Tách and Custom Split.

Tách trên web

Tác giả web không hỗ trợ tách từ menu. Để phân chia dữ liệu trong khi làm việc trên trình duyệt, bạn có thể tạo phép tính SPLIT theo cách thủ công. Xem Các lựa chọn thay thế để tách từ menu

Trường chia

Trường chuỗi có thể được phân tách tự động dựa trên dấu tách chung mà Tableau phát hiện trong trường. Bạn cũng có thể xác định cách chia theo cách thủ công

Tùy thuộc vào loại kết nối, một phần tách có thể tự động tách các giá trị của trường thành tối đa mười trường mới

Tách trường tự động

Trên trang Nguồn dữ liệu, trong lưới, nhấp vào mũi tên thả xuống bên cạnh tên trường, sau đó chọn Tách .

Trong ngăn Dữ liệu, nhấp chuột phải vào trường bạn muốn tách rồi chọn Chuyển đổi > Split.

Kết quả phân tách là các trường tính toán tiêu chuẩn có thể được chỉnh sửa hoặc xóa giống như bất kỳ trường tính toán nào khác. Loại dữ liệu của các trường mới được tạo bởi quá trình phân tách có thể khác nhau tùy thuộc vào sự kết hợp mẫu mà Tableau phát hiện

Tách một trường với phân tách tùy chỉnh

Sử dụng tùy chọn phân chia tùy chỉnh để kiểm soát nhiều hơn đối với việc phân chia. Bạn có thể chỉ định dấu tách và chọn tách các giá trị ở N lần xuất hiện đầu tiên của dấu tách, N lần xuất hiện cuối cùng hoặc ở tất cả các lần xuất hiện

Trên trang Nguồn dữ liệu, trong lưới, nhấp vào mũi tên thả xuống bên cạnh tên trường. Chọn Tách tùy chỉnh .

Từ ngăn Dữ liệu, trong ngăn Dữ liệu, nhấp chuột phải vào trường bạn muốn tách rồi chọn Chuyển đổi > Custom Split.

Các trường mới được tạo bởi phần tách tùy chỉnh luôn dẫn đến kiểu dữ liệu chuỗi

Ghi chú. Trong một số trường hợp, nếu quá trình phân tách tự động mất quá nhiều thời gian để tạo các trường mới hoặc Tableau không thể tìm thấy dấu tách chung, hộp thoại phân tách tùy chỉnh sẽ hiển thị

Phân chia tùy chỉnh hữu ích khi số lượng dấu phân cách thay đổi theo từng giá trị. Không thể sử dụng phân tách tự động trong những trường hợp này

Ví dụ: giả sử trường Thông tin nhân viên có các giá trị sau

  • jsmith. kế toán. Bắc
  • dnguyen. nguồn nhân lực
  • lscott. tuyển dụng. hướng Tây
  • karnold. tuyển dụng. hướng Tây

Phần tách tùy chỉnh có thể được định cấu hình để tách trên ký tự ống [". "] và tách tất cả các cột. Đối với giá trị không có vùng, trường kết quả thứ ba sẽ là null đối với hàng đó

Các lựa chọn thay thế để tách từ menu

Tách thủ công bằng chức năng SPLIT

Hàm SPLIT hoạt động tương tự như cách chia tùy chỉnh, nhưng chỉ có một trường kết quả được trả về cho mỗi phép tính. Bạn xác định dấu tách và chỉ định giá trị nào sẽ trả về bằng cách cung cấp số mã thông báo

Ví dụ: để tách Tên khách hàng thành Tên và Họ, hãy tạo hai trường được tính toán

  • Họ. SPLIT[[Customer Name], " ", 1]
  • Họ. SPLIT[[Customer Name], " ", 2]

Ví dụ về Thông tin nhân viên [chẳng hạn như "jsmith. kế toán. North"] sẽ sử dụng ba trường được tính toán

  • tên tài khoản. SPLIT[[Employee Info], |, 1]
  • Phòng. SPLIT[[Employee Info], |, 2]
  • Vùng đất. SPLIT[[Employee Info], |, 3]

Để biết thêm thông tin, hãy xem chức năng SPLIT

Tách thủ công bằng hàm LEFT và RIGHT

Nếu trường hợp sử dụng của bạn là để trích xuất một phần cụ thể của chuỗi hơn là tách nó dựa trên dấu phân cách, thì bạn có thể sử dụng hàm LEFT và RIGHT . Chúng chỉ trả về một phần của chuỗi dựa trên một số ký tự được chỉ định

Ví dụ: nếu giá trị của hàng là IGW8892

Phép tínhKết quảRIGHT[[Value], 4]8892LEFT[[Value], 4]IGW8LEFT[RIGHT[[Value], 2] , 1]9

Để biết thêm thông tin, hãy xem LEFT và RIGHT trong Hàm chuỗi

Sử dụng biểu thức chính quy cho các trường chứa dấu phân cách hỗn hợp

Các trường không thể được phân tách tự động nếu các loại dấu tách khác nhau. Ví dụ: giả sử một trường bao gồm các giá trị sau

  • thợ rèn. kế toán
  • dr nguyễn-nhân sự
  • lscott_recruiting
  • karnold_recruiting

Trong những trường hợp như thế này, hãy cân nhắc sử dụng cụm từ thông dụng để trích xuất thông tin mong muốn. Để biết thêm thông tin, hãy xem Chức năng bổ sung

Làm việc với các phần tách và phần tách tùy chỉnh

Những điều cần lưu ý khi làm việc với các phần tách và phần tách tùy chỉnh

  • Các trường mới không thể được sử dụng làm khóa để nối các bảng nhưng có thể được sử dụng để trộn các nguồn dữ liệu

  • Không thể sử dụng các trường mới trong một trục

  • Các tùy chọn phân tách và phân tách tùy chỉnh không được hỗ trợ cho bộ, nhóm, tham số và thùng

  • Microsoft SQL Server chỉ cho phép tối đa bốn trường phân chia

  • Để tạo hơn mười trường mới, hãy cân nhắc chia nhỏ nhiều lần. Bạn có thể sử dụng phân tách lại trên một trường từ lần phân tách đầu tiên vẫn bao gồm nhiều mẩu thông tin

Khắc phục sự cố tách và tách tùy chỉnh

Các sự cố đã biết mà bạn có thể gặp phải khi sử dụng phần tách và phần tách tùy chỉnh

  • Thiếu tùy chọn phân tách và phân tách tùy chỉnh đối với loại nguồn dữ liệu được hỗ trợ. Các tùy chọn tách và tách tùy chỉnh chỉ khả dụng cho các trường có kiểu dữ liệu chuỗi

  • giá trị null. Sau khi tạo phần tách hoặc phần tách tùy chỉnh, các trường mới có thể chứa giá trị null hoặc không có giá trị nào cả. Giá trị rỗng hoặc ô trống xảy ra khi không có giá trị nào cho các trường mới dự kiến

  • Dữ liệu đã bị xóa. Tableau có thể sử dụng các phần giá trị của trường làm dấu phân cách. Nếu một phần giá trị của trường được sử dụng làm dấu phân cách, thì các giá trị đó sẽ không còn xuất hiện trong các trường mới

    Ví dụ

  • Giá trị ban đầu Giá trị trường phân chiaZip-9810298102Zip-9810998109Zip-9811998199Zip-9819598195

    Việc tách không tạo ra một trường riêng cho "Zip-" vì toàn bộ chuỗi đó được sử dụng làm dấu phân cách

Chủ Đề