Hướng dẫn automated data cleaning excel - excel làm sạch dữ liệu tự động

Truy vấn sức mạnh trong Microsoft Excel là một kết nối dữ liệu mạnh mẽ, làm sạch và định hình công nghệ là một phần cốt lõi của bộ phân tích hiện đại Microsoft của các công cụ kinh doanh thông minh. Đạt được dữ liệu sạch để phân tích tiêu thụ vô số giờ cho các chuyên gia trong tất cả các ngành công nghiệp. Với truy vấn điện, việc chuẩn bị và làm sạch dữ liệu của bạn sẽ được chuyển đổi, tự động và cải thiện, cho bạn thời gian để phân tích và thúc đẩy tác động kinh doanh.

Show

    CUỘC THI ĐẤU

    • Trả về vị trí tương đối của một mục trong một mảng phù hợp với một giá trị được chỉ định theo một thứ tự được chỉ định. Sử dụng khớp thay vì một trong các chức năng tra cứu khi bạn cần vị trí của một mục trong một phạm vi thay vì chính mục.
    • BÙ LẠI
    • Trả về một tham chiếu đến một phạm vi là một số lượng hàng và cột được chỉ định từ một ô hoặc phạm vi của ô. Tham chiếu được trả lại có thể là một ô đơn hoặc một loạt các ô. Bạn có thể chỉ định số lượng hàng và số lượng cột được trả về.
    • Sau đây là danh sách một phần của các nhà cung cấp bên thứ ba có sản phẩm được sử dụng để làm sạch dữ liệu theo nhiều cách khác nhau.
    • Lưu ý: & NBSP; Microsoft không cung cấp hỗ trợ cho các sản phẩm của bên thứ ba.

    Những từ sai chính tả, không gian dấu vết bướng bỉnh, tiền tố không mong muốn, các trường hợp không phù hợp và các nhân vật không in nổi tạo ấn tượng đầu tiên tồi tệ. Và đó thậm chí không phải là một danh sách đầy đủ các cách mà dữ liệu của bạn có thể bị bẩn. Cuộn tay áo lên. Đã đến lúc làm sạch mùa xuân lớn của bảng tính của bạn với Microsoft Excel.

    Bạn không phải lúc nào cũng có quyền kiểm soát định dạng và loại dữ liệu mà bạn nhập từ nguồn dữ liệu bên ngoài, chẳng hạn như cơ sở dữ liệu, tệp văn bản hoặc trang web. Trước khi bạn có thể phân tích dữ liệu, bạn thường cần phải làm sạch nó. May mắn thay, Excel có nhiều tính năng để giúp bạn có được dữ liệu ở định dạng chính xác mà bạn muốn. Đôi khi, nhiệm vụ rất đơn giản và có một tính năng cụ thể thực hiện công việc cho bạn. Ví dụ: bạn có thể dễ dàng sử dụng trình kiểm tra chính tả để làm sạch các từ sai chính tả trong các cột có chứa nhận xét hoặc mô tả. Hoặc, nếu bạn muốn xóa các hàng trùng lặp, bạn có thể nhanh chóng thực hiện điều này bằng cách sử dụng hộp thoại Xóa trùng lặp.Remove Duplicates dialog box.

    Vào những thời điểm khác, bạn có thể cần điều khiển một hoặc nhiều cột bằng cách sử dụng công thức để chuyển đổi các giá trị đã nhập thành các giá trị mới. Ví dụ: nếu bạn muốn loại bỏ các khoảng trắng theo dõi, bạn có thể tạo một cột mới để làm sạch dữ liệu bằng cách sử dụng công thức, điền vào cột mới, chuyển đổi các công thức của cột mới thành các giá trị và sau đó xóa cột gốc.

    Các bước cơ bản để làm sạch dữ liệu như sau:

    1. Nhập dữ liệu từ một nguồn dữ liệu bên ngoài.

    2. Tạo một bản sao lưu của dữ liệu gốc trong một sổ làm việc riêng.

    3. Đảm bảo rằng dữ liệu ở định dạng bảng của các hàng và cột có: dữ liệu tương tự trong mỗi cột, tất cả các cột và hàng hiển thị và không có hàng trống trong phạm vi. Để có kết quả tốt nhất, sử dụng bảng Excel.

    4. Các tác vụ không yêu cầu thao tác cột trước, chẳng hạn như kiểm tra chính tả hoặc sử dụng hộp thoại Tìm và thay thế.Find and Replace dialog box.

    5. Tiếp theo, thực hiện các nhiệm vụ yêu cầu thao tác cột. Các bước chung để thao túng một cột là:

      1. Chèn một cột mới (b) bên cạnh cột gốc (a) cần làm sạch.

      2. Thêm một công thức sẽ chuyển đổi dữ liệu ở đầu cột mới (b).

      3. Điền vào công thức trong cột mới (b). Trong một bảng Excel, một cột được tính toán được tạo tự động với các giá trị được lấp đầy.

      4. Chọn cột mới (b), sao chép nó, sau đó dán làm giá trị vào cột mới (b).

      5. Tháo cột gốc (A), chuyển đổi cột mới từ B thành A.

    Để định kỳ làm sạch cùng một nguồn dữ liệu, hãy xem xét ghi lại mã macro hoặc viết để tự động hóa toàn bộ quá trình. Ngoài ra còn có một số phần bổ trợ bên ngoài được viết bởi các nhà cung cấp bên thứ ba, được liệt kê trong phần Nhà cung cấp bên thứ ba, mà bạn có thể xem xét sử dụng nếu bạn không có thời gian hoặc tài nguyên để tự động hóa quy trình.

    Thêm thông tin

    Sự mô tả

    Điền dữ liệu tự động trong các ô bảng tính

    Chỉ ra cách sử dụng lệnh điền.Fill command.

    Tạo và định dạng bảng

    Thay đổi kích thước bảng bằng cách thêm hoặc tháo hàng và cột

    Sử dụng các cột được tính toán trong bảng Excel

    Hiển thị cách tạo bảng Excel và thêm hoặc xóa các cột hoặc cột được tính toán.

    Tạo một macro

    Hiển thị một số cách để tự động hóa các tác vụ lặp đi lặp lại bằng cách sử dụng macro.

    Các hàng trùng lặp là một vấn đề phổ biến khi bạn nhập dữ liệu. Trước tiên, bạn nên lọc các giá trị duy nhất để xác nhận rằng kết quả là những gì bạn muốn trước khi bạn xóa các giá trị trùng lặp.

    Thêm thông tin

    Sự mô tả

    Lọc cho các giá trị duy nhất hoặc xóa các giá trị trùng lặp

    Hiển thị hai quy trình liên quan chặt chẽ: Cách lọc cho các hàng duy nhất và cách xóa các hàng trùng lặp.

    Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.

    Thêm thông tin

    Sự mô tả

    Lọc cho các giá trị duy nhất hoặc xóa các giá trị trùng lặp

    Hiển thị hai quy trình liên quan chặt chẽ: Cách lọc cho các hàng duy nhất và cách xóa các hàng trùng lặp.

    Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.Find command and several functions to find text.

    Kiểm tra xem một ô có chứa văn bản không (không nhạy cảm trường hợp)

    Kiểm tra xem một ô có chứa văn bản không (nhạy cảm trường hợp)Replace command and several functions to remove text.

    Hiển thị cách sử dụng lệnh tìm và một số chức năng để tìm văn bản.

    Xóa các ký tự khỏi văn bảnFind and Replace dialog boxes.

    Chỉ ra cách sử dụng lệnh thay thế và một số chức năng để xóa văn bản.

    Tìm hoặc thay thế văn bản và số trên bảng tính

    Hiển thị cách sử dụng hộp thoại Tìm và thay thế.

    Tìm, Findb

    Tìm kiếm, SearchB

    Thay thế, thay thếb

    THAY THẾ
    MID, MIDB

    Trái, trái

    Phải, phải

    Thêm thông tin

    Sự mô tả

    Lọc cho các giá trị duy nhất hoặc xóa các giá trị trùng lặp

    Hiển thị hai quy trình liên quan chặt chẽ: Cách lọc cho các hàng duy nhất và cách xóa các hàng trùng lặp.

    Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.

    Kiểm tra xem một ô có chứa văn bản không (không nhạy cảm trường hợp)

    Kiểm tra xem một ô có chứa văn bản không (nhạy cảm trường hợp)

    Hiển thị cách sử dụng lệnh tìm và một số chức năng để tìm văn bản.

    Xóa các ký tự khỏi văn bản

    Chỉ ra cách sử dụng lệnh thay thế và một số chức năng để xóa văn bản.

    Tìm hoặc thay thế văn bản và số trên bảng tính

    Thêm thông tin

    Sự mô tả

    Lọc cho các giá trị duy nhất hoặc xóa các giá trị trùng lặp

    Hiển thị hai quy trình liên quan chặt chẽ: Cách lọc cho các hàng duy nhất và cách xóa các hàng trùng lặp.

    Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.

    Kiểm tra xem một ô có chứa văn bản không (không nhạy cảm trường hợp)

    Kiểm tra xem một ô có chứa văn bản không (nhạy cảm trường hợp)

    Hiển thị cách sử dụng lệnh tìm và một số chức năng để tìm văn bản.

    Tìm, Findb

    Tìm kiếm, SearchB

    Thay thế, thay thếb

    Thêm thông tin

    Sự mô tả

    Lọc cho các giá trị duy nhất hoặc xóa các giá trị trùng lặp

    Hiển thị hai quy trình liên quan chặt chẽ: Cách lọc cho các hàng duy nhất và cách xóa các hàng trùng lặp.

    Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.

    Kiểm tra xem một ô có chứa văn bản không (không nhạy cảm trường hợp)

    Kiểm tra xem một ô có chứa văn bản không (nhạy cảm trường hợp)

    Hiển thị cách sử dụng lệnh tìm và một số chức năng để tìm văn bản.

    Xóa các ký tự khỏi văn bản

    Chỉ ra cách sử dụng lệnh thay thế và một số chức năng để xóa văn bản.

    Tìm hoặc thay thế văn bản và số trên bảng tính

    Hiển thị cách sử dụng hộp thoại Tìm và thay thế.

    Tìm, Findb

    Thêm thông tin

    Sự mô tả

    Lọc cho các giá trị duy nhất hoặc xóa các giá trị trùng lặp

    Hiển thị hai quy trình liên quan chặt chẽ: Cách lọc cho các hàng duy nhất và cách xóa các hàng trùng lặp.

    Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.

    Kiểm tra xem một ô có chứa văn bản không (không nhạy cảm trường hợp)

    Kiểm tra xem một ô có chứa văn bản không (nhạy cảm trường hợp)

    Hiển thị cách sử dụng lệnh tìm và một số chức năng để tìm văn bản.

    NGÀY

    Trả về số sê -ri tuần tự đại diện cho một ngày cụ thể. Nếu định dạng ô là chung trước khi hàm được nhập, kết quả được định dạng là ngày.

    DateValue

    Chuyển đổi một ngày được biểu diễn bằng văn bản thành một số sê -ri.

    THỜI GIAN

    Trả về số thập phân trong một thời gian cụ thể. Nếu định dạng ô là chung trước khi hàm được nhập, kết quả được định dạng là ngày.

    GIÁ TRỊ THỜI GIAN

    Trả về số thập phân của thời gian được biểu thị bằng một chuỗi văn bản. Số thập phân là một giá trị từ 0 (0) đến 0,99999999, đại diện cho thời gian từ 0:00:00 (12:00:00 AM) đến 23:59:59 (11:59:59 p.m.).

    Một nhiệm vụ chung sau khi nhập dữ liệu từ nguồn dữ liệu bên ngoài là hợp nhất hai hoặc nhiều cột thành một hoặc chia một cột thành hai hoặc nhiều cột. Ví dụ: bạn có thể muốn chia một cột chứa tên đầy đủ thành họ và họ. Hoặc, bạn có thể muốn chia một cột chứa một trường địa chỉ vào các cột đường, thành phố, khu vực và mã bưu chính riêng biệt. Điều ngược lại cũng có thể đúng. Bạn có thể muốn hợp nhất cột đầu tiên và tên cuối cùng vào cột tên đầy đủ hoặc kết hợp các cột địa chỉ riêng biệt thành một cột. Các giá trị chung bổ sung có thể yêu cầu hợp nhất thành một cột hoặc chia thành nhiều cột bao gồm mã sản phẩm, đường dẫn tệp và địa chỉ giao thức Internet (IP).

    Thêm thông tin

    Sự mô tả

    Kết hợp tên đầu tiên và tên cuối cùng

    Kết hợp văn bản và số

    Kết hợp văn bản với một ngày hoặc thời gian

    Kết hợp hai hoặc nhiều cột bằng cách sử dụng hàm

    Hiển thị các ví dụ điển hình về việc kết hợp các giá trị từ hai hoặc nhiều cột.

    Chia văn bản thành các cột khác nhau với trình hướng dẫn văn bản chuyển đổi thành các cột

    Chỉ ra cách sử dụng trình hướng dẫn này để phân chia các cột dựa trên các phân định phổ biến khác nhau.

    Chia văn bản thành các cột khác nhau với các chức năng

    Chỉ ra cách sử dụng các hàm trái, giữa, phải, tìm kiếm và LEN để chia cột tên thành hai hoặc nhiều cột.

    Kết hợp hoặc phân chia nội dung của các ô

    Hiển thị cách sử dụng hàm concatenate, & (ampersand) và chuyển đổi văn bản thành trình hướng dẫn cột.

    Hợp nhất các tế bào hoặc phân chia các tế bào hợp nhất

    Chỉ ra cách sử dụng các ô hợp nhất, hợp nhất qua, và hợp nhất và các lệnh trung tâm.Merge Cells, Merge Across, and Merge and Center commands.

    Concatenate

    Tham gia hai hoặc nhiều chuỗi văn bản vào một chuỗi văn bản.

    Hầu hết các tính năng phân tích và định dạng trong Office Excel cho rằng dữ liệu tồn tại trong một bảng hai chiều bằng phẳng. Đôi khi bạn có thể muốn làm cho các hàng trở thành cột và các cột trở thành hàng. Vào những thời điểm khác, dữ liệu thậm chí không được cấu trúc theo định dạng bảng và bạn cần một cách để chuyển đổi dữ liệu từ một định dạng không thành dạng bảng.

    Thêm thông tin

    Sự mô tả

    Kết hợp tên đầu tiên và tên cuối cùng

    Kết hợp văn bản và số

    Kết hợp văn bản với một ngày hoặc thời gian

    Thêm thông tin

    Sự mô tả

    Kết hợp tên đầu tiên và tên cuối cùng

    Kết hợp văn bản và số

    Kết hợp văn bản với một ngày hoặc thời gian

    Kết hợp hai hoặc nhiều cột bằng cách sử dụng hàm

    Hiển thị các ví dụ điển hình về việc kết hợp các giá trị từ hai hoặc nhiều cột.

    Chia văn bản thành các cột khác nhau với trình hướng dẫn văn bản chuyển đổi thành các cột

    Chỉ ra cách sử dụng trình hướng dẫn này để phân chia các cột dựa trên các phân định phổ biến khác nhau.

    Chia văn bản thành các cột khác nhau với các chức năng

    Chỉ ra cách sử dụng các hàm trái, giữa, phải, tìm kiếm và LEN để chia cột tên thành hai hoặc nhiều cột.

    Kết hợp hoặc phân chia nội dung của các ô

    Hiển thị cách sử dụng hàm concatenate, & (ampersand) và chuyển đổi văn bản thành trình hướng dẫn cột.

    Hợp nhất các tế bào hoặc phân chia các tế bào hợp nhất

    Chỉ ra cách sử dụng các ô hợp nhất, hợp nhất qua, và hợp nhất và các lệnh trung tâm.

    Concatenate

    Tham gia hai hoặc nhiều chuỗi văn bản vào một chuỗi văn bản.

    Hầu hết các tính năng phân tích và định dạng trong Office Excel cho rằng dữ liệu tồn tại trong một bảng hai chiều bằng phẳng. Đôi khi bạn có thể muốn làm cho các hàng trở thành cột và các cột trở thành hàng. Vào những thời điểm khác, dữ liệu thậm chí không được cấu trúc theo định dạng bảng và bạn cần một cách để chuyển đổi dữ liệu từ một định dạng không thành dạng bảng.Microsoft does not provide support for third-party products.

    Chuyển vị

    Trả về một phạm vi dọc của các ô dưới dạng phạm vi ngang hoặc ngược lại.

    Thỉnh thoảng, các quản trị viên cơ sở dữ liệu sử dụng Office Excel để tìm và chính xác các lỗi phù hợp khi hai hoặc nhiều bảng được nối. Điều này có thể liên quan đến việc điều chỉnh hai bảng từ các bảng tính khác nhau, ví dụ, để xem tất cả các bản ghi trong cả hai bảng hoặc để so sánh các bảng và tìm các hàng không khớp.

    Tra cứu các giá trị trong danh sách dữ liệu

    Add-Ins.com

    Công cụ tìm bản sao

    AddIntools

    AddIntools hỗ trợ

    WinPure

    ListCleaner Lite LiteCleaner Pro Clean và Match 2007
    ListCleaner Pro
    Clean and Match 2007

    Đầu trang