Hướng dẫn automated data cleaning excel - excel làm sạch dữ liệu tự động
Truy vấn sức mạnh trong Microsoft Excel là một kết nối dữ liệu mạnh mẽ, làm sạch và định hình công nghệ là một phần cốt lõi của bộ phân tích hiện đại Microsoft của các công cụ kinh doanh thông minh. Đạt được dữ liệu sạch để phân tích tiêu thụ vô số giờ cho các chuyên gia trong tất cả các ngành công nghiệp. Với truy vấn điện, việc chuẩn bị và làm sạch dữ liệu của bạn sẽ được chuyển đổi, tự động và cải thiện, cho bạn thời gian để phân tích và thúc đẩy tác động kinh doanh. Show CUỘC THI ĐẤU
Những từ sai chính tả, không gian dấu vết bướng bỉnh, tiền tố không mong muốn, các trường hợp không phù hợp và các nhân vật không in nổi tạo ấn tượng đầu tiên tồi tệ. Và đó thậm chí không phải là một danh sách đầy đủ các cách mà dữ liệu của bạn có thể bị bẩn. Cuộn tay áo lên. Đã đến lúc làm sạch mùa xuân lớn của bảng tính của bạn với Microsoft Excel. Bạn không phải lúc nào cũng có quyền kiểm soát định dạng và loại dữ liệu mà bạn nhập từ nguồn dữ liệu bên ngoài, chẳng hạn như cơ sở dữ liệu, tệp văn bản hoặc trang web. Trước khi bạn có thể phân tích dữ liệu, bạn thường cần phải làm sạch nó. May mắn thay, Excel có nhiều tính năng để giúp bạn có được dữ liệu ở định dạng chính xác mà bạn muốn. Đôi khi, nhiệm vụ rất đơn giản và có một tính năng cụ thể thực hiện công việc cho bạn. Ví dụ: bạn có thể dễ dàng sử dụng trình kiểm tra chính tả để làm sạch các từ sai chính tả trong các cột có chứa nhận xét hoặc mô tả. Hoặc, nếu bạn muốn xóa các hàng trùng lặp, bạn có thể nhanh chóng thực hiện điều này bằng cách sử dụng hộp thoại Xóa trùng lặp.Remove Duplicates dialog box. Vào những thời điểm khác, bạn có thể cần điều khiển một hoặc nhiều cột bằng cách sử dụng công thức để chuyển đổi các giá trị đã nhập thành các giá trị mới. Ví dụ: nếu bạn muốn loại bỏ các khoảng trắng theo dõi, bạn có thể tạo một cột mới để làm sạch dữ liệu bằng cách sử dụng công thức, điền vào cột mới, chuyển đổi các công thức của cột mới thành các giá trị và sau đó xóa cột gốc. Các bước cơ bản để làm sạch dữ liệu như sau:
Để định kỳ làm sạch cùng một nguồn dữ liệu, hãy xem xét ghi lại mã macro hoặc viết để tự động hóa toàn bộ quá trình. Ngoài ra còn có một số phần bổ trợ bên ngoài được viết bởi các nhà cung cấp bên thứ ba, được liệt kê trong phần Nhà cung cấp bên thứ ba, mà bạn có thể xem xét sử dụng nếu bạn không có thời gian hoặc tài nguyên để tự động hóa quy trình.
Các hàng trùng lặp là một vấn đề phổ biến khi bạn nhập dữ liệu. Trước tiên, bạn nên lọc các giá trị duy nhất để xác nhận rằng kết quả là những gì bạn muốn trước khi bạn xóa các giá trị trùng lặp.
Bạn có thể muốn loại bỏ một chuỗi hàng đầu chung, chẳng hạn như nhãn theo sau là dấu hai chấm và không gian, hoặc hậu tố, chẳng hạn như cụm từ ở cuối chuỗi lỗi thời hoặc không cần thiết. Bạn có thể làm điều này bằng cách tìm các phiên bản của văn bản đó và sau đó thay thế nó không có văn bản hoặc văn bản khác.
Phải, phải
Tìm hoặc thay thế văn bản và số trên bảng tính
Thay thế, thay thếb
Tìm, Findb
Một nhiệm vụ chung sau khi nhập dữ liệu từ nguồn dữ liệu bên ngoài là hợp nhất hai hoặc nhiều cột thành một hoặc chia một cột thành hai hoặc nhiều cột. Ví dụ: bạn có thể muốn chia một cột chứa tên đầy đủ thành họ và họ. Hoặc, bạn có thể muốn chia một cột chứa một trường địa chỉ vào các cột đường, thành phố, khu vực và mã bưu chính riêng biệt. Điều ngược lại cũng có thể đúng. Bạn có thể muốn hợp nhất cột đầu tiên và tên cuối cùng vào cột tên đầy đủ hoặc kết hợp các cột địa chỉ riêng biệt thành một cột. Các giá trị chung bổ sung có thể yêu cầu hợp nhất thành một cột hoặc chia thành nhiều cột bao gồm mã sản phẩm, đường dẫn tệp và địa chỉ giao thức Internet (IP).
Hầu hết các tính năng phân tích và định dạng trong Office Excel cho rằng dữ liệu tồn tại trong một bảng hai chiều bằng phẳng. Đôi khi bạn có thể muốn làm cho các hàng trở thành cột và các cột trở thành hàng. Vào những thời điểm khác, dữ liệu thậm chí không được cấu trúc theo định dạng bảng và bạn cần một cách để chuyển đổi dữ liệu từ một định dạng không thành dạng bảng.
Kết hợp văn bản với một ngày hoặc thời gian
Tham gia hai hoặc nhiều chuỗi văn bản vào một chuỗi văn bản. Hầu hết các tính năng phân tích và định dạng trong Office Excel cho rằng dữ liệu tồn tại trong một bảng hai chiều bằng phẳng. Đôi khi bạn có thể muốn làm cho các hàng trở thành cột và các cột trở thành hàng. Vào những thời điểm khác, dữ liệu thậm chí không được cấu trúc theo định dạng bảng và bạn cần một cách để chuyển đổi dữ liệu từ một định dạng không thành dạng bảng.Microsoft does not provide support for third-party products.
Đầu trang |