Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Việc sử dụng bảng tính điện tử có từ năm 1979 và vẫn là một trong những cách phổ biến nhất để xem xét và thao tác dữ liệu

Ngày nay, chương trình bảng tính phổ biến của Microsoft, Excel có hơn 750 triệu người dùng và được sử dụng trong một số công ty lớn nhất trên toàn thế giới. Cá nhân tôi sử dụng Excel gần như mỗi ngày vì đôi khi nó có thể dẫn đến kết quả nhanh hơn so với việc quay Python hoặc tải dữ liệu vào cơ sở dữ liệu.  

Một trong những lý do khiến Excel trở nên phổ biến là vì nó có rất nhiều tính năng và chức năng có thể được sử dụng để dọn dẹp, tổng hợp . Trong bài viết này, chúng ta sẽ xem qua 10 tính năng và chức năng để sử dụng phân tích dữ liệu trong Excel mà tôi nghĩ mọi nhà phân tích đều cần biết.

Bạn có thể nhấp vào bất kỳ tính năng nào để bỏ qua trước chúng

Trước khi chúng ta bắt đầu…

Để thể hiện sức mạnh của phân tích dữ liệu trong Excel, chúng tôi cần một số dữ liệu để xử lý và vẽ biểu đồ. Tôi đang sử dụng tập dữ liệu Phân tích tính cách khách hàng từ Kaggle trong các ví dụ này. Các bạn tải về để làm theo.

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

… và, nếu bạn muốn xem cùng…

Đây là nhà khoa học dữ liệu cấp cao của chúng tôi, Tom, giải thích các chức năng này trong một video

1. Bảng Pivot và biểu đồ Pivot

Một trong những tính năng yêu thích của tôi trong Excel là biểu đồ trục và, như một tính năng theo sát chặt chẽ, bảng tổng hợp. Biểu đồ tổng hợp trực quan hóa dữ liệu được biểu thị trong bảng tổng hợp, cho chúng ta cái nhìn sâu sắc trong nháy mắt. Bảng tổng hợp cung cấp một cách tiếp cận đơn giản để định dạng lại các cột và hàng, biến chúng thành các nhóm, thống kê hoặc tóm tắt. Chúng ta có thể tạo biểu đồ cùng với bảng bằng tính năng PivotChart trong Chèn

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Giả sử chúng ta muốn đếm các bản ghi được nhóm theo Marital_Status . Sử dụng bảng tổng hợp làm cho điều đó trở nên cực kỳ đơn giản, bởi vì nó biến đổi dữ liệu và tổng hợp dữ liệu đó cho chúng tôi.

Để tạo biểu đồ tổng hợp và bảng tổng hợp, trước tiên hãy chọn phạm vi dữ liệu bạn muốn đưa vào rồi nhấp vào Chèn > PivotChart > PivotChart & PivotTable . The Create PivotTable editor will pop up.

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Phạm vi đã chọn sẽ xuất hiện trong trường Bảng/Phạm vi theo mặc định. Nhấp vào OK và bảng tổng hợp sẽ tạo.

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Trong Trường PivotChart, hãy kéo Marital_Status từ danh sách trường vào Trục (Danh mục)< . Sau đó, kéo box. Then drag Marital_Status từ danh sách trường vào hộp Giá trị . Vì dữ liệu Marital_Status là một chuỗi nên tập hợp Giá trị phải mặc định là Count . Nếu loại dữ liệu là số, tập hợp mặc định là Tổng .

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Bảng tổng hợp và biểu đồ sẽ được điền. Bạn có thể thêm các thứ nguyên hoặc bộ lọc bổ sung bằng cách kéo các trường mới vào hộp tương ứng. Chỉ mất vài cú nhấp chuột để tổng hợp dữ liệu và trực quan hóa nó trong Excel, đó là lý do tại sao nó là một công cụ được sử dụng rộng rãi như vậy

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

2. định dạng có điều kiện

Nghĩ về điều đó, có lẽ tôi sử dụng định dạng có điều kiện nhiều hơn bất kỳ tính năng nào khác trong Excel. Định dạng có điều kiện cho phép bạn tô sáng hoặc ẩn các ô dựa trên quy tắc bạn chỉ định. Áp dụng quy tắc cho một ô hoặc nhiều ô trong cùng một trang tính. Nó hữu ích để làm nổi bật các giá trị ngoại lai, trùng lặp hoặc mẫu trong dữ liệu.

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Giả sử chúng ta muốn đánh dấu tất cả các giá trị Year_Birth lớn hơn 1987 trong tập dữ liệu.

Chọn cột Year_Birth và nhấp vào Định dạng có điều kiện > Đánh dấu quy tắc ô > Lớn hơn . The editor will pop up:

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Nhập năm 1987 và nhấp vào OK . Các ô trong cột có giá trị lớn hơn 1987 sẽ chuyển sang màu đỏ nhạt.

Nếu chúng tôi quyết định muốn điều chỉnh quy tắc định dạng có điều kiện mà chúng tôi vừa tạo, hãy đi theo đường dẫn Định dạng có điều kiện > Trình quản lý quy tắc định dạng có điều kiện .

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Từ người quản lý, chúng tôi có thể tạo quy tắc mới hoặc chỉnh sửa quy tắc hiện có. Có thể có nhiều quy tắc ảnh hưởng đến bảng tính

3. Loại bỏ các bản sao

Dữ liệu thường lộn xộn, vì vậy điều quan trọng là bạn phải biết cách loại bỏ các dữ liệu trùng lặp. Sử dụng các quy tắc định dạng có điều kiện, bạn có thể đánh dấu dữ liệu trùng lặp để xem lại trước khi xóa. Tính năng Xóa các mục trùng lặp có sẵn trong Dữ liệu > Công cụ dữ liệu > Xóa các mục trùng lặp .

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Đánh dấu tập dữ liệu trong Excel và nhấp vào Xóa các mục trùng lặp . Trình chỉnh sửa Xóa trùng lặp xuất hiện.

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Trình chỉnh sửa cho phép chúng tôi chọn các cột sẽ được đưa vào khi xóa các bản sao. Đảm bảo hộp kiểm Dữ liệu của tôi có tiêu đề được đánh dấu nếu tên cột không hiển thị.

Nhấp vào OK . Các bản sao sẽ bị xóa khỏi tập dữ liệu. Nó sẽ cho chúng ta biết có bao nhiêu giá trị duy nhất còn lại.

4. Xlookup

XLOOKUP giống như sự kết hợp giữa VLOOKUP và HLOOKUP, vì nó có thể di chuyển theo chiều dọc hoặc chiều ngang để tra cứu giá trị từ một dải ô. Về cơ bản, nó cho phép bạn sử dụng một phạm vi đã chọn làm bảng tra cứu và trả về kết quả “đã tra cứu” cho một ô. Cú pháp như sau

=XLOOKUP(giá_trị_trao_đổi,_mảng_trao_đổi,_mảng_trả_về, [if_not_found], [chế_độ khớp], [chế_độ_tìm_kiếm])

Giả sử chúng ta muốn tra cứu Year_Birth dựa trên ID value. In cell AD2 , nhập giá trị ID—ví dụ: 8755. Trong ô AE2, nhập công thức XLOOKUP.

=XLOOKUP(

The lookup_value là giá trị chúng ta muốn hàm tra cứu, vì vậy chúng ta nhập AD2< . .

Mảng lookup_array là cột hoặc hàng chứa giá trị tra cứu, vì vậy chúng tôi nhập A2. A2241 vì điều đó sẽ cung cấp cho chúng tôi một loạt ID.

The return_array là cột hoặc hàng chứa giá trị mà chúng tôi muốn trả về, vì vậy chúng tôi chọn B2:B2241 vì điều đó sẽ cung cấp cho chúng tôi các giá trị Year_Birth .

Công thức hoàn thành sẽ như thế này. =XLOOKUP(AD2, A2. A2241, B2. B2241)

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Nhập các ID khác nhau và Year_Birth tương ứng sẽ trả về.

Các hàm tra cứu rất mạnh và thậm chí bạn có thể nối dữ liệu từ các trang tính khác nhau hoặc lồng các hàm tra cứu vào nhau. Ví dụ: bạn có thể tính tổng giá trị của nhiều lần tra cứu.  

5. SỐ PHIẾU

Hàm IFERROR được sử dụng để tạo thông báo lỗi tùy chỉnh khi công thức dẫn đến lỗi. Ví dụ: chúng ta có thể sử dụng nó để bọc hàm XLOOKUP của mình để nó trả về một thông báo rõ ràng nếu không tìm thấy ID. Cú pháp tương đối đơn giản.

=IFERROR(giá trị, giá_trị_nếu_lỗi)

Quay lại hàm XLOOKUP,  nếu chúng ta nhập ID vào AD2 không tồn tại trong mảng tra cứu, AE2 outputs #N/A. Instead, let’s return “ID Not Found.” For the value in the IFERROR function, use the XLOOKUP function. It should look like this:

=IFERROR(XLOOKUP(AD2, A2. A2241, B2. B2241), “Không tìm thấy ID”)

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Ngoài văn bản, bạn cũng có thể trỏ value_if_error vào một ô khác. Nếu bạn nhắm mục tiêu một ô trống làm giá trị cho value_if_error , 0 sẽ .

6. CUỘC THI ĐẤU

Tương tự như các hàm tra cứu, MATCH có thể được sử dụng khi bạn cần vị trí của một giá trị trong một dải thay vì chính giá trị đó.

Đây là cú pháp cho MATCH

=MATCH(giá trị_tra cứu, mảng_tra cứu, [loại_khớp])

Khi viết hàm, điều quan trọng là phải biết sử dụng loại đối sánh nào. Mặc dù nó là tùy chọn và mặc định là 1, nhưng các tùy chọn khả dụng là -1, 0 hoặc 1.

  • -1. Tìm giá trị nhỏ nhất lớn hơn hoặc bằng lookup_value .
  • 0. Tìm giá trị đầu tiên chính xác bằng lookup_value .
  • 1. Tìm giá trị lớn nhất nhỏ hơn hoặc bằng lookup_value .

Nếu chúng tôi muốn tìm năm sinh được tra cứu lần đầu tiên xảy ra, hãy thêm công thức MATCH sau vào ô AF2 .

=MATCH(AE2,B. B, 0)

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

7. COUNTBLANK

Chức năng COUNTBLANK khá trực quan, nhưng đây là một chức năng quan trọng đối với việc sắp xếp lại dữ liệu trong phân tích vì nhiều thuật toán học máy nhạy cảm với giá trị rỗng. Khi biết có bao nhiêu giá trị là null, bạn sẽ hiểu rõ hơn về cách tiếp cận chúng. Ví dụ: nếu nhiều giá trị là null, bạn nên bỏ cột. Nếu một vài giá trị là null, bạn nên gán một giá trị để điền vào giá trị null. COUNTBLANK đếm số ô trống trong một phạm vi. Cú pháp đơn giản.

=COUNTBLANK(phạm vi)

Chúng tôi muốn đếm số lượng giá trị rỗng trong cột Thu nhập , vì vậy hãy thêm công thức này vào ô AG2:

=COUNTBLANK(E2. E2241)

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

8. NGÀY và NGÀY MẠNG

DAYS NETWORKDAYS là các hàm riêng biệt nhưng chúng đủ giống nhau để không đảm bảo các mục nhập riêng lẻ trong . Hàm DAYS chỉ trả về số ngày giữa hai ngày, trong khi hàm NETWORKDAYS hơi khác ở chỗ nó không bao gồm các ngày cuối tuần và các ngày lễ được chỉ định. Nó chỉ trả về số ngày làm việc giữa hai ngày. Cú pháp cho cả hai đều dễ nhớ.

=DAYS(ngày_bắt đầu, ngày_kết thúc)

=NETWORKDAYS(ngày_bắt đầu, ngày_kết thúc, [ngày_nghỉ])

Tại công việc của tôi, một trong những điều tôi phân tích là dữ liệu sử dụng. Tôi sử dụng các chức năng này cho những việc như đếm số ngày kể từ khi người dùng đăng nhập hoặc sử dụng công cụ. Vì phần mềm của chúng tôi được sử dụng trong trường học nên đôi khi, việc loại trừ các ngày cuối tuần và ngày lễ khỏi dữ liệu sử dụng của chúng tôi là điều hợp lý, vì vậy tôi rất biết ơn về chức năng NETWORKDAYS

9. CẤP

Hàm RANK sắp xếp một số theo kích thước của nó so với các giá trị khác trong danh sách và trả về thứ hạng mong muốn. Điều đó có nghĩa là thứ hạng của số sẽ là vị trí của nó nếu danh sách được sắp xếp theo thứ tự tăng dần hoặc giảm dần. Ví dụ: sắp xếp Thu nhập theo thứ tự giảm dần để giá trị lớn nhất ở trên cùng và đó có thể là xếp hạng 1. RANK cho các số trùng lặp cùng thứ hạng, nhưng được tính lũy kế. Điều đó có nghĩa là nếu hai giá trị là hạng bốn, thì hạng tiếp theo sẽ là sáu, không phải năm (1,2,3,4,4,6). Cú pháp cho RANK có 3 đối số

=RANK(số, giới thiệu, [thứ tự])

Điều quan trọng cần lưu ý là [order] có thể được đặt thành 0 for descending and 1 (or greater) for ascending. 

Chúng tôi muốn xếp hạng thu nhập (cột E) của khách hàng, vì vậy chúng tôi sẽ sử dụng công thức sau trong ô AH2 .

=XẾP HẠNG(E2, E2. E2241, 0)

Ở góc dưới cùng bên phải của ô AH2 , nhấp vào hình vuông và kéo hình vuông đó xuống hàng dữ liệu cuối cùng và công thức sẽ tự động .

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

10. TÓM TẮT

Hàm cuối cùng trong danh sách top 10 của tôi là TÓM TẮT . Thật tuyệt khi bạn cần làm số học trên các nhóm giá trị cụ thể. Nó có thể được sử dụng để cộng, trừ, nhân hoặc chia các giá trị số đã chọn cho các phạm vi tương ứng. Mặc dù nghe có vẻ phức tạp nhưng logic khá trực quan khi bạn thử. Tuy nhiên, cú pháp không trực quan lắm.

=SUMPRODUCT(mảng1, [mảng2], [mảng3],…)

Chúng tôi muốn tính tổng KidHome cho tất cả các hàng có Giáo dục equals Graduation (C2) and Marital_Status equals Single (D2). Chúng ta sẽ thêm công thức này vào ô AI.

=TÓM TẮT((C2. C2241=C2)*(D2. D2241=D2)*(F2. F2241))

Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?
Tôi có thể trở thành Nhà phân tích dữ liệu chỉ với Excel không?

Nếu muốn xem một giá trị Học vấn khác, chẳng hạn như Tiến sĩ, chúng ta có thể thay đổi C2 thành C6 in the formula. 

Tóm tắt và các bước tiếp theo

Đây không phải là danh sách đầy đủ mọi tính năng và chức năng mà Excel cung cấp, nhưng 10 chức năng này giúp tôi phân tích và làm sạch dữ liệu mà không gặp rắc rối khi khởi động Python hoặc tải dữ liệu trong máy chủ SQL

Biểu đồ Pivot rất phù hợp với các tập dữ liệu nhỏ, đặc biệt nếu bạn cần chia sẻ dữ liệu với những người không có kỹ thuật. Mặc dù Excel có vẻ như là một công cụ cồng kềnh trong thế giới dữ liệu lớn, nhưng nó vẫn là một trong những công cụ phân tích dữ liệu phổ biến nhất trên hành tinh vì một lý do nào đó

Nhưng đừng tin lời chúng tôi—Nick tốt nghiệp Chương trình Phân tích Dữ liệu CareerFoundry có lời khuyên này cho những người thay đổi nghề nghiệp tiềm năng khác, sau khi hoàn thành xuất sắc việc chuyển từ giáo viên toán sang nhà phân tích dữ liệu

Biết Excel—bất kể vai trò của bạn là gì—đều quan trọng. Nếu bạn làm việc tại một doanh nghiệp và bạn biết một số kỹ năng Excel từ trung cấp đến nâng cao, điều đó sẽ giúp bạn tiết kiệm thời gian và thậm chí có thể nghĩ ra điều gì đó sẽ gây ấn tượng với sếp của bạn. Excel là một công cụ khổng lồ mạnh mẽ hơn rất nhiều so với những gì tôi biết

Tôi có thể xin việc nếu chỉ biết Excel không?

MS Excel là một trong những kỹ năng được yêu cầu nhiều nhất cho việc làm trong nhiều ngành. Chứng chỉ Excel sẽ mở ra nhiều cánh cửa cơ hội cho bạn . Bởi vì nó có thể được sử dụng trong nhiều môi trường kinh doanh khác nhau, từ quản lý dự án đến nguồn nhân lực, bất kỳ ai là chuyên gia Microsoft Excel luôn có nhu cầu.

Nhà phân tích dữ liệu có cần biết Excel không?

Microsoft Excel, con thú tinh vi mà tất cả chúng ta đều đã từng sử dụng vào một lúc nào đó trong đời, là một công cụ thiết yếu trong phân tích dữ liệu . Chương trình bảng tính này là một trong những điều đầu tiên mà các nhà phân tích dữ liệu khao khát phải nắm bắt được. Trong bài viết này, chúng tôi sẽ cho bạn biết cách Excel được các nhà phân tích dữ liệu sử dụng.

Những kỹ năng Excel nào là cần thiết cho nhà phân tích dữ liệu?

10 tính năng cần thiết của Excel dành cho nhà phân tích dữ liệu (và cách sử dụng chúng) .
Bảng Pivot và biểu đồ Pivot
định dạng có điều kiện
Loại bỏ các bản sao
Xlookup
SỐ PHIẾU
CUỘC THI ĐẤU
COUNTBLANK
NGÀY và NGÀY MẠNG

Tôi có thể trở thành nhà phân tích dữ liệu nếu tôi không giỏi toán không?

Mặc dù các nhà phân tích dữ liệu cần phải giỏi về các con số và kiến ​​thức cơ bản về Toán học và Thống kê có thể hữu ích, nhưng phần lớn phân tích dữ liệu chỉ tuân theo một loạt các bước hợp lý. Như vậy, mọi người có thể thành công trong lĩnh vực này mà không cần nhiều kiến ​​thức toán học .