Hướng dẫn how do you use excel to solve outliers? - làm thế nào để bạn sử dụng excel để giải quyết các ngoại lệ?
Khi làm việc với dữ liệu trong Excel, bạn sẽ thường gặp các vấn đề xử lý các ngoại lệ trong bộ dữ liệu của mình. Show
Có các ngoại lệ là khá phổ biến trong tất cả các loại dữ liệu, và điều quan trọng là xác định và xử lý các ngoại lệ này để đảm bảo rằng phân tích của bạn là chính xác và có ý nghĩa hơn. Trong hướng dẫn này, tôi sẽ chỉ cho bạn cách tìm các ngoại lệ trong Excel và một số kỹ thuật mà tôi đã sử dụng trong công việc của mình để xử lý các ngoại lệ này.how to find outliers in Excel, and some of the techniques that I have used in my work to handle these outliers.
Các ngoại lệ là gì và tại sao điều quan trọng là tìm thấy những điều này là gì?Tìm ngoại lệ bằng cách sắp xếp dữ liệu Tìm các ngoại lệ bằng cách sử dụng các chức năng tứong Tìm các ngoại lệ bằng cách sử dụng các chức năng lớn/nhỏ Cách xử lý các ngoại lệ đúng cách Một ngoại lệ là một điểm dữ liệu vượt ra ngoài các điểm dữ liệu khác trong tập dữ liệu. Khi bạn có một ngoại lệ trong dữ liệu, nó có thể làm lệch dữ liệu của bạn có thể dẫn đến các suy luận không chính xác. Hãy để tôi cho bạn một ví dụ đơn giản. Hãy nói rằng 30 người đang đi trong một chiếc xe buýt từ đích A đến đích B. Tất cả những người ở trong một nhóm cân nặng và nhóm thu nhập tương tự. Với mục đích của hướng dẫn này, hãy để Lôi xem xét trọng lượng trung bình là 220 pounds và thu nhập trung bình hàng năm là 70.000 đô la. Bây giờ ở đâu đó giữa tuyến đường của chúng tôi, xe buýt dừng lại và Bill Gates nhảy vào. Bây giờ, bạn nghĩ điều này sẽ làm gì với trọng lượng trung bình và thu nhập trung bình của người dân trên xe buýt. Mặc dù trọng lượng trung bình không có khả năng thay đổi nhiều, thu nhập trung bình của người dân trên xe buýt sẽ tăng vọt rất nhiều. Tìm ngoại lệ bằng cách sắp xếp dữ liệuTìm các ngoại lệ bằng cách sử dụng các chức năng tứong Tìm các ngoại lệ bằng cách sử dụng các chức năng lớn/nhỏ Cách xử lý các ngoại lệ đúng cách Một ngoại lệ là một điểm dữ liệu vượt ra ngoài các điểm dữ liệu khác trong tập dữ liệu. Khi bạn có một ngoại lệ trong dữ liệu, nó có thể làm lệch dữ liệu của bạn có thể dẫn đến các suy luận không chính xác. Có thể bạn quan tâmHãy để tôi cho bạn một ví dụ đơn giản.
Và để đảm bảo rằng phân tích của bạn là chính xác, bằng cách nào đó bạn cần phải xác định các ngoại lệ này và sau đó quyết định cách đối xử tốt nhất với chúng. Bây giờ, hãy để Lôi thấy một vài cách để tìm các ngoại lệ trong Excel. Với các bộ dữ liệu nhỏ, một cách nhanh chóng để xác định các ngoại lệ là chỉ cần sắp xếp dữ liệu và thực hiện thủ công một số giá trị ở đầu dữ liệu được sắp xếp này. Tìm các ngoại lệ bằng cách sử dụng các chức năng tứongTìm các ngoại lệ bằng cách sử dụng các chức năng lớn/nhỏ Cách xử lý các ngoại lệ đúng cách Một ngoại lệ là một điểm dữ liệu vượt ra ngoài các điểm dữ liệu khác trong tập dữ liệu. Khi bạn có một ngoại lệ trong dữ liệu, nó có thể làm lệch dữ liệu của bạn có thể dẫn đến các suy luận không chính xác. Hãy để tôi cho bạn một ví dụ đơn giản. =QUARTILE.INC($B$2:$B$15,1) Hãy nói rằng 30 người đang đi trong một chiếc xe buýt từ đích A đến đích B. Tất cả những người ở trong một nhóm cân nặng và nhóm thu nhập tương tự. Với mục đích của hướng dẫn này, hãy để Lôi xem xét trọng lượng trung bình là 220 pounds và thu nhập trung bình hàng năm là 70.000 đô la. =QUARTILE.INC($B$2:$B$15,3) Bây giờ ở đâu đó giữa tuyến đường của chúng tôi, xe buýt dừng lại và Bill Gates nhảy vào. =F3-F2 Bây giờ, bạn nghĩ điều này sẽ làm gì với trọng lượng trung bình và thu nhập trung bình của người dân trên xe buýt. Mặc dù trọng lượng trung bình không có khả năng thay đổi nhiều, thu nhập trung bình của người dân trên xe buýt sẽ tăng vọt rất nhiều. Điều đó vì thu nhập của Bill Gates, là một ngoại lệ trong nhóm của chúng tôi và điều đó cho chúng tôi một cách giải thích sai về dữ liệu. Thu nhập trung bình cho mỗi người trên xe buýt sẽ là vài tỷ đô la, vượt quá giá trị thực tế. =Quartile1 - 1.5*(Inter Quartile Range) Khi làm việc với các bộ dữ liệu thực tế trong Excel, bạn có thể có các ngoại lệ theo bất kỳ hướng nào (nghĩa là, một ngoại lệ tích cực hoặc ngoại lệ tiêu cực). =F2-1.5*F4 Và để đảm bảo rằng phân tích của bạn là chính xác, bằng cách nào đó bạn cần phải xác định các ngoại lệ này và sau đó quyết định cách đối xử tốt nhất với chúng. =Quartile3 + 1.5*(Inter Quartile Range) mà trong ví dụ của chúng tôi trở thành: =F3+1.5*F4 Bây giờ chúng tôi có giới hạn trên và dưới trong tập dữ liệu của mình, chúng tôi có thể quay lại dữ liệu gốc và nhanh chóng xác định những giá trị không nằm trong phạm vi này. Một cách nhanh chóng để làm điều này là kiểm tra mọi giá trị và trả về đúng hoặc sai trong một cột mới. Tôi đã sử dụng công thức dưới đây hoặc công thức để đúng với những giá trị đó là ngoại lệ. =OR(B2<$F$5,B2>$F$6) Bây giờ bạn có thể lọc cột ngoại lệ và chỉ hiển thị các bản ghi trong đó giá trị là đúng. Ngoài ra, bạn cũng có thể sử dụng định dạng có điều kiện để làm nổi bật tất cả các ô trong đó giá trị là đúng Lưu ý: Mặc dù đây là một phương pháp được chấp nhận nhiều hơn để tìm các ngoại lệ trong thống kê. Tôi thấy phương pháp này một chút không thể sử dụng trong các kịch bản thực tế. Trong ví dụ trên, giới hạn thấp hơn được tính theo công thức là -103, trong khi bộ dữ liệu chúng ta chỉ có thể dương. Vì vậy, phương pháp này có thể giúp chúng ta tìm ra các ngoại lệ theo một hướng (giá trị cao), nó vô dụng trong việc xác định các ngoại lệ theo hướng khác. While this is a more accepted method to find outliers in statistics. I find this method a bit unusable in real-life scenarios. In the above example, the lower limit calculated by the formula is -103, while the dataset we have can only be positive. So this method can help us find outliers in one direction (high values), it’s useless in identifying outliers in the other direction. Tìm các ngoại lệ bằng cách sử dụng các chức năng lớn/nhỏNếu bạn làm việc với nhiều dữ liệu (giá trị trong nhiều cột), bạn có thể trích xuất các giá trị lớn nhất và nhỏ nhất 5 hoặc 7 và xem liệu có bất kỳ ngoại lệ nào trong đó không. Nếu có bất kỳ ngoại lệ nào, bạn sẽ có thể xác định chúng mà không cần phải đi qua tất cả các dữ liệu theo cả hai hướng. Giả sử chúng ta có bộ dữ liệu dưới đây và chúng ta muốn biết nếu có bất kỳ ngoại lệ nào. Dưới đây là công thức sẽ cung cấp cho bạn giá trị lớn nhất trong bộ dữ liệu: =LARGE($B$2:$B$16,1) Tương tự, giá trị lớn thứ hai sẽ được đưa ra bởi =LARGE($B$2:$B$16,1) Nếu bạn không sử dụng Microsoft 365, có các mảng động, bạn có thể sử dụng công thức dưới đây và nó sẽ cung cấp cho bạn năm giá trị lớn nhất từ bộ dữ liệu với một công thức duy nhất: =QUARTILE.INC($B$2:$B$15,3)0 Tương tự, nếu bạn muốn 5 giá trị nhỏ nhất, hãy sử dụng công thức dưới đây: =QUARTILE.INC($B$2:$B$15,3)1 Hoặc những điều sau đây trong trường hợp bạn không có mảng động: =QUARTILE.INC($B$2:$B$15,3)2 Khi bạn có các giá trị này, nó thực sự dễ dàng tìm ra bất kỳ ngoại lệ nào trong tập dữ liệu. Mặc dù tôi đã chọn để trích xuất 5 giá trị lớn nhất và nhỏ nhất, bạn có thể chọn nhận được 7 hoặc 10 dựa trên mức độ lớn của bộ dữ liệu của bạn. Tôi không chắc đây có phải là một phương pháp chấp nhận được để tìm các ngoại lệ trong Excel hay không, nhưng đây là phương pháp mà tôi đã sử dụng khi tôi phải làm việc với nhiều dữ liệu tài chính trong công việc của mình vài năm trước. So với tất cả các phương pháp khác được đề cập trong hướng dẫn này, tôi thấy đây là phương pháp hiệu quả nhất. Cách xử lý các ngoại lệ đúng cáchCho đến nay, chúng tôi đã thấy các phương pháp sẽ giúp chúng tôi tìm thấy các ngoại lệ trong tập dữ liệu của chúng tôi. Nhưng phải làm gì một khi bạn biết rằng có những ngoại lệ. Dưới đây là một vài phương pháp mà bạn có thể sử dụng để xử lý các ngoại lệ để phân tích dữ liệu của bạn là chính xác. Xóa các ngoại lệCách dễ nhất để loại bỏ các ngoại lệ khỏi bộ dữ liệu của bạn là chỉ cần xóa chúng. Bằng cách này, nó đã giành được phân tích của bạn. Nó có một giải pháp khả thi hơn khi bạn có các bộ dữ liệu lớn và xóa một vài ngoại lệ đã giành được tác động đến phân tích tổng thể. Và tất nhiên, trước khi xóa dữ liệu, hãy đảm bảo bạn tạo một bản sao và đi sâu vào những gì mà gây ra các ngoại lệ này. Bình thường hóa các ngoại lệ (điều chỉnh giá trị)Bình thường hóa các ngoại lệ là những gì tôi từng làm khi tôi đang làm việc toàn thời gian. Đối với tất cả các giá trị ngoại lệ, tôi chỉ cần thay đổi chúng thành một giá trị cao hơn một chút so với giá trị tối đa trong tập dữ liệu. Điều này đảm bảo rằng tôi không xóa dữ liệu nhưng đồng thời tôi không để nó làm lệch dữ liệu của mình. Để cung cấp cho bạn một ví dụ thực tế, nếu bạn đang phân tích biên lợi nhuận ròng của các công ty, nơi hầu hết các công ty nằm trong phạm vi -10%đến 30%và có một vài giá trị tăng 100%, tôi Chỉ cần thay đổi các giá trị ngoại lệ này thành 30% hoặc 35%. Vì vậy, đây là một số phương pháp mà bạn có thể sử dụng trong Excel để tìm các ngoại lệ.Excel to find outliers. Khi bạn đã xác định được các ngoại lệ, bạn có thể đi sâu vào dữ liệu và tìm kiếm những gì mà gây ra những thứ này, đồng thời chọn một trong các kỹ thuật để xử lý các ngoại lệ này (có thể loại bỏ chúng hoặc bình thường hóa chúng bằng cách điều chỉnh giá trị) Tôi hy vọng bạn tìm thấy hướng dẫn này hữu ích. Các hướng dẫn Excel khác mà bạn cũng có thể thích:
Bạn có thể sử dụng Excel để tìm ngoại lệ không?Excel có rất nhiều chức năng được sử dụng có thể cải thiện đáng kể phân tích dữ liệu của bạn.Một trong những tính năng tốt nhất là các khả năng thống kê của nó để bạn có thể tìm thấy các ngoại lệ trong Excel dễ dàng với các công thức thống kê đơn giản ..you can find outliers in Excel easily with simple statistics formulas..
Cách nhanh nhất để loại bỏ các ngoại lệ trong Excel là gì?Cách dễ nhất để loại bỏ các ngoại lệ khỏi bộ dữ liệu của bạn là chỉ cần xóa chúng.Bằng cách này, nó sẽ không làm lệch phân tích của bạn.delete them. This way it won't skew your analysis.
Công thức tính toán các ngoại lệ là gì?Một phân phối bình thường cũng có ngoại lệ.Giá trị Z giúp xác định các ngoại lệ.Z = (x - μ)/ trong đó là giá trị trung bình của dữ liệu và là độ lệch chuẩn của dữ liệu.Dữ liệu với giá trị Z ngoài 3 được coi là ngoại lệ.Z = (x - μ)/ σ where μ is the mean of the data and σ is the standard deviation of the data. The data with Z-values beyond 3 are considered as outliers. |
Bài Viết Liên Quan
Hecta mét vuông bằng bao nhiêu km vuông?
1 ha bằng bao nhiêu mét vuông? Công thức quy đổi dễ tính nhất.adminJune 10, 20215:31 pmNội dung bài viết5 / 5 ( 2 votes )1 ha bằng bao nhiêu mét vuông? Chúng ta thường ...
Phương thức được định nghĩa trong lớp hình chữ nhật được sử dụng để vẽ hình chữ nhật Python là gì?
lớp Hình chữ nhật (đối tượng). def __init__(self,width=2,height=3,color=r). bản thân. chiều cao = chiều cao bản thân. chiều rộng = chiều rộng bản thân. color=color ...
Làm cách nào để ghi đè một chức năng trong PHP?
5 năm trước bởi Ryan Jentzsch — xem nguồnchưa đọcTôi biết Trình gỡ lỗi PHP nâng cao nhưng tôi cần loại trình gỡ lỗi nàychức năng cho là chế nhạo và thử ...
Làm cách nào để tìm nạp hình ảnh từ cơ sở dữ liệu trong PHP và hiển thị trong Div?
Tiếp cận. Đảm bảo bạn đã cài đặt máy chủ XAMPP hoặc WAMP trên máy của mình. Trong hướng dẫn này, chúng tôi sẽ sử dụng máy chủ WAMP1. Tạo nên cơ sở ...
Diễu Hành Lễ Hội Las Palmas 2023
Ngày 3 tháng 3 là Drag Queen Gala, kỷ niệm 25 năm thành lập. Ngày hôm sau là Cuộc diễu hành vĩ đại và cuối cùng, vào Chủ nhật, ngày 5 tháng 2, Lễ hội Las Palmas ...
Cách hiển thị các thẻ trong trang WordPress
Tôi vừa mới làm việc trên một chủ đề WordPress cao cấp mới mà tôi sẽ phát hành vào tuần tới và khi tôi đang tạo mẫu trang sơ đồ trang web của mình, tôi ...
Php kết xuất pdf
Thực hiện chức năng xuất PDF danh sách Sản phẩm (pdf)Cài đặt thư viện xuất PDFcomposer require barryvdh/laravel-dompdfMô hình hoạt động của pdfBước 1. tạo route ...
Quên mật khẩu phpmyadmin WAMP
Tôi đã tự hỏi liệu ai đó có thể giúp tôi không, tôi đã tìm kiếm trực tuyến hàng giờ để thử mọi giải pháp có thểnhưng vẫn không gặp may khi thay đổi ...
Thêm Trình quản lý thẻ của Google vào WordPress mà không cần plugin
Khi nói đến việc quản lý trang web WordPress của bạn, Trình quản lý thẻ của Google (GTM) sẽ là một trong những công cụ bạn nên sử dụngTại sao? Hãy làm theo ...
600 Giờ bao nhiêu ngày
? 1 năm có bao nhiêu giờ, phút, giây? Thì không phải ai cũng có thể nắm rõ và trả lời chính xác. Vậy nên, tất cả sẽ được Legoland giải đáp chi tiết ngay ...
Hướng dẫn dùng pandas videos python
Tại sao nên học cách làm việc với Python Pandas Excel? Excel là một trong những công cụ dữ liệu phổ biến và được sử dụng rộng rãi nhất; khó mà tìm được ...
Bí mật PHP
Một thẻ đã tồn tại với tên chi nhánh được cung cấp. Nhiều lệnh Git chấp nhận cả tên thẻ và tên nhánh, vì vậy việc tạo nhánh này có thể gây ra hành vi ...
Trăng tròn tháng 1 năm 2023 theo giờ Argentina
Năm mới bắt đầu với trăng khuyết, nhưng câu hỏi bắt đầu được đặt ra là khi nào trăng tròn vào năm 2023? Tuy nhiên, lịch âm còn có một mục đích cực ...
Python kiểm tra xem loại có phải là danh sách không
Python has a built-in function called type() that helps you find the class type of the variable given as input. For example, if the input is a string, you will get the output as , for the list, it ...
Câu lệnh nào sau đây không đúng đối với tuple trong Python
Danh sách và bộ dữ liệu được cho là loại dữ liệu hữu ích, linh hoạt nhất của Python. Bạn sẽ tìm thấy chúng trong hầu hết mọi chương trình Python thông ...
Làm thế nào để Python biết phần cuối của một chuỗi?
Tuy nhiên, có nhiều cách khác để lấy giá trị cuối cùng của as chuỗi trong python; . Dưới đây là một số kỹ thuật chỉ ra cách lấy ký tự cuối cùng và n ký ...
Cx_Oracle ssl Python
Giải pháp. Nếu bạn có python3 -m pip install oracledb --upgrade 2 được bao gồm trong chuỗi kết nối của mình, hãy đảm bảo rằng python3 -m pip install oracledb ...
90000 euro bằng bao nhiêu tiền việt nam
Để đối phó với hạn hán và xâm nhập mặn đang diễn ra tại nhiều vùng của Việt Nam từ cuối năm 2015, Liên minh châu Âu đang cung cấp 90.000 euro tài trợ ...
Tổng bình phương các chữ số trong C++
/* www.programming9.com */ #include main() { int n,i,sum; i=1,sum=0; printf(Enter Maximum Value(n):); scanf(%d,&n); while(i
Tốc độ gió ở Amritsar 13 tháng một 2023
Hướng dẫn thời tiết tháng 1 cho Ấn Độ (Amritsar) hiển thị thời tiết trung bình dài hạn được xử lý từ dữ liệu do CRU (Đại học East Anglia), Văn phòng ...