Hướng dẫn what is mean median and mode in python? - trung bình và chế độ có nghĩa là gì trong python?

Question

Trong các bài viết trước của tôi, chúng ta đã thấy trung bình, trung bình và chế độ tính toán trong SQL Server và C#.Net. Không giống như SQL Server và .NET, ngôn ngữ lập trình Python có một mô -đun sẵn có gọi là Thống kê có một số chức năng thống kê toán học cơ bản bao gồm trung bình, trung bình và chế độ. Mô -đun thống kê này đã được giới thiệu trong Python phiên bản 3.4.Python programming language has an inbuilt module called statistics which has some basic mathematical statistics functions including mean, median and mode. This statistics module was introduced in Python version 3.4.

Nội dung chính Show

Tài liệu tham khảo
Giới thiệu
Tính toán giá trị trung bình của một mẫu
Tìm kiếm trung bình của một mẫu
Tìm chế độ của một mẫu
Sự kết luận
Làm thế nào để bạn tìm thấy trung bình trung bình và chế độ trong Python?
Median có nghĩa là gì trong Python?
Chế độ có nghĩa là gì trong Python?
Có nghĩa là Python là gì?

Mô -đun thống kê có nhiều chức năng. Dưới đây là các chức năng tính toán trung bình, trung bình và chế độ.

trung bình (): để có được giá trị trung bình số học của tập dữ liệu đã cho. Trung bình số học cũng là trung bình của dữ liệu. : To get the arithmetic mean of the given set of data. Arithmetic mean is also the average of the data.
Median (): Để có được giá trị trung bình hoặc giá trị trung bình của bộ dữ liệu đã cho. : To get the median or the middle value of the given set of data.
MODE (): Để có được chế độ duy nhất của tập dữ liệu đã cho. Nếu có nhiều chế độ trong dữ liệu, thì hàm này sẽ trả về chế độ đầu tiên mà nó xác định.: To get the single mode of the given set of data. If there are multiple modes in the data, then this function returns the first mode it identifies.
Multimode (): Liệt kê tất cả các chế độ trong tập dữ liệu đã cho. Nếu không có chế độ, thì hàm này sẽ trả về tất cả các phần tử của dữ liệu. : Lists all the modes in the given set of data. If there is no mode, then this function will return all the elements of the data.

Dưới đây là mã mẫu để tìm trung bình, trung bình và chế độ trong Python bằng mô -đun thống kê.

Thí dụ

import statistics

data = [220, 100, 190, 180, 250, 190, 240, 180, 140, 180, 190]

# Finding Mean
print("\nMean: ", statistics.mean(data))

# Finding Median
print("Median: ", statistics.median(data))

# Finding Single Mode
print("Single Mode: ", statistics.mode(data))

# Finding Multiple Modes
print("Mode: ", statistics.multimode(data))

Đầu ra

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

Tài liệu tham khảo

Đọc thêm về mô -đun thống kê Python tại Python Docs.

Giới thiệu

Khi chúng tôi đang cố gắng mô tả và tóm tắt một mẫu dữ liệu, có lẽ chúng tôi bắt đầu bằng cách tìm giá trị trung bình (hoặc trung bình), trung bình và chế độ của dữ liệu. Đây là các biện pháp xu hướng trung tâm và thường là cái nhìn đầu tiên của chúng tôi về một bộ dữ liệu.central tendency measures and are often our first look at a dataset.

Trong hướng dẫn này, chúng ta sẽ học cách tìm hoặc tính toán giá trị trung bình, trung bình và chế độ trong Python. Trước tiên chúng tôi sẽ mã hóa hàm Python cho mỗi biện pháp theo sau bằng cách sử dụng mô -đun ____99 của Python để hoàn thành cùng một nhiệm vụ.

Với kiến thức này, chúng tôi sẽ có thể xem nhanh các bộ dữ liệu của chúng tôi và có ý tưởng về xu hướng chung của dữ liệu.

Tính toán giá trị trung bình của một mẫu

Nếu chúng ta có một mẫu các giá trị số, thì giá trị trung bình của nó hoặc trung bình là tổng số của các giá trị (hoặc quan sát) chia cho số lượng giá trị.

Giả sử chúng tôi có mẫu ____10. Chúng ta có thể tính toán giá trị trung bình của nó bằng cách thực hiện thao tác:

(4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10 = 5.2

Giá trị trung bình (trung bình số học) là một mô tả chung về dữ liệu của chúng tôi. Giả sử bạn mua 10 pound cà chua. Khi bạn đếm cà chua ở nhà, bạn sẽ nhận được 25 cà chua. Trong trường hợp này, bạn có thể nói rằng trọng lượng trung bình của cà chua là 0,4 pound. Đó sẽ là một mô tả tốt về cà chua của bạn.

Giá trị trung bình cũng có thể là một mô tả kém về một mẫu dữ liệu. Giả sử bạn đang phân tích một nhóm chó. Nếu bạn lấy trọng lượng tích lũy của tất cả các con chó và chia nó cho số lượng chó, thì đó có lẽ là một mô tả kém về trọng lượng của một con chó cá nhân vì các giống chó khác nhau có thể có kích thước và trọng lượng rất khác nhau.

Mức trung bình tốt như thế nào hoặc mức độ xấu mô tả một mẫu phụ thuộc vào mức độ lan truyền dữ liệu. Trong trường hợp của cà chua, mỗi trọng lượng gần giống nhau và giá trị trung bình là một mô tả tốt về chúng. Trong trường hợp của chó, không có con chó tại chỗ. Họ có thể từ một Chihuahua nhỏ đến một con chó săn Đức khổng lồ. Vì vậy, ý nghĩa của chính nó không phải là một mô tả tốt trong trường hợp này.

Bây giờ là lúc để hành động và tìm hiểu làm thế nào chúng ta có thể tính toán trung bình bằng cách sử dụng Python.

Tính trung bình với Python

Để tính giá trị trung bình của một mẫu dữ liệu số, chúng tôi sẽ sử dụng hai hàm tích hợp của Python. Một để tính tổng tổng của các giá trị và một để tính chiều dài của mẫu.

Hàm đầu tiên là

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

1. Hàm tích hợp này có một giá trị số có thể lặp lại và trả về tổng số của chúng.

Hàm thứ hai là

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

2. Hàm tích hợp này trả về độ dài của một đối tượng.

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

2 có thể thực hiện các chuỗi (chuỗi, byte, tuple, danh sách hoặc phạm vi) hoặc bộ sưu tập (từ điển, bộ hoặc bộ đông lạnh) làm đối số.

Đây là cách chúng ta có thể tính toán trung bình:

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

Trước tiên chúng tôi tổng hợp các giá trị trong

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

4 bằng cách sử dụng

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

1. Sau đó, chúng tôi chia tổng số đó cho độ dài của

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

4, đó là giá trị kết quả là

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

7.

Sử dụng trung bình của Python ()

Vì tính toán giá trị trung bình là một hoạt động chung, Python bao gồm chức năng này trong mô -đun statistics. Nó cung cấp một số chức năng để tính toán số liệu thống kê cơ bản trên các bộ dữ liệu. Hàm

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

9 lấy một mẫu dữ liệu số (bất kỳ điều khác được) và trả về giá trị trung bình của nó.

Đây là cách Python's

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 hoạt động:

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

Chúng tôi chỉ cần nhập mô -đun statistics và sau đó gọi

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 với mẫu của chúng tôi làm đối số. Điều đó sẽ trả về giá trị trung bình của mẫu. Đây là một cách nhanh chóng để tìm kiếm ý nghĩa sử dụng Python.

Tìm kiếm trung bình của một mẫu

Trung bình của một mẫu dữ liệu số là giá trị nằm ở giữa khi chúng ta sắp xếp dữ liệu. Dữ liệu có thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần, trung bình vẫn giữ nguyên.

Để tìm trung vị, chúng ta cần:

Sắp xếp mẫu
Xác định vị trí giá trị ở giữa mẫu được sắp xếp

Khi định vị số ở giữa một mẫu được sắp xếp, chúng ta có thể đối mặt với hai loại tình huống:

Nếu mẫu có số lượng quan sát lẻ, thì giá trị trung bình trong mẫu được sắp xếp là trung bìnhodd number of observations, then the middle value in the sorted sample is the median
Nếu mẫu có số lượng quan sát chẵn, thì chúng ta sẽ cần tính giá trị trung bình của hai giá trị giữa trong mẫu được sắp xếpeven number of observations, then we'll need to calculate the mean of the two middle values in the sorted sample

Nếu chúng tôi có mẫu

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

3 và muốn tìm trung bình của nó, thì trước tiên chúng tôi sắp xếp mẫu thành

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

4. Trung bình sẽ là

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

5 vì đó là giá trị ở giữa.

Mặt khác, nếu chúng ta có mẫu

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6, thì trung bình của nó sẽ là

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

7.

Chúng ta hãy xem làm thế nào chúng ta có thể sử dụng Python để tính toán trung bình.

Tìm trung vị với Python

Để tìm trung vị, trước tiên chúng ta cần sắp xếp các giá trị trong mẫu của chúng tôi. Chúng ta có thể đạt được điều đó bằng cách sử dụng chức năng

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8 tích hợp.

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8 có một số ít và trả về một

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 được sắp xếp chứa cùng các giá trị của bản gốc.

Bước thứ hai là định vị giá trị nằm ở giữa mẫu được sắp xếp. Để xác định giá trị đó trong một mẫu có số lượng quan sát lẻ, chúng ta có thể chia số lượng quan sát cho 2. Kết quả sẽ là chỉ số của giá trị ở giữa mẫu được sắp xếp.

Vì một toán tử phân chia (

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

1) trả về số float, chúng ta sẽ cần sử dụng toán tử phân chia sàn, (

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

2) để có được số nguyên. Vì vậy, chúng ta có thể sử dụng nó làm chỉ mục trong hoạt động lập chỉ mục (

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

3).

Nếu mẫu có số lượng quan sát chẵn, thì chúng ta cần xác định vị trí hai giá trị giữa. Giả sử chúng tôi có mẫu

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6. Nếu chúng ta chia chiều dài của nó (

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

5) cho

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6 bằng cách sử dụng phân chia sàn, thì chúng ta sẽ nhận được

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

5. Đó là chỉ số của giá trị trung lưu trên của chúng tôi (

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8). Để tìm chỉ số giá trị trung lưu thấp hơn của chúng tôi (

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

5), chúng tôi có thể giảm chỉ số của giá trị trung lưu trên bằng

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

0.

Kiểm tra hướng dẫn thực hành của chúng tôi, thực tế để học Git, với các thực hành tốt nhất, các tiêu chuẩn được công nghiệp chấp nhận và bao gồm bảng gian lận. Ngừng các lệnh git googling và thực sự tìm hiểu nó!

Hãy đặt tất cả những thứ này lại với nhau trong chức năng tính toán trung bình của một mẫu. Đây là một triển khai có thể:

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

Hàm này lấy một mẫu các giá trị số và trả về trung bình của nó. Trước tiên chúng tôi tìm thấy độ dài của mẫu,

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

1. Sau đó, chúng tôi tính toán chỉ số của giá trị giữa (hoặc giá trị trung lưu trên) bằng cách chia

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

1 cho

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6.

Tuyên bố

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

4 kiểm tra xem mẫu trong tay có số lượng quan sát lẻ. Nếu vậy, thì trung bình là giá trị tại

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

5.

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

6 cuối cùng chạy nếu mẫu có số lượng quan sát chẵn. Trong trường hợp đó, chúng tôi tìm thấy trung bình bằng cách tính giá trị trung bình của hai giá trị trung bình.

Lưu ý rằng hoạt động cắt

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

7 có hai giá trị. Giá trị tại

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 và giá trị tại

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

5 vì các hoạt động cắt loại trừ giá trị tại chỉ số cuối cùng (

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

0).

Sử dụng trung bình của Python ()

Python's

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

1 lấy một mẫu dữ liệu và trả về trung bình của nó. Đây là cách phương thức hoạt động:

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

Lưu ý rằng

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

2 tự động xử lý việc tính toán trung bình cho các mẫu có số lẻ hoặc số lượng quan sát chẵn.

Tìm chế độ của một mẫu

Chế độ là quan sát (hoặc quan sát) thường xuyên nhất trong một mẫu. Nếu chúng ta có mẫu

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

3, thì chế độ của nó là

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6 vì

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6 xuất hiện hai lần trong mẫu trong khi các yếu tố khác chỉ xuất hiện một lần.

Chế độ không cần phải là duy nhất. Một số mẫu có nhiều hơn một chế độ. Giả sử chúng tôi có mẫu

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

6. Mẫu này có hai chế độ -

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6 và

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8 vì chúng là các giá trị xuất hiện thường xuyên hơn và cả hai xuất hiện cùng một số lần.

Chế độ thường được sử dụng cho dữ liệu phân loại. Các loại dữ liệu phân loại phổ biến là:

Boolean - chỉ có thể lấy hai giá trị như trong
>>> import statistics >>> statistics.median([3, 5, 1, 4, 2]) 3 >>> statistics.median([3, 5, 1, 4, 2, 6]) 3.5
9 hoặc
>>> from collections import Counter >>> def my_mode(sample): ... c = Counter(sample) ... return [k for k, v in c.items() if v == c.most_common(1)[0][1]] ... >>> my_mode(["male", "male", "female", "male"]) ['male'] >>> my_mode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> my_mode([4, 1, 2, 2, 3, 5]) [2] >>> my_mode([4, 1, 2, 2, 3, 5, 4]) [4, 2]
0,
>>> from collections import Counter >>> def my_mode(sample): ... c = Counter(sample) ... return [k for k, v in c.items() if v == c.most_common(1)[0][1]] ... >>> my_mode(["male", "male", "female", "male"]) ['male'] >>> my_mode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> my_mode([4, 1, 2, 2, 3, 5]) [2] >>> my_mode([4, 1, 2, 2, 3, 5, 4]) [4, 2]
1 hoặc
>>> from collections import Counter >>> def my_mode(sample): ... c = Counter(sample) ... return [k for k, v in c.items() if v == c.most_common(1)[0][1]] ... >>> my_mode(["male", "male", "female", "male"]) ['male'] >>> my_mode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> my_mode([4, 1, 2, 2, 3, 5]) [2] >>> my_mode([4, 1, 2, 2, 3, 5, 4]) [4, 2]
2 - Can take only two values like in

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

9 or

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

0,

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

1 or

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

2

danh nghĩa - có thể mất nhiều hơn hai giá trị như trong
>>> from collections import Counter >>> def my_mode(sample): ... c = Counter(sample) ... return [k for k, v in c.items() if v == c.most_common(1)[0][1]] ... >>> my_mode(["male", "male", "female", "male"]) ['male'] >>> my_mode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> my_mode([4, 1, 2, 2, 3, 5]) [2] >>> my_mode([4, 1, 2, 2, 3, 5, 4]) [4, 2]
3 - Can take more than two values like in

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

3

Ordinal - có thể mất nhiều hơn hai giá trị nhưng các giá trị có thứ tự hợp lý như trong
>>> from collections import Counter >>> def my_mode(sample): ... c = Counter(sample) ... return [k for k, v in c.items() if v == c.most_common(1)[0][1]] ... >>> my_mode(["male", "male", "female", "male"]) ['male'] >>> my_mode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> my_mode([4, 1, 2, 2, 3, 5]) [2] >>> my_mode([4, 1, 2, 2, 3, 5, 4]) [4, 2]
4 - Can take more than two values but the values have a logical order like in

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

4

Khi chúng tôi phân tích dữ liệu dữ liệu phân loại, chúng tôi có thể sử dụng chế độ để biết danh mục nào là phổ biến nhất trong dữ liệu của chúng tôi.

Chúng ta có thể tìm thấy các mẫu không có chế độ. Nếu tất cả các quan sát là duy nhất (không có quan sát lặp đi lặp lại), thì mẫu của bạn sẽ không có chế độ.

Bây giờ chúng ta đã biết những điều cơ bản về chế độ, chúng ta hãy xem làm thế nào chúng ta có thể tìm thấy nó bằng Python.

Tìm chế độ với Python

Để tìm chế độ có Python, chúng tôi sẽ bắt đầu bằng cách đếm số lần xuất hiện của từng giá trị trong mẫu trong tay. Sau đó, chúng tôi sẽ nhận được (các) giá trị với số lần xuất hiện cao hơn.

Vì các đối tượng đếm là một hoạt động phổ biến, Python cung cấp lớp

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

5. Lớp này được thiết kế đặc biệt để đếm các đối tượng.

Lớp

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

6 cung cấp một phương thức được xác định là

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

7. Phương pháp này trả về một

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 của hai mục tiêu với các yếu tố phổ biến

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

1 và số lượng tương ứng của chúng. Nếu

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

1 bị bỏ qua hoặc

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

1, thì

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

2 trả về tất cả các yếu tố.

Chúng ta hãy sử dụng

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

6 và

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

2 để mã hóa một hàm lấy mẫu dữ liệu và trả về chế độ của nó.

Đây là một triển khai có thể:

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

Trước tiên, chúng tôi đếm các quan sát trong

Mean:  187.27272727272728
Median:  190
Single Mode:  190
Mode:  [190, 180]

4 bằng cách sử dụng đối tượng

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

6 (

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

7). Sau đó, chúng tôi sử dụng khả năng hiểu danh sách để tạo

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 chứa các quan sát xuất hiện cùng số lần trong mẫu.

Vì

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

9 trả về

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 với một

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

1 của mẫu

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

2, chúng ta cần có được quan sát tại Index

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

3 trong

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 và sau đó là mục tại Index

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

0 trong Điều này có thể được thực hiện với biểu thức

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

7. Giá trị đó là chế độ đầu tiên của mẫu của chúng tôi.

Lưu ý rằng điều kiện của sự hiểu biết so sánh số lượng của mỗi quan sát (

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

8) với số lượng quan sát phổ biến nhất (

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

7). Điều này sẽ cho phép chúng tôi có được nhiều quan sát (statistics0) với cùng một số lượng trong trường hợp mẫu đa chế độ.

Sử dụng chế độ Python ()

Python's statistics1 mất một số statistics2 và trả về chế độ (đầu tiên) của nó. Hãy xem cách chúng ta có thể sử dụng nó:

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

Với một mẫu một chế độ, statistics3 của Python trả về giá trị phổ biến nhất,

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

6. Tuy nhiên, trong quá trình tiến hành hai ví dụ, nó đã trả lại

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8 và statistics6. Các mẫu này có các yếu tố khác xảy ra cùng một số lần, nhưng chúng không được bao gồm.

Vì Python 3.8, chúng tôi cũng có thể sử dụng statistics7, chấp nhận một điều đáng tin cậy và trả về

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 của các chế độ.

Đây là một ví dụ về cách sử dụng statistics9:

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

Lưu ý: Hàm luôn trả về

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0, ngay cả khi bạn vượt qua mẫu một chế độ. The function always returns a

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0, even if you pass a single-mode sample.

Sự kết luận

Giá trị trung bình (hoặc trung bình), trung bình và chế độ thường là cái nhìn đầu tiên của chúng tôi về một mẫu dữ liệu khi chúng tôi cố gắng hiểu xu hướng trung tâm của dữ liệu.

Trong hướng dẫn này, chúng tôi đã học cách tìm hoặc tính toán giá trị trung bình, trung bình và chế độ sử dụng Python. Trước tiên chúng tôi đề cập đến từng bước, cách tạo các chức năng của riêng mình để tính toán chúng và sau đó là cách sử dụng mô-đun ____99 của Python như một cách nhanh chóng để tìm các biện pháp này.

Làm thế nào để bạn tìm thấy trung bình trung bình và chế độ trong Python?

Chương trình tìm kiếm trung bình, trung bình và chế độ mà không sử dụng thư viện:..

Trung bình: Numb = [2, 3, 5, 7, 8] No = Len (Numb) Summ = sum (numb) mean = summ / không in ("giá trị trung bình hoặc trung bình của tất cả các số này (", tê, ") là ", str (có nghĩa là)) ....

Trung bình: ... .

Cách thức: ... .

Chương trình tìm kiếm trung bình, trung bình và chế độ bằng thư viện được xác định trước:.

Median có nghĩa là gì trong Python?

Trung bình (dữ liệu) trả về trung bình (giá trị trung bình) của dữ liệu số, sử dụng giá trị trung bình chung của phương thức trung bình hai.Nếu dữ liệu trống, StatisticerRror được nâng lên.Dữ liệu có thể là một chuỗi hoặc có thể lặp lại.middle value) of numeric data, using the common “mean of middle two” method. If data is empty, StatisticsError is raised. data can be a sequence or iterable.

Chế độ có nghĩa là gì trong Python?

Chế độ () Hàm trong mô -đun thống kê Python Chế độ của một tập hợp các giá trị dữ liệu là giá trị xuất hiện thường xuyên nhất.Đó là giá trị mà dữ liệu rất có thể được lấy mẫu.the value that appears most often. It is the value at which the data is most likely to be sampled.

Có nghĩa là Python là gì?

Thống kê Python |hàm trung bình () hàm trung bình () có thể được sử dụng để tính trung bình/trung bình của một danh sách các số nhất định.Nó trả về giá trị trung bình của tập dữ liệu được truyền dưới dạng tham số.Trung bình số học là tổng dữ liệu chia cho số lượng điểm dữ liệu.mean() function can be used to calculate mean/average of a given list of numbers. It returns mean of the data set passed as parameters. Arithmetic mean is the sum of data divided by the number of data-points.

programming python Median Python Mode Python K-means Python In Python

Hướng dẫn what is mean median and mode in python? - trung bình và chế độ có nghĩa là gì trong python?

Thí dụ

Đầu ra

Tài liệu tham khảo

Giới thiệu

Tính toán giá trị trung bình của một mẫu

Tính trung bình với Python

Sử dụng trung bình của Python ()

Tìm kiếm trung bình của một mẫu

Tìm trung vị với Python

Sử dụng trung bình của Python ()

Tìm chế độ của một mẫu

Tìm chế độ với Python

Sử dụng chế độ Python ()

Sự kết luận

Làm thế nào để bạn tìm thấy trung bình trung bình và chế độ trong Python?

Median có nghĩa là gì trong Python?

Chế độ có nghĩa là gì trong Python?

Có nghĩa là Python là gì?

Bài Viết Liên Quan

Quảng Cáo

Có thể bạn quan tâm

Toplist được quan tâm

Quảng cáo

Xem Nhiều

Quảng cáo

Chúng tôi

Điều khoản

Trợ giúp

Mạng xã hội