Hướng dẫn is there a statistics module in python? - có một mô-đun thống kê trong python không?

Mới trong phiên bản 3.4.

Mã nguồn: lib/thống kê.py Lib/statistics.py


Mô-đun này cung cấp các chức năng để tính toán số liệu thống kê toán học của dữ liệu số (________ 38-giá trị).

Mô-đun này không nhằm mục đích là đối thủ cạnh tranh với các thư viện của bên thứ ba như Numpy, SCIPY hoặc các gói thống kê đầy đủ tính năng độc quyền nhằm vào các nhà thống kê chuyên nghiệp như Minitab, SAS và MATLAB. Nó nhằm vào mức độ biểu đồ và máy tính khoa học.

Trừ khi được ghi nhận rõ ràng, các chức năng này hỗ trợ

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
9,
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
0,
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
1 và
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
2. Hành vi với các loại khác (cho dù trong tháp số hay không) hiện không được hỗ trợ. Các bộ sưu tập với sự kết hợp của các loại cũng không được xác định và phụ thuộc vào thực hiện. Nếu dữ liệu đầu vào của bạn bao gồm các loại hỗn hợp, bạn có thể sử dụng
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
3 để đảm bảo kết quả nhất quán, ví dụ:
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
4.

Một số bộ dữ liệu sử dụng các giá trị

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
5 (không phải số) để biểu diễn dữ liệu bị thiếu. Vì NAN có ngữ nghĩa so sánh bất thường, chúng gây ra các hành vi đáng ngạc nhiên hoặc không xác định trong các chức năng thống kê sắp xếp dữ liệu hoặc tính toán xảy ra. Các chức năng bị ảnh hưởng là
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
6,
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
7,
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
8,
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
9,
>>> harmonic_mean([40, 60])
48.0
0,
>>> harmonic_mean([40, 60])
48.0
1 và
>>> harmonic_mean([40, 60])
48.0
2. Các giá trị
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
5 phải được tước trước khi gọi các chức năng này:

>>> from statistics import median
>>> from math import isnan
>>> from itertools import filterfalse

>>> data = [20.7, float('NaN'),19.2, 18.3, float('NaN'), 14.4]
>>> sorted(data)  # This has surprising behavior
[20.7, nan, 14.4, 18.3, 19.2, nan]
>>> median(data)  # This result is unexpected
16.35

>>> sum(map(isnan, data))    # Number of missing values
2
>>> clean = list(filterfalse(isnan, data))  # Strip NaN values
>>> clean
[20.7, 19.2, 18.3, 14.4]
>>> sorted(clean)  # Sorting now works as expected
[14.4, 18.3, 19.2, 20.7]
>>> median(clean)       # This result is now well defined
18.75

Trung bình và các biện pháp của vị trí trung tâm lor

Các chức năng này tính toán giá trị trung bình hoặc điển hình từ dân số hoặc mẫu.

>>> harmonic_mean([40, 60])
48.0
4

Giá trị trung bình số học (trung bình trung bình) của dữ liệu.

>>> harmonic_mean([40, 60])
48.0
5

Nhanh chóng, điểm nổi trung bình số học, với trọng số tùy chọn.

>>> harmonic_mean([40, 60])
48.0
6

Giá trị trung bình hình học của dữ liệu.

>>> harmonic_mean([40, 60])
48.0
7

Trung bình hài hòa của dữ liệu.

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
6

Trung bình (giá trị trung bình) của dữ liệu.

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
7

Trung bình thấp của dữ liệu.

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
8

Trung bình cao của dữ liệu.

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
9

Trung bình, hoặc phần trăm thứ 50, của dữ liệu được nhóm.

>>> harmonic_mean([40, 60])
48.0
0

Chế độ đơn (giá trị phổ biến nhất) của dữ liệu rời rạc hoặc danh nghĩa.

>>> harmonic_mean([40, 60])
48.0
1

Danh sách các chế độ (giá trị phổ biến nhất) của dữ liệu rời rạc hoặc danh nghĩa.

>>> harmonic_mean([40, 60])
48.0
2

Chia dữ liệu thành các khoảng với xác suất bằng nhau.

Các biện pháp lây lan

Các chức năng này tính toán một thước đo số lượng dân số hoặc mẫu có xu hướng lệch khỏi các giá trị điển hình hoặc trung bình.

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
5

Độ lệch chuẩn dân số của dữ liệu.

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
6

Phương sai dân số của dữ liệu.

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
7

Mẫu độ lệch chuẩn của dữ liệu.

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
8

Phương sai mẫu của dữ liệu.

Thống kê quan hệ giữa hai đầu vào

Các chức năng này tính toán số liệu thống kê về mối quan hệ giữa hai đầu vào.

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
9

Phương pháp hiệp phương sai cho hai biến.

>>> median([1, 3, 5, 7])
4.0
0

Hệ số tương quan Pearson sườn cho hai biến.

>>> median([1, 3, 5, 7])
4.0
1

Độ dốc và chặn cho hồi quy tuyến tính đơn giản.

Chi tiết chức năng %

Lưu ý: Các chức năng không yêu cầu dữ liệu được cung cấp cho chúng được sắp xếp. Tuy nhiên, để đọc thuận tiện, hầu hết các ví dụ hiển thị các chuỗi được sắp xếp.

Thống kê.Mean (Dữ liệu) ¶mean(data)

Trả về giá trị trung bình số học của dữ liệu có thể là một chuỗi hoặc có thể lặp lại.

Giá trị trung bình số học là tổng của dữ liệu chia cho số lượng điểm dữ liệu. Nó thường được gọi là trung bình, mặc dù nó chỉ là một trong nhiều mức trung bình toán học khác nhau. Đó là thước đo vị trí trung tâm của dữ liệu.

Nếu dữ liệu trống,

>>> median([1, 3, 5, 7])
4.0
2 sẽ được nâng lên.

Một số ví dụ về việc sử dụng:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')

Ghi chú

Giá trị trung bình bị ảnh hưởng mạnh mẽ bởi các ngoại lệ và không nhất thiết là một ví dụ điển hình về các điểm dữ liệu. Để biết mạnh mẽ hơn, mặc dù kém hiệu quả hơn, thước đo xu hướng trung tâm, xem

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
6.

Giá trị trung bình của mẫu đưa ra một ước tính không thiên vị về trung bình dân số thực sự, do đó khi được lấy trung bình trên tất cả các mẫu có thể,

>>> median([1, 3, 5, 7])
4.0
4 hội tụ về giá trị trung bình thực của toàn bộ dân số. Nếu dữ liệu đại diện cho toàn bộ dân số chứ không phải là một mẫu, thì
>>> median([1, 3, 5, 7])
4.0
5 tương đương với việc tính toán trung bình dân số thực.

Thống kê.FMean (Dữ liệu, Trọng lượng = Không) ¶fmean(data, weights=None)

Chuyển đổi dữ liệu thành phao và tính toán trung bình số học.

Điều này chạy nhanh hơn hàm

>>> harmonic_mean([40, 60])
48.0
4 và nó luôn trả về
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
0. Dữ liệu có thể là một chuỗi hoặc có thể lặp lại. Nếu bộ dữ liệu đầu vào trống, tăng
>>> median([1, 3, 5, 7])
4.0
2.

>>> fmean([3.5, 4.0, 5.25])
4.25

Trọng số tùy chọn được hỗ trợ. Ví dụ, một giáo sư chỉ định một lớp cho một khóa học bằng cách đánh số các câu đố ở mức 20%, bài tập về nhà ở mức 20%, kỳ thi giữa kỳ ở mức 30%và kỳ thi cuối cùng ở mức 30%:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6

Nếu trọng số được cung cấp, nó phải có cùng chiều dài với dữ liệu hoặc

>>> median([1, 3, 5, 7])
4.0
9 sẽ được nâng lên.

Mới trong phiên bản 3.8.

Đã thay đổi trong phiên bản 3.11: Thêm hỗ trợ cho trọng số.Added support for weights.

Thống kê.geometric_mean (dữ liệu) ¶geometric_mean(data)

Chuyển đổi dữ liệu thành phao và tính giá trị trung bình hình học.

Giá trị trung bình hình học cho thấy xu hướng trung tâm hoặc giá trị điển hình của dữ liệu bằng cách sử dụng sản phẩm của các giá trị (trái ngược với giá trị trung bình số học sử dụng tổng của chúng).

Tăng

>>> median([1, 3, 5, 7])
4.0
2 nếu bộ dữ liệu đầu vào trống, nếu nó chứa số 0 hoặc nếu nó chứa giá trị âm. Dữ liệu có thể là một chuỗi hoặc có thể lặp lại.

Không có nỗ lực đặc biệt nào được thực hiện để đạt được kết quả chính xác. (Tuy nhiên, điều này có thể thay đổi trong tương lai.)

>>> round(geometric_mean([54, 24, 36]), 1)
36.0

Mới trong phiên bản 3.8.

Thống kê.Harmonic_Mean (Dữ liệu, Trọng lượng = Không) ¶harmonic_mean(data, weights=None)

Trả về giá trị trung bình hài hòa của dữ liệu, một chuỗi hoặc có thể lặp lại các số có giá trị thực. Nếu trọng số bị bỏ qua hoặc không có, thì trọng số bằng nhau được giả định.

Giá trị trung bình hài hòa là đối ứng của số học

>>> harmonic_mean([40, 60])
48.0
4 của đối ứng của dữ liệu. Ví dụ, giá trị trung bình hài hòa của ba giá trị A, B và C sẽ tương đương với
>>> median_low([1, 3, 5])
3
>>> median_low([1, 3, 5, 7])
3
2. Nếu một trong các giá trị bằng không, kết quả sẽ bằng không.

Giá trị trung bình hài hòa là một loại trung bình, một thước đo vị trí trung tâm của dữ liệu. Nó thường phù hợp khi tỷ lệ hoặc tỷ lệ trung bình, ví dụ tốc độ.

Giả sử một chiếc ô tô di chuyển 10 km ở 40 km/giờ, sau đó 10 km khác với tốc độ 60 km/giờ. Tốc độ trung bình là bao nhiêu?

>>> harmonic_mean([40, 60])
48.0

Giả sử một chiếc xe di chuyển 40 km/giờ trong 5 km và khi giao thông dọn sạch, tốc độ lên tới 60 km/giờ cho 30 km còn lại của hành trình. Tốc độ trung bình là bao nhiêu?

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên nếu dữ liệu trống, bất kỳ phần tử nào đều nhỏ hơn 0 hoặc nếu tổng trọng số không dương.

Thuật toán hiện tại có sớm khi nó gặp số không trong đầu vào. Điều này có nghĩa là các đầu vào tiếp theo không được kiểm tra tính hợp lệ. (Hành vi này có thể thay đổi trong tương lai.)

Mới trong phiên bản 3.6.

Thay đổi trong phiên bản 3.10: Thêm hỗ trợ cho trọng số.Added support for weights.

Thống kê.Median (Dữ liệu) ¶median(data)

Trả về trung bình (giá trị trung bình) của dữ liệu số, sử dụng giá trị trung bình phổ biến của phương thức giữa hai. Nếu dữ liệu trống,

>>> median([1, 3, 5, 7])
4.0
2 sẽ được nâng lên. Dữ liệu có thể là một chuỗi hoặc có thể lặp lại.

Trung bình là một thước đo mạnh mẽ của vị trí trung tâm và ít bị ảnh hưởng bởi sự hiện diện của các ngoại lệ. Khi số lượng điểm dữ liệu là lẻ, điểm dữ liệu giữa được trả về:

Khi số lượng điểm dữ liệu là chẵn, trung bình được nội suy bằng cách lấy trung bình của hai giá trị trung bình:

>>> median([1, 3, 5, 7])
4.0

Điều này phù hợp khi dữ liệu của bạn là riêng biệt và bạn không quan tâm rằng trung bình có thể không phải là một điểm dữ liệu thực tế.

Nếu dữ liệu là thứ tự (hỗ trợ các hoạt động đặt hàng) nhưng không phải là số (không hỗ trợ bổ sung), hãy xem xét sử dụng

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
7 hoặc
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
8 thay thế.

Thống kê.Median_Low (dữ liệu) ¶median_low(data)

Trả về trung bình thấp của dữ liệu số. Nếu dữ liệu trống,

>>> median([1, 3, 5, 7])
4.0
2 sẽ được nâng lên. Dữ liệu có thể là một chuỗi hoặc có thể lặp lại.

Trung bình thấp luôn là thành viên của bộ dữ liệu. Khi số lượng điểm dữ liệu là lẻ, giá trị trung bình được trả về. Khi nó là chẵn, nhỏ hơn trong hai giá trị giữa được trả về.

>>> median_low([1, 3, 5])
3
>>> median_low([1, 3, 5, 7])
3

Sử dụng trung bình thấp khi dữ liệu của bạn rời rạc và bạn thích trung bình là điểm dữ liệu thực tế hơn là nội suy.

Thống kê.Median_High (Dữ liệu) ¶median_high(data)

Trả về trung bình cao của dữ liệu. Nếu dữ liệu trống,

>>> median([1, 3, 5, 7])
4.0
2 sẽ được nâng lên. Dữ liệu có thể là một chuỗi hoặc có thể lặp lại.

Trung bình cao luôn là thành viên của bộ dữ liệu. Khi số lượng điểm dữ liệu là lẻ, giá trị trung bình được trả về. Khi nó thậm chí, lớn hơn của hai giá trị giữa được trả về.

>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5

Sử dụng trung bình cao khi dữ liệu của bạn rời rạc và bạn thích trung bình là điểm dữ liệu thực tế hơn là nội suy.

Thống kê.Median_grouped (dữ liệu, khoảng = 1) ¶median_grouped(data, interval=1)

Trả về trung bình của dữ liệu liên tục được nhóm, được tính là phần trăm thứ 50, sử dụng phép nội suy. Nếu dữ liệu trống,

>>> median([1, 3, 5, 7])
4.0
2 sẽ được nâng lên. Dữ liệu có thể là một chuỗi hoặc có thể lặp lại.

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
0

Trong ví dụ sau, dữ liệu được làm tròn, sao cho mỗi giá trị đại diện cho điểm giữa của các lớp dữ liệu, ví dụ: 1 là điểm giữa của lớp 0,5, 1,5, 2 là điểm giữa của 1,5, 2,5, 3 là điểm giữa của 2,5. được sử dụng để ước tính nó:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
1

Khoảng thời gian đối số tùy chọn biểu thị khoảng thời gian lớp và mặc định thành 1. Thay đổi khoảng thời gian lớp một cách tự nhiên sẽ thay đổi phép nội suy:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
2

Hàm này không kiểm tra xem các điểm dữ liệu ít nhất là cách xa nhau.

Chi tiết triển khai CPYThon: Trong một số trường hợp,

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
9 có thể ép buộc các điểm dữ liệu vào phao. Hành vi này có khả năng thay đổi trong tương lai. Under some circumstances,
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
9 may coerce data points to floats. This behaviour is likely to change in the future.

Xem thêm

  • Thống kê về các ngành khoa học hành vi, Frederick J Gravetter và Larry B Wallnau (phiên bản thứ 8).

  • Chức năng SSMedian trong bảng tính Gnome Gnumeric, bao gồm cả cuộc thảo luận này.

Thống kê.Mode (Dữ liệu) ¶mode(data)

Trả về điểm dữ liệu phổ biến nhất từ ​​dữ liệu rời rạc hoặc danh nghĩa. Chế độ (khi nó tồn tại) là giá trị điển hình nhất và đóng vai trò là thước đo vị trí trung tâm.

Nếu có nhiều chế độ có cùng tần số, hãy trả về phương thức đầu tiên gặp trong dữ liệu. Nếu loại nhỏ nhất hoặc lớn nhất trong số đó là mong muốn thay vào đó, hãy sử dụng

>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5
1 hoặc
>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5
2. Nếu dữ liệu đầu vào trống,
>>> median([1, 3, 5, 7])
4.0
2 sẽ được nâng lên.

>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5
4 giả định dữ liệu riêng biệt và trả về một giá trị duy nhất. Đây là phương pháp điều trị tiêu chuẩn của chế độ như thường được dạy trong các trường học:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
3

Chế độ là duy nhất ở chỗ nó là thống kê duy nhất trong gói này cũng áp dụng cho dữ liệu danh nghĩa (không phải là số):

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
4

Đã thay đổi trong phiên bản 3.8: Bây giờ xử lý các bộ dữ liệu đa phương thức bằng cách trả về chế độ đầu tiên gặp phải. Trước đây, nó đã tăng

>>> median([1, 3, 5, 7])
4.0
2 khi tìm thấy nhiều hơn một chế độ.Now handles multimodal datasets by returning the first mode encountered. Formerly, it raised
>>> median([1, 3, 5, 7])
4.0
2 when more than one mode was found.

Thống kê.MultImode (dữ liệu) ¶multimode(data)

Trả về một danh sách các giá trị xảy ra thường xuyên nhất theo thứ tự mà chúng lần đầu tiên gặp phải trong dữ liệu. Sẽ trả về nhiều hơn một kết quả nếu có nhiều chế độ hoặc danh sách trống nếu dữ liệu trống:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
5

Mới trong phiên bản 3.8.

Thống kê.pstdev (Dữ liệu, MU = Không) ¶pstdev(data, mu=None)

Trả về độ lệch chuẩn dân số (căn bậc hai của phương sai dân số). Xem

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
6 để biết đối số và các chi tiết khác.

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
6

Thống kê.pvariance (Dữ liệu, MU = Không) ¶pvariance(data, mu=None)

Trả về phương sai dân số của dữ liệu, một chuỗi không trống hoặc có thể lặp lại các số có giá trị thực. Phương sai, hoặc khoảnh khắc thứ hai về giá trị trung bình, là thước đo tính biến thiên (lan truyền hoặc phân tán) của dữ liệu. Một phương sai lớn chỉ ra rằng dữ liệu được trải ra; Một phương sai nhỏ cho thấy nó được phân cụm gần trung bình.

Nếu đối số thứ hai tùy chọn MU được đưa ra, nó thường là giá trị trung bình của dữ liệu. Nó cũng có thể được sử dụng để tính toán khoảnh khắc thứ hai xung quanh một điểm không phải là ý nghĩa. Nếu nó bị thiếu hoặc

>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5
7 (mặc định), giá trị trung bình số học được tự động tính toán.

Sử dụng chức năng này để tính toán phương sai từ toàn bộ dân số. Để ước tính phương sai từ một mẫu, hàm

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
8 thường là một lựa chọn tốt hơn.

Tăng

>>> median([1, 3, 5, 7])
4.0
2 nếu dữ liệu trống.

Examples:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
7

Nếu bạn đã tính giá trị trung bình của dữ liệu của mình, bạn có thể chuyển nó dưới dạng đối số thứ hai tùy chọn MU để tránh tính toán lại:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
8

Số thập phân và phân số được hỗ trợ:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
9

Ghi chú

Khi được gọi với toàn bộ dân số, điều này mang lại phương sai dân số σ². Thay vào đó, khi được gọi vào một mẫu, đây là phương sai mẫu sai lệch S², còn được gọi là phương sai với độ tự do N.

Nếu bạn bằng cách nào đó biết dân số thực sự có nghĩa là μ, bạn có thể sử dụng hàm này để tính phương sai của một mẫu, cho dân số đã biết là đối số thứ hai. Với điều kiện các điểm dữ liệu là một mẫu ngẫu nhiên của dân số, kết quả sẽ là một ước tính không thiên vị về phương sai dân số.

Thống kê.stdev (dữ liệu, xbar = none) ¶stdev(data, xbar=None)

Trả về độ lệch chuẩn mẫu (căn bậc hai của phương sai mẫu). Xem

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
8 để biết đối số và các chi tiết khác.

>>> fmean([3.5, 4.0, 5.25])
4.25
0

Thống kê.Variance (dữ liệu, xbar = none) ¶variance(data, xbar=None)

Trả về phương sai mẫu của dữ liệu, có thể lặp lại ít nhất hai số có giá trị thực. Phương sai, hoặc khoảnh khắc thứ hai về giá trị trung bình, là thước đo tính biến thiên (lan truyền hoặc phân tán) của dữ liệu. Một phương sai lớn chỉ ra rằng dữ liệu được trải ra; Một phương sai nhỏ cho thấy nó được phân cụm gần trung bình.

Nếu đối số thứ hai tùy chọn xbar được đưa ra, nó phải là giá trị trung bình của dữ liệu. Nếu nó bị thiếu hoặc

>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5
7 (mặc định), giá trị trung bình được tính toán tự động.

Sử dụng chức năng này khi dữ liệu của bạn là một mẫu từ dân số. Để tính toán phương sai từ toàn bộ dân số, xem

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
6.

Tăng

>>> median([1, 3, 5, 7])
4.0
2 nếu dữ liệu có ít hơn hai giá trị.

Examples:

>>> fmean([3.5, 4.0, 5.25])
4.25
1

Nếu bạn đã tính giá trị trung bình của dữ liệu của mình, bạn có thể chuyển nó dưới dạng đối số thứ hai tùy chọn Xbar để tránh tính toán lại:

>>> fmean([3.5, 4.0, 5.25])
4.25
2

Hàm này không cố gắng xác minh rằng bạn đã vượt qua giá trị trung bình thực tế là Xbar. Sử dụng các giá trị tùy ý cho Xbar có thể dẫn đến kết quả không hợp lệ hoặc không thể.

Giá trị thập phân và phân số được hỗ trợ:

>>> fmean([3.5, 4.0, 5.25])
4.25
3

Ghi chú

Khi được gọi với toàn bộ dân số, điều này mang lại phương sai dân số σ². Thay vào đó, khi được gọi vào một mẫu, đây là phương sai mẫu sai lệch S², còn được gọi là phương sai với độ tự do N.

Nếu bạn bằng cách nào đó biết dân số thực sự có nghĩa là μ, bạn có thể sử dụng hàm này để tính phương sai của một mẫu, cho dân số đã biết là đối số thứ hai. Với điều kiện các điểm dữ liệu là một mẫu ngẫu nhiên của dân số, kết quả sẽ là một ước tính không thiên vị về phương sai dân số.

Thống kê.stdev (dữ liệu, xbar = none) ¶quantiles(data, *, n=4, method='exclusive')

Trả về độ lệch chuẩn mẫu (căn bậc hai của phương sai mẫu). Xem

>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
8 để biết đối số và các chi tiết khác.

Thống kê.Variance (dữ liệu, xbar = none) ¶

Dữ liệu có thể là bất kỳ điều gì có thể chứa dữ liệu mẫu. Đối với kết quả có ý nghĩa, số lượng điểm dữ liệu trong dữ liệu phải lớn hơn n. Tăng

>>> median([1, 3, 5, 7])
4.0
2 nếu không có ít nhất hai điểm dữ liệu.

Các điểm cắt được nội suy tuyến tính từ hai điểm dữ liệu gần nhất. Ví dụ: nếu một điểm cắt giảm một phần ba khoảng cách giữa hai giá trị mẫu,

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
08 và
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
09, điểm cắt sẽ đánh giá thành
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
10.

Phương pháp tính toán các lượng tử có thể được thay đổi tùy thuộc vào việc dữ liệu bao gồm hoặc loại trừ các giá trị thấp nhất và cao nhất có thể từ dân số.

Phương pháp mặc định là độc quyền của người Viking và được sử dụng cho dữ liệu được lấy mẫu từ một quần thể có thể có các giá trị cực đoan hơn so với các mẫu. Phần dân số rơi xuống dưới mức thứ i của các điểm dữ liệu được sắp xếp M được tính toán là

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
11. Với chín giá trị mẫu, phương pháp sắp xếp chúng và gán các phần trăm sau: 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%.

Đặt phương pháp thành bao gồm của người Viking được sử dụng để mô tả dữ liệu dân số hoặc cho các mẫu được biết là bao gồm các giá trị cực đoan nhất từ ​​dân số. Giá trị tối thiểu trong dữ liệu được coi là phần trăm thứ 0 và giá trị tối đa được coi là phần trăm thứ 100. Phần dân số rơi xuống dưới mức thứ i của các điểm dữ liệu được sắp xếp M được tính toán là

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
12. Với 11 giá trị mẫu, phương pháp sắp xếp chúng và gán các phần trăm sau: 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%.

>>> fmean([3.5, 4.0, 5.25])
4.25
4

Mới trong phiên bản 3.8.

Thống kê.Covariance (x, y, /) ¶covariance(x, y, /)

Trả lại hiệp phương sai mẫu của hai đầu vào x và y. Hiệp phương sai là thước đo độ biến thiên chung của hai đầu vào.

Cả hai đầu vào phải có cùng độ dài (không dưới hai), nếu không

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên.

Examples:

>>> fmean([3.5, 4.0, 5.25])
4.25
5

Mới trong phiên bản 3.10.

Thống kê.correlation (X, Y, /)correlation(x, y, /)

Trả về hệ số tương quan Pearson, cho hai đầu vào. Hệ số tương quan Pearson sườn R có các giá trị giữa -1 đến +1. Nó đo lường sức mạnh và hướng của mối quan hệ tuyến tính, trong đó +1 có nghĩa là rất mạnh mẽ, mối quan hệ tuyến tính tích cực, -1 rất mạnh mẽ, mối quan hệ tuyến tính tiêu cực và 0 không có mối quan hệ tuyến tính.

Cả hai đầu vào phải có cùng độ dài (không dưới hai) và không cần phải là hằng số, nếu không

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên.

Examples:

>>> fmean([3.5, 4.0, 5.25])
4.25
6

Mới trong phiên bản 3.10.

Thống kê.correlation (X, Y, /)linear_regression(x, y, /, *, proportional=False)

Trả về hệ số tương quan Pearson, cho hai đầu vào. Hệ số tương quan Pearson sườn R có các giá trị giữa -1 đến +1. Nó đo lường sức mạnh và hướng của mối quan hệ tuyến tính, trong đó +1 có nghĩa là rất mạnh mẽ, mối quan hệ tuyến tính tích cực, -1 rất mạnh mẽ, mối quan hệ tuyến tính tiêu cực và 0 không có mối quan hệ tuyến tính.

Cả hai đầu vào phải có cùng độ dài (không dưới hai) và không cần phải là hằng số, nếu không

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên.

Thống kê.linear_regression (x, y, /, *, tỷ lệ = false) ¶

Trả về độ dốc và chặn các tham số hồi quy tuyến tính đơn giản được ước tính bằng cách sử dụng bình phương tối thiểu thông thường. Hồi quy tuyến tính đơn giản mô tả mối quan hệ giữa biến X độc lập và biến phụ thuộc y theo hàm tuyến tính này:

y = độ dốc * x + chặn + nhiễu

>>> fmean([3.5, 4.0, 5.25])
4.25
7

trong đó

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
15 và
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
16 là các tham số hồi quy được ước tính và
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
17 thể hiện tính biến đổi của dữ liệu không được giải thích bởi hồi quy tuyến tính (nó bằng với chênh lệch giữa các giá trị dự đoán và thực tế của biến phụ thuộc).

Cả hai đầu vào phải có cùng độ dài (không dưới hai) và biến độc lập X không thể không đổi; Nếu không, một

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên.

Mới trong phiên bản 3.10.

Thống kê.correlation (X, Y, /)Added support for proportional.

Trả về hệ số tương quan Pearson, cho hai đầu vào. Hệ số tương quan Pearson sườn R có các giá trị giữa -1 đến +1. Nó đo lường sức mạnh và hướng của mối quan hệ tuyến tính, trong đó +1 có nghĩa là rất mạnh mẽ, mối quan hệ tuyến tính tích cực, -1 rất mạnh mẽ, mối quan hệ tuyến tính tiêu cực và 0 không có mối quan hệ tuyến tính.

Cả hai đầu vào phải có cùng độ dài (không dưới hai) và không cần phải là hằng số, nếu không

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên.

Thống kê.linear_regression (x, y, /, *, tỷ lệ = false) ¶ statistics.StatisticsError

Trả về độ dốc và chặn các tham số hồi quy tuyến tính đơn giản được ước tính bằng cách sử dụng bình phương tối thiểu thông thường. Hồi quy tuyến tính đơn giản mô tả mối quan hệ giữa biến X độc lập và biến phụ thuộc y theo hàm tuyến tính này:

y = độ dốc * x + chặn + nhiễu

trong đó

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
15 và
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
16 là các tham số hồi quy được ước tính và
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
17 thể hiện tính biến đổi của dữ liệu không được giải thích bởi hồi quy tuyến tính (nó bằng với chênh lệch giữa các giá trị dự đoán và thực tế của biến phụ thuộc).

Cả hai đầu vào phải có cùng độ dài (không dưới hai) và biến độc lập X không thể không đổi; Nếu không, một

>>> median([1, 3, 5, 7])
4.0
2 được nâng lên.

Ví dụ, chúng ta có thể sử dụng ngày phát hành của các bộ phim Monty Python để dự đoán số lượng các bộ phim Monty Python tích lũy được sản xuất vào năm 2019 cho rằng họ đã giữ tốc độ. statistics.NormalDist(mu=0.0, sigma=1.0)

Nếu tỷ lệ là đúng, biến độc lập X và biến phụ thuộc y được cho là tỷ lệ thuận. Dữ liệu phù hợp với một dòng đi qua nguồn gốc. Vì chặn sẽ luôn là 0,0, hàm tuyến tính cơ bản đơn giản hóa thành:

y = độ dốc * x + nhiễu

Đã thay đổi trong phiên bản 3.11: Đã thêm hỗ trợ cho tỷ lệ.

Ngoại lệ ha

Một ngoại lệ duy nhất được xác định:

Ngoại lệ.

Lớp con của
>>> median([1, 3, 5, 7])
4.0
9 cho các trường hợp ngoại lệ liên quan đến thống kê.

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20 Đối tượng

stdev¶

Một thuộc tính chỉ đọc cho độ lệch chuẩn của phân phối bình thường.

sự khác nhau

Một thuộc tính chỉ đọc cho phương sai của phân phối bình thường. Bằng với bình phương của độ lệch chuẩn.

classMethodFrom_samples (dữ liệu) ¶ from_samples(data)

Tạo một thể hiện phân phối bình thường với các tham số MU và Sigma được ước tính từ dữ liệu bằng cách sử dụng

>>> harmonic_mean([40, 60])
48.0
5 và
>>> harmonic_mean([40, 60], weights=[5, 30])
56.0
7.

Dữ liệu có thể là bất kỳ điều gì có thể lặp lại và nên bao gồm các giá trị có thể được chuyển đổi thành loại

>>> round(geometric_mean([54, 24, 36]), 1)
36.0
0. Nếu dữ liệu không chứa ít nhất hai yếu tố, tăng
>>> median([1, 3, 5, 7])
4.0
2 vì phải mất ít nhất một điểm để ước tính giá trị trung tâm và ít nhất hai điểm để ước tính phân tán.iterable and should consist of values that can be converted to type
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
0. If data does not contain at least two elements, raises
>>> median([1, 3, 5, 7])
4.0
2 because it takes at least one point to estimate a central value and at least two points to estimate dispersion.

mẫu (n, *, hạt = không) ¶(n, *, seed=None)

Tạo n mẫu ngẫu nhiên cho một giá trị trung bình và độ lệch chuẩn nhất định. Trả về

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
27 của các giá trị
>>> round(geometric_mean([54, 24, 36]), 1)
36.0
0.

Nếu hạt giống được đưa ra, tạo một thể hiện mới của trình tạo số ngẫu nhiên cơ bản. Điều này rất hữu ích để tạo ra kết quả có thể tái tạo, ngay cả trong bối cảnh đa luồng.

pdf (x)(x)

Sử dụng hàm mật độ xác suất (PDF), tính toán khả năng tương đối là một biến ngẫu nhiên X sẽ ở gần giá trị x cho. Về mặt toán học, đó là giới hạn của tỷ lệ

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
29 khi DX tiếp cận bằng không.

Khả năng tương đối được tính là xác suất của một mẫu xảy ra trong một phạm vi hẹp chia cho chiều rộng của phạm vi (do đó từ mật độ từ mật độ). Vì khả năng liên quan đến các điểm khác, giá trị của nó có thể lớn hơn

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
30.

cdf (x)(x)

Sử dụng hàm phân phối tích lũy (CDF), tính xác suất rằng biến ngẫu nhiên X sẽ nhỏ hơn hoặc bằng x. Về mặt toán học, nó được viết

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
31.

inv_cdf (p)(p)

Tính toán hàm phân phối tích lũy nghịch đảo, còn được gọi là hàm lượng tử hoặc hàm phần trăm. Về mặt toán học, nó được viết

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
32.

Tìm giá trị x của biến ngẫu nhiên x sao cho xác suất của biến nhỏ hơn hoặc bằng giá trị đó bằng xác suất đã cho p.

chồng chéo (khác) ¶(other)

Đo lường thỏa thuận giữa hai phân phối xác suất bình thường. Trả về giá trị từ 0,0 đến 1.0 cho diện tích chồng chéo cho hai hàm mật độ xác suất.

lượng tử (n = 4)(n=4)

Chia phân phối bình thường thành N khoảng liên tục với xác suất bằng nhau. Trả về một danh sách (n - 1) cắt điểm phân tách các khoảng.

Đặt n thành 4 cho các bộ tứ (mặc định). Đặt n đến 10 cho deciles. Đặt n đến 100 cho phần trăm cho 99 điểm cắt tách phân phối bình thường thành 100 nhóm có kích thước bằng nhau.

Zscore (x)(x)

Tính điểm tiêu chuẩn mô tả x theo số lượng độ lệch chuẩn ở trên hoặc dưới giá trị trung bình của phân phối bình thường:

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
33.

Mới trong phiên bản 3.9.

Các trường hợp của

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20 Hỗ trợ bổ sung, trừ, nhân và chia cho một hằng số. Các hoạt động này được sử dụng để dịch và mở rộng. Ví dụ:

>>> fmean([3.5, 4.0, 5.25])
4.25
8

Chia một hằng số cho một ví dụ

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20 không được hỗ trợ vì kết quả sẽ được phân phối bình thường.

Do các phân phối bình thường phát sinh từ các hiệu ứng phụ gia của các biến độc lập, nên có thể thêm và trừ hai biến ngẫu nhiên phân phối thông thường độc lập được biểu thị dưới dạng các trường hợp của

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20. Ví dụ:

>>> fmean([3.5, 4.0, 5.25])
4.25
9

Mới trong phiên bản 3.8.

>>> mean([1, 2, 3, 4, 4]) 2.8 >>> mean([-1.0, 2.5, 3.25, 5.75]) 2.625 >>> from fractions import Fraction as F >>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)]) Fraction(13, 21) >>> from decimal import Decimal as D >>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")]) Decimal('0.5625') 20 ví dụ và công thức nấu ăn

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20 dễ dàng giải quyết các vấn đề xác suất cổ điển.

Ví dụ, được đưa ra dữ liệu lịch sử cho các bài kiểm tra SAT cho thấy điểm số thường được phân phối với giá trị trung bình là 1060 và độ lệch chuẩn là 195, xác định tỷ lệ học sinh có điểm kiểm tra từ 1100 đến 1200, sau khi làm tròn đến số toàn bộ gần nhất:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
0

Tìm các bộ tứ và deciles cho điểm SAT:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
1

Để ước tính phân phối cho một mô hình hơn là dễ dàng để giải quyết một cách phân tích,

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20 có thể tạo ra các mẫu đầu vào cho mô phỏng Monte Carlo:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
2

Phân phối bình thường có thể được sử dụng để gần đúng phân phối nhị thức khi cỡ mẫu lớn và khi xác suất thử nghiệm thành công là gần 50%.

Ví dụ, một hội nghị nguồn mở có 750 người tham dự và hai phòng có sức chứa 500 người. Có một cuộc nói chuyện về Python và một người khác về Ruby. Trong các hội nghị trước đây, 65% người tham dự thích nghe các cuộc nói chuyện Python. Giả sử sở thích dân số thiên đường đã thay đổi, xác suất phòng trăn sẽ ở trong giới hạn năng lực của nó là gì?

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
3

Phân phối bình thường thường phát sinh trong các vấn đề học tập máy.

Wikipedia có một ví dụ thú vị về một trình phân loại Bayes ngây thơ. Thách thức là dự đoán giới tính của một người từ các phép đo các tính năng phân phối bình thường bao gồm chiều cao, trọng lượng và kích thước bàn chân.

Chúng tôi đã cung cấp một bộ dữ liệu đào tạo với các phép đo cho tám người. Các phép đo được giả định là được phân phối bình thường, vì vậy chúng tôi tóm tắt dữ liệu với

>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625

>>> from fractions import Fraction as F
>>> mean([F(3, 7), F(1, 21), F(5, 3), F(1, 3)])
Fraction(13, 21)

>>> from decimal import Decimal as D
>>> mean([D("0.5"), D("0.75"), D("0.625"), D("0.375")])
Decimal('0.5625')
20:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
4

Tiếp theo, chúng tôi bắt gặp một người mới có các phép đo tính năng được biết đến nhưng không rõ giới tính:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
5

Bắt đầu với xác suất 50% trước khi là nam hoặc nữ, chúng tôi tính toán sau là lần trước là sản phẩm của khả năng cho các phép đo tính năng được đưa ra cho giới tính:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
6

Dự đoán cuối cùng đi đến sau lớn nhất. Điều này được gọi là tối đa một posteriori hoặc bản đồ:

>>> grades = [85, 92, 83, 91]
>>> weights = [0.20, 0.20, 0.30, 0.30]
>>> fmean(grades, weights)
87.6
7

Gói Python nào là cho số liệu thống kê?

StatSmodels là một gói Python mô hình thống kê cung cấp nhiều lớp và chức năng để tạo ước tính thống kê.Gói StatSmodel sử dụng để trở thành một phần của mô -đun SCIPY, nhưng hiện tại, gói StatSmodel được phát triển riêng. is a statistical model python package that provides many classes and functions to create a statistical estimation. Statsmodel package use to be a part of the Scipy module, but currently, the statsmodel package is developed separately.

Là một phần thống kê của thư viện Python tiêu chuẩn?

Mô -đun thống kê là một phần của thư viện tiêu chuẩn Python..

Python có phải là một công cụ thống kê?

Python đặc biệt phù hợp với các lĩnh vực học tập sâu và học máy, và cũng thực tế như phần mềm thống kê thông qua việc sử dụng các gói, có thể dễ dàng cài đặt.is also practical as statistics software through the use of packages, which can easily be installed.

Chế độ thống kê trong Python là gì?

Các số liệu thống kê.Phương thức MODE () Tính toán chế độ (xu hướng trung tâm) của tập dữ liệu số hoặc danh nghĩa đã cho.calculates the mode (central tendency) of the given numeric or nominal data set.