Hướng dẫn confidence interval in forecasting python - khoảng tin cậy trong dự báo python
Cập nhật lần cuối vào ngày 10 tháng 12 năm 2020 Show
Các mô hình dự báo chuỗi thời gian có thể đưa ra dự đoán vừa cung cấp khoảng thời gian dự đoán cho những dự đoán đó. Các khoảng dự đoán cung cấp một kỳ vọng trên và thấp hơn cho quan sát thực sự. Chúng có thể hữu ích để đánh giá phạm vi kết quả thực tế có thể để dự đoán và để hiểu rõ hơn về kỹ năng của mô hình Trong hướng dẫn này, bạn sẽ khám phá cách tính toán và giải thích các khoảng thời gian dự đoán cho dự báo chuỗi thời gian với Python. Cụ thể, bạn sẽ học:
Khởi động dự án của bạn với dự báo chuỗi thời gian cuốn sách mới của tôi với Python, bao gồm các hướng dẫn từng bước và các tệp mã nguồn Python cho tất cả các ví dụ. with my new book Time Series Forecasting With Python, including step-by-step tutorials and the Python source code files for all examples. Hãy để lặn trong.
Hiểu chuỗi thời gian dự báo độ không đảm bảo bằng cách sử dụng các khoảng dự đoán với Pythonphoto của Bernard Spragg. New Zealand, một số quyền được bảo lưu. Dự báo ArimaViệc triển khai ARIMA trong Thư viện Python StatSmodels có thể được sử dụng để phù hợp với mô hình ARIMA. Nó trả về một đối tượng arimaresults. Đối tượng này cung cấp hàm get_forecast () & nbsp; có thể được sử dụng để đưa ra dự đoán về các bước thời gian trong tương lai và mặc định để dự đoán giá trị ở bước tiếp theo sau khi kết thúc dữ liệu đào tạo. Giả sử chúng tôi dự đoán chỉ bước tiếp theo, hàm get_forecast () trả về một đối tượng dự đoán với thông tin hữu ích như:
Trong hướng dẫn này, chúng tôi sẽ hiểu rõ hơn về khoảng thời gian dự đoán được cung cấp với dự báo Arima. Trước khi chúng tôi đi sâu vào, trước tiên hãy nhìn vào bộ dữ liệu ca sinh nữ hàng ngày mà chúng tôi sẽ sử dụng làm bối cảnh cho hướng dẫn này. Ngừng học chuỗi thời gian dự báo cách chậm!Lấy khóa học email 7 ngày miễn phí của tôi và khám phá cách bắt đầu (với mã mẫu). Nhấp để đăng ký và cũng nhận được phiên bản Ebook PDF miễn phí của khóa học. Bộ dữ liệu ca sinh nữ hàng ngàyBộ dữ liệu này mô tả số lượng ca sinh nữ hàng ngày ở California vào năm 1959. Các đơn vị là một đếm và có 365 quan sát. Nguồn của bộ dữ liệu được ghi có vào Newton (1988).
Tải xuống bộ dữ liệu và lưu nó trong thư mục làm việc hiện tại của bạn với tên tệp hàng ngày-total-female-births.csv. Ví dụ dưới đây tải và đồ thị tập dữ liệu.
Chạy ví dụ tải tập dữ liệu và đồ thị dưới dạng biểu đồ dòng. Bộ dữ liệu ca sinh nữ hàng ngày Bộ dữ liệu này mô tả số lượng ca sinh nữ hàng ngày ở California vào năm 1959.Các đơn vị là một đếm và có 365 quan sát. Nguồn của bộ dữ liệu được ghi có vào Newton (1988). Tải xuống bộ dữ liệu. Tải xuống bộ dữ liệu và lưu nó trong thư mục làm việc hiện tại của bạn với tên tệp hàng ngày-total-female-births.csv. Ví dụ dưới đây tải và đồ thị tập dữ liệu. Từ Pandas Nhập READ_CSV
# Tải tập dữ liệu
Diễn giải khoảng thời gian dự đoánHàm get_forecast () cho phép khoảng thời gian dự đoán được chỉ định. Đối số alpha trên hàm conf_int () trên dự đoán chỉ định mức dự đoán. Alpha là 0,05 có nghĩa là mô hình ARIMA sẽ ước tính các giá trị trên và thấp hơn xung quanh dự báo trong đó chỉ có 5% cơ hội rằng giá trị thực sẽ không nằm trong phạm vi đó. Nói cách khác, khoảng thời gian dự đoán 95% cho thấy rằng có khả năng cao rằng quan sát thực sự sẽ nằm trong phạm vi. Trong ví dụ trên, dự báo là 45,149. Khoảng dự đoán 95% cho thấy rằng quan sát thực sự có khả năng nằm trong phạm vi của các giá trị trong khoảng từ 31.413 đến 58.886. Quan sát thực sự là 50,0 và nằm trong phạm vi này. Chúng ta có thể thắt chặt phạm vi của các giá trị có khả năng theo một vài cách:
Hơn nữa, khoảng thời gian dự đoán cũng bị giới hạn bởi các giả định được thực hiện bởi mô hình, chẳng hạn như phân phối các lỗi được thực hiện bởi mô hình phù hợp với phân phối Gaussian với giá trị trung bình bằng 0 (ví dụ: nhiễu trắng). Mở rộng ví dụ trên, chúng tôi có thể báo cáo dự báo của mình với một vài khoảng thời gian dự đoán thường được sử dụng là 80%, 90%, 95%và 99%. Ví dụ hoàn chỉnh được liệt kê dưới đây.
Chạy ví dụ in các dự báo và khoảng dự đoán cho mỗi giá trị alpha. Chúng ta có thể thấy rằng chúng ta có được giá trị dự báo tương tự mỗi lần và một khoảng thời gian mở rộng khi mong muốn của chúng ta về khoảng thời gian an toàn hơn tăng lên. Chúng ta có thể thấy rằng 80% nắm bắt giá trị thực tế của chúng ta chỉ tốt trong trường hợp cụ thể này.
Bản tóm tắtTrong hướng dẫn này, bạn đã phát hiện ra cách tính và giải thích khoảng thời gian dự đoán cho dự báo chuỗi thời gian với Python. Cụ thể, bạn đã học được:
Bạn có bất kỳ câu hỏi nào về các khoảng dự đoán dự báo, hoặc về hướng dẫn này? Đặt câu hỏi của bạn trong các ý kiến dưới đây và tôi sẽ cố gắng hết sức để trả lời. Bạn muốn phát triển dự báo chuỗi thời gian với Python?Phát triển dự báo của riêng bạn trong vài phút... Chỉ với một vài dòng mã Python Khám phá cách trong ebook mới của tôi: Giới thiệu về dự báo chuỗi thời gian với Python Nó bao gồm các hướng dẫn tự học và các dự án đầu cuối về các chủ đề như: tải dữ liệu, trực quan hóa, mô hình hóa, điều chỉnh thuật toán và nhiều hơn nữa ...self-study tutorials and end-to-end projects on topics like: Loading data, visualization, modeling, algorithm tuning, and much more... Cuối cùng mang lại dự báo chuỗi thời gian cho các dự án của riêng bạn |