Tổng bình phương còn lại python

Gần đây, tôi đã viết một bài báo về Hồi quy tuyến tính và cách nó được sử dụng trong Khoa học dữ liệu. Về tổng quan, tôi không đi sâu vào chi tiết quá nhiều về các công cụ hoặc phương pháp mà Hồi quy tuyến tính sử dụng. Một công cụ như vậy là Sum of Squares. Lúc đầu, tôi chỉ định viết một lời giải thích ngắn gọn trong bài viết trước. Tuy nhiên, có một vài công thức khác nhau được sử dụng để xác định Tổng bình phương, do đó, việc giới hạn công thức đó trong một hoặc hai câu sẽ hơi khó nghĩ. Thay vào đó, và vì tôi thấy câu trả lời thú vị, tôi nghĩ đã đến lúc viết một blog khác. Vì vậy, với ý nghĩ đó, trong bài viết hôm nay, chúng ta sẽ xem xét Tổng bình phương. Trước tiên, chúng ta sẽ mô tả Tổng bình phương là gì và tại sao nó được sử dụng, sau đó chúng ta sẽ xem xét các công thức cần thiết và tác dụng của chúng. Vì vậy, không chậm trễ nữa, chúng ta hãy tìm hiểu sâu hơn về Tổng bình phương

Tổng bình phương là gì?

Tổng bình phương được sử dụng để không chỉ mô tả mối quan hệ giữa các điểm dữ liệu và đường hồi quy tuyến tính mà còn cả mức độ chính xác của đường đó mô tả dữ liệu. Bạn sử dụng một loạt công thức để xác định xem đường hồi quy có mô tả chính xác dữ liệu hay mức độ “tốt” hay “xấu” của đường đó

Một lưu ý quan trọng là đảm bảo dữ liệu của bạn trước tiên mô tả hồi quy chứ không phải tương quan. Đây là một danh sách kiểm tra đơn giản để tìm sự khác biệt

  • Hồi quy sẽ nhấn mạnh cách một biến sẽ ảnh hưởng đến biến kia chứ không chỉ đơn giản là mối quan hệ giữa các biến
  • Mối tương quan không nắm bắt được thương vong, trong đó Hồi quy dựa trên nó. Điều này rất quan trọng vì thay vì mức độ kết nối, nó sẽ hiển thị nguyên nhân và kết quả
  • Trong Tương quan, mối tương quan giữa x và y sẽ giống như y và x. Trong Hồi quy, x và y với y và x sẽ mang lại kết quả khác nhau
  • Cuối cùng, mối tương quan sẽ biểu thị bằng đồ thị một điểm duy nhất, trong khi Hồi quy biểu thị bằng đồ thị một đường

Bây giờ chúng ta đã biết thêm một chút về Tổng bình phương, hãy xem các công thức cần thiết

Tổng bình phương Tổng

Công thức đầu tiên chúng ta sẽ xem xét là Tổng bình phương [ký hiệu là SST hoặc TSS]. TSS tìm sự khác biệt bình phương giữa mỗi biến và giá trị trung bình

yi = Số hạng thứ i trong tập hợp

ȳ = giá trị trung bình của tất cả các mục trong tập hợp

Điều này có nghĩa là đối với mỗi biến, bạn lấy giá trị và trừ đi giá trị trung bình, sau đó bình phương kết quả. Điều này cung cấp cho bạn khoảng cách từ đường tuyến tính được vẽ đến từng biến cụ thể. Bạn cũng có thể mô tả TSS là độ phân tán của các biến quan sát xung quanh giá trị trung bình hoặc phương sai. Vì vậy, mục tiêu của TSS là đo lường tổng độ biến thiên của tập dữ liệu

Hồi quy tổng bình phương

Công thức tiếp theo chúng ta sẽ nói đến là Tổng hồi quy bình phương [ký hiệu là SSR], còn được gọi là Tổng bình phương được giải thích [ký hiệu là ESS]. SSR được sử dụng để mô tả sự khác biệt giữa giá trị dự đoán và giá trị trung bình của biến phụ thuộc

ŷi — giá trị được ước tính bởi đường hồi quy

ȳ — giá trị trung bình của một mẫu

Để bắt đầu, một lần nữa chúng ta sẽ cần giá trị trung bình. Giá trị ước tính là giá trị nằm trên đường hồi quy. Điều đó có nghĩa là thay vì giá trị thực của từng biến, hãy lấy giá trị của vị trí của biến đó trên đường hồi quy. Điều này sẽ cho chúng tôi biết mức độ phù hợp của dòng với dữ liệu. Nếu SSR khớp với TSS, thì dòng đó sẽ hoàn toàn phù hợp

Tổng bình phương lỗi

Công thức cuối cùng để thảo luận là Sum of Squares Error [ký hiệu là SSE], còn được gọi là Residual Sum of Squares [RSS]. SSE tìm thấy sự khác biệt giữa giá trị được quan sát hoặc thực tế của biến và giá trị ước tính, đó là giá trị của nó theo đường hồi quy

Ở đâu

yi - giá trị quan sát được

ŷi — giá trị được ước tính bởi đường hồi quy

Trong trường hợp hoàn toàn phù hợp, lỗi sẽ là 0, nghĩa là giá trị ước tính giống với giá trị thực tế. Bất kỳ giá trị nào trên 0 đều hiển thị lỗi hoặc mức độ không chính xác của dòng theo các giá trị. Giá trị càng thấp, đường hồi quy càng phù hợp với dữ liệu. Tổng số dư cao sẽ chứng minh rằng mô hình đại diện cho dữ liệu kém

Bây giờ chúng tôi đã giải thích cả ba, chúng tôi có thể đại diện cho mối quan hệ của họ

Phần kết luận

Trong bài viết hôm nay, chúng ta đã nói về Tổng bình phương. Đầu tiên, chúng tôi đã mô tả nó là gì và tại sao nó được sử dụng. Tiếp theo, chúng tôi liệt kê sự khác biệt giữa Tương quan và Hồi quy. Cuối cùng, chúng tôi đã xem xét các công thức được sử dụng [TSS, SSR và SSE] và tìm ra một công thức thể hiện mối quan hệ giữa chúng. Tôi hy vọng rằng Tổng bình phương rõ ràng hơn một chút và bạn thấy mô tả này hữu ích và thú vị. Chúng tôi không nhất thiết phải tính toán tất cả các công thức bằng tay. Các ngôn ngữ như R có các chức năng để tính toán từng công thức để bạn có thể xác định xem đường hồi quy có phù hợp hay không mà không cần phải làm thêm. Tôi hy vọng bạn thích lời giải thích này và, như mọi khi, tôi sẽ gặp lại bạn trong phần tiếp theo. Chúc mừng

Làm cách nào để tìm TSS trong Python?

Bạn muốn. từ thống kê trung bình nhập x = [[3,1,3,1,3,13]] def tss[a]. m = mean[a] n = 0 for i in a. n += [[i-m]**2] return [n] print[tss[x]] ''' Câu trả lời của @mateen mang tính Pythonic hơn và sẽ hoạt động tốt hơn vòng lặp, nhưng tôi .

SSE trong Python là gì?

3. Sum of Squares Error [SSE] – Tổng bình phương sự khác biệt giữa các điểm dữ liệu được dự đoán [ŷi] và các điểm dữ liệu được quan sát [yi].

Là r bình phương dư tổng bình phương?

Để tính R2, bạn cần tìm tổng bình phương của phần dư và tổng bình phương . Bắt đầu bằng cách tìm phần dư, là khoảng cách từ đường hồi quy đến từng điểm dữ liệu. Tìm ra giá trị y dự đoán bằng cách thay giá trị x tương ứng vào phương trình đường hồi quy.

Chủ Đề