Biểu đồ hồi quy bội excel

Hồi quy tuyến tính là một loại phân tích dữ liệu xem xét mối quan hệ tuyến tính giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Nó thường được sử dụng để thể hiện trực quan sức mạnh của mối quan hệ hoặc mối tương quan giữa các yếu tố khác nhau và sự phân tán kết quả – tất cả nhằm mục đích giải thích hành vi của biến phụ thuộc. Mục tiêu của mô hình hồi quy tuyến tính là ước tính độ lớn của mối quan hệ giữa các biến và liệu nó có ý nghĩa thống kê hay không

Giả sử chúng tôi muốn kiểm tra sức mạnh của mối quan hệ giữa lượng kem ăn và béo phì. Chúng tôi sẽ lấy biến độc lập, lượng kem và liên hệ nó với biến phụ thuộc, béo phì, để xem liệu có mối quan hệ nào không. Cho một hồi quy là một màn hình đồ họa của mối quan hệ này, độ biến thiên của dữ liệu càng thấp, mối quan hệ càng chặt chẽ và sự phù hợp với đường hồi quy càng chặt chẽ.  

Trong tài chính, hồi quy tuyến tính được sử dụng để xác định mối quan hệ giữa giá tài sản và dữ liệu kinh tế trên một loạt các ứng dụng. Chẳng hạn, nó được sử dụng để xác định các trọng số nhân tố trong Mô hình Fama-French và là cơ sở để xác định Beta của một cổ phiếu trong mô hình định giá tài sản vốn (CAPM)

Ở đây, chúng tôi xem xét cách sử dụng dữ liệu được nhập vào Microsoft Excel để thực hiện hồi quy tuyến tính và cách diễn giải kết quả

Chìa khóa rút ra

  • Hồi quy tuyến tính mô hình hóa mối quan hệ giữa (các) biến phụ thuộc và biến độc lập
  • Còn được gọi là bình phương nhỏ nhất thông thường (OLS), hồi quy tuyến tính về cơ bản ước tính một đường phù hợp nhất giữa tất cả các biến trong mô hình
  • Phân tích hồi quy có thể được coi là mạnh mẽ nếu các biến độc lập, không có phương sai thay đổi và các số hạng sai số của các biến không tương quan với nhau
  • Lập mô hình hồi quy tuyến tính trong Excel dễ dàng hơn với Data Analysis ToolPak
  • Đầu ra hồi quy có thể được giải thích cho cả quy mô và cường độ của mối tương quan giữa một hoặc nhiều biến trên biến phụ thuộc

Cân nhắc quan trọng

Có một vài giả định quan trọng về tập dữ liệu của bạn phải đúng để tiến hành phân tích hồi quy. Nếu không, kết quả sẽ được giải thích không chính xác hoặc chúng sẽ thể hiện sự sai lệch

  1. Các biến phải thực sự độc lập (sử dụng kiểm định Chi-square)
  2. Dữ liệu không được có các phương sai lỗi khác nhau (điều này được gọi là phương sai thay đổi không đồng nhất (cũng được đánh vần là phương sai thay đổi không đồng nhất))
  3. Các điều khoản lỗi của mỗi biến phải không tương quan. Nếu không, điều đó có nghĩa là các biến có mối tương quan chặt chẽ với nhau

Nếu ba điểm đó nghe có vẻ phức tạp, chúng có thể. Nhưng ảnh hưởng của một trong những cân nhắc không đúng đó là ước tính sai lệch. Về cơ bản, bạn sẽ đánh giá sai mối quan hệ mà bạn đang đo lường

Xuất một Hồi quy trong Excel

Bước đầu tiên khi chạy phân tích hồi quy trong Excel là kiểm tra kỹ xem plugin Excel Data Analysis ToolPak miễn phí đã được cài đặt chưa. Plugin này làm cho việc tính toán một loạt các số liệu thống kê rất dễ dàng. Không bắt buộc phải lập biểu đồ đường hồi quy tuyến tính, nhưng nó giúp việc tạo bảng thống kê trở nên đơn giản hơn. Để xác minh xem đã cài đặt chưa, hãy chọn "Dữ liệu" từ thanh công cụ. Nếu tùy chọn "Phân tích dữ liệu" thì tính năng này đã được cài đặt và sẵn sàng sử dụng. Nếu chưa cài đặt, bạn có thể yêu cầu tùy chọn này bằng cách nhấp vào nút Office và chọn "Tùy chọn Excel"

Sử dụng Data Analysis ToolPak, tạo đầu ra hồi quy chỉ bằng vài cú nhấp chuột

Biến độc lập trong Excel nằm trong khoảng X

Với lợi nhuận của S&P 500, giả sử chúng ta muốn biết liệu chúng ta có thể ước tính độ mạnh và mối quan hệ của lợi nhuận cổ phiếu Visa (V) hay không. Chứng khoán Visa (V) trả về dữ liệu điền vào cột 1 dưới dạng biến phụ thuộc. S&P 500 trả về dữ liệu điền vào cột 2 dưới dạng biến độc lập

  1. Chọn "Dữ liệu" từ thanh công cụ. Menu "Dữ liệu" hiển thị
  2. Chọn "Phân tích dữ liệu". Hộp thoại Phân tích dữ liệu - Công cụ phân tích hiển thị
  3. Từ menu, chọn "Hồi quy" và nhấp vào "OK"
  4. Trong hộp thoại Regression, nhấp vào hộp "Input Y Range" và chọn dữ liệu biến phụ thuộc (trả về chứng khoán Visa (V))
  5. Nhấp vào ô "Input X Range" và chọn dữ liệu biến độc lập (S&P 500 trả về)
  6. Bấm "OK" để chạy kết quả

[Ghi chú. Nếu bảng có vẻ nhỏ, hãy nhấp chuột phải vào hình ảnh và mở trong tab mới để có độ phân giải cao hơn. ]

Biểu đồ hồi quy bội excel

Giải thích kết quả

Sử dụng dữ liệu đó (tương tự từ bài viết bình phương R của chúng tôi), chúng tôi nhận được bảng sau

Biểu đồ hồi quy bội excel

Giá trị R2, còn được gọi là hệ số xác định, đo lường tỷ lệ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập hoặc mức độ phù hợp của mô hình hồi quy với dữ liệu. Giá trị R2 nằm trong khoảng từ 0 đến 1 và giá trị cao hơn cho biết mức độ phù hợp tốt hơn. Giá trị p, hoặc giá trị xác suất, cũng nằm trong khoảng từ 0 đến 1 và cho biết liệu thử nghiệm có ý nghĩa hay không. Trái ngược với giá trị R2, giá trị p nhỏ hơn là thuận lợi vì nó cho thấy mối tương quan giữa các biến phụ thuộc và biến độc lập

Giải thích kết quả

Điểm mấu chốt ở đây là những thay đổi trong cổ phiếu Visa dường như có mối tương quan cao với S&P 500

  • Trong kết quả hồi quy ở trên, chúng ta có thể thấy rằng cứ mỗi 1 điểm thay đổi trong Visa, sẽ có 1 điểm tương ứng. Thay đổi 36 điểm trong S&P 500
  • Chúng ta cũng có thể thấy rằng giá trị p rất nhỏ (0. 000036), cũng tương ứng với T-test rất lớn. Điều này cho thấy rằng phát hiện này có ý nghĩa thống kê cao, vì vậy khả năng kết quả này là do ngẫu nhiên là cực kỳ thấp
  • Từ bình phương R, chúng ta có thể thấy rằng chỉ riêng giá V có thể giải thích hơn 62% biến động quan sát được trong chỉ số S&P 500

Tuy nhiên, một nhà phân tích tại thời điểm này có thể lưu ý một chút thận trọng vì những lý do sau

  • Với chỉ một biến trong mô hình, không rõ liệu V có ảnh hưởng đến giá S&P 500 hay không, liệu S&P 500 có ảnh hưởng đến giá V hay một biến thứ ba không được quan sát nào ảnh hưởng đến cả hai mức giá
  • Visa là một thành phần của S&P 500, vì vậy có thể có mối tương quan giữa các biến ở đây
  • Chỉ có 20 quan sát, có thể không đủ để đưa ra kết luận tốt
  • Dữ liệu là một chuỗi thời gian, vì vậy cũng có thể có hiện tượng tự tương quan
  • Khoảng thời gian đang nghiên cứu có thể không đại diện cho các khoảng thời gian khác

Biểu đồ hồi quy trong Excel

Chúng ta có thể lập biểu đồ hồi quy trong Excel bằng cách tô sáng dữ liệu và biểu đồ dưới dạng biểu đồ phân tán. Để thêm đường hồi quy, hãy chọn "Thêm thành phần biểu đồ" từ menu "Thiết kế biểu đồ". Trong hộp thoại, chọn "Đường xu hướng" rồi chọn "Đường xu hướng tuyến tính". Để thêm giá trị R2, hãy chọn "Tùy chọn Đường xu hướng khác" từ "menu Đường xu hướng. Cuối cùng, chọn "Hiển thị giá trị bình phương R trên biểu đồ". Kết quả trực quan tổng hợp sức mạnh của mối quan hệ, mặc dù không cung cấp nhiều chi tiết như bảng trên.  

Biểu đồ hồi quy bội excel
Biểu đồ hồi quy bội excel

Hình ảnh của Sabrina Jiang © Investopedia 2020

Làm thế nào để bạn giải thích một hồi quy tuyến tính?

Đầu ra của một mô hình hồi quy sẽ tạo ra các kết quả số khác nhau. Các hệ số (hoặc beta) cho bạn biết mối liên hệ giữa một biến độc lập và biến phụ thuộc, giữ mọi thứ khác không đổi. Nếu hệ số là, giả sử, +0. 12, nó cho bạn biết rằng mỗi thay đổi 1 điểm trong biến đó tương ứng với 0. 12 biến phụ thuộc cùng chiều. Nếu thay vào đó -3. 00, điều đó có nghĩa là biến giải thích thay đổi 1 điểm dẫn đến biến phụ thuộc thay đổi 3 lần, theo hướng ngược lại

Làm thế nào để bạn biết nếu một hồi quy là đáng kể?

Ngoài việc tạo ra các hệ số beta, đầu ra hồi quy cũng sẽ chỉ ra các kiểm định về ý nghĩa thống kê dựa trên sai số chuẩn của từng hệ số (chẳng hạn như giá trị p và khoảng tin cậy). Thông thường, các nhà phân tích sử dụng giá trị p bằng 0. 05 hoặc ít hơn để biểu thị tầm quan trọng; . Các kiểm định ý nghĩa khác trong mô hình hồi quy có thể là kiểm định t cho từng biến, cũng như thống kê F hoặc chi-square cho ý nghĩa chung của tất cả các biến trong mô hình cùng nhau

Làm thế nào để bạn giải thích bình phương R của một hồi quy tuyến tính?

R2 (R-squared) là thước đo thống kê về mức độ phù hợp của mô hình hồi quy tuyến tính (từ 0. 00 đến 1. 00), còn được gọi là hệ số xác định. Nói chung, R2 càng cao thì mô hình càng phù hợp. Bình phương R cũng có thể được hiểu là mức độ thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập (giải thích) trong mô hình. Do đó, một bình phương R của 0. 50 gợi ý rằng một nửa của tất cả các biến thể quan sát được trong biến phụ thuộc có thể được giải thích bằng (các) biến phụ thuộc