messenger_logo
Liên hệ qua Messenger
SciEco

Kiểm định phương sai sai số thay đổi

Đn
Đội ngũ SciEco
Ngày viết: 12/12/2023

Trong bài viết này, SciEco cung cấp nội dung về kiểm định phương sai sai số thay đổi - một trong những kiểm định quan trọng trong khuyết tật mô hình hồi quy OLS.

Phương sai sai số thay đổi là hiện tượng mà phương sai của các sai số ước lượng không bằng nhau (heteroscedasticity). Hiện tượng này có thể xảy ra đối với cả 3 dạng dữ liệu: Chéo (Cross-sectional), Chuỗi thời gian (Time-series), Bảng (Panel). Đối với dữ liệu chéo được ước lượng bằng phương pháp OLS, các phương pháp kiểm định phương sai sai số thay đổi như sau:

1. Hiện tượng phương sai sai số thay đổi

Xét mô hình ban đầu:

Yi=βo+β1X1+β2X2+ui(1)Y_i = \beta_o + \beta_1*X_{1} + \beta_2*X_2 +u_i (1)

Một giả thiết quan trọng của OLS chính là:

Giả thiết 3: Phương sai sai số ngẫu nhiên không đổi (homoscedasticity)

Var(ui)=σ2Var(u_i) = \sigma^2

Nếu giả thiết này bị vi phạm thì mô hình có phương sai sai số thay đổi (heteroskedasticity)

Var(ui)σi2Var(u_i) \neq {\sigma_i}^2

Hệ quả:

2. Kiểm định phát hiện phương sai sai số thay đổi

Ta thực hiện hồi quy bình phương phần dư e (do uuchưa biết) theo các yếu tố khi hệ số góc có ý nghĩa thống kê. Nếu bình phương phần dư e thay đổi theo đó thì xuất hiện hiện tượng phương sai sai số thay đổi.

Kiểm định BPG (Breusch-Pagan-Godfrey)

Hồi quy mô hình ban đầu (1) thu được phần dư ee

Mô hình hồi quy phụ:

e2=α0+α1X1+α2X2+ve^2 = \alpha_0 + \alpha_1*X_1 + \alpha_2*X_2 + v

Ta xét cặp giả thuyết sau:

{H0:α1=α2=0H1:α12+α220)\begin{cases} H_0: \alpha_1 = \alpha_2 = 0 \\ H_1: {\alpha_1}^2 + {\alpha_2}^2 \neq 0) \end{cases}

Sử dụng kiểm định F, tính với hệ số R bình phương của hồi quy phụ và bậc tự do k:

F=(R2(U)R2(R))/m/(1R2(U))/(nk(U))F = ({R_*}^2(U) - {R_*}^2(R))/m / (1-{R_*}^2(U))/(n-k(U))

Hoặc sử dụng kiểm định Chi bình phương (Chi_Square), với hệ số R bình phương của hồi quy phụ và bậc tự do k:

χqs2=nR2{\chi_{qs}}^2 = n*{R_*}^2

Bác bỏ H0 khi

χqs2>χα2(k1){\chi_{qs}}^2 > {\chi_\alpha}^2(k_*-1)

Kết luận: Mô hình có phương sai sai số thay đổi.

Kiểm định White

Dùng cho mô hình nhiều biến giải thích. Hồi qui bình phương phần dư theo tổ hợp bậc cao dần của các biến giải thích.

Hồi quy mô hình ban đầu (1) thu được phần dư e:

e2=α0+α1X1+α2X2+α3X12+α4X22+α5X1X2e^2=\alpha_0+\alpha_1*X_1+\alpha_2*X_2+\alpha_3*{X_1}^2+\alpha_4*{X_2}^2+\alpha_5*X_1*X_2

Nếu hệ số góc bất kì khác 0 thì mô hình có phương sai sai số thay đổi.

Xét cặp giả thuyết:

{H0:R2=0H1:R20)\begin{cases} H_0: {R_*}^2 = 0 \\ H_1: {R_*}^2 \neq 0) \end{cases}

Tương tự, dùng kiểm định F và kiểm định Chi bình phương (Chi_Square).

Như vậy, xác định khuyết tật phương sai sai số của mô hình được thực hiện thông qua ý nghĩa thống kê của các hệ số ước lượng trong hồi quy phụ. Hồi quy phụ nhằm xác định phần dư của mô hình có bị tác động bởi các biến độc lập hay không. Nếu có (ít nhất 1 hệ số của hồi quy phụ khác 0 và có ý nghĩa thống kê) thì mô hình ban đầu xảy ra hiện tượng phương sai sai số thay đổi. Và tùy vào các xây dựng hàm hồi quy phụ mà chúng ta có các phương pháp kiểm định khác nhau. Ngoài kiểm định Breusch-Pagan-Godfrey và White mà SciEco đã giới thiệu ở trên, các kiểm định khuyết tật này còn được đưa ra bởi Harvey, Gleijer, Park, Koenker-Bass...

Trong bài viết tiếp theo, SciEco hướng dẫn chi tiết bạn đọc cách xác định phương phương sai sai số thay đổi qua phần mềm STATA.


Bài viết khác
1. Giới thiệu Phân cụm đồ thị (K-means Clustering) là quá trình phân chia hoặc tách biệt dữ liệu theo các nhóm dựa trên các đặc điểm chung sau đó được biểu thị qua một đồ thị. Phù hợp với những công việc cần phân khúc các tệp khách hàng trong thương mại, phân tích thị trường. Điều này giúp các công ty hiểu rõ hơn về sở thích và nhu cầu của từng nhóm, qua đó đưa ra chiến lược marketing phù hợp. Trong thuật toán phân cụm, K-means là một thuật toán phân cụm đơn giản và phổ biến trong học máy (machine learning) để phân cụm các điểm dữ liệu thành các nhóm riêng biệt dựa trên các đặc điểm của chúng. Thuật toán này dùng để chia dữ liệu thành các nhóm dựa trên khoảng cách giữa các điểm dữ liệu với nhau. 2. Ta cài đặt những thư viện sau
Trong thời đại của số hóa và khoa học dữ liệu lên ngôi, khả năng phân tích, giải mã và trích xuất thông tin hữu ích từ khối lượng dữ liệu khổng lồ là một kỹ năng không thể thiếu để giúp bạn thích nghi với yêu cầu của công việc! Đặc biệt, với việc làm chủ STATA, phần mềm phân tích dữ liệu có giao diện thân thiện và khả năng xử lý dữ liệu mạnh mẽ sẽ là công cụ đắc lực cho bạn. Để có thể giúp bạn chinh phục STATA, SciEco ở đây để mang đến cho bạn khóa học STATA đầy hấp dẫn: Nội dung khóa học chi tiết: Bài 1: Giới thiệu về STATA và VES
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội