messenger_logo
Liên hệ qua Messenger
SciEco

Kiểm định phương sai sai số thay đổi

Đn
Đội ngũ SciEco
Ngày viết: 12/12/2023

Trong bài viết này, SciEco cung cấp nội dung về kiểm định phương sai sai số thay đổi - một trong những kiểm định quan trọng trong khuyết tật mô hình hồi quy OLS.

Phương sai sai số thay đổi là hiện tượng mà phương sai của các sai số ước lượng không bằng nhau (heteroscedasticity). Hiện tượng này có thể xảy ra đối với cả 3 dạng dữ liệu: Chéo (Cross-sectional), Chuỗi thời gian (Time-series), Bảng (Panel). Đối với dữ liệu chéo được ước lượng bằng phương pháp OLS, các phương pháp kiểm định phương sai sai số thay đổi như sau:

1. Hiện tượng phương sai sai số thay đổi

Xét mô hình ban đầu:

Yi=βo+β1X1+β2X2+ui(1)Y_i = \beta_o + \beta_1*X_{1} + \beta_2*X_2 +u_i (1)

Một giả thiết quan trọng của OLS chính là:

Giả thiết 3: Phương sai sai số ngẫu nhiên không đổi (homoscedasticity)

Var(ui)=σ2Var(u_i) = \sigma^2

Nếu giả thiết này bị vi phạm thì mô hình có phương sai sai số thay đổi (heteroskedasticity)

Var(ui)σi2Var(u_i) \neq {\sigma_i}^2

Hệ quả:

2. Kiểm định phát hiện phương sai sai số thay đổi

Ta thực hiện hồi quy bình phương phần dư e (do uuchưa biết) theo các yếu tố khi hệ số góc có ý nghĩa thống kê. Nếu bình phương phần dư e thay đổi theo đó thì xuất hiện hiện tượng phương sai sai số thay đổi.

Kiểm định BPG (Breusch-Pagan-Godfrey)

Hồi quy mô hình ban đầu (1) thu được phần dư ee

Mô hình hồi quy phụ:

e2=α0+α1X1+α2X2+ve^2 = \alpha_0 + \alpha_1*X_1 + \alpha_2*X_2 + v

Ta xét cặp giả thuyết sau:

{H0:α1=α2=0H1:α12+α220)\begin{cases} H_0: \alpha_1 = \alpha_2 = 0 \\ H_1: {\alpha_1}^2 + {\alpha_2}^2 \neq 0) \end{cases}

Sử dụng kiểm định F, tính với hệ số R bình phương của hồi quy phụ và bậc tự do k:

F=(R2(U)R2(R))/m/(1R2(U))/(nk(U))F = ({R_*}^2(U) - {R_*}^2(R))/m / (1-{R_*}^2(U))/(n-k(U))

Hoặc sử dụng kiểm định Chi bình phương (Chi_Square), với hệ số R bình phương của hồi quy phụ và bậc tự do k:

χqs2=nR2{\chi_{qs}}^2 = n*{R_*}^2

Bác bỏ H0 khi

χqs2>χα2(k1){\chi_{qs}}^2 > {\chi_\alpha}^2(k_*-1)

Kết luận: Mô hình có phương sai sai số thay đổi.

Kiểm định White

Dùng cho mô hình nhiều biến giải thích. Hồi qui bình phương phần dư theo tổ hợp bậc cao dần của các biến giải thích.

Hồi quy mô hình ban đầu (1) thu được phần dư e:

e2=α0+α1X1+α2X2+α3X12+α4X22+α5X1X2e^2=\alpha_0+\alpha_1*X_1+\alpha_2*X_2+\alpha_3*{X_1}^2+\alpha_4*{X_2}^2+\alpha_5*X_1*X_2

Nếu hệ số góc bất kì khác 0 thì mô hình có phương sai sai số thay đổi.

Xét cặp giả thuyết:

{H0:R2=0H1:R20)\begin{cases} H_0: {R_*}^2 = 0 \\ H_1: {R_*}^2 \neq 0) \end{cases}

Tương tự, dùng kiểm định F và kiểm định Chi bình phương (Chi_Square).

Như vậy, xác định khuyết tật phương sai sai số của mô hình được thực hiện thông qua ý nghĩa thống kê của các hệ số ước lượng trong hồi quy phụ. Hồi quy phụ nhằm xác định phần dư của mô hình có bị tác động bởi các biến độc lập hay không. Nếu có (ít nhất 1 hệ số của hồi quy phụ khác 0 và có ý nghĩa thống kê) thì mô hình ban đầu xảy ra hiện tượng phương sai sai số thay đổi. Và tùy vào các xây dựng hàm hồi quy phụ mà chúng ta có các phương pháp kiểm định khác nhau. Ngoài kiểm định Breusch-Pagan-Godfrey và White mà SciEco đã giới thiệu ở trên, các kiểm định khuyết tật này còn được đưa ra bởi Harvey, Gleijer, Park, Koenker-Bass...

Trong bài viết tiếp theo, SciEco hướng dẫn chi tiết bạn đọc cách xác định phương phương sai sai số thay đổi qua phần mềm STATA.


Bài viết khác
Trong trò chơi 20 câu hỏi, chiến thuật thông minh nhất mà chúng ta thường áp dụng là đặt ra những câu hỏi có khả năng chia đôi các lựa chọn còn lại. Cách tiếp cận này có sự tương đồng đáng kinh ngạc với thuật toán cây quyết định trong học máy, dù giữa chúng có một điểm khác biệt căn bản. Một cây quyết định thực tế thường có hành vi giống như đang gian lận. Trong khi người chơi phải tự tìm ra đáp án, thuật toán cây quyết định lại biết trước mục tiêu cuối cùng là gì. Nó cố gắng tìm ra những đặc trưng và giá trị phân tách tốt nhất để tách biệt đối tượng mục tiêu khỏi các dữ liệu còn lại tại mỗi node, nhưng nó cần biết câu trả lời đúng để đưa ra những câu hỏi tối ưu nhất. Đây chính là lý do tại sao khi chúng ta thay đổi đối tượng cần tìm, thuật toán có thể chọn các đặc trưng và điểm phân chia hoàn toàn khác nhau. Xây dựng mô hình cây quyết định với dữ liệu Tổng thống Hoa Kỳ Để thử nghiệm giả thuyết này, tôi đã sử dụng tập dữ liệu về các đời Tổng thống Hoa Kỳ. Một thách thức nhỏ khi xử lý dữ liệu này là một số biến số có quá nhiều giá trị riêng biệt, ví dụ như tên các đảng phái chính trị vào thế kỷ 18. Để mô hình hoạt động hiệu quả hơn, tôi đã tiến hành nhóm các giá trị này lại nhằm giảm bớt sự phức tạp. Ban đầu, tôi thử chọn ngẫu nhiên một vị Tổng thống, nhưng sau đó tôi quyết định chọn Ronald Reagan làm mục tiêu để tạo ra một cấu trúc cây thú vị và gần gũi hơn với cách đặt câu hỏi của con người. Nếu chọn President Garfield, chúng ta có thể có câu hỏi độc đáo về việc ông từng chứng minh định lý Pythagoras, nhưng điều đó có vẻ hơi quá chuyên sâu cho một mô hình tổng quát. Dưới đây là cấu trúc cây quyết định được tạo ra để tìm ra mục tiêu Ronald Reagan:
Thị trường tiền mã hóa vừa chứng kiến một cột mốc lịch sử khi giá Bitcoin chạm ngưỡng 125.664 đô la vào ngày 5 tháng 10. Sự bùng nổ này được thúc đẩy bởi dòng vốn ròng kỷ lục trị giá 3,24 tỷ đô la đổ vào các quỹ ETF Bitcoin giao ngay cùng nhu cầu ngày càng tăng từ công chúng. Trong bối cảnh đó, việc phân tích và dự báo xu hướng của các quỹ hoán đổi danh mục liên quan đến công nghệ blockchain trở nên quan trọng hơn bao giờ hết đối với các nhà đầu tư. Bài viết này sẽ hướng dẫn cách thực hiện dự báo lồng nhau cho hai quỹ ETF blockchain tiêu biểu bằng cách tận dụng sức mạnh tính toán song song của backend Spark. Thiết lập môi trường và thu thập dữ liệu Để bắt đầu, chúng ta cần thiết lập kết nối với Spark và chuẩn bị các thư viện cần thiết trong hệ sinh thái tidymodels và modeltime. Việc sử dụng Spark giúp tăng tốc quá trình huấn luyện mô hình khi xử lý nhiều chuỗi thời gian cùng lúc. Hai quỹ được lựa chọn để phân tích bao gồm Invesco CoinShares Global Blockchain và iShares Blockchain and Tech.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội