messenger_logo
Liên hệ qua Messenger
SciEco

Kiểm định sự phụ thuộc chéo (Cross-sectional Dependence Test) trên STATA

NH
Nguyễn Hữu Kiên
Ngày viết: 04/04/2024

Sự phụ thuộc chéo

Sự phụ thuộc chéo (Cross-Sectional Dependence) đề cập đến mối tương quan giữa các đối tượng tại cùng một thời điểm. Ví dụ về thương mại quốc tế được đại diện bởi tổng kim ngạch xuất nhập khẩu, quan sát tại hai quốc gia A và B, lượng nhập khẩu quốc gia A tăng cũng có nghĩa làm tăng lượng xuất khẩu của quốc gia B, và cùng làm tăng tổng kim ngạch xuất nhập khẩu của cả hai quốc gia. Trên thực tế, hầu hết các quốc gia có hoạt động thương mại qua lại lẫn nhau, dẫn đến sự tương quan về tổng kim ngạch XNK giữa các quốc gia, hay dữ liệu bảng quan sát hoạt động thương mại này có thể tồn tại sự phụ thuộc chéo.

Ở khía cạnh kinh tế lượng, sự phụ thuộc chéo thường được xác định dựa trên kiểm định được đề xuất bởi Pesaran (2004). Xét mô hình dữ liệu bảng:

yit=αi+βiXit+uity_{it}=\alpha_i + \beta_i X_{it} +u_{it}

Giả thuyết cho kiểm định sự phụ thuộc chéo như sau:

H0:ρij=ρij=corr(uit,ujt)=0,ijH_0: \rho_{ij} = \rho_{ij} = corr(u_{it}, u_{jt}) = 0, \forall i \ne j

Số cặp phụ thuộc chéo có thể có (uit,ujt)(u_{it}, u_{jt}) tăng theo số đối tượng (N).

Đối với dữ liệu bảng cân bằng:

CD=2TN(N1)(i=1N1j=i+1Nρ^ij)N(0,1)CD = \sqrt{\frac{2T}{N(N-1)}}\left(\sum_{i=1}^{N-1}\sum_{j=i+1}^{N}\hat{\rho}_{ij}\right)\simeq{N(0,1)}

ρ^ij=ρ^ji=t=1Tu^itu^jtt=1Tu^it2t=1Tu^jt2\hat{\rho}_{ij} = \hat{\rho}_{ji} = \frac{\sum_{t=1}^T \hat{u}_{it}\hat{u}_{jt}}{\sqrt{\sum_{t=1}^T \hat{u}_{it}^2}\sqrt{\sum_{t=1}^T \hat{u}_{jt}^2}}

Đối với dữ liệu bảng không cân bằng:

CD=2TN(N1)(i=1N1j=i+1NTijρ^ij)N(0,1)CD = \sqrt{\frac{2T}{N(N-1)}}\left(\sum_{i=1}^{N-1}\sum_{j=i+1}^{N}\sqrt{T_{ij}}\hat{\rho}_{ij}\right)\simeq{N(0,1)}

ρ^ij=ρ^ji=tTiTj(u^itu^ˉi)(u^jtu^ˉj)tTiTj(u^itu^ˉi)2tTiTj(u^jtu^ˉj)2\hat{\rho}_{ij} = \hat{\rho}_{ji} = \frac{\sum_{t \in T_i \cap T_j} (\hat{u}_{it} - \bar{\hat{u}}_i)(\hat{u}_{jt} - \bar{\hat{u}}_j)}{\sqrt{\sum_{t \in T_i\cap T_j}( \hat{u}_{it} - \bar{\hat{u}}_i)^2}\sqrt{\sum_{t \in T_i\cap T_j}( \hat{u}_{jt} - \bar{\hat{u}}_j)^2}}

Với

u^ˉi=tTiTju^it#(TiTj) \bar{\hat{u}}_i = \frac{\sum_{t \in T_i \cap T_j}\hat{u}_{it}} {\#(T_i\cap T_j)}

Kiểm định của Pesaran (2004) đề xuất được sử dụng đối với dữ liệu bảng có N lớn, T nhỏ. Tuy nhiên, đối với dữ liệu bảng có N nhỏ, kiểm định này vẫn cho thấy hiệu quả. Hơn nữa, kiểm định có thể sử dụng đối với cả dữ liệu bảng cân bằng và không cân bằng. Do vậy, kiểm định sự phụ thuộc chéo do Pesaran (2004) đề xuất được ứng dụng rộng rãi. Hiện nay, đã có một số kiểm định sự phụ thuộc chéo được phát triển thêm như Weighted CD (Juodis and Reese, 2022), Power Enhanced CD (Juodis and Reese, 2022 and Fan et. al., 2015) và CD Star (Pesaran & Xie, 2021).

Thực hành trên STATA

Tải dữ liệu SciEco_trade.

1//Nhập dữ liệu
2	use SciEco_trade, clear
3
4//Khai báo dữ liệu bảng
5	xtset ID year
6
7//Tính tổng kim ngạch XNK
8	gen trade_total=export+import
9
10//Ước lượng FEM/REM
11	xtreg trade_total,fe
12
13//Kiểm định CSD
14	xtcsd, pesaran

Kết quả kiểm định sự phụ thuộc chéo đối với biến trade_totalP_value=0.000, do đó, bác bỏ giả thuyết , hay tồn tại sự thuộc chéo.

Áp dụng tương tự với những biến còn lại trong mô hình nghiên cứu của bạn để có góc nhìn tổng thể về vấn đề phụ thuộc chéo trong dữ liệu, từ đó đưa ra các quyết định lựa chọn phương pháp kiểm định nghiệm đơn vị, đồng tích hợp… phù hợp. Sự chi phối của vấn đề phụ thuộc chéo đến quyết định lựa chọn các kiểm định khác của dữ liệu bảng là nội dung quan trọng và SciEco sẽ giới thiệu trong các bài viết tiếp theo.


Bài viết khác
Bài viết này khám phá cách cập nhật và tạo các lệnh Stata để tích hợp với những mô hình AI phổ biến như ChatGPT, Claude, Gemini và Grok. Sau khi bài đăng trước về lệnh Stata để chạy ChatGPT trở nên phổ biến, những thay đổi trong mã API của OpenAI đã khiến lệnh đó không còn hoạt động. Mục tiêu của chúng tôi là hướng dẫn bạn cách điều chỉnh mã API và viết các lệnh Stata tương tự để tận dụng sức mạnh của các công cụ AI khác nhau trực tiếp từ môi trường Stata. Trọng tâm của bài viết này, cũng như bài trước, là minh họa mức độ dễ dàng để tận dụng các tính năng của PyStata nhằm kết nối với ChatGPT và các công cụ AI khác, thay vì đưa ra lời khuyên về cách sử dụng các công cụ AI để trả lời các câu hỏi cụ thể của Stata. Do đó, các ví dụ chỉ đơn giản là yêu cầu một bài haiku về Stata. Tuy nhiên, bạn có thể truyền bất kỳ yêu cầu nào mà bạn thấy hữu ích trong quy trình làm việc của mình với Stata. Tổng Quan Về Tích Hợp Stata/Python Chúng tôi giả định rằng bạn đã quen thuộc với tích hợp Stata/Python và cách viết lệnh chatgpt ban đầu. Nếu các chủ đề này còn lạ lẫm, bạn nên đọc các bài đăng trên blog dưới đây:
Trong lập trình các lệnh ước lượng tùy chỉnh trong Stata, việc đảm bảo chức năng `predict` hoạt động chính xác sau khi chạy mô hình là một yếu tố quan trọng để người dùng có thể trích xuất các dự đoán hiệu quả. Bài viết này sẽ hướng dẫn cách xây dựng một ado-command riêng biệt để tính toán các giá trị dự đoán và tích hợp nó vào lệnh ước lượng chính, từ đó mở rộng khả năng phân tích dữ liệu. Một Lệnh Ado Để Tính Toán Dự Đoán Theo quy ước, một ado-command dùng để tính toán các dự đoán cho lệnh ước lượng `mytest` sẽ được đặt tên là `mytest_p`. Trong trường hợp này, chúng ta sẽ xem xét `mypoisson5_p`, ado-command chịu trách nhiệm tính toán dự đoán sau khi chạy lệnh `mypoisson5`. Cú pháp của `mypoisson5_p` được định nghĩa như sau:
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội