messenger_logo
Liên hệ qua Messenger
SciEco

[Dữ liệu chuỗi thời gian] MÔ HÌNH AR, MA VÀ ARIMA (Phần 2)

PH
Phạm Huy Du
Ngày viết: 07/05/2024

2. THỰC HÀNH TRÊN STATA

Trong phần này, chúng ta sẽ sử dụng chỉ số giá tiêu dùng (CPI) của Mỹ từ 1/1/2008 đến 1/2/2021 (tần suất: theo tháng) để tiến hành dự báo với các mô hình được nêu trong bài viết.

2.1. Kiểm định tính dừng của chuỗi số

Trước hết, chúng ta cần kiểm định tính dừng của chuỗi CPI bằng kiểm định ADF như sau:

1dfuller CPI,trend regress

\rightarrow Kết quả kiểm định nghiệm đơn vị được thể hiện theo định dạng sau:

Kết quả cho thấy thống kê kiểm định ADF (-1.879) > giá trị tới hạn (-3.442 ở mức ý nghĩa 5%) \Rightarrow Không thể bác bỏ giá thuyết H0 về sự tồn tại của nghiệm đơn vị của chuỗi CPI \Rightarrow Chuỗi CPI là chuỗi không dừng.

Điều này phản ánh đúng với thực tế rằng đa phần của chuỗi số kinh tế - tài chính đều không dừng tại chuỗi gốc. Do đó, ta sẽ sử dụng sai phân bậc nhất của log chuỗi CPI – hay còn gọi là tốc độ tăng của chỉ số giá tiêu dùng (lạm phát) như sau:

1gen lCPI = ln(CPI)
2gen dlCPI = D.lCPI
3dfuller dlCPI,trend regress

\rightarrow Kết quả kiểm định nghiệm đơn vị được thể hiện theo định dạng sau:

Kết quả cho thấy thống kê kiểm định ADF (-7.060) > giá trị tới hạn (-3.443 ở mức ý nghĩa 5%) \Rightarrow Bác bỏ giá thuyết H0 về sự tồn tại của nghiệm đơn vị của chuỗi dlCPI \Rightarrow Chuỗi dlCPI là chuỗi dừng.

2.2. Lựa chọn độ trễ hợp lý p và q

2.2.1. Lựa chọn độ trễ q*

Để lựa chọn độ trễ q* phù hợp, ta sẽ vẽ hàm tự tương quan (ACF) như sau:

1ac dlCPI

Dựa vào hàm tự tương quan ACF, ta thấy đồ thị ACF đột ngột cắt đứt/bằng 0 kể từ sau độ trễ 1 (về mặt trực quan, kể từ sau độ trễ 1, các giá trị tương quan đều nằm trong khoảng đậm) \Rightarrow q* = 1

2.2.2. Lựa chọn độ trễ p*

Để lựa chọn độ trễ p* phù hợp, ta sẽ vẽ hàm tương quan riêng (PACF) như sau:

1pac dlCPI

Dựa vào hàm tương quan riêng PACF, ta thấy đồ thị PACF đột ngột cắt đứt/bằng 0 kể từ sau độ trễ 2 (về mặt trực quan, kể từ sau độ trễ 2, các giá trị tương quan riêng đều nằm trong khoảng đậm) \Rightarrow p* = {1,2}.

2.3. Ước lượng, kiểm định và dự báo cho các mô hình

2.3.1. Mô hình AR(1)

Ta sẽ tiến hành ước lượng mô hình AR(1) cho chuỗi dlCPI như sau:

1arima lCPI,arima(1,1,0)

Nhìn chung, ta thấy các hệ số ước lượng đều có ý nghĩa thống kê ở mức ý nghĩa 5%. Tuy nhiên, để có thể sử dụng mô hình này để dự báo, ta cần phải đảm bảo phần dư là nhiễu trắng. Do đó, ta sẽ tiến hành kiểm định phần dư là nhiễu trắng bằng kiểm định Portmanteau như sau:

1arima lCPI,arima(1,1,0)
2predict error1,resid
3wntestq error1

Kết quả kiểm định cho thấy P-value (0.8446) > 0.05 \Rightarrow chưa thể bác bỏ giả thuyết H0 \Rightarrow phần dư trong mô hình AR(1) là nhiễu trắng.

Sau đó, chúng ta sẽ sử dụng mô hình này để dự đoán cho 24 tháng (2 năm) tiếp theo như sau:

1sappend,add(24)
2arima lCPI,arima(1,1,0)
3predict flcpi1,y dynamic(m(2021m3))

2.3.2. Mô hình MA(1)

Ta sẽ tiến hành ước lượng mô hình MA(1) cho chuỗi dlCPI như sau:

1arima lCPI,arima(0,1,1)

Nhìn chung, ta thấy các hệ số ước lượng đều có ý nghĩa thống kê ở mức ý nghĩa 5%. Tuy nhiên, để có thể sử dụng mô hình này để dự báo, ta cần phải đảm bảo phần dư là nhiễu trắng. Do đó, ta sẽ tiến hành kiểm định phần dư là nhiễu trắng bằng kiểm định Portmanteau như sau:

1arima lCPI,arima(0,1,1)
2predict error2,resid
3wntestq error2

Kết quả kiểm định cho thấy P-value (0.8052) > 0.05 \Rightarrow chưa thể bác bỏ giả thuyết H0 \Rightarrow phần dư trong mô hình MA(1) là nhiễu trắng.

Sau đó, chúng ta sẽ sử dụng mô hình này để dự đoán cho 24 tháng (2 năm) tiếp theo như sau:

1tsappend,add(24) // nếu trước đó đã tạo rồi thì không cần đoạn code này nữa
2arima lCPI,arima(0,1,1)
3predict flcpi2,y dynamic(m(2021m3))

2.3.3. Mô hình ARIMA(1,1,1)

Ta sẽ tiến hành ước lượng mô hình ARIMA(1,1,1) cho chuỗi dlCPI như sau:

1arima lCPI,arima(1,1,1)

Nhìn chung, ta thấy các hệ số ước lượng đều có ý nghĩa thống kê ở mức ý nghĩa 5%. Tuy nhiên, để có thể sử dụng mô hình này để dự báo, ta cần phải đảm bảo phần dư là nhiễu trắng. Do đó, ta sẽ tiến hành kiểm định phần dư là nhiễu trắng bằng kiểm định Portmanteau như sau:

1arima lCPI,arima(1,1,1)
2predict error3,resid
3wntestq error3

Kết quả kiểm định cho thấy P-value (0.9727) > 0.05 \Rightarrow chưa thể bác bỏ giả thuyết H0 \Rightarrow phần dư trong mô hình ARIMA(1,1,1) là nhiễu trắng.

Sau đó, chúng ta sẽ sử dụng mô hình này để dự đoán cho 24 tháng (2 năm) tiếp theo như sau:

1tsappend,add(24) // nếu trước đó đã tạo rồi thì không cần đoạn code này nữa
2arima lCPI,arima(1,1,1)
3predict flcpi3,y dynamic(m(2021m3))

Nguồn tham khảo:

1. Phạm, Thế Anh. (2022). Giáo trình phân tích định lượng trong kinh tế vĩ mô. Nhà xuất bản Đại học Kinh tế quốc dân.


Bài viết khác
1. Giới thiệu Phân cụm đồ thị (K-means Clustering) là quá trình phân chia hoặc tách biệt dữ liệu theo các nhóm dựa trên các đặc điểm chung sau đó được biểu thị qua một đồ thị. Phù hợp với những công việc cần phân khúc các tệp khách hàng trong thương mại, phân tích thị trường. Điều này giúp các công ty hiểu rõ hơn về sở thích và nhu cầu của từng nhóm, qua đó đưa ra chiến lược marketing phù hợp. Trong thuật toán phân cụm, K-means là một thuật toán phân cụm đơn giản và phổ biến trong học máy (machine learning) để phân cụm các điểm dữ liệu thành các nhóm riêng biệt dựa trên các đặc điểm của chúng. Thuật toán này dùng để chia dữ liệu thành các nhóm dựa trên khoảng cách giữa các điểm dữ liệu với nhau. 2. Ta cài đặt những thư viện sau
Trong thời đại của số hóa và khoa học dữ liệu lên ngôi, khả năng phân tích, giải mã và trích xuất thông tin hữu ích từ khối lượng dữ liệu khổng lồ là một kỹ năng không thể thiếu để giúp bạn thích nghi với yêu cầu của công việc! Đặc biệt, với việc làm chủ STATA, phần mềm phân tích dữ liệu có giao diện thân thiện và khả năng xử lý dữ liệu mạnh mẽ sẽ là công cụ đắc lực cho bạn. Để có thể giúp bạn chinh phục STATA, SciEco ở đây để mang đến cho bạn khóa học STATA đầy hấp dẫn: Nội dung khóa học chi tiết: Bài 1: Giới thiệu về STATA và VES
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội