messenger_logo
Liên hệ qua Messenger
SciEco

[Dữ liệu chuỗi thời gian] MÔ HÌNH AR, MA VÀ ARIMA (Phần 2)

PH
Phạm Huy Du
Ngày viết: 07/05/2024

2. THỰC HÀNH TRÊN STATA

Trong phần này, chúng ta sẽ sử dụng chỉ số giá tiêu dùng (CPI) của Mỹ từ 1/1/2008 đến 1/2/2021 (tần suất: theo tháng) để tiến hành dự báo với các mô hình được nêu trong bài viết.

2.1. Kiểm định tính dừng của chuỗi số

Trước hết, chúng ta cần kiểm định tính dừng của chuỗi CPI bằng kiểm định ADF như sau:

1dfuller CPI,trend regress

\rightarrow Kết quả kiểm định nghiệm đơn vị được thể hiện theo định dạng sau:

Kết quả cho thấy thống kê kiểm định ADF (-1.879) > giá trị tới hạn (-3.442 ở mức ý nghĩa 5%) \Rightarrow Không thể bác bỏ giá thuyết H0 về sự tồn tại của nghiệm đơn vị của chuỗi CPI \Rightarrow Chuỗi CPI là chuỗi không dừng.

Điều này phản ánh đúng với thực tế rằng đa phần của chuỗi số kinh tế - tài chính đều không dừng tại chuỗi gốc. Do đó, ta sẽ sử dụng sai phân bậc nhất của log chuỗi CPI – hay còn gọi là tốc độ tăng của chỉ số giá tiêu dùng (lạm phát) như sau:

1gen lCPI = ln(CPI)
2gen dlCPI = D.lCPI
3dfuller dlCPI,trend regress

\rightarrow Kết quả kiểm định nghiệm đơn vị được thể hiện theo định dạng sau:

Kết quả cho thấy thống kê kiểm định ADF (-7.060) > giá trị tới hạn (-3.443 ở mức ý nghĩa 5%) \Rightarrow Bác bỏ giá thuyết H0 về sự tồn tại của nghiệm đơn vị của chuỗi dlCPI \Rightarrow Chuỗi dlCPI là chuỗi dừng.

2.2. Lựa chọn độ trễ hợp lý p và q

2.2.1. Lựa chọn độ trễ q*

Để lựa chọn độ trễ q* phù hợp, ta sẽ vẽ hàm tự tương quan (ACF) như sau:

1ac dlCPI

Dựa vào hàm tự tương quan ACF, ta thấy đồ thị ACF đột ngột cắt đứt/bằng 0 kể từ sau độ trễ 1 (về mặt trực quan, kể từ sau độ trễ 1, các giá trị tương quan đều nằm trong khoảng đậm) \Rightarrow q* = 1

2.2.2. Lựa chọn độ trễ p*

Để lựa chọn độ trễ p* phù hợp, ta sẽ vẽ hàm tương quan riêng (PACF) như sau:

1pac dlCPI

Dựa vào hàm tương quan riêng PACF, ta thấy đồ thị PACF đột ngột cắt đứt/bằng 0 kể từ sau độ trễ 2 (về mặt trực quan, kể từ sau độ trễ 2, các giá trị tương quan riêng đều nằm trong khoảng đậm) \Rightarrow p* = {1,2}.

2.3. Ước lượng, kiểm định và dự báo cho các mô hình

2.3.1. Mô hình AR(1)

Ta sẽ tiến hành ước lượng mô hình AR(1) cho chuỗi dlCPI như sau:

1arima lCPI,arima(1,1,0)

Nhìn chung, ta thấy các hệ số ước lượng đều có ý nghĩa thống kê ở mức ý nghĩa 5%. Tuy nhiên, để có thể sử dụng mô hình này để dự báo, ta cần phải đảm bảo phần dư là nhiễu trắng. Do đó, ta sẽ tiến hành kiểm định phần dư là nhiễu trắng bằng kiểm định Portmanteau như sau:

1arima lCPI,arima(1,1,0)
2predict error1,resid
3wntestq error1

Kết quả kiểm định cho thấy P-value (0.8446) > 0.05 \Rightarrow chưa thể bác bỏ giả thuyết H0 \Rightarrow phần dư trong mô hình AR(1) là nhiễu trắng.

Sau đó, chúng ta sẽ sử dụng mô hình này để dự đoán cho 24 tháng (2 năm) tiếp theo như sau:

1sappend,add(24)
2arima lCPI,arima(1,1,0)
3predict flcpi1,y dynamic(m(2021m3))

2.3.2. Mô hình MA(1)

Ta sẽ tiến hành ước lượng mô hình MA(1) cho chuỗi dlCPI như sau:

1arima lCPI,arima(0,1,1)

Nhìn chung, ta thấy các hệ số ước lượng đều có ý nghĩa thống kê ở mức ý nghĩa 5%. Tuy nhiên, để có thể sử dụng mô hình này để dự báo, ta cần phải đảm bảo phần dư là nhiễu trắng. Do đó, ta sẽ tiến hành kiểm định phần dư là nhiễu trắng bằng kiểm định Portmanteau như sau:

1arima lCPI,arima(0,1,1)
2predict error2,resid
3wntestq error2

Kết quả kiểm định cho thấy P-value (0.8052) > 0.05 \Rightarrow chưa thể bác bỏ giả thuyết H0 \Rightarrow phần dư trong mô hình MA(1) là nhiễu trắng.

Sau đó, chúng ta sẽ sử dụng mô hình này để dự đoán cho 24 tháng (2 năm) tiếp theo như sau:

1tsappend,add(24) // nếu trước đó đã tạo rồi thì không cần đoạn code này nữa
2arima lCPI,arima(0,1,1)
3predict flcpi2,y dynamic(m(2021m3))

2.3.3. Mô hình ARIMA(1,1,1)

Ta sẽ tiến hành ước lượng mô hình ARIMA(1,1,1) cho chuỗi dlCPI như sau:

1arima lCPI,arima(1,1,1)

Nhìn chung, ta thấy các hệ số ước lượng đều có ý nghĩa thống kê ở mức ý nghĩa 5%. Tuy nhiên, để có thể sử dụng mô hình này để dự báo, ta cần phải đảm bảo phần dư là nhiễu trắng. Do đó, ta sẽ tiến hành kiểm định phần dư là nhiễu trắng bằng kiểm định Portmanteau như sau:

1arima lCPI,arima(1,1,1)
2predict error3,resid
3wntestq error3

Kết quả kiểm định cho thấy P-value (0.9727) > 0.05 \Rightarrow chưa thể bác bỏ giả thuyết H0 \Rightarrow phần dư trong mô hình ARIMA(1,1,1) là nhiễu trắng.

Sau đó, chúng ta sẽ sử dụng mô hình này để dự đoán cho 24 tháng (2 năm) tiếp theo như sau:

1tsappend,add(24) // nếu trước đó đã tạo rồi thì không cần đoạn code này nữa
2arima lCPI,arima(1,1,1)
3predict flcpi3,y dynamic(m(2021m3))

Nguồn tham khảo:

1. Phạm, Thế Anh. (2022). Giáo trình phân tích định lượng trong kinh tế vĩ mô. Nhà xuất bản Đại học Kinh tế quốc dân.


Bài viết khác
Stata cung cấp một phương thức đơn giản và tinh tế để thực hiện các mô hình hồi quy Bayes bằng cách thêm tiền tố bayes vào trước các lệnh ước lượng. Với hơn 45 lệnh được hỗ trợ, người dùng có thể linh hoạt lựa chọn giữa các phân phối tiền nghiệm mặc định hoặc tự thiết lập theo nhu cầu nghiên cứu. Trong bài viết này, chúng ta sẽ tìm hiểu cách áp dụng hồi quy logistic Bayes và khám phá sức mạnh của phân phối tiền nghiệm Cauchy đối với các hệ số hồi quy. Một thách thức phổ biến khi làm việc với Bayes là việc lựa chọn phân phối tiền nghiệm. Cách tiếp cận thận trọng thường dùng các tiền nghiệm yếu hoặc không có thông tin để đảm bảo tính khách quan dựa trên dữ liệu. Tuy nhiên, các tiền nghiệm không có thông tin đôi khi không đủ để giải quyết những vấn đề như hiện tượng phân tách hoàn hảo trong hồi quy logistic. Ngược lại, nếu không có kiến thức chuyên gia sâu sắc, việc chọn tiền nghiệm có thông tin cũng không hề dễ dàng. Dựa trên khuyến nghị của Gelman và các cộng sự, việc sử dụng phân phối tiền nghiệm Cauchy thông tin yếu là một giải pháp cân bằng hiệu quả. Chuẩn bị dữ liệu và chuẩn hóa Chúng ta sử dụng bộ dữ liệu Iris nổi tiếng để phân loại hoa. Biến phụ thuộc virg phân biệt loài Iris virginica với các loài khác. Các biến độc lập bao gồm chiều dài và chiều rộng của đài hoa và cánh hoa. Theo khuyến nghị của các nhà nghiên cứu, các biến độc lập nên được chuẩn hóa để có trung bình bằng 0 và độ lệch chuẩn bằng 0.5 trước khi áp dụng phân phối tiền nghiệm Cauchy.
Trong bài viết này, bạn sẽ tìm hiểu kiểm định t là gì và cách thực hiện phương pháp này trong ngôn ngữ lập trình r. Đầu tiên, chúng ta sẽ làm quen với một hàm đơn giản giúp thực hiện kiểm định chỉ với một dòng mã nguồn. Sau đó, chúng ta sẽ cùng khám phá bản chất của kiểm định thông qua việc xây dựng từng bước với dữ liệu thực tế về hành khách tàu Titanic. Kiểm định t là gì Kiểm định t là một quy trình thống kê được sử dụng để kiểm tra xem sự khác biệt giữa hai nhóm có ý nghĩa hay chỉ là do ngẫu nhiên. Trong bài viết này, chúng ta sẽ xem xét dữ liệu từ các hành khách trên tàu Titanic, chia họ thành hai nhóm nam và nữ. Giả sử chúng ta muốn kiểm tra giả thuyết rằng nam giới và nữ giới có độ tuổi trung bình như nhau. Nếu dữ liệu cho thấy phụ nữ trẻ hơn nam giới trung bình 2 tuổi, chúng ta cần đặt câu hỏi: liệu đây là một sự khác biệt thực sự hay chỉ là sự trùng hợp ngẫu nhiên? Kiểm định t sẽ giúp chúng ta trả lời câu hỏi đó. Tại sao kiểm định t lại quan trọng
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội