Ước lượng OLS và các kiểm định

Phương pháp OLS (Ordinary Least Square) do nhà toán học Đức Carl Friedrich Gauss đưa ra. Mục đích của phương pháp này là tìm giá trị của các hệ số hồi quy sao cho khoảng cách giữa giá trị thực của quan sát với giá trị được dự đoán của nó là gần nhất.

1. Đơn vị đo trong ước lượng OLS

Khi biến độc lập và (hoặc) biến phụ thuộc thay đổi đơn vị đo sẽ ảnh hưởng tới giá trị ước lượng OLS. Ví dụ: Hồi quy bằng phương pháp OLS chiều cao của con theo chiều cao của cha bằng mô hình sau:

\widehat{Y_{i}} = \widehat{B_{o}} + \widehat{B_{1}}*X_{1}

Thu được mô hình hồi quy:

\text{Chiều cao con (cm)} = 150 + 0.1* \text{Chiều cao cha (cm)} + e

Nếu

Chiều cao của người cha chuyển từ cm sang m: $\widehat{\beta_1}$ tăng 100 lần

Chiều cao của người con chuyển từ cm sang m: $\widehat{\beta_0}$ và $\widehat{\beta_1}$ giảm 100 lần

Mô hình	Biến phụ thuộc	Biến độc lập	Cách giải thích
Lin-lin	y	x	\triangle y = \beta_1
Lin-log	y	log(x)	\triangle y = \frac{\beta_1}{100}%\triangle
Log-lin	log(y)	x	%\triangle y = (100.\beta_1)\triangle x
Log-log	log(y)	log(x)

Ví dụ 1: Xem số liệu về "wage and education"

Wage: lương được đo bằng usd/giờ vào năm 1976 tại Mỹ

Educ: số năm học tại trường

Lin-lin

\widehat{wage} = -0.90 + 0.54\textrm{edu}

Mỗi năm học tăng thêm được dự đoán làm tăng mức lương theo giờ là 0,54 USD

Log-lin

\widehat{Log(wage)} = -0.90 + 0.54\text{edu}

Mỗi năm học tăng thêm sẽ làm tăng lương ở một mức % cố định. Trong ví dụ trên, với mỗi năm học tăng lên sẽ làm mức lương theo giờ tăng 54%.

Ví dụ 2: Xem số liệu về giá và lượng cầu của một hàng hoá .

Price: Giá (tính theo USD)

Demand: lượng cầu (đơn vị: nghìn chiếc)

Lin-log

Cách giải thích

Khi giá hàng hoá X tăng 1% thì lượng cầu của loại hàng này giảm 0.94 ngàn chiếc.

Log-log

Cách giải thích:

Khi giá hàng hoá X tăng 1% thì lượng cầu của hàng hoá này tăng 93,4%.

2. Các bước thực hiện mô hình hồi quy

Bước 1: Chuẩn bị mô hình về mặt lý thuyết

Bước 2: Chuẩn bị số liệu

Bước 3: Ước lượng mô hình

Bước 4: Chẩn đoán lỗi

3. Thực hành

Bài toán: Đánh giá các yếu tố ảnh hưởng GRDP tại một số tỉnh thành của Việt Nam

Giả thuyết:
$H_1$ : Giá trị của chỉ số ICT có ảnh hưởng tích cực tới tổng thu nhập của tinh

$H_2$ : Số dân của tỉnh có ảnh hưởng tích cực tới tổng thu nhập của tỉnh

$H_3$ : Lực lượng lao động của ảnh hưởng tích cực tới tổng thu nhập của tỉnh

$H_4$ : Số lượng trường THPT trong tỉnh có ảnh hưởng tích cực tới tổng thu nhập

Mô hình ước lượng lý thuyết

\widehat{GRDP} = \widehat{\beta_0} + \widehat{\beta_1}ICT + \widehat{\beta_2}POP + \widehat{\beta_3}LABOR + \widehat{\beta_4}TER

3.1 Thực hiện mô hình hồi quy tuyến tính

Nhập dữ liệu

1clear 
2cd "/Users/nguyenkien/Library/CloudStorage/OneDrive-SharedLibraries-SciEco/Ha My Nguyen - STATA/Basic STATA/Teaching/Buổi 8" 
3use cactinh.dta, clear //mo file chua data

Chuẩn bị dữ liệu

Ở bước này, ta cần thực hiện các lệnh thống kê mô tả dữ liệu để kiểm tra các giá trị khuyết thiếu và giá trị ngoại lai

1summarize GRDP ICT POP LABOR TER

Diễn giải kết quả hồi quy:

MSE: sai số bình phương bình quân
RMSE: căn bậc 2 của MSE, được sử dụng như tiêu chuẩn đo chất lượng của mô hình. RMSE càng nhỏ càng tốt
R-squared: Tỷ lệ của phương sai trong biến phụ thuộc có thể được giải thích bởi biến giải thích. Trong ví dụ này, 75.44% sự thay đổi trong GRDP có thể được giải thích bởi các biến độc lập.
Coef.: Hệ số hồi quy, cho thấy sự thay đổi trung bình trong biến phụ thuộc liên quan đến sự gia tăng trong biến giải thích như thế nào. Trong ví dụ này:
Hệ số hồi quy của ICT là 66920.14 cho thấy: Trong điều kiện các yếu tố khác không đổi, ICT tăng 1 đơn vị sẽ làm GDP của địa phương tăng 66,920 tỷ đồng. Tuy nhiên, do ICT là chỉ số với độ chia nhỏ nhất là 0.01 và tối đa là 1, nên kết quả hồi quy có thể được diễn giải là: Trong điều kiện các yếu tố khác không đổi, ICT tăng 0.01 đơn vị sẽ làm GDP của địa phương tăng trung bình 669 tỷ đồng
Hệ số hồi quy của POP là 53.09 cho thấy: Trong điều kiện các yếu tố khác không đổi, dân số của địa phương tăng 1 nghìn người sẽ khiến GDP của địa phương tăng trung bình 53.1 tỷ đồng

Các hệ số hồi quy còn lại diễn giải tương tự, tuy nhiên cần chú ý đến đơn vị của biến khi diễn giải hệ số hồi quy.

Các kiểm định

Kiểm định tính có ý nghĩa của hệ số hồi quy: Từ kết quả hồi quy, ta thấy giá trị p-value ( P>|t|) đều nhỏ hơn 0.05. Vì vậy, ta có thể kết luận rằng các hệ số hồi quy có ý nghĩa thống kê/ có mối quan hệ có ý nghĩa thống kê giữa các biến. Có 3 mức ý nghĩa phổ biến là 0.01 0.05 và 0.1
Kiểm định độ phù hợp cả mô hình: Ta thấy Prob > F: 0.000 <0.05 => Bác bỏ giả thuyết H0. Mô hình hồi quy là phù hợp