messenger_logo
Liên hệ qua Messenger
SciEco

Ước lượng OLS và các kiểm định

NH
Nguyễn Hà My
Ngày viết: 04/07/2023

Phương pháp OLS (Ordinary Least Square) do nhà toán học Đức Carl Friedrich Gauss đưa ra. Mục đích của phương pháp này là tìm giá trị của các hệ số hồi quy sao cho khoảng cách giữa giá trị thực của quan sát với giá trị được dự đoán của nó là gần nhất.

1. Đơn vị đo trong ước lượng OLS

Khi biến độc lập và (hoặc) biến phụ thuộc thay đổi đơn vị đo sẽ ảnh hưởng tới giá trị ước lượng OLS. Ví dụ: Hồi quy bằng phương pháp OLS chiều cao của con theo chiều cao của cha bằng mô hình sau:

Yi^=Bo^+B1^X1\widehat{Y_{i}} = \widehat{B_{o}} + \widehat{B_{1}}*X_{1}

Thu được mô hình hồi quy:

Chieˆˋu cao con (cm)=150+0.1Chieˆˋu cao cha (cm)+e\text{Chiều cao con (cm)} = 150 + 0.1* \text{Chiều cao cha (cm)} + e

Nếu

Chiều cao của người cha chuyển từ cm sang m: β1^\widehat{\beta_1} tăng 100 lần

Chiều cao của người con chuyển từ cm sang m: β0^\widehat{\beta_0} β1^\widehat{\beta_1} giảm 100 lần

Mô hình
Biến phụ thuộc
Biến độc lập
Cách giải thích
Lin-lin
y
x
\triangle y = \beta_1
Lin-log
y
log(x)
\triangle y = \frac{\beta_1}{100}%\triangle
Log-lin
log(y)
x
%\triangle y = (100.\beta_1)\triangle x
Log-log
log(y)
log(x)

Ví dụ 1: Xem số liệu về "wage and education"

Wage: lương được đo bằng usd/giờ vào năm 1976 tại Mỹ

Educ: số năm học tại trường

Lin-lin

wage^=0.90+0.54edu\widehat{wage} = -0.90 + 0.54\textrm{edu}

Mỗi năm học tăng thêm được dự đoán làm tăng mức lương theo giờ là 0,54 USD

Log-lin

Log(wage)^=0.90+0.54edu\widehat{Log(wage)} = -0.90 + 0.54\text{edu}

Mỗi năm học tăng thêm sẽ làm tăng lương ở một mức % cố định. Trong ví dụ trên, với mỗi năm học tăng lên sẽ làm mức lương theo giờ tăng 54%.

Ví dụ 2: Xem số liệu về giá và lượng cầu của một hàng hoá .

Price: Giá (tính theo USD)

Demand: lượng cầu (đơn vị: nghìn chiếc)

Lin-log

Cách giải thích

Khi giá hàng hoá X tăng 1% thì lượng cầu của loại hàng này giảm 0.94 ngàn chiếc.

Log-log

Cách giải thích:

Khi giá hàng hoá X tăng 1% thì lượng cầu của hàng hoá này tăng 93,4%.


2. Các bước thực hiện mô hình hồi quy

Bước 1: Chuẩn bị mô hình về mặt lý thuyết

Bước 2: Chuẩn bị số liệu

Bước 3: Ước lượng mô hình

Bước 4: Chẩn đoán lỗi

3. Thực hành

Bài toán: Đánh giá các yếu tố ảnh hưởng GRDP tại một số tỉnh thành của Việt Nam

Giả thuyết:
H1H_1: Giá trị của chỉ số ICT có ảnh hưởng tích cực tới tổng thu nhập của tinh

H2H_2: Số dân của tỉnh có ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H3H_3: Lực lượng lao động của ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H4H_4: Số lượng trường THPT trong tỉnh có ảnh hưởng tích cực tới tổng thu nhập

Mô hình ước lượng lý thuyết

GRDP^=β0^+β1^ICT+β2^POP+β3^LABOR+β4^TER\widehat{GRDP} = \widehat{\beta_0} + \widehat{\beta_1}ICT + \widehat{\beta_2}POP + \widehat{\beta_3}LABOR + \widehat{\beta_4}TER

3.1 Thực hiện mô hình hồi quy tuyến tính

1clear 
2cd "/Users/nguyenkien/Library/CloudStorage/OneDrive-SharedLibraries-SciEco/Ha My Nguyen - STATA/Basic STATA/Teaching/Buổi 8" 
3use cactinh.dta, clear //mo file chua data 

Ở bước này, ta cần thực hiện các lệnh thống kê mô tả dữ liệu để kiểm tra các giá trị khuyết thiếu và giá trị ngoại lai

1summarize GRDP ICT POP LABOR TER 

Diễn giải kết quả hồi quy:

Các hệ số hồi quy còn lại diễn giải tương tự, tuy nhiên cần chú ý đến đơn vị của biến khi diễn giải hệ số hồi quy.


Các kiểm định


Bài viết khác
Trong các bài viết trước, tôi đã hướng dẫn cách tính công suất thống kê cho kiểm định t, tích hợp mô phỏng vào lệnh power trong Stata, cũng như áp dụng cho mô hình hồi quy tuyến tính và hồi quy logistic. Hôm nay, chúng ta sẽ tiến thêm một bước xa hơn bằng cách ước lượng công suất thống kê cho các mô hình đa cấp và mô hình dữ liệu dọc thông qua mô phỏng. Mục tiêu của chúng ta là xây dựng một chương trình có khả năng tính toán công suất thống kê cho các giá trị tham số khác nhau của mô hình. Ví dụ, chúng ta có thể đánh giá sự thay đổi của công suất khi số lượng quan sát ở cấp độ 1 và cấp độ 2 thay đổi trong một nghiên cứu theo thời gian. Các bước chuẩn bị cho mô phỏng mô hình đa cấp Để thực hiện mô phỏng một cách hệ thống, chúng ta sẽ tuân theo quy trình gồm bảy bước cụ thể. Trong ví dụ này, hãy tưởng tượng bạn đang lập kế hoạch cho một nghiên cứu dọc về trọng lượng của trẻ em và bạn đặc biệt quan tâm đến sự tương tác giữa độ tuổi và giới tính.
Stata cung cấp một phương thức đơn giản và tinh tế để thực hiện các mô hình hồi quy Bayes bằng cách thêm tiền tố bayes vào trước các lệnh ước lượng. Với hơn 45 lệnh được hỗ trợ, người dùng có thể linh hoạt lựa chọn giữa các phân phối tiền nghiệm mặc định hoặc tự thiết lập theo nhu cầu nghiên cứu. Trong bài viết này, chúng ta sẽ tìm hiểu cách áp dụng hồi quy logistic Bayes và khám phá sức mạnh của phân phối tiền nghiệm Cauchy đối với các hệ số hồi quy. Một thách thức phổ biến khi làm việc với Bayes là việc lựa chọn phân phối tiền nghiệm. Cách tiếp cận thận trọng thường dùng các tiền nghiệm yếu hoặc không có thông tin để đảm bảo tính khách quan dựa trên dữ liệu. Tuy nhiên, các tiền nghiệm không có thông tin đôi khi không đủ để giải quyết những vấn đề như hiện tượng phân tách hoàn hảo trong hồi quy logistic. Ngược lại, nếu không có kiến thức chuyên gia sâu sắc, việc chọn tiền nghiệm có thông tin cũng không hề dễ dàng. Dựa trên khuyến nghị của Gelman và các cộng sự, việc sử dụng phân phối tiền nghiệm Cauchy thông tin yếu là một giải pháp cân bằng hiệu quả. Chuẩn bị dữ liệu và chuẩn hóa Chúng ta sử dụng bộ dữ liệu Iris nổi tiếng để phân loại hoa. Biến phụ thuộc virg phân biệt loài Iris virginica với các loài khác. Các biến độc lập bao gồm chiều dài và chiều rộng của đài hoa và cánh hoa. Theo khuyến nghị của các nhà nghiên cứu, các biến độc lập nên được chuẩn hóa để có trung bình bằng 0 và độ lệch chuẩn bằng 0.5 trước khi áp dụng phân phối tiền nghiệm Cauchy.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội