messenger_logo
Liên hệ qua Messenger
SciEco

Ước lượng OLS và các kiểm định

NH
Nguyễn Hà My
Ngày viết: 04/07/2023

Phương pháp OLS (Ordinary Least Square) do nhà toán học Đức Carl Friedrich Gauss đưa ra. Mục đích của phương pháp này là tìm giá trị của các hệ số hồi quy sao cho khoảng cách giữa giá trị thực của quan sát với giá trị được dự đoán của nó là gần nhất.

1. Đơn vị đo trong ước lượng OLS

Khi biến độc lập và (hoặc) biến phụ thuộc thay đổi đơn vị đo sẽ ảnh hưởng tới giá trị ước lượng OLS. Ví dụ: Hồi quy bằng phương pháp OLS chiều cao của con theo chiều cao của cha bằng mô hình sau:

Yi^=Bo^+B1^X1\widehat{Y_{i}} = \widehat{B_{o}} + \widehat{B_{1}}*X_{1}

Thu được mô hình hồi quy:

Chieˆˋu cao con (cm)=150+0.1Chieˆˋu cao cha (cm)+e\text{Chiều cao con (cm)} = 150 + 0.1* \text{Chiều cao cha (cm)} + e

Nếu

Chiều cao của người cha chuyển từ cm sang m: β1^\widehat{\beta_1} tăng 100 lần

Chiều cao của người con chuyển từ cm sang m: β0^\widehat{\beta_0} β1^\widehat{\beta_1} giảm 100 lần

Mô hình
Biến phụ thuộc
Biến độc lập
Cách giải thích
Lin-lin
y
x
\triangle y = \beta_1
Lin-log
y
log(x)
\triangle y = \frac{\beta_1}{100}%\triangle
Log-lin
log(y)
x
%\triangle y = (100.\beta_1)\triangle x
Log-log
log(y)
log(x)

Ví dụ 1: Xem số liệu về "wage and education"

Wage: lương được đo bằng usd/giờ vào năm 1976 tại Mỹ

Educ: số năm học tại trường

Lin-lin

wage^=0.90+0.54edu\widehat{wage} = -0.90 + 0.54\textrm{edu}

Mỗi năm học tăng thêm được dự đoán làm tăng mức lương theo giờ là 0,54 USD

Log-lin

Log(wage)^=0.90+0.54edu\widehat{Log(wage)} = -0.90 + 0.54\text{edu}

Mỗi năm học tăng thêm sẽ làm tăng lương ở một mức % cố định. Trong ví dụ trên, với mỗi năm học tăng lên sẽ làm mức lương theo giờ tăng 54%.

Ví dụ 2: Xem số liệu về giá và lượng cầu của một hàng hoá .

Price: Giá (tính theo USD)

Demand: lượng cầu (đơn vị: nghìn chiếc)

Lin-log

Cách giải thích

Khi giá hàng hoá X tăng 1% thì lượng cầu của loại hàng này giảm 0.94 ngàn chiếc.

Log-log

Cách giải thích:

Khi giá hàng hoá X tăng 1% thì lượng cầu của hàng hoá này tăng 93,4%.


2. Các bước thực hiện mô hình hồi quy

Bước 1: Chuẩn bị mô hình về mặt lý thuyết

Bước 2: Chuẩn bị số liệu

Bước 3: Ước lượng mô hình

Bước 4: Chẩn đoán lỗi

3. Thực hành

Bài toán: Đánh giá các yếu tố ảnh hưởng GRDP tại một số tỉnh thành của Việt Nam

Giả thuyết:
H1H_1: Giá trị của chỉ số ICT có ảnh hưởng tích cực tới tổng thu nhập của tinh

H2H_2: Số dân của tỉnh có ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H3H_3: Lực lượng lao động của ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H4H_4: Số lượng trường THPT trong tỉnh có ảnh hưởng tích cực tới tổng thu nhập

Mô hình ước lượng lý thuyết

GRDP^=β0^+β1^ICT+β2^POP+β3^LABOR+β4^TER\widehat{GRDP} = \widehat{\beta_0} + \widehat{\beta_1}ICT + \widehat{\beta_2}POP + \widehat{\beta_3}LABOR + \widehat{\beta_4}TER

3.1 Thực hiện mô hình hồi quy tuyến tính

1clear 
2cd "/Users/nguyenkien/Library/CloudStorage/OneDrive-SharedLibraries-SciEco/Ha My Nguyen - STATA/Basic STATA/Teaching/Buổi 8" 
3use cactinh.dta, clear //mo file chua data 

Ở bước này, ta cần thực hiện các lệnh thống kê mô tả dữ liệu để kiểm tra các giá trị khuyết thiếu và giá trị ngoại lai

1summarize GRDP ICT POP LABOR TER 

Diễn giải kết quả hồi quy:

Các hệ số hồi quy còn lại diễn giải tương tự, tuy nhiên cần chú ý đến đơn vị của biến khi diễn giải hệ số hồi quy.


Các kiểm định


Bài viết khác
Trong quá trình phân tích dữ liệu, việc trực quan hóa các dự báo từ mô hình luôn là một thách thức, đặc biệt là khi chúng ta đối mặt với các mô hình có nhiều biến tương tác. Mặc dù visreg hay ggeffects là những công cụ phổ biến, nhưng sự xuất hiện của modelbased trong hệ sinh thái easystats đã mang đến một hướng tiếp cận mới mẻ và mạnh mẽ hơn để xử lý các tương tác phức tạp trong mô hình hồi quy tổng quát. Khởi đầu với hệ sinh thái easystats Gói thư viện modelbased là một thành phần quan trọng của easystats, được thiết kế để đơn giản hóa việc phân tích và trình bày các mô hình thống kê. Để bắt đầu, chúng ta sẽ sử dụng dữ liệu thực tế về độ che phủ của san hô và sự phong phú của các loài cá để minh họa cách gói thư viện này hoạt động.
Trong các bài viết trước, chúng ta đã tìm hiểu cách sử dụng lệnh table thế hệ mới để tạo bảng và các lệnh collect để tùy chỉnh cũng như xuất dữ liệu. Trong bài viết này, tôi sẽ hướng dẫn các bạn cách kết hợp những công cụ này để tạo ra một bảng thống kê mô tả chuyên nghiệp, thường được gọi là Bảng 1 trong các báo cáo khoa học. Mục tiêu của chúng ta là tạo ra một bảng dữ liệu hoàn chỉnh trong tài liệu Microsoft Word với định dạng chuẩn mực. Khởi Tạo Bảng Cơ Bản Đầu tiên, chúng ta sẽ sử dụng bộ dữ liệu NHANES và lệnh table để tạo cấu trúc bảng ban đầu. Tôi sẽ sử dụng tùy chọn nototal để loại bỏ dòng tổng số nhằm giữ cho bảng gọn gàng hơn.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội