messenger_logo
Liên hệ qua Messenger
SciEco

Ước lượng OLS và các kiểm định

NH
Nguyễn Hà My
Ngày viết: 04/07/2023

Phương pháp OLS (Ordinary Least Square) do nhà toán học Đức Carl Friedrich Gauss đưa ra. Mục đích của phương pháp này là tìm giá trị của các hệ số hồi quy sao cho khoảng cách giữa giá trị thực của quan sát với giá trị được dự đoán của nó là gần nhất.

1. Đơn vị đo trong ước lượng OLS

Khi biến độc lập và (hoặc) biến phụ thuộc thay đổi đơn vị đo sẽ ảnh hưởng tới giá trị ước lượng OLS. Ví dụ: Hồi quy bằng phương pháp OLS chiều cao của con theo chiều cao của cha bằng mô hình sau:

Yi^=Bo^+B1^X1\widehat{Y_{i}} = \widehat{B_{o}} + \widehat{B_{1}}*X_{1}

Thu được mô hình hồi quy:

Chieˆˋu cao con (cm)=150+0.1Chieˆˋu cao cha (cm)+e\text{Chiều cao con (cm)} = 150 + 0.1* \text{Chiều cao cha (cm)} + e

Nếu

Chiều cao của người cha chuyển từ cm sang m: β1^\widehat{\beta_1} tăng 100 lần

Chiều cao của người con chuyển từ cm sang m: β0^\widehat{\beta_0} β1^\widehat{\beta_1} giảm 100 lần

Mô hình
Biến phụ thuộc
Biến độc lập
Cách giải thích
Lin-lin
y
x
\triangle y = \beta_1
Lin-log
y
log(x)
\triangle y = \frac{\beta_1}{100}%\triangle
Log-lin
log(y)
x
%\triangle y = (100.\beta_1)\triangle x
Log-log
log(y)
log(x)

Ví dụ 1: Xem số liệu về "wage and education"

Wage: lương được đo bằng usd/giờ vào năm 1976 tại Mỹ

Educ: số năm học tại trường

Lin-lin

wage^=0.90+0.54edu\widehat{wage} = -0.90 + 0.54\textrm{edu}

Mỗi năm học tăng thêm được dự đoán làm tăng mức lương theo giờ là 0,54 USD

Log-lin

Log(wage)^=0.90+0.54edu\widehat{Log(wage)} = -0.90 + 0.54\text{edu}

Mỗi năm học tăng thêm sẽ làm tăng lương ở một mức % cố định. Trong ví dụ trên, với mỗi năm học tăng lên sẽ làm mức lương theo giờ tăng 54%.

Ví dụ 2: Xem số liệu về giá và lượng cầu của một hàng hoá .

Price: Giá (tính theo USD)

Demand: lượng cầu (đơn vị: nghìn chiếc)

Lin-log

Cách giải thích

Khi giá hàng hoá X tăng 1% thì lượng cầu của loại hàng này giảm 0.94 ngàn chiếc.

Log-log

Cách giải thích:

Khi giá hàng hoá X tăng 1% thì lượng cầu của hàng hoá này tăng 93,4%.


2. Các bước thực hiện mô hình hồi quy

Bước 1: Chuẩn bị mô hình về mặt lý thuyết

Bước 2: Chuẩn bị số liệu

Bước 3: Ước lượng mô hình

Bước 4: Chẩn đoán lỗi

3. Thực hành

Bài toán: Đánh giá các yếu tố ảnh hưởng GRDP tại một số tỉnh thành của Việt Nam

Giả thuyết:
H1H_1: Giá trị của chỉ số ICT có ảnh hưởng tích cực tới tổng thu nhập của tinh

H2H_2: Số dân của tỉnh có ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H3H_3: Lực lượng lao động của ảnh hưởng tích cực tới tổng thu nhập của tỉnh

H4H_4: Số lượng trường THPT trong tỉnh có ảnh hưởng tích cực tới tổng thu nhập

Mô hình ước lượng lý thuyết

GRDP^=β0^+β1^ICT+β2^POP+β3^LABOR+β4^TER\widehat{GRDP} = \widehat{\beta_0} + \widehat{\beta_1}ICT + \widehat{\beta_2}POP + \widehat{\beta_3}LABOR + \widehat{\beta_4}TER

3.1 Thực hiện mô hình hồi quy tuyến tính

1clear 
2cd "/Users/nguyenkien/Library/CloudStorage/OneDrive-SharedLibraries-SciEco/Ha My Nguyen - STATA/Basic STATA/Teaching/Buổi 8" 
3use cactinh.dta, clear //mo file chua data 

Ở bước này, ta cần thực hiện các lệnh thống kê mô tả dữ liệu để kiểm tra các giá trị khuyết thiếu và giá trị ngoại lai

1summarize GRDP ICT POP LABOR TER 

Diễn giải kết quả hồi quy:

Các hệ số hồi quy còn lại diễn giải tương tự, tuy nhiên cần chú ý đến đơn vị của biến khi diễn giải hệ số hồi quy.


Các kiểm định


Bài viết khác
Trong thế giới trực quan hóa dữ liệu không gian, việc biểu diễn độ cao địa hình luôn là một chủ đề hấp dẫn. Hưởng ứng ngày thứ hai của thử thách làm bản đồ trong ba mươi ngày với chủ đề về các đường nét, chúng ta sẽ cùng khám phá cách biến đổi một mô hình độ cao kỹ thuật số thành bản đồ dạng ridgeline. Thay vì sử dụng các mảng màu truyền thống, bản đồ ridgeline tạo ra hiệu ứng nổi ba chiều giả lập bằng cách xếp chồng các đường viền lên nhau, mang lại một góc nhìn đậm chất nghệ thuật nhưng vẫn giữ được tính khoa học của dữ liệu không gian. Bài viết này sẽ hướng dẫn bạn cách thực hiện điều đó bằng ngôn ngữ lập trình R với bộ dữ liệu địa hình của Thụy Sĩ. Chuẩn bị công cụ và tải dữ liệu không gian Để bắt đầu, chúng ta cần nạp các thư viện xử lý dữ liệu không gian và vẽ biểu đồ cốt lõi trong R. Chúng ta sẽ sử dụng rnaturalearth để lấy đường biên giới quốc gia của Thụy Sĩ và elevatr để tải dữ liệu độ cao địa hình. Dữ liệu độ cao này dạng raster, một cấu trúc dữ liệu lưới quen thuộc trong xử lý ảnh vệ tinh và bản đồ. Sau khi lấy được biên giới Thụy Sĩ, chúng ta tải dữ liệu raster độ cao ở mức thu phóng là chín và đặt tên cho biến độ cao này là z để tiện thao tác trong các bước tiếp theo.
Trong bài viết này, SciEco sẽ giúp bạn làm rõ sự khác biệt giữa hai thuật ngữ thường xuyên xuất hiện trên các trang báo kinh tế quốc tế (Stock, Flow or Impulse?, n.d.). Mặc dù có vẻ đơn giản, nhưng chúng lại dễ gây nhầm lẫn, đặc biệt là khi bạn tiếp cận những bài viết chuyên sâu về lĩnh vực kinh tế.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội