Hôm nay, đội ngũ SciEco gửi tới các bạn bài viết về cách diễn giải hệ số hồi quy với dạng hàm log. Trong hàm log-log, cả biến đầu vào và biến phụ thuộc đều được lấy logarit tự nhiên. Do đó, tác động của hệ số góc β1 trong hàm log-log sẽ thay đổi như sau:
- Nếu β1 > 1: Khi giá trị của biến đầu vào X tăng lên, giá trị của biến phụ thuộc Y tăng với tốc độ nhanh hơn theo hàm mũ.
- Nếu 0 < β1< 1: Khi giá trị của biến đầu vào X tăng lên, giá trị của biến phụ thuộc Y tăng với tốc độ chậm hơn theo hàm mũ.
- Nếu β1 < 0 : Khi giá trị của biến đầu vào X tăng lên, giá trị của biến phụ thuộc Y giảm theo hàm mũ
Như vậy hàm log-log thường được sử dụng khi muốn phân tích tác động của biến đầu vào lên biến phụ thuộc theo cách tỷ lệ. Trong khi đó, hàm lin-lin thường được sử dụng khi muốn xem xét tác động của biến đầu vào lên biến phụ thuộc theo cách tuyến tính.
Dạng hàm lin-lin:
Y=β0+β1X+ε ⇒ Khi X tăng 1 đơn vị thì Y tăng β1 đơn vị
Dạng hàm log-log:
log(Y)=β0+β1log(X)+ε ⇒ Khi log(X) tăng 1 đơn vị thì log(Y) tăng β1 đơn vị
⇒ Khi log(X) tăng log(1.01) đơn vị thì log(Y) tăng β1×log(1.01) đơn vị
Biến đổi:
log(X)+log(1.01)=log(X×1.01) log(Y)+β1log(1.01)=log(Y)+log(1.01β1)=log(Y×1.01β1) ⇒ Khi X tăng 1% thì Y tăng 1.01β1 lần
Ví dụ: khi β1=2
Khi X tăng 1% thì Y tăng 1.012≈1.02 (lần) ∼ tăng 2%
Kết luận: Khi X tăng 1% thì Y tăng β1%

Phương pháp ước lượng tối đa khả dĩ mục tiêu thường được gọi là TMLE là một công cụ mạnh mẽ trong phân tích nhân quả. Nhiều nhà nghiên cứu từng nghe về đặc tính song trùng bền vững của phương pháp này nhưng chỉ thực sự thấu hiểu nó khi tiến hành giả lập dữ liệu thực tế. Phương pháp này hoạt động cực kỳ hiệu quả khi một trong hai mô hình kết quả hoặc mô hình điều trị được thiết lập chính xác. Việc kết hợp thuật toán XGBoost cùng TMLE giúp tự động bắt trọn các mối quan hệ phức tạp trong dữ liệu mà không cần phải khai báo các tương tác thủ công. Bài viết này sẽ đi sâu vào cơ chế vận hành của phương pháp thông qua việc giả lập dữ liệu cụ thể trong môi trường R.
Khái Niệm Về Tmle
TMLE là một phương pháp thống kê tiên tiến được sử dụng để ước lượng các tác động nhân quả trong các nghiên cứu quan sát và thử nghiệm lâm sàng. Phương pháp này kết hợp linh hoạt giữa các thuật toán học máy và kỹ thuật thống kê truyền thống nhằm mang lại các ước lượng vững cho hiệu quả tác động của can thiệp, đồng thời kiểm soát tốt các yếu tố nhiễu.
Quy trình vận hành của TMLE gồm hai giai đoạn chính. Đầu tiên, hệ thống sẽ ước lượng mô hình kết quả và mô hình điều trị. Sau đó, các ước lượng này được sử dụng để hiệu chỉnh nhằm hướng trực tiếp đến tham số mục tiêu cần nghiên cứu. Cách tiếp cận này đặc biệt hữu ích trong các bối cảnh mà phương pháp truyền thống dễ bị lệch hoặc hoạt động kém hiệu quả do sự xuất hiện của các mối quan hệ phi tuyến phức tạp.

Trong phân tích khoa học dữ liệu, việc ước lượng tham số mô hình là một bước quan trọng, nhưng việc đảm bảo mô hình được chỉ định chính xác còn thiết yếu hơn. Bài viết này sẽ đi sâu vào cách kiểm định thông số kỹ thuật mô hình bằng phương pháp momen tổng quát (GMM) trong Stata, đặc biệt khi làm việc với các mô hình nhận dạng thừa. Chúng ta sẽ khám phá cách sử dụng phiên bản chương trình của lệnh GMM, vốn rất hữu ích cho các mô hình phức tạp, và cách kiểm định các ràng buộc nhận dạng thừa bằng thống kê J của Hansen.
Mô Hình Poisson Với Biến Giải Thích Nội Sinh
Chúng ta sẽ sử dụng GMM để ước lượng các tham số của một mô hình Poisson có biến giải thích nội sinh. Biến giải thích nội sinh là những biến có thể tương quan với thành phần sai số của mô hình, dẫn đến ước lượng không nhất quán nếu không được xử lý đúng cách.
Mô hình hồi quy Poisson của biến phụ thuộc y_i trên các biến ngoại sinh x_i và biến nội sinh y_{2,i} có dạng kỳ vọng của y_i với điều kiện các biến x_i, y_{2,i} và biến nhiễu epsilon_i được biểu thị qua hàm mũ của tổng beta_1 nhân x_i cộng beta_2 nhân y_{2,i}, rồi cộng thêm biến nhiễu epsilon_i. Biến nhiễu epsilon_i có giá trị trung bình bằng 0. Các biến giải thích y_{2,i} có thể tương quan với epsilon_i. Công thức này tương tự như công thức của lệnh ivpoisson với các sai số cộng gộp.