Hôm nay, đội ngũ SciEco gửi tới các bạn bài viết về cách diễn giải hệ số hồi quy với dạng hàm log. Trong hàm log-log, cả biến đầu vào và biến phụ thuộc đều được lấy logarit tự nhiên. Do đó, tác động của hệ số góc β1 trong hàm log-log sẽ thay đổi như sau:
- Nếu β1 > 1: Khi giá trị của biến đầu vào X tăng lên, giá trị của biến phụ thuộc Y tăng với tốc độ nhanh hơn theo hàm mũ.
- Nếu 0 < β1< 1: Khi giá trị của biến đầu vào X tăng lên, giá trị của biến phụ thuộc Y tăng với tốc độ chậm hơn theo hàm mũ.
- Nếu β1 < 0 : Khi giá trị của biến đầu vào X tăng lên, giá trị của biến phụ thuộc Y giảm theo hàm mũ
Như vậy hàm log-log thường được sử dụng khi muốn phân tích tác động của biến đầu vào lên biến phụ thuộc theo cách tỷ lệ. Trong khi đó, hàm lin-lin thường được sử dụng khi muốn xem xét tác động của biến đầu vào lên biến phụ thuộc theo cách tuyến tính.
Dạng hàm lin-lin:
Y=β0+β1X+ε ⇒ Khi X tăng 1 đơn vị thì Y tăng β1 đơn vị
Dạng hàm log-log:
log(Y)=β0+β1log(X)+ε ⇒ Khi log(X) tăng 1 đơn vị thì log(Y) tăng β1 đơn vị
⇒ Khi log(X) tăng log(1.01) đơn vị thì log(Y) tăng β1×log(1.01) đơn vị
Biến đổi:
log(X)+log(1.01)=log(X×1.01) log(Y)+β1log(1.01)=log(Y)+log(1.01β1)=log(Y×1.01β1) ⇒ Khi X tăng 1% thì Y tăng 1.01β1 lần
Ví dụ: khi β1=2
Khi X tăng 1% thì Y tăng 1.012≈1.02 (lần) ∼ tăng 2%
Kết luận: Khi X tăng 1% thì Y tăng β1%
1. Giới thiệu
Phân cụm đồ thị (K-means Clustering) là quá trình phân chia hoặc tách biệt dữ liệu theo các nhóm dựa trên các đặc điểm chung sau đó được biểu thị qua một đồ thị. Phù hợp với những công việc cần phân khúc các tệp khách hàng trong thương mại, phân tích thị trường. Điều này giúp các công ty hiểu rõ hơn về sở thích và nhu cầu của từng nhóm, qua đó đưa ra chiến lược marketing phù hợp.
Trong thuật toán phân cụm, K-means là một thuật toán phân cụm đơn giản và phổ biến trong học máy (machine learning) để phân cụm các điểm dữ liệu thành các nhóm riêng biệt dựa trên các đặc điểm của chúng. Thuật toán này dùng để chia dữ liệu thành các nhóm dựa trên khoảng cách giữa các điểm dữ liệu với nhau.
2. Ta cài đặt những thư viện sau
Trong thời đại của số hóa và khoa học dữ liệu lên ngôi, khả năng phân tích, giải mã và trích xuất thông tin hữu ích từ khối lượng dữ liệu khổng lồ là một kỹ năng không thể thiếu để giúp bạn thích nghi với yêu cầu của công việc!
Đặc biệt, với việc làm chủ STATA, phần mềm phân tích dữ liệu có giao diện thân thiện và khả năng xử lý dữ liệu mạnh mẽ sẽ là công cụ đắc lực cho bạn. Để có thể giúp bạn chinh phục STATA, SciEco ở đây để mang đến cho bạn khóa học STATA đầy hấp dẫn:
Nội dung khóa học chi tiết:
Bài 1: Giới thiệu về STATA và VES