messenger_logo
Liên hệ qua Messenger
SciEco

[KHOÁ HỌC R] Phân tích dữ liệu và Lập báo cáo phân tích với ngôn ngữ R (R Programming)

Đn
Đội ngũ SciEco
Ngày viết: 19/09/2024

Khoá học "Lập báo cáo và phân tích dữ liệu với ngôn ngữ R" là một khóa học thực tế và chuyên sâu nhằm giúp bạn nắm vững kỹ năng sử dụng ngôn ngữ lập trình R để thực hiện phân tích dữ liệu và tạo báo cáo chất lượng cao.

Trong khoá học này, bạn sẽ được hướng dẫn từ cơ bản đến nâng cao về cách sử dụng R để xử lý và biểu diễn dữ liệu một cách hiệu quả. Bằng cách áp dụng các kỹ thuật thống kê và phân tích dữ liệu trong R, bạn sẽ có khả năng hiểu rõ hơn về các biến thể trong dữ liệu và đưa ra những phân tích chính xác.

Không chỉ giúp bạn nắm vững kỹ năng kỹ thuật, khoá học cũng tập trung vào việc tạo ra báo cáo chuyên nghiệp và ấn tượng bằng cách sử dụng RMarkdown và Quarto. Bạn sẽ học cách tùy chỉnh và tối ưu hóa báo cáo để trình bày kết quả phân tích một cách rõ ràng và dễ hiểu.

Dù bạn là một sinh viên, nhà nghiên cứu hay chuyên gia trong lĩnh vực dữ liệu, khoá học này sẽ giúp bạn trở thành một người chuyên nghiệp có khả năng sử dụng R để thực hiện phân tích dữ liệu và làm việc với dữ liệu một cách mạnh mẽ và hiệu quả

Hình thức học

Khoá tiêu chuẩn và Khoá cao cấp

Khoá R tiêu chuẩn (standard): học viên được truy cập và học các nội dung trong video và trao đổi thắc mắc với giảng viên qua kênh hỗ trợ online
Khoá R cao cấp (premium): Bao gồm khoá R tiêu chuẩn, ngoài ra cuối khoá sẽ có buổi tư vấn trực tiếp của học viên với PSG.TS. Lê Thanh Hà và đội ngũ giảng viên để giải đáp thắc mắc hoặc định hướng phát triển trong tương lai

Đối tượng

Mục tiêu khoá học

Lợi ích tham gia khoá học

Buổi 1: Giới thiệu chung

Buổi 2: Giới thiệu dplyr và tidyr

Buổi 3: Xử lý số liệu thô (Missing Data)

Buổi 4: Xử lý số liệu thô (Dữ liệu đột xuất và dữ liệu nhiễu)

Buổi 5: Trực quan hóa số liệu

Buổi 6: Hồi quy OLS

Buổi 7: Hồi quy OLS (phần 2)

Buổi 8: Mô hình FE, RE

Buổi 9 + 10: Thực hành tạo báo cáo phân tích từ dữ liệu thực tế


Bài viết khác
Trong các bài viết trước, tôi đã hướng dẫn cách tính công suất thống kê cho kiểm định t, tích hợp mô phỏng vào lệnh power trong Stata, cũng như áp dụng cho mô hình hồi quy tuyến tính và hồi quy logistic. Hôm nay, chúng ta sẽ tiến thêm một bước xa hơn bằng cách ước lượng công suất thống kê cho các mô hình đa cấp và mô hình dữ liệu dọc thông qua mô phỏng. Mục tiêu của chúng ta là xây dựng một chương trình có khả năng tính toán công suất thống kê cho các giá trị tham số khác nhau của mô hình. Ví dụ, chúng ta có thể đánh giá sự thay đổi của công suất khi số lượng quan sát ở cấp độ 1 và cấp độ 2 thay đổi trong một nghiên cứu theo thời gian. Các bước chuẩn bị cho mô phỏng mô hình đa cấp Để thực hiện mô phỏng một cách hệ thống, chúng ta sẽ tuân theo quy trình gồm bảy bước cụ thể. Trong ví dụ này, hãy tưởng tượng bạn đang lập kế hoạch cho một nghiên cứu dọc về trọng lượng của trẻ em và bạn đặc biệt quan tâm đến sự tương tác giữa độ tuổi và giới tính.
Stata cung cấp một phương thức đơn giản và tinh tế để thực hiện các mô hình hồi quy Bayes bằng cách thêm tiền tố bayes vào trước các lệnh ước lượng. Với hơn 45 lệnh được hỗ trợ, người dùng có thể linh hoạt lựa chọn giữa các phân phối tiền nghiệm mặc định hoặc tự thiết lập theo nhu cầu nghiên cứu. Trong bài viết này, chúng ta sẽ tìm hiểu cách áp dụng hồi quy logistic Bayes và khám phá sức mạnh của phân phối tiền nghiệm Cauchy đối với các hệ số hồi quy. Một thách thức phổ biến khi làm việc với Bayes là việc lựa chọn phân phối tiền nghiệm. Cách tiếp cận thận trọng thường dùng các tiền nghiệm yếu hoặc không có thông tin để đảm bảo tính khách quan dựa trên dữ liệu. Tuy nhiên, các tiền nghiệm không có thông tin đôi khi không đủ để giải quyết những vấn đề như hiện tượng phân tách hoàn hảo trong hồi quy logistic. Ngược lại, nếu không có kiến thức chuyên gia sâu sắc, việc chọn tiền nghiệm có thông tin cũng không hề dễ dàng. Dựa trên khuyến nghị của Gelman và các cộng sự, việc sử dụng phân phối tiền nghiệm Cauchy thông tin yếu là một giải pháp cân bằng hiệu quả. Chuẩn bị dữ liệu và chuẩn hóa Chúng ta sử dụng bộ dữ liệu Iris nổi tiếng để phân loại hoa. Biến phụ thuộc virg phân biệt loài Iris virginica với các loài khác. Các biến độc lập bao gồm chiều dài và chiều rộng của đài hoa và cánh hoa. Theo khuyến nghị của các nhà nghiên cứu, các biến độc lập nên được chuẩn hóa để có trung bình bằng 0 và độ lệch chuẩn bằng 0.5 trước khi áp dụng phân phối tiền nghiệm Cauchy.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội