messenger_logo
Liên hệ qua Messenger
SciEco

[BLOG 007] Viết báo cáo phân tích bằng R và Quarto

KH
Khanh Hoang
Ngày viết: 18/12/2023

Quarto được xem là thế hệ tiếp theo sau R Markdown, hỗ trợ tạo báo cáo từ đa ngôn ngữ (R và Python) với nhiều tính năng mới.

Trong hướng dẫn này, SciEco sẽ chỉ cho bạn cách sử dụng RStudio với Quarto để tạo báo cáo phân tích chuyên nghiệp.

Để tạo một tệp Quarto, bạn chọn nút “Quarto Document…”, ở đây bạn có thể thấy, quarto hỗ trợ báo cáo ở dạng tệp văn bản (Quarto Document), hoặc ở dạng slides (Quarto Presentation).

Bạn có thể thấy tệp Quarto được tạo ra bên dưới có đuôi .qmd

Tại tệp quarto mới được tạo ra, bạn có thể viết báo cáo, và tạo code chunk để chạy code của R

Để render báo cáo bạn chọn nút “Render” ngay lập tức 1 bản xem trước báo cáo được hiện tại ở cửa sổ bên phải

Bạn có thể chọn “Render on Save” để RStudio tự động render báo cáo mỗi khi bạn ấn save. Tại bước này, bạn chỉ cần quay lại cửa sổ bên trái để chỉnh sửa và hoàn thiện báo cáo của mình.

Sau khi bạn đã hoàn thiện xong báo cáo, bước cuối cùng là chia sẻ báo cáo phân tích của mình cho đồng nghiệp hoặc đối tác, để làm điều đó có 2 cách:

1. Xuất ra file định dạng PDF và chia sẻ file PDF đó

Lưu ý: mặc định máy tính của bạn chưa có Latex nên sẽ không xuất được file pdf, bạn cần phải cài đặt latex theo hướng dẫn tại đây.

Sau khi cài Latex, bước tiếp theo bạn cần đổi title của báo cáo, ở đây tôi để là “Report”, lưu ý title cần phải được đặt trong dấu ngoặc kép.

Sau đó, bạn đổi format của báo cáo thành pdf, mặc định là html, và ấn render.

Sau một lúc, báo cáo sẽ tự động render và trả về báo cáo dạng pdf ngay bên cạnh tệp quarto của bạn.

2. Xuất ra file định dạng web (HTML) và chia sẻ thông qua đường link

Lưu ý: nếu sử dụng link, báo cáo của bạn sẽ công khai và bất cứ ai có đường link đều sẽ xem được báo cáo.

Tương tự như cách 1, bạn cần đổi format của báo cáo thành HTML, sau đó ấn Render, ngay lập tức sẽ có báo cáo dạng web tại cửa sổ bên phải

Tại đây bạn chọn Publish để đưa báo cáo của mình lên internet

Có rất nhiều nền tảng bạn có thể chọn để chia sẻ báo cáo của mình, ở đây SciEco chọn RPubs vì nền tảng này hoàn toàn miễn phí

Sau khi tài liệu được upload lên RPubs, bạn cần tạo 1 tài khoản tại trang này, tại đây SciEco đã có tài khoản nên sẽ đăng nhập

Bước tiếp theo bạn cần đặt tên và mô tả cho tài liệu của bạn, bạn có thể đặt 1 slug cho báo cáo của bạn để người khác dễ truy cập. Bạn có thể hiểu slug unique id cho tài liệu này (slug là tuỳ chọn, nếu bạn để trống, rpubs sẽ tự động tạo 1 dãy mã số bất kỳ)

Hoàn thành, bạn đã chia sẻ được báo cáo online, bạn hoàn toàn có thể lấy đường link trên và gửi cho đối tác của mình, đối tác của bạn có thể xem báo cáo và nhận xét tại phần comment góc bên dưới báo cáo.


Bài viết khác
Dữ liệu mạng xã hội đã trở thành một nguồn tài nguyên vô giá cho các nghiên cứu xã hội học, hành vi người dùng và phân tích thị trường. Bên cạnh các nguồn dữ liệu truyền thống, việc thu thập thông tin từ Facebook luôn là mục tiêu quan trọng của các nhà nghiên cứu dữ liệu. Để hỗ trợ quá trình này, công cụ facebook2stata được phát triển nhằm giúp người dùng kết nối trực tiếp Stata với hệ thống dữ liệu của Facebook. Bài viết này sẽ hướng dẫn chi tiết cách cài đặt, cấu hình mã xác thực và thực hiện các truy vấn cơ bản từ Facebook vào môi trường làm việc của Stata. Cài đặt công cụ facebook2stata Để bắt đầu, bạn cần cài đặt gói lệnh facebook2stata từ máy chủ của Stata. Việc cài đặt vô cùng đơn giản bằng cách khởi chạy dòng lệnh sau trong cửa sổ dòng lệnh của phần mềm.
Phương pháp ước lượng tối đa khả dĩ mục tiêu thường được gọi là TMLE là một công cụ mạnh mẽ trong phân tích nhân quả. Nhiều nhà nghiên cứu từng nghe về đặc tính song trùng bền vững của phương pháp này nhưng chỉ thực sự thấu hiểu nó khi tiến hành giả lập dữ liệu thực tế. Phương pháp này hoạt động cực kỳ hiệu quả khi một trong hai mô hình kết quả hoặc mô hình điều trị được thiết lập chính xác. Việc kết hợp thuật toán XGBoost cùng TMLE giúp tự động bắt trọn các mối quan hệ phức tạp trong dữ liệu mà không cần phải khai báo các tương tác thủ công. Bài viết này sẽ đi sâu vào cơ chế vận hành của phương pháp thông qua việc giả lập dữ liệu cụ thể trong môi trường R. Khái Niệm Về Tmle TMLE là một phương pháp thống kê tiên tiến được sử dụng để ước lượng các tác động nhân quả trong các nghiên cứu quan sát và thử nghiệm lâm sàng. Phương pháp này kết hợp linh hoạt giữa các thuật toán học máy và kỹ thuật thống kê truyền thống nhằm mang lại các ước lượng vững cho hiệu quả tác động của can thiệp, đồng thời kiểm soát tốt các yếu tố nhiễu. Quy trình vận hành của TMLE gồm hai giai đoạn chính. Đầu tiên, hệ thống sẽ ước lượng mô hình kết quả và mô hình điều trị. Sau đó, các ước lượng này được sử dụng để hiệu chỉnh nhằm hướng trực tiếp đến tham số mục tiêu cần nghiên cứu. Cách tiếp cận này đặc biệt hữu ích trong các bối cảnh mà phương pháp truyền thống dễ bị lệch hoặc hoạt động kém hiệu quả do sự xuất hiện của các mối quan hệ phi tuyến phức tạp.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội