messenger_logo
Liên hệ qua Messenger
SciEco

[BLOG 007] Viết báo cáo phân tích bằng R và Quarto

KH
Khanh Hoang
Ngày viết: 18/12/2023

Quarto được xem là thế hệ tiếp theo sau R Markdown, hỗ trợ tạo báo cáo từ đa ngôn ngữ (R và Python) với nhiều tính năng mới.

Trong hướng dẫn này, SciEco sẽ chỉ cho bạn cách sử dụng RStudio với Quarto để tạo báo cáo phân tích chuyên nghiệp.

Để tạo một tệp Quarto, bạn chọn nút “Quarto Document…”, ở đây bạn có thể thấy, quarto hỗ trợ báo cáo ở dạng tệp văn bản (Quarto Document), hoặc ở dạng slides (Quarto Presentation).

Bạn có thể thấy tệp Quarto được tạo ra bên dưới có đuôi .qmd

Tại tệp quarto mới được tạo ra, bạn có thể viết báo cáo, và tạo code chunk để chạy code của R

Để render báo cáo bạn chọn nút “Render” ngay lập tức 1 bản xem trước báo cáo được hiện tại ở cửa sổ bên phải

Bạn có thể chọn “Render on Save” để RStudio tự động render báo cáo mỗi khi bạn ấn save. Tại bước này, bạn chỉ cần quay lại cửa sổ bên trái để chỉnh sửa và hoàn thiện báo cáo của mình.

Sau khi bạn đã hoàn thiện xong báo cáo, bước cuối cùng là chia sẻ báo cáo phân tích của mình cho đồng nghiệp hoặc đối tác, để làm điều đó có 2 cách:

1. Xuất ra file định dạng PDF và chia sẻ file PDF đó

Lưu ý: mặc định máy tính của bạn chưa có Latex nên sẽ không xuất được file pdf, bạn cần phải cài đặt latex theo hướng dẫn tại đây.

Sau khi cài Latex, bước tiếp theo bạn cần đổi title của báo cáo, ở đây tôi để là “Report”, lưu ý title cần phải được đặt trong dấu ngoặc kép.

Sau đó, bạn đổi format của báo cáo thành pdf, mặc định là html, và ấn render.

Sau một lúc, báo cáo sẽ tự động render và trả về báo cáo dạng pdf ngay bên cạnh tệp quarto của bạn.

2. Xuất ra file định dạng web (HTML) và chia sẻ thông qua đường link

Lưu ý: nếu sử dụng link, báo cáo của bạn sẽ công khai và bất cứ ai có đường link đều sẽ xem được báo cáo.

Tương tự như cách 1, bạn cần đổi format của báo cáo thành HTML, sau đó ấn Render, ngay lập tức sẽ có báo cáo dạng web tại cửa sổ bên phải

Tại đây bạn chọn Publish để đưa báo cáo của mình lên internet

Có rất nhiều nền tảng bạn có thể chọn để chia sẻ báo cáo của mình, ở đây SciEco chọn RPubs vì nền tảng này hoàn toàn miễn phí

Sau khi tài liệu được upload lên RPubs, bạn cần tạo 1 tài khoản tại trang này, tại đây SciEco đã có tài khoản nên sẽ đăng nhập

Bước tiếp theo bạn cần đặt tên và mô tả cho tài liệu của bạn, bạn có thể đặt 1 slug cho báo cáo của bạn để người khác dễ truy cập. Bạn có thể hiểu slug unique id cho tài liệu này (slug là tuỳ chọn, nếu bạn để trống, rpubs sẽ tự động tạo 1 dãy mã số bất kỳ)

Hoàn thành, bạn đã chia sẻ được báo cáo online, bạn hoàn toàn có thể lấy đường link trên và gửi cho đối tác của mình, đối tác của bạn có thể xem báo cáo và nhận xét tại phần comment góc bên dưới báo cáo.


Bài viết khác
Trong lĩnh vực sinh thái học định lượng và dịch tễ học phân tử, các nhà khoa học thường sử dụng mô hình thống kê để dự báo sự phân bố loài hoặc mô hình lây truyền bệnh tật. Tuy nhiên, một ứng dụng thú vị khác của mô hình cộng tổng quát, thường được gọi là GAM, chính là dự báo giá trị vòng đời khách hàng trong các doanh nghiệp phần mềm dịch vụ. Việc dự báo CLV đối mặt với những thách thức thống kê tương tự như dự báo sinh thái: các mối quan hệ phi tuyến tính đạt đến giới hạn bão hòa, cấu trúc phân cấp nơi các nhóm khách hàng hành xử khác nhau và nhu cầu cân bằng giữa tính linh hoạt của mô hình với khả năng giải thích cho các bên liên quan. Nhiều doanh nghiệp hiện nay vẫn dựa vào các phương pháp tính toán đơn giản như lấy giá trị đơn hàng trung bình nhân với tần suất và thời gian gắn bó. Cách tiếp cận này bỏ qua quỹ đạo cá nhân và động lực thời gian. Ngược lại, các mô hình học máy dạng hộp đen có thể nắm bắt các quy luật phức tạp nhưng lại thiếu tính diễn giải cần thiết cho các quyết định chiến lược. Mô hình GAM xuất hiện như một giải pháp trung gian hoàn hảo, cho phép nắm bắt các mối quan hệ phi tuyến phức tạp thông qua các hàm mượt có thể trực quan hóa, đồng thời xử lý tốt hiện tượng phương sai thay đổi đặc trưng trong dữ liệu doanh thu. Hiểu về động lực kinh doanh SaaS Các công ty SaaS hoạt động dựa trên doanh thu định kỳ từ đăng ký thuê bao. Khách hàng trả tiền hàng tháng hoặc hàng năm để duy trì quyền truy cập vào phần mềm. Điều này thay đổi hoàn toàn bài toán thống kê. Thách thức lớn nhất là chi phí thu hút khách hàng thường rất lớn so với doanh thu hàng tháng. Một khách hàng trả 99 đô la mỗi tháng nhưng tốn 500 đô la để thu hút sẽ cần ít nhất sáu tháng để doanh nghiệp đạt điểm hòa vốn.
Trong bài viết này, tôi sẽ giới thiệu cho bạn một cách tiếp cận tương đối đơn giản về thống kê Bayes. Phương pháp Bayes ngày càng trở nên phổ biến và bạn có thể thực hiện các mô hình này bằng lệnh bayesmh trong phần mềm Stata. Nội dung hôm nay sẽ tập trung vào các khái niệm, thuật ngữ chuyên môn và cú pháp cơ bản. Trong bài viết tiếp theo, chúng ta sẽ cùng tìm hiểu sâu hơn về mô hình Markov chain Monte Carlo thông qua thuật toán Metropolis-Hastings. Thống kê bayes qua ví dụ thực tế Nhiều người trong chúng ta được đào tạo theo trường phái thống kê tần suất, nơi các tham số được coi là các đại lượng cố định nhưng chưa biết giá trị. Chúng ta ước lượng các tham số này bằng cách lấy mẫu từ quần thể, và các mẫu khác nhau sẽ cho ra các ước lượng khác nhau. Tập hợp các ước lượng này tạo nên phân phối mẫu, giúp định lượng sự không chắc chắn của kết quả. Tuy nhiên, bản thân tham số vẫn luôn được xem là một hằng số cố định. Thống kê Bayes mang đến một tư duy hoàn toàn khác. Ở đây, các tham số được đối xử như các biến ngẫu nhiên và có thể được mô tả bằng các phân phối xác suất. Chúng ta thậm chí không cần dữ liệu để mô tả phân phối của một tham số, bởi xác suất đơn giản là mức độ tin tưởng của chúng ta vào giá trị đó.
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội