messenger_logo
Liên hệ qua Messenger
SciEco

Bảng biểu tùy chỉnh trong stata 17: sức mạnh từ lệnh table mới

I
IEFPA
Ngày viết: 29/04/2026

Trong phiên bản Stata 17, hệ thống tạo bảng biểu đã được nâng cấp toàn diện, mang lại khả năng tùy biến mạnh mẽ và linh hoạt. Không chỉ dừng lại ở việc mở rộng chức năng của lệnh table, Stata còn giới thiệu một hệ thống hoàn toàn mới cho phép thu thập kết quả từ bất kỳ lệnh nào, thiết kế bố cục theo ý muốn và xuất bản trực tiếp sang các định dạng tài liệu phổ biến. Bài viết này sẽ hướng dẫn bạn những bước đầu tiên để làm quen với lệnh table cải tiến.

Những Ví Dụ Điển Hình Về Bảng Biểu Tùy Chỉnh

Trước khi đi sâu vào cú pháp, hãy cùng điểm qua một số mẫu bảng biểu mà bạn có thể dễ dàng tạo ra bằng hệ thống mới này.

Bảng Thống Kê Mô Tả Cơ Bản

Đây là dạng bảng phổ biến nhất trong các báo cáo nghiên cứu, thường dùng để mô tả đặc điểm mẫu và phân tách theo một biến phân loại. Bảng này báo cáo giá trị trung bình và độ lệch chuẩn cho các biến liên tục, đồng thời hiển thị tần suất và tỷ lệ phần trăm cho các biến phân loại.

Bảng Kết Quả Kiểm Định Thống Kê

Trong nhiều trường hợp, chúng ta cần báo cáo kết quả kiểm định giả thuyết cho một nhóm biến. Hệ thống mới cho phép trình bày giá trị trung bình của các nhóm, sự khác biệt giữa chúng và giá trị p-value của các kiểm định t-test một cách chuyên nghiệp.

Bảng So Sánh Các Mô Hình Hồi Quy

Khi thực hiện phân tích, việc so sánh kết quả từ nhiều mô hình hồi quy khác nhau là rất quan trọng. Bạn có thể tạo bảng hiển thị tỷ số chênh và sai số chuẩn của các biến độc lập trong nhiều mô hình hồi quy logistic, đi kèm với các chỉ số đánh giá như AIC và BIC để so sánh.

Bảng Chi Tiết Cho Một Mô Hình Hồi Quy

Đối với mô hình hồi quy cuối cùng, bạn có thể cần một bảng chi tiết bao gồm tỷ số chênh, sai số chuẩn, giá trị z, p-value và khoảng tin cậy 95 phần trăm cho từng biến số.

Chuẩn Bị Dữ Liệu Phân Tích

Chúng ta sẽ sử dụng bộ dữ liệu từ Khảo sát Kiểm tra Sức khỏe và Dinh dưỡng Quốc gia để thực hành. Đầu tiên, hãy mở dữ liệu và xem qua các biến số chính.

1webuse nhanes2l
2describe age sex race height weight bmi highbp bpsystol bpdiast tcresult tgresult hdresult

Bộ dữ liệu này bao gồm các số liệu về nhân trắc học và sinh học của những người tham gia khảo sát tại Hoa Kỳ. Để đơn giản hóa trong bài hướng dẫn này, chúng ta sẽ tạm thời bỏ qua trọng số khảo sát và tập trung vào cú pháp tạo bảng.

Làm Quen Với Cú Pháp Lệnh Table

Cú pháp cơ bản của lệnh table là table (Biến hàng) (Biến cột). Nếu bạn chỉ muốn tạo bảng cho một biến hàng duy nhất như biến cao huyết áp, bạn có thể viết như sau:

1table (highbp) ()

Theo mặc định, bảng sẽ hiển thị tần suất cho từng danh mục của biến và tổng số. Cặp ngoặc đơn thứ hai để trống vì chúng ta không có biến cột. Nếu bạn muốn đặt biến này ở cột, hãy chuyển nó sang cặp ngoặc đơn thứ hai:

1table () (highbp)

Để tạo bảng chéo giữa biến giới tính và cao huyết áp, chúng ta điền biến vào cả hai vị trí. Tổng hàng và tổng cột sẽ được tự động thêm vào.

1table (sex) (highbp)

Nếu không muốn hiển thị các dòng tổng cộng, bạn chỉ cần thêm tùy chọn nototals vào sau lệnh.

Cấu Trúc Bảng Lồng Nhau

Stata cho phép lồng ghép nhiều biến số vào hàng hoặc cột. Thứ tự của các biến trong ngoặc đơn sẽ quyết định cấu trúc phân cấp của bảng. Ví dụ, để xem tần suất của giới tính lồng trong các nhóm cao huyết áp, chúng ta sử dụng:

1table (highbp sex) (), nototals

Ngược lại, nếu muốn nhóm cao huyết áp lồng trong giới tính, bạn chỉ cần đổi thứ tự biến. Khả năng này cũng áp dụng tương tự cho các biến cột, giúp bạn tạo ra những bảng biểu đa chiều phức tạp một cách dễ dàng.

Tùy Chỉnh Thống Kê Và Định Dạng Số Liệu

Mặc dù tần suất là giá trị mặc định, bạn có thể yêu cầu bất kỳ chỉ số thống kê nào thông qua tùy chọn statistic.

1table (sex) (highbp), statistic(frequency) statistic(percent) nototals

Bạn cũng có thể thêm giá trị trung bình hoặc độ lệch chuẩn của biến tuổi vào bảng. Để các con số trông chuyên nghiệp hơn, tùy chọn nformat sẽ giúp định dạng chữ số thập phân, trong khi sformat có thể thêm các ký hiệu như dấu phần trăm hoặc dấu ngoặc đơn xung quanh số liệu.

1table (sex) (highbp), statistic(frequency) statistic(percent) statistic(mean age) statistic(sd age) nototals nformat(%9.0fc frequency) nformat(%6.2f mean sd) sformat("%s%%" percent) sformat("(%s)" sd)

Áp Dụng Phong Cách Trình Bày Chuyên Nghiệp

Cuối cùng, Stata cung cấp các kiểu dáng có sẵn để bạn áp dụng nhanh chóng. Tùy chọn style cho phép thay đổi diện mạo của bảng ngay lập tức, ví dụ như kiểu trình bày chuẩn cho các bài báo khoa học.

1table (sex) (highbp), statistic(frequency) statistic(percent) statistic(mean age) statistic(sd age) nototals nformat(%9.0fc frequency) nformat(%6.2f mean sd) sformat("%s%%" percent) sformat("(%s)" sd) style(table-1)

Lệnh table mới trong Stata 17 đã thực sự thay đổi cách chúng ta làm việc với dữ liệu. Từ việc tạo bảng chéo đơn giản đến những bảng thống kê phức tạp, mọi thứ đều có thể được thực hiện một cách nhất quán và thẩm mỹ.

✨ Khả năng tùy biến bảng biểu trong Stata 17 không chỉ giúp tiết kiệm thời gian trình bày mà còn đảm bảo tính chính xác và đồng nhất cho các báo cáo nghiên cứu khoa học.

Bài tập ứng dụng

Dựa trên bộ dữ liệu nhanes2l đã mở, bạn hãy viết lệnh tạo một bảng biểu hiển thị giá trị trung bình của biến chỉ số khối cơ thể (bmi) và biến nồng độ cholesterol (tcresult) theo từng nhóm chủng tộc (race). Yêu cầu bảng không hiển thị dòng tổng cộng và các giá trị số được định dạng lấy hai chữ số thập phân.


Bài viết khác
Trong nghiên cứu ứng dụng, các mô hình chiều cao, tức là những mô hình có quá nhiều biến giải thích tiềm năng so với kích thước mẫu hiện có, đang ngày càng trở nên phổ biến. Lasso, một kỹ thuật được thảo luận trong các bài viết trước, có thể được dùng để ước lượng các hệ số quan tâm trong mô hình chiều cao. Bài viết này sẽ đi sâu vào các lệnh trong Stata 16 giúp ước lượng các hệ số này một cách đáng tin cậy. Để minh họa vấn đề, chúng ta sẽ xem xét một ví dụ từ dữ liệu mà Sunyer cùng cộng sự (2017) đã sử dụng để ước lượng ảnh hưởng của ô nhiễm không khí lên thời gian phản ứng của học sinh tiểu học. Mô hình tổng quát có thể được biểu diễn như sau: biến thời gian phản ứng htime của cá nhân i được giải thích bởi mức độ ô nhiễm no2_class của trường học cá nhân i nhân với hệ số gamma, cộng với tích của véctơ biến kiểm soát x_i và véctơ hệ số beta, cùng với thành phần sai số epsilon_i. Cụ thể, htime là thước đo thời gian phản ứng của trẻ i trong một bài kiểm tra, no2_class đo mức độ ô nhiễm trong trường học của trẻ i, và véctơ x_i chứa các biến kiểm soát cần được đưa vào mô hình. Vấn đề đặt ra là có tới 252 biến kiểm soát tiềm năng trong x, nhưng chúng ta chỉ có 1.084 quan sát. Phương pháp thông thường là hồi quy htime theo no2_class và tất cả 252 biến kiểm soát trong x sẽ không tạo ra các ước lượng đáng tin cậy cho hệ số gamma. Nhìn kỹ hơn vào vấn đề, chúng ta thấy nhiều biến kiểm soát là các thành phần bậc hai. Chúng ta nghĩ rằng cần đưa một số trong các thành phần này vào, nhưng không quá nhiều, cùng với no2_class để có được một xấp xỉ tốt cho quá trình tạo ra dữ liệu.
Việc tính toán marginal likelihood đóng vai trò then chốt trong việc so sánh và lựa chọn mô hình Bayes. Tuy nhiên, đây luôn là một thách thức lớn về mặt tính toán do yêu cầu tích phân trên không gian tham số nhiều chiều. Phương pháp trung bình điều hòa truyền thống dù đơn giản nhưng thường gặp phải vấn đề phương sai vô hạn, khiến kết quả không ổn định. Để giải quyết bài toán này, các nhà nghiên cứu đã phát triển những hướng đi mới dựa trên việc giới hạn không gian lấy mẫu trong các vùng mật độ cao nhằm đảm bảo tính hội tụ của các ước lượng bằng chứng thực nghiệm. SỰ TIẾN HÓA CỦA CÁC PHƯƠNG PHÁP DỰA TRÊN TRUNG BÌNH ĐIỀU HÒA Nền tảng của các nghiên cứu hiện đại bắt nguồn từ đồng nhất thức của Alan Gelfand và Dipak Dey vào năm 1994. Ý tưởng cốt lõi là sử dụng một hàm tự do để điều chỉnh trọng số của các mẫu từ phân phối hậu nghiệm. Khi hàm này được chọn là phân phối đều trên một vùng mật độ hậu nghiệm cao nhất, được gọi là vùng HPD, ước lượng thu được sẽ đảm bảo tính có chặn và do đó có phương sai hữu hạn. Đây là bước ngoặt giúp loại bỏ sự bất ổn định vốn có của phương pháp trung bình điều hòa nguyên bản. Từ phương pháp thames đến những cải tiến cần thiết
SciEco
Science for Economics
Định hướng đào tạo phân tích dữ liệu, xây dựng chính sách, tối ưu hoá danh mục tài chính cá nhân và dự báo thị trường.
Liên hệ
Địa chỉ: Số 60, ngõ 41, Phố Thái Hà, Trung Liệt, Đống Đa, Hà Nội (Google Map)
Email: science.for.economics@gmail.com
Hotline: 03.57.94.7680 (Mrs. Hà)
Mạng xã hội