Chỉ số Gini là một thước đo thống kê được sử dụng để định lượng sự bất bình đẳng trong một phân phối, thường được áp dụng cho phân phối thu nhập hoặc tài sản trong một quần thể. Đây là thước đo sự tập trung, phản ánh cách các nguồn lực được phân bổ giữa các cá nhân trong một quốc gia hoặc khu vực.
Chỉ số này được nhà thống kê người Ý Corrado Gini phát triển vào năm 1912. Giá trị của chỉ số Gini nằm trong khoảng từ 0 đến 1 (hoặc 0% đến 100%), trong đó 0 đại diện cho sự bình đẳng hoàn hảo (mọi người đều có cùng mức thu nhập) và 1 đại diện cho sự bất bình đẳng tối đa (chỉ một người sở hữu toàn bộ thu nhập, những người khác không có gì).
Để hiểu rõ hơn, hãy xét một ví dụ đơn giản: "Có hai cái bánh mì. Bạn ăn cả hai, tôi không ăn cái nào. Mức tiêu thụ trung bình: một cái bánh mì mỗi người." Dù mức trung bình là một cái bánh mì mỗi người, chỉ số Gini trong trường hợp này là 1 (bất bình đẳng tối đa) vì một người tiêu thụ toàn bộ, người còn lại không có gì. Chỉ số này không phải là Trí tuệ nhân tạo hay một khái niệm trừu tượng, mà chỉ là một thước đo thống kê đơn giản.
Khái Niệm Chỉ Số Gini
Chỉ số Gini đo lường mức độ bất bình đẳng trong phân phối thu nhập hoặc tài sản của một xã hội. Giá trị của nó phản ánh mức độ chênh lệch giữa các cá nhân. Một xã hội có chỉ số Gini thấp sẽ có sự phân chia thu nhập hoặc tài sản đồng đều hơn, trong khi chỉ số Gini cao cho thấy sự tập trung tài sản vào một nhóm nhỏ.
Ví dụ về hai người và hai cái bánh mì minh họa rõ ràng khái niệm này. Nếu mỗi người ăn một cái bánh mì, đó là bình đẳng hoàn hảo, Gini bằng 0. Nếu một người ăn cả hai cái bánh mì và người kia không có gì, đó là bất bình đẳng tối đa, Gini bằng 1. Chỉ số Gini cung cấp một cái nhìn định lượng về mức độ bất bình đẳng, bổ sung cho các thước đo trung bình như thu nhập bình quân đầu người.
Tính Toán Chỉ Số Gini Dựa Trên Đường Cong Lorenz
Việc tính toán chỉ số Gini dựa trên đường cong Lorenz, một biểu đồ thể hiện tỷ lệ phần trăm tích lũy của tổng thu nhập được nhận bởi tỷ lệ phần trăm tích lũy của dân số. Chỉ số Gini được tính bằng diện tích giữa đường cong Lorenz và đường thẳng thể hiện sự bình đẳng hoàn hảo, chia cho tổng diện tích dưới đường thẳng thể hiện sự bình đẳng hoàn hảo.
Nói cách khác, nếu 1% dân số nghèo nhất nhận được 1% tổng thu nhập, 2% dân số nghèo nhất nhận được 2% tổng thu nhập, v.v., thì đó là trường hợp bình đẳng hoàn hảo với chỉ số Gini bằng 0.
Theo dữ liệu của Ủy ban Kinh tế Mỹ Latinh và Caribe (CEPAL) năm 2024, Chile có phân phối thu nhập như sau:
| Phân vị thứ mười | Thu nhập (%) |
| :-------------- | :---------- |
| 1 | 1.7 |
| 2 | 3.1 |
| 3 | 4.2 |
| 4 | 5.2 |
| 5 | 6.4 |
| 6 | 7.7 |
| 7 | 9.4 |
| 8 | 11.9 |
| 9 | 16.2 |
| 10 | 34.2 |
Từ những dữ liệu này, có thể tính toán chỉ số Gini của Chile, xấp xỉ 0.44 (44%), cho thấy mức độ bất bình đẳng vừa phải trong phân phối thu nhập.
Sử dụng ngôn ngữ R, chúng ta có thể tính toán chỉ số Gini từ các dữ liệu này:
1# Tính toán không sử dụng thư viện
2# Phần trăm tích lũy của thu nhập theo phân vị thứ mười
3ingreso <- c(1.7, 3.1, 4.2, 5.2, 6.4, 7.7, 9.4, 11.9, 16.2, 34.2)
4ingreso_acumulado <- cumsum(ingreso)
5# Dân số tích lũy theo phân vị thứ mười
6poblacion_acumulada <- seq(0.1, 1, by = 0.1)
7# Chuyển đổi thành tỷ lệ tích lũy
8ingreso_prop_acum <- ingreso_acumulado / 100
9# Thêm điểm ban đầu (0,0) cho đường cong Lorenz
10x <- c(0, poblacion_acumulada)
11y <- c(0, ingreso_prop_acum)
12# Tính toán diện tích dưới đường cong Lorenz sử dụng quy tắc hình thang
13area_lorenz <- sum((x[-1] - x[-length(x)]) * (y[-1] + y[-length(y)]) / 2)
14# Tính toán chỉ số Gini
15# Gini = (Diện tích giữa đường thẳng bình đẳng và đường cong Lorenz) / (Tổng diện tích dưới đường thẳng bình đẳng)
16# Diện tích dưới đường thẳng bình đẳng = 0.5, vậy:
17# Gini = (0.5 - area_lorenz) / 0.5 = 1 - 2 * area_lorenz
18indice_gini <- 1 - 2 * area_lorenz
19indice_gini1[1] 0.4366Sử dụng thư viện "ineq":
1if (!require(ineq)) { install.packages("ineq", repos = "https://cran.r-project.org") }1Loading required package: ineq1library(ineq)
2# Chuyển đổi dữ liệu tích lũy thành đóng góp cá nhân của từng phân vị thứ mười
3participacion_individual <- c(ingreso_acumulado[1], diff(ingreso_acumulado))
4# Tính toán Gini sử dụng thư viện ineq
5Gini(participacion_individual)1[1] 0.4366Minh Họa Trực Quan Với Đường Cong Lorenz
Việc trực quan hóa dữ liệu bằng đường cong Lorenz rất hữu ích để hiểu rõ hơn về cách chỉ số Gini được tính toán và các khu vực liên quan.
1library(ggplot2)
2# Dữ liệu cho đường cong Lorenz
3lorenz_data <- data.frame(
4 Poblacion = c(0, poblacion_acumulada),
5 Ingreso = c(0, ingreso_prop_acum))
6ggplot(lorenz_data, aes(x = Poblacion, y = Ingreso)) +
7 geom_line(color = "blue", linewidth = 1.2) +
8 geom_abline(slope = 1, intercept = 0, linewidth = 1.2, linetype = "dashed", color = "red") +
9 geom_ribbon(aes(ymin = Ingreso, ymax = Poblacion), fill = "lightblue", alpha = 0.5) +
10 geom_ribbon(aes(ymin = 0, ymax = Ingreso), fill = "lightgreen", alpha = 0.5) +
11 geom_text(aes(x = 0.6, y = 0.2), label = "B", color = "black", size = 8) +
12 geom_text(aes(x = 0.6, y = 0.5), label = "A", color = "black", size = 8) +
13 labs(title = "Đường cong Lorenz",
14 x = "Tỷ lệ tích lũy của dân số",
15 y = "Tỷ lệ tích lũy của thu nhập") +
16 theme_minimal()Nếu diện tích giữa đường thẳng bình đẳng hoàn hảo và đường cong Lorenz là A, và diện tích dưới đường cong Lorenz là B, thì chỉ số Gini được tính là A chia cho (A cộng B).
Trong biểu đồ, diện tích A được thể hiện bằng màu xanh lam nhạt và diện tích B bằng màu xanh lá cây nhạt. Về mặt hình học, một xã hội có tính bình đẳng cao sẽ có diện tích A tiến về 0, trong khi một xã hội có tính bất bình đẳng cao sẽ có diện tích B tiến về 0.
Quay lại ví dụ của Nicanor Parra, với mức tiêu thụ trung bình một cái bánh mì mỗi người, có thể có các phân phối bánh mì khác nhau nhưng cùng một mức trung bình:
* Người A ăn 1 cái bánh mì, Người B ăn 1 cái bánh mì.
* Người A ăn 2 cái bánh mì, Người B ăn 0 cái bánh mì.
* Người A ăn 0 cái bánh mì, Người B ăn 2 cái bánh mì.
Đối với trường hợp 1, chỉ số Gini là 0 (bình đẳng hoàn hảo). Đối với các trường hợp 2 và 3, chỉ số Gini là 1 (bất bình đẳng tối đa), vì một người tiêu thụ toàn bộ bánh mì và người kia không tiêu thụ gì.
Tác Động Của Thay Đổi Phân Phối Thu Nhập
Chỉ số Gini là một thống kê bổ sung cho các thước đo khác như giá trị trung bình hoặc giá trị trung vị, cung cấp cái nhìn toàn diện hơn về phân phối thu nhập trong một quần thể. Vấn đề nằm ở chỗ nhiều người có xu hướng diễn giải chỉ số Gini như một thước đo tuyệt đối về công bằng xã hội, điều này không chính xác. Nó chỉ đơn giản là một công cụ để hiểu sự phân phối thu nhập và không giải quyết các vấn đề đạo đức hay luân lý.
Hơn nữa, chỉ số Gini không nắm bắt tất cả các khía cạnh của bất bình đẳng, chẳng hạn như sự dịch chuyển xã hội hoặc sự khác biệt trong khả năng tiếp cận hoặc chất lượng dịch vụ. Do đó, điều quan trọng là phải sử dụng nó cùng với các chỉ số và phân tích khác để có được sự hiểu biết toàn diện hơn về bất bình đẳng trong một xã hội.
Hãy xem điều gì sẽ xảy ra nếu giả định 10% tài sản của nhóm 10% giàu nhất bị trưng thu và chia đều cho tất cả các nhóm phân vị thứ mười. Điều này sẽ ảnh hưởng đến chỉ số Gini như thế nào?
1ingreso2 <- ingreso
2monto_expropiado <- ingreso2[10] * 0.1
3ingreso2[10] <- ingreso2[10] * 0.9
4ingreso2 <- ingreso2 + monto_expropiado / 10
5ingreso_acumulado2 <- cumsum(ingreso2)
6participacion_individual2 <- c(ingreso_acumulado2[1], diff(ingreso_acumulado2))
7gini1 <- Gini(participacion_individual)
8gini2 <- Gini(participacion_individual2)
9c("Gini original" = gini1, "Gini hipotético" = gini2)1Gini original Gini hipotético
2 0.43660 0.405821# Thay đổi phần trăm trong chỉ số Gini
2(gini2 - gini1) / gini1 * 1001[1] -7.049931Theo kết quả, việc trưng thu 10% thu nhập của nhóm 10% giàu nhất và chia đều cho tất cả các nhóm làm giảm chỉ số Gini khoảng 7%, cho thấy sự giảm bớt bất bình đẳng mà không cần thêm thông tin về tính công bằng hay không công bằng của biện pháp này.
Chỉ Số Gini Và Các Yếu Tố Khác Trong Phân Tích Bất Bình Đẳng
Hãy xem xét dữ liệu cho Nam Mỹ sử dụng dữ liệu từ Ngân hàng Thế giới:
1if (!require(wbstats)) { install.packages("wbstats", repos = "https://cran.r-project.org") }
2library(wbstats)
3# Lấy dữ liệu chỉ số Gini cho Mỹ Latinh
4gini_data <- wb_data(indicator = "SI.POV.GINI", start_date = 2020, end_date = 2024)1# Lọc dữ liệu cho Nam Mỹ và giữ lại dữ liệu gần nhất cho mỗi quốc gia
2library(dplyr)1Attaching package: 'dplyr'1The following objects are masked from 'package:stats':
2 filter, lag1The following objects are masked from 'package:base':
2 intersect, setdiff, setequal, union1iso2 <- c("AR", "BO", "BR", "CL", "CO", "EC", "PE", "PR", "PY", "UY", "VE")
2gini_data <- gini_data %>%
3 filter(iso2c %in% iso2 & !is.na(SI.POV.GINI)) %>%
4 group_by(iso2c) %>%
5 slice_max(order_by = date, n = 1) %>%
6 ungroup() %>%
7 mutate(SI.POV.GINI = round(SI.POV.GINI / 100, 3))
8print(gini_data, n = 11)1# A tibble: 9 × 9
2 iso2c iso3c country date SI.POV.GINI unit obs_status footnote last_updated
3 <chr> <chr> <chr> <dbl> <dbl> <chr> <chr> <chr> <date>
41 AR ARG Argentina 2024 0.424 <NA> <NA> Based o… 2025-10-07
52 BO BOL Bolivia 2023 0.421 <NA> <NA> Based o… 2025-10-07
63 BR BRA Brazil 2023 0.516 <NA> <NA> Based o… 2025-10-07
74 CL CHL Chile 2022 0.43 <NA> <NA> Based o… 2025-10-07
85 CO COL Colombia 2023 0.539 <NA> <NA> Based o… 2025-10-07
96 EC ECU Ecuador 2024 0.452 <NA> <NA> Based o… 2025-10-07
107 PE PER Peru 2024 0.401 <NA> <NA> Based o… 2025-10-07
118 PY PRY Paraguay 2024 0.442 <NA> <NA> Based o… 2025-10-07
129 UY URY Uruguay 2024 0.4 <NA> <NA> Based o… 2025-10-07Hãy trực quan hóa các dữ liệu này trên bản đồ bằng cách sử dụng thư viện "d3po":
1if (!require(d3po)) { install.packages("d3po", repos = "https://pachadotdev.r-universe.dev") }
2library(d3po)
3dout <- map_ids(maps$south_america$continent) %>%
4 left_join(gini_data, by = c("id" = "iso2c"))
5# dout %>%
6# filter(!is.na(value))
7my_gradient <- c("#7e2119", "#cf3a33", "#ec5938", "#ee874d", "#f6cc84")
8d3po(dout, width = 800, height = 600) %>%
9 po_geomap(daes(group = id, size = SI.POV.GINI, color = my_gradient, gradient = T, tooltip = name),
10 map = maps$south_america$continent) %>%
11 po_labels(
12 title = "Hệ số Gini ở Nam Mỹ",
13 subtitle = "Nguồn: Ngân hàng Thế giới") %>%
14 po_tooltip("<b>Quốc gia: {name}</b><br/>Giá trị: {SI.POV.GINI}")Nhìn thoáng qua, có thể thấy Brazil là quốc gia có mức độ bất bình đẳng cao nhất ở Nam Mỹ, và mức độ bất bình đẳng ở Argentina và Chile là tương tự nhau.
So Sánh Với Chỉ Số Phát Triển Con Người (IDH)
Hãy so sánh dữ liệu chỉ số Gini này với Chỉ số Phát triển Con người (IDH):
1idh_data <- wb_data(indicator = "HD.HCI.OVRL", start_date = 2020, end_date = 2024)
2idh_data <- idh_data %>%
3 filter(iso2c %in% iso2 & !is.na(HD.HCI.OVRL)) %>%
4 group_by(iso2c) %>%
5 slice_max(order_by = date, n = 1) %>%
6 ungroup() %>%
7 mutate(HD.HCI.OVRL = round(HD.HCI.OVRL, 3))
8print(idh_data, n = 11)1# A tibble: 8 × 9
2 iso2c iso3c country date HD.HCI.OVRL unit obs_status footnote last_updated
3 <chr> <chr> <chr> <dbl> <dbl> <chr> <chr> <chr> <date>
41 AR ARG Argentina 2020 0.602 <NA> <NA> <NA> 2020-09-21
52 BR BRA Brazil 2020 0.551 <NA> <NA> <NA> 2020-09-21
63 CL CHL Chile 2020 0.652 <NA> <NA> <NA> 2020-09-21
74 CO COL Colombia 2020 0.604 <NA> <NA> <NA> 2020-09-21
85 EC ECU Ecuador 2020 0.594 <NA> <NA> <NA> 2020-09-21
96 PE PER Peru 2020 0.605 <NA> <NA> <NA> 2020-09-21
107 PY PRY Paraguay 2020 0.528 <NA> <NA> <NA> 2020-09-21
118 UY URY Uruguay 2020 0.599 <NA> <NA> <NA> 2020-09-211dout_idh <- map_ids(maps$south_america$continent) %>%
2 left_join(idh_data, by = c("id" = "iso2c"))
3my_gradient <- c("#0b5394", "#3075b3", "#4583bb", "#6fa8dc", "#7fbce9")
4d3po(dout_idh, width = 800, height = 600) %>%
5 po_geomap(daes(group = id, size = HD.HCI.OVRL, color = my_gradient, gradient = T, tooltip = name),
6 map = maps$south_america$continent) %>%
7 po_labels(
8 title = "Chỉ số Phát triển Con người ở Nam Mỹ",
9 subtitle = "Nguồn: Ngân hàng Thế giới") %>%
10 po_tooltip("<b>Quốc gia: {name}</b><br/>Giá trị: {HD.HCI.OVRL}")Qua việc so sánh chỉ số Gini và IDH, chúng ta có thể thấy một bức tranh đa chiều hơn về tình hình phát triển và bất bình đẳng tại các quốc gia. Một quốc gia có chỉ số Gini cao (bất bình đẳng lớn) nhưng IDH cũng khá cao có thể cho thấy sự phát triển tổng thể, nhưng lợi ích của sự phát triển đó chưa được phân bổ đồng đều. Ngược lại, một quốc gia có chỉ số Gini thấp nhưng IDH cũng thấp có thể cho thấy sự bình đẳng trong nghèo đói.
✨ Giá trị đắt giá: Chỉ số Gini là một công cụ thống kê mạnh mẽ để đo lường bất bình đẳng, nhưng cần được hiểu trong bối cảnh rộng hơn và kết hợp với các chỉ số phát triển xã hội khác để đưa ra đánh giá toàn diện về tình hình của một quốc gia. Nó không phải là thước đo tuyệt đối về công bằng mà là một chỉ số về phân phối tài nguyên.
Câu hỏi tư duy hoặc bài tập ứng dụng:
Bạn hãy tìm dữ liệu phân phối thu nhập theo phân vị thứ mười của Việt Nam trong một năm gần đây và tự tính toán chỉ số Gini. Sau đó, so sánh chỉ số này với các quốc gia khác trong khu vực Đông Nam Á và đưa ra nhận định về mức độ bất bình đẳng thu nhập của Việt Nam.


