L'elefant de Milanovic
Branko Milanovic i Simon Kuznets són dos dels acadèmics més coneguts en els estudis de la desigualtat. A cada un d’ells se’l coneix per identificar una determinada trajectòria de la desigualtat en un període de temps determinat:
- L’elefant de Milanovic: La diferencia en percentatge de guany entre la distribució per nivell d’ingressos l’any 2008 i l’any 1988 fa forma d’elefant.
- La corba de Kuznets: A mesura que la riquesa d’un país creix amb el procés d’industrialització, en una primera fase les desigualtats creixen i en una segona fase decreixen, de manera que la relació entre creixement econòmic i desigualtats té forma de U invertida.
En aquesta pràctica observarem el que es coneix com l’Elefant de Milanovic, que és la forma que descriu l’evolució de la desigualtat mundial entre els períodes 1988 i 2008. Aquesta corba, descrita per Branko Milanovic i Christoph Laekner, indica la diferencia en percentatge de guany entre la distribució per nivell d’ingressos l’any 2008 i l’any 19881. En primer lloc, carregarem els paquets que necessitem.
#recordeu que els paquets han d'estar prèviament instal·lats
library(tidyr)
library(dplyr)
library(ggplot2)
L’elefant de Milanovic
L’elefant de Milanovic és una visualització recent que descriu com ha evolucionat la desigualtat mundial en les darreres dècades. Els exercicis d’aquest apartat s’han de complementar amb el capítol 1 del llibre Global Inequality (Milanovic 2016). Per crear una reproducció semblant a la de l’elefant, en primer lloc hem de descarregar la base de dades All Ginis i observar el seu contingut. A la Taula 1 podeu consultar les primeres observacions del marc de dades all_ginis
.
download.file("https://www.gc.cuny.edu/getmedia/514d5ba9-74ed-4007-a3fe-02b079705c91/LM_WPID_web_2",
"all_ginis.dta")
#descàrrega amb el paquet foreign
library(foreign) #caldrà instal·lar el paquet foreign
all_ginis <- as_tibble(read.dta("all_ginis.dta"))
#descàrrega amb el paquet haven
library(haven) #caldrà instal·lar el paquet haven
all_ginis <- read_dta("all_ginis.dta")
contcod | country | region | year | inc_con | source | mysample | bin_year | group | pop | RRinc | RRmean | cons_2005ppp_pc | gdp_2005ppp_pc | totpop | Dno_china | ventile_n | RRmean_ventile_n | pop_ventile_n | nvals |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
BGD | Bangladesh | Other Asia | 1988 | C | povcal | 1 | 1988 | 1 | 10.0062320 | 185 | 444 | 637.7204 | 723.0073 | 100.062320 | 1 | 1 | 188.2125 | 158.266 | 1 |
IND-U | India | India | 1987 | C | povcal | 1 | 1988 | 1 | 20.9592464 | 210 | 611 | NA | NA | 209.592464 | 1 | 1 | 188.2125 | 158.266 | 0 |
UZB | Uzbekistan | Russia, C. Asia, SE Europe | 1988 | I | wyd | 1 | 1988 | 1 | 1.9561180 | 203 | 402 | NA | 2004.3074 | 19.561180 | 1 | 1 | 188.2125 | 158.266 | 0 |
UGA | Uganda | Sub-Saharan Africa | 1989 | C | povcal | 1 | 1988 | 2 | 1.6482365 | 133 | 441 | 394.4634 | 547.3591 | 16.482365 | 1 | 1 | 188.2125 | 158.266 | 0 |
MRT | Mauritania | Sub-Saharan Africa | 1987 | C | povcal | 1 | 1988 | 2 | 0.1892328 | 205 | 732 | 1392.1792 | 1822.7952 | 1.892328 | 1 | 1 | 188.2125 | 158.266 | 0 |
PAK | Pakistan | Other Asia | 1987 | C | povcal | 1 | 1988 | 1 | 10.5332464 | 165 | 453 | 1038.4399 | 1505.3386 | 105.332464 | 1 | 1 | 188.2125 | 158.266 | 0 |
HND | Honduras | L. America & Carib. | 1989 | I | povcal | 1 | 1988 | 2 | 0.4618245 | 196 | 1142 | 1717.3328 | 2731.6196 | 4.618245 | 1 | 1 | 188.2125 | 158.266 | 0 |
GHA | Ghana | Sub-Saharan Africa | 1988 | C | povcal | 1 | 1988 | 1 | 1.4010951 | 166 | 578 | 598.9019 | 882.0447 | 14.010951 | 1 | 1 | 188.2125 | 158.266 | 0 |
UGA | Uganda | Sub-Saharan Africa | 1989 | C | povcal | 1 | 1988 | 3 | 1.6482365 | 180 | 441 | 394.4634 | 547.3591 | 16.482365 | 1 | 1 | 188.2125 | 158.266 | 0 |
HND | Honduras | L. America & Carib. | 1989 | I | povcal | 1 | 1988 | 1 | 0.4618245 | 119 | 1142 | 1717.3328 | 2731.6196 | 4.618245 | 1 | 1 | 188.2125 | 158.266 | 0 |
Exercici 1: Fes una exploració general del marc de dades i les seves variables. Ajuda’t del llibre de codis de la base de dades que trobaràs a All Ginis Dataset:
- Per consultar el marc de dades només has de teclejar el seu nom (
all_ginis
). Et serà molt útil la funcióglimpse(all_ginis)
. - Per consultar una variable pots teclejar el nom del marc de dades, seguit de
$
i el nom de la variable (all_ginis$nom_variable
) o bé aplicar la funció que necessitis a la variable. Per exemple:funcio(all_ginis$nom_variable)
.
Respon a les següents preguntes:
- D’acord amb el que has après a Normes ISO, quina(es) variable(s) podríem utilitzar per unir les dades de All Ginis amb les d’un altre marc de dades?
- Per realitzar el seu estudi, els autors Lakner i Milanovic van agrupar les dades de desigualtat en uns pocs anys, agrupats a la variable
bin_year
. Quins són aquests anys? Utilitzaunique()
per saber-ho. Esbrina la diferència entreyear
ibin_year
. - Com justifica Milanovic en el seu llibre que és rellevant observar l’evolució de la desigualtat global en el període 1988 i 2008?
- Amb
unique()
també pots saber quins valors pot prendre la variableinc_con
. Què signifiquen aquests valors? Quina implicació té per conèixer les desigualtats d’un país saber si les dades prenen un valor o un altre? - Busca quina variable indica la font amb què s’han obtingut les dades. Quantes fonts secundàries diferents hi ha? Trobaràs una descripció d’aquestes fonts al llibre de codis. Quin és la principal font d’informació primària que utilitzen? Comenta els aspectes positius i negatius d’obtenir dades de desigualtat a partir d’aquest tipus de font primària que s’utilitza.
- Identifica el significat de les variables
pop
,totpop
,RRinc
,RRmean
iventile_n
.
Un cop ja hem conegut més a fons les dades amb les que treballarem, ja podem generar l’elefant, que trobem representat a la Figura 1. Veureu que és un gràfic molt semblant al que descriu Milanovic en el seu llibre2.
all_ginis %>%
filter(bin_year %in% c(1988, 2008), #filtrem només els anys 1988 i 2008
!is.na(RRinc)) %>% #eliminem NA
group_by(ventile_n, bin_year, RRmean_ventile_n) %>% #agrupem per ventil, any i ingrés real
summarize() %>% #simplifiquem el marc de dades
spread(bin_year, RRmean_ventile_n) %>% #posem un any a cada columna
mutate(diff = (`2008` - `1988`) / `1988`) %>% #creem una nova columna amb la diferència d'ingrés real entre 2008 i 1988
ggplot(aes(x = ventile_n, y = diff)) +
geom_line() +
scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
labs(x = "Income group (ventile)", y = "Real income growth (%)") +
theme_bw()
Exercici 2: A partir del que descriu Milanovic a les primeres pàgines de Global Inequality (Milanovic 2016) i del que observes en el gràfic de la Figura 1, fes els següents exercicis:
- Descriu el que observes al gràfic: Què ens ensenya? Què ens indica l’eix de les x? I l’eix de les y?
- Interpreta el què observes en el primer, cinquè, quinzè i vintè vintil del gràfic.
- Què significa l’ingrés real? Què ens permet calcular que no ens permet l’ingrés nominal?
La desigualtat a dins dels països
Un cop ja coneixem l’evolució de la desigualtat global, podem centrar-nos a observar de més de prop l’evolució de la desigualtat en un país determinat. Podeu consultar la llista de països que tenim a la base de dades amb unique (all_ginis$country)
.
## [1] "Bangladesh" "India"
## [3] "Uzbekistan" "Uganda"
## [5] "Mauritania" "Pakistan"
## [7] "Honduras" "Ghana"
## [9] "Guatemala" "Nigeria"
## [11] "Lesotho" "Costa Rica"
## [13] "Brazil" "Indonesia"
## [15] "El Salvador" "Gambia, The"
## [17] "Central African Republic" "Burundi"
## [19] "Madagascar" "Swaziland"
## [21] "Angola" "Burkina Faso"
## [23] "Nicaragua" "Kyrgyz Republic"
## [25] "Peru" "Mali"
## [27] "Niger" "Zambia"
## [29] "Guinea-Bissau" "Comoros"
## [31] "Botswana" "Panama"
## [33] "Zimbabwe" "Senegal"
## [35] "Ecuador" "Guinea"
## [37] "Namibia" "Vietnam"
## [39] "Ethiopia" "Kenya"
## [41] "Lao PDR" "Malawi"
## [43] "Mozambique" "Tajikistan"
## [45] "Cambodia" "South Africa"
## [47] "Rwanda" "Nepal"
## [49] "Colombia" "Venezuela, RB"
## [51] "Papua New Guinea" "Maldives"
## [53] "Paraguay" "Mexico"
## [55] "Moldova" "Micronesia, Fed. Sts."
## [57] "Bolivia" "Congo, Dem. Rep."
## [59] "Benin" "Tanzania"
## [61] "Sierra Leone" "Fiji"
## [63] "Congo, Rep." "Chad"
## [65] "Haiti" "Cote d'Ivoire"
## [67] "Timor-Leste" "Liberia"
## [69] "Togo" "Yemen, Rep."
## [71] "Dominican Republic" "Philippines"
## [73] "Belize" "New Zealand"
## [75] "St. Lucia" "Suriname"
## [77] "Sao Tome and Principe" "Turkmenistan"
## [79] "Guyana" "Cameroon"
## [81] "Cape Verde" "Argentina"
## [83] "Djibouti" "Georgia"
## [85] "Bhutan" "Sudan"
## [87] "Azerbaijan" "Sri Lanka"
## [89] "Armenia" "Mongolia"
## [91] "Thailand" "Chile"
## [93] "Algeria" "Tunisia"
## [95] "Jamaica" "Morocco"
## [97] "Kazakhstan" "Gabon"
## [99] "Iraq" "Romania"
## [101] "Egypt, Arab Rep." "Lithuania"
## [103] "Trinidad and Tobago" "Poland"
## [105] "Iran, Islamic Rep." "Jordan"
## [107] "Turkey" "Russian Federation"
## [109] "Malaysia" "Syrian Arab Republic"
## [111] "Kosovo" "Ukraine"
## [113] "Albania" "Belarus"
## [115] "Latvia" "Macedonia, FYR"
## [117] "Uruguay" "Estonia"
## [119] "Bulgaria" "Seychelles"
## [121] "Hungary" "Ireland"
## [123] "Montenegro" "Serbia"
## [125] "West Bank and Gaza" "Israel"
## [127] "United Kingdom" "Portugal"
## [129] "Slovak Republic" "Bosnia and Herzegovina"
## [131] "Cyprus" "United States"
## [133] "Italy" "France"
## [135] "Greece" "Korea, Rep."
## [137] "Netherlands" "Spain"
## [139] "Australia" "Singapore"
## [141] "Slovenia" "Belgium"
## [143] "Czech Republic" "Canada"
## [145] "Hong Kong SAR, China" "Croatia"
## [147] "Japan" "Finland"
## [149] "Germany" "Denmark"
## [151] "Switzerland" "Taiwan"
## [153] "Austria" "Sweden"
## [155] "Barbados" "Norway"
## [157] "Iceland" "Luxembourg"
## [159] "China"
En aquest apartat ens centrarem en el cas d’un estat concret, Espanya, i mirarem de respondre aquestes dues preguntes:
- Com ha canviat la distribució de la renda al llarg del temps?
- Com ha canviat la desigualtat mesurada en termes de l’Índex de Gini?
Per poder-les respondre haurem de preparar un marc de dades a partir de la base de dades All Ginis que inclogui només les observacions del país que volem analitzar. Hem de tenir en compte que fins ara hem vist la distribució mundial de la renda en vintils (cada grup és una vintena part de la població total), però que la distribució per països es troba agrupada en decils (es divideix la població en deu grups iguals). Hem seguit el següent procediment que ha donat com a resultat la Taula 2:
- Hem filtrat les dades de
all_ginis
pel país que ens interessa i pels anys 1988 i 2008. D’aquí n’ha sortit el marc de dadesgini_spain
. - Hem creat les columnes
RRinc_cum
iRRmean_cum
. Aquestes dues columnes ens serviran per calcular més endavant l’Índex de Gini.
gini_spain <- all_ginis %>%
filter(country == "Spain", #seleccionem el país
bin_year %in% c(1988, 2008)) %>% #seleccionem els dos anys d'interès
select(bin_year, group, RRinc, RRmean) %>%
arrange(bin_year, RRinc) %>%
group_by(bin_year) %>%
mutate(RRinc_cum = cumsum(RRinc),
RRmean_cum = cumsum(RRmean))
bin_year | group | RRinc | RRmean | RRinc_cum | RRmean_cum |
---|---|---|---|---|---|
1988 | 1 | 1989 | 7030 | 1989 | 7030 |
1988 | 2 | 3320 | 7030 | 5309 | 14060 |
1988 | 3 | 4090 | 7030 | 9399 | 21090 |
1988 | 4 | 4768 | 7030 | 14167 | 28120 |
1988 | 5 | 5534 | 7030 | 19701 | 35150 |
1988 | 6 | 6382 | 7030 | 26083 | 42180 |
1988 | 7 | 7340 | 7030 | 33423 | 49210 |
1988 | 8 | 8566 | 7030 | 41989 | 56240 |
1988 | 9 | 10586 | 7030 | 52575 | 63270 |
1988 | 10 | 17723 | 7030 | 70298 | 70300 |
2008 | 1 | 2966 | 10725 | 2966 | 10725 |
2008 | 2 | 5078 | 10725 | 8044 | 21450 |
2008 | 3 | 6442 | 10725 | 14486 | 32175 |
2008 | 4 | 7638 | 10725 | 22124 | 42900 |
2008 | 5 | 8816 | 10725 | 30940 | 53625 |
2008 | 6 | 10130 | 10725 | 41070 | 64350 |
2008 | 7 | 11642 | 10725 | 52712 | 75075 |
2008 | 8 | 13458 | 10725 | 66170 | 85800 |
2008 | 9 | 16225 | 10725 | 82395 | 96525 |
2008 | 10 | 24857 | 10725 | 107252 | 107250 |
Exercici 3: Examina la Taula 2 i respon a les preguntes següents:
- Quant guanyava un ciutadà de l’estat espanyol, de mitjana, el 1988?
- Quina era la mediana d’ingressos a Espanya l’any 1988?
- Si sabem el valor que pren la mitjana i la mediana, podem intuir quina forma pren la distribució. Serà una distribució positiva o negativa? Això significa que la major part de la població té uns ingressos inferiors o superiors a la mitjana?
- Explica, a partir de les dades de la taula, el significat de les columnes
RRinc_cum
iRRmean_cum
.
Canvi de la distribució de la renda en un país
Per saber com ha canviat la distribució de la renda a Espanya de 1988 a 2008 hem de fer una operació molt semblant a la que hem realitzat per crear l’elefant. En el cas anterior, però, hem volgut visualitzar la distribució de la renda mundial i ara observarem un cas en concret.
gini_spain %>%
select(group, bin_year, RRinc) %>%
spread(bin_year, RRinc) %>%
mutate(diff = (`2008` - `1988`) / `1988`) %>%
ggplot(aes(x = group, y = diff)) +
geom_line() +
scale_x_continuous(breaks = 1:10) +
scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
labs(x = "Income group (decile)", y = "Real income growth (%)") +
theme_bw() +
theme(panel.grid.minor.x = element_blank())
Exercici 4: Observa la Figura 2 i el codi utilitzat per reproduir-la i fes les activitats següents:
- Com ha evolucionat la renda a Espanya entre 1988 i 2008? Fes una descripció del gràfic.
- La renda real del decil més alt ha augmentat relativament menys que la resta de decils. Significa això que les desigualtats han disminuït a Espanya?
- Quines limitacions tenen els gràfics que representen les dades per decils? Podem saber la variació en l’ingrés real de les rendes més altes? (per exemple, el Top 1%)
- Escull un període i un altre país a partir de les dades disponibles i modifica el codi per obtenir una taula i un gràfic amb l’evolució de la desigualtat d’ingressos. Busca un país on el canvi en la desigualtat d’ingressos per al període seleccionat et cridi l’atenció. Explica’n el motiu i comenta la taula i el gràfic resultant.
Canvi en termes de l’Índex de Gini
La segona pregunta que ens fèiem anteriorment és com havia canviat la desigualtat mesurada en termes de l’índex de Gini. Hi ha diverses formes numèriques de calcular les desigualtats en una població. L’índex de Gini és una d’elles. En aquest curs només us demanem saber que un índex de Gini proper a 1 significa molta desigualtat mentre que un índex proper a 0 significa poca desigualtat, però si voleu saber com es calcula teniu aquest tutorial per fer el càlcul en Excel.
Font: YoutubeL’índex de Gini es calcula a partir de la corba de Lorenz, que veieu a la següent Figura 3. Per crear la figura hem utilitzat les columnes RRinc_cum
i RRmean_cum
, que hem creat anteriorment i que en un exercici us demanàvem que examinéssiu el seu significat. El gràfic està creat a partir d’aquestes dues variables.
- La línia blava representa
RRinc_cum
. - La línia taronja representa
RRmean_cum
. - L’índex de Gini és la proporció que ocupa l’àrea entre la línia blava i la línia taronja (àrea A) respecte tota l’àrea del triangle inferior dret del gràfic (àrea A + B).
zeros <- tribble(~bin_year, ~group, ~RRinc, ~RRmean, ~RRinc_cum, ~RRmean_cum,
1988,0,0,0,0,0,
2008,0,0,0,0,0)
gini_spain %>%
bind_rows(zeros) %>% #afegim el grup 0 de cada any
ggplot(aes(x = group)) +
geom_line(aes(y = RRinc_cum), col = "blue", lty = 2, size = 1) +
geom_line(aes(y = RRmean_cum), col = "orange", size = 1) +
scale_x_continuous(breaks = 0:10) +
facet_wrap(~bin_year, scales = "free")
Exercici 5: A la Figura 3 observem la corba de Lorenz d’Espanya els anys 1988 i 2008. Respon a les següents preguntes:
- Observem gaires diferències entre la corba de Lorenz l’any 1988 i l’any 2008? A quin any diries, a simple vista, que hi havia més desigualtat a Espanya?
- Comenta el gràfic a partir de comparar el tercer, el cinquè i el novè decil de la distribució de la renda a Espanya en els dos anys.
- Què significaria que la línia blava i la línia taronja coincidissin?
- Si la línia blava fes un cercle més pronunciat (més allunyat de la línia taronja) tindríem més o menys desigualtat?
El càlcul de l’índex de Gini, doncs, parteix de la corba de Lorenz. Per obtenir-lo hem de calcular la proporció de l’àrea que es troba entre la línia blava i la línia taronja sobre l’àrea en forma de triangle entre la línia taronja i l’extrem inferior dret del gràfic. Per això farem les operacions següents:
- Calculem B: l’àrea que forma
RRinc_cum
(línia blava) i l’extrem inferior dret del gràfic. - Calculem A: l’àrea que forma
RRmean_cum
(línia taronja) i l’extrem inferior dret del gràfic. - L’índex de Gini s’obté amb la fórmula:
\[Gini = \frac{A}{A + B} * 100\]
gini_spain %>%
mutate(base = group - lag(group, default = 0),
quadre = lag(RRinc_cum, default = 0) * base,
triangle = (RRinc_cum - lag(RRinc_cum, default = 0)) / 2,
area = quadre + triangle) %>%
summarize(B = sum(area), #calculem B
`A+B` = max(RRmean_cum) * max(group) / 2, #calculem A + B
A = `A+B` - B, #calculem A
Gini = round(A / `A+B` * 100, 1)) %>% #obtenim l'índex de Gini
transmute(Any = bin_year, A, B, `A+B`, Gini)
Any | A | B | A+B | Gini |
---|---|---|---|---|
1988 | 111716 | 239784 | 351500 | 31.8 |
2008 | 161717 | 374533 | 536250 | 30.2 |
EXERCICI FINAL: El codi anterior ens ha generat la Taula 3, on podem veure l’extensió de les àrees A i B i l’índex de Gini d’Espanya en els anys seleccionats.
- Interpreta l’índex de Gini d’Espanya. Les desigualtats han disminuït o han augmentat en el període 1988-2008?
- Podríem dir que l’índex de Gini és alt a Espanya en comparació als altres països del món?
- Quina seria l’àrea total de tot el gràfic? (pista: fa forma de quadrat)
- Escull un altre país en dos anys que seleccionis entre els que tens disponibles a la variable
bin_year
. Visualitza la corba de Lorenz i calcula l’índex de Gini. Fes un breu comentari dels resultats.
Referències
Aquesta activitat està elaborada amb propòsits estrictament docents. Les operacions que es realitzen no pretenen tenir cap validesa des d’un punt de vista acadèmic. Podeu ajudar-vos d’aquest RMarkdown↩︎
L’única diferència és que a Global Inequalities observem el guany relatiu per vintils entre 1988 i 2008, mentre que en aquest gràfic observem el canvi relatiu en l’ingrés real per vintils entre 1988 i 2008.↩︎