L'elefant de Milanovic

Branko Milanovic i Simon Kuznets són dos dels acadèmics més coneguts en els estudis de la desigualtat. A cada un d’ells se’l coneix per identificar una determinada trajectòria de la desigualtat en un període de temps determinat:

  • L’elefant de Milanovic: La diferencia en percentatge de guany entre la distribució per nivell d’ingressos l’any 2008 i l’any 1988 fa forma d’elefant.
  • La corba de Kuznets: A mesura que la riquesa d’un país creix amb el procés d’industrialització, en una primera fase les desigualtats creixen i en una segona fase decreixen, de manera que la relació entre creixement econòmic i desigualtats té forma de U invertida.

En aquesta pràctica observarem el que es coneix com l’Elefant de Milanovic, que és la forma que descriu l’evolució de la desigualtat mundial entre els períodes 1988 i 2008. Aquesta corba, descrita per Branko Milanovic i Christoph Laekner, indica la diferencia en percentatge de guany entre la distribució per nivell d’ingressos l’any 2008 i l’any 19881. En primer lloc, carregarem els paquets que necessitem.

#recordeu que els paquets han d'estar prèviament instal·lats 
library(tidyr)
library(dplyr)
library(ggplot2)

L’elefant de Milanovic

L’elefant de Milanovic és una visualització recent que descriu com ha evolucionat la desigualtat mundial en les darreres dècades. Els exercicis d’aquest apartat s’han de complementar amb el capítol 1 del llibre Global Inequality (Milanovic 2016). Per crear una reproducció semblant a la de l’elefant, en primer lloc hem de descarregar la base de dades All Ginis i observar el seu contingut. A la Taula 1 podeu consultar les primeres observacions del marc de dades all_ginis.

download.file("https://www.gc.cuny.edu/getmedia/514d5ba9-74ed-4007-a3fe-02b079705c91/LM_WPID_web_2",
              "all_ginis.dta")

#descàrrega amb el paquet foreign
library(foreign) #caldrà instal·lar el paquet foreign
all_ginis <- as_tibble(read.dta("all_ginis.dta"))

#descàrrega amb el paquet haven
library(haven) #caldrà instal·lar el paquet haven
all_ginis <- read_dta("all_ginis.dta")

DESCÀRREGA: Si no us funciona el codi de descàrrega, descarregueu l’arxiu .dta manualment, ubiqueu-lo al vostre directori de treball i canvieu-li el nom per all_ginis.dta. A continuació, utilitzeu la versió foreign o haven per convertir l’arxiu en objecte d’R.

Table 1: All ginis dataset
contcodcountryregionyearinc_consourcemysamplebin_yeargrouppopRRincRRmeancons_2005ppp_pcgdp_2005ppp_pctotpopDno_chinaventile_nRRmean_ventile_npop_ventile_nnvals
BGDBangladeshOther Asia1988Cpovcal11988110.0062320185444637.7204723.0073100.06232011188.2125158.2661
IND-UIndiaIndia1987Cpovcal11988120.9592464210611NANA209.59246411188.2125158.2660
UZBUzbekistanRussia, C. Asia, SE Europe1988Iwyd1198811.9561180203402NA2004.307419.56118011188.2125158.2660
UGAUgandaSub-Saharan Africa1989Cpovcal1198821.6482365133441394.4634547.359116.48236511188.2125158.2660
MRTMauritaniaSub-Saharan Africa1987Cpovcal1198820.18923282057321392.17921822.79521.89232811188.2125158.2660
PAKPakistanOther Asia1987Cpovcal11988110.53324641654531038.43991505.3386105.33246411188.2125158.2660
HNDHondurasL. America & Carib.1989Ipovcal1198820.461824519611421717.33282731.61964.61824511188.2125158.2660
GHAGhanaSub-Saharan Africa1988Cpovcal1198811.4010951166578598.9019882.044714.01095111188.2125158.2660
UGAUgandaSub-Saharan Africa1989Cpovcal1198831.6482365180441394.4634547.359116.48236511188.2125158.2660
HNDHondurasL. America & Carib.1989Ipovcal1198810.461824511911421717.33282731.61964.61824511188.2125158.2660

Exercici 1: Fes una exploració general del marc de dades i les seves variables. Ajuda’t del llibre de codis de la base de dades que trobaràs a All Ginis Dataset:

  • Per consultar el marc de dades només has de teclejar el seu nom (all_ginis). Et serà molt útil la funció glimpse(all_ginis).
  • Per consultar una variable pots teclejar el nom del marc de dades, seguit de $ i el nom de la variable (all_ginis$nom_variable) o bé aplicar la funció que necessitis a la variable. Per exemple: funcio(all_ginis$nom_variable).

Respon a les següents preguntes:

  1. D’acord amb el que has après a Normes ISO, quina(es) variable(s) podríem utilitzar per unir les dades de All Ginis amb les d’un altre marc de dades?
  2. Per realitzar el seu estudi, els autors Lakner i Milanovic van agrupar les dades de desigualtat en uns pocs anys, agrupats a la variable bin_year. Quins són aquests anys? Utilitza unique() per saber-ho. Esbrina la diferència entre year i bin_year.
  3. Com justifica Milanovic en el seu llibre que és rellevant observar l’evolució de la desigualtat global en el període 1988 i 2008?
  4. Amb unique() també pots saber quins valors pot prendre la variable inc_con. Què signifiquen aquests valors? Quina implicació té per conèixer les desigualtats d’un país saber si les dades prenen un valor o un altre?
  5. Busca quina variable indica la font amb què s’han obtingut les dades. Quantes fonts secundàries diferents hi ha? Trobaràs una descripció d’aquestes fonts al llibre de codis. Quin és la principal font d’informació primària que utilitzen? Comenta els aspectes positius i negatius d’obtenir dades de desigualtat a partir d’aquest tipus de font primària que s’utilitza.
  6. Identifica el significat de les variables pop, totpop, RRinc, RRmean i ventile_n.

Un cop ja hem conegut més a fons les dades amb les que treballarem, ja podem generar l’elefant, que trobem representat a la Figura 1. Veureu que és un gràfic molt semblant al que descriu Milanovic en el seu llibre2.

all_ginis %>%
  filter(bin_year %in% c(1988, 2008), #filtrem només els anys 1988 i 2008
         !is.na(RRinc)) %>% #eliminem NA
  group_by(ventile_n, bin_year, RRmean_ventile_n) %>% #agrupem per ventil, any i ingrés real
  summarize() %>% #simplifiquem el marc de dades
  spread(bin_year, RRmean_ventile_n) %>% #posem un any a cada columna
  mutate(diff = (`2008` - `1988`) / `1988`) %>% #creem una nova columna amb la diferència d'ingrés real entre 2008 i 1988
  ggplot(aes(x = ventile_n, y = diff)) +
  geom_line() + 
  scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
  labs(x = "Income group (ventile)", y = "Real income growth (%)") +
  theme_bw()
L'Elefant de Milanovic (1988 - 2008)

Figure 1: L’Elefant de Milanovic (1988 - 2008)

Exercici 2: A partir del que descriu Milanovic a les primeres pàgines de Global Inequality (Milanovic 2016) i del que observes en el gràfic de la Figura 1, fes els següents exercicis:

  1. Descriu el que observes al gràfic: Què ens ensenya? Què ens indica l’eix de les x? I l’eix de les y?
  2. Interpreta el què observes en el primer, cinquè, quinzè i vintè vintil del gràfic.
  3. Què significa l’ingrés real? Què ens permet calcular que no ens permet l’ingrés nominal?

La desigualtat a dins dels països

Un cop ja coneixem l’evolució de la desigualtat global, podem centrar-nos a observar de més de prop l’evolució de la desigualtat en un país determinat. Podeu consultar la llista de països que tenim a la base de dades amb unique (all_ginis$country).

##   [1] "Bangladesh"               "India"                   
##   [3] "Uzbekistan"               "Uganda"                  
##   [5] "Mauritania"               "Pakistan"                
##   [7] "Honduras"                 "Ghana"                   
##   [9] "Guatemala"                "Nigeria"                 
##  [11] "Lesotho"                  "Costa Rica"              
##  [13] "Brazil"                   "Indonesia"               
##  [15] "El Salvador"              "Gambia, The"             
##  [17] "Central African Republic" "Burundi"                 
##  [19] "Madagascar"               "Swaziland"               
##  [21] "Angola"                   "Burkina Faso"            
##  [23] "Nicaragua"                "Kyrgyz Republic"         
##  [25] "Peru"                     "Mali"                    
##  [27] "Niger"                    "Zambia"                  
##  [29] "Guinea-Bissau"            "Comoros"                 
##  [31] "Botswana"                 "Panama"                  
##  [33] "Zimbabwe"                 "Senegal"                 
##  [35] "Ecuador"                  "Guinea"                  
##  [37] "Namibia"                  "Vietnam"                 
##  [39] "Ethiopia"                 "Kenya"                   
##  [41] "Lao PDR"                  "Malawi"                  
##  [43] "Mozambique"               "Tajikistan"              
##  [45] "Cambodia"                 "South Africa"            
##  [47] "Rwanda"                   "Nepal"                   
##  [49] "Colombia"                 "Venezuela, RB"           
##  [51] "Papua New Guinea"         "Maldives"                
##  [53] "Paraguay"                 "Mexico"                  
##  [55] "Moldova"                  "Micronesia, Fed. Sts."   
##  [57] "Bolivia"                  "Congo, Dem. Rep."        
##  [59] "Benin"                    "Tanzania"                
##  [61] "Sierra Leone"             "Fiji"                    
##  [63] "Congo, Rep."              "Chad"                    
##  [65] "Haiti"                    "Cote d'Ivoire"           
##  [67] "Timor-Leste"              "Liberia"                 
##  [69] "Togo"                     "Yemen, Rep."             
##  [71] "Dominican Republic"       "Philippines"             
##  [73] "Belize"                   "New Zealand"             
##  [75] "St. Lucia"                "Suriname"                
##  [77] "Sao Tome and Principe"    "Turkmenistan"            
##  [79] "Guyana"                   "Cameroon"                
##  [81] "Cape Verde"               "Argentina"               
##  [83] "Djibouti"                 "Georgia"                 
##  [85] "Bhutan"                   "Sudan"                   
##  [87] "Azerbaijan"               "Sri Lanka"               
##  [89] "Armenia"                  "Mongolia"                
##  [91] "Thailand"                 "Chile"                   
##  [93] "Algeria"                  "Tunisia"                 
##  [95] "Jamaica"                  "Morocco"                 
##  [97] "Kazakhstan"               "Gabon"                   
##  [99] "Iraq"                     "Romania"                 
## [101] "Egypt, Arab Rep."         "Lithuania"               
## [103] "Trinidad and Tobago"      "Poland"                  
## [105] "Iran, Islamic Rep."       "Jordan"                  
## [107] "Turkey"                   "Russian Federation"      
## [109] "Malaysia"                 "Syrian Arab Republic"    
## [111] "Kosovo"                   "Ukraine"                 
## [113] "Albania"                  "Belarus"                 
## [115] "Latvia"                   "Macedonia, FYR"          
## [117] "Uruguay"                  "Estonia"                 
## [119] "Bulgaria"                 "Seychelles"              
## [121] "Hungary"                  "Ireland"                 
## [123] "Montenegro"               "Serbia"                  
## [125] "West Bank and Gaza"       "Israel"                  
## [127] "United Kingdom"           "Portugal"                
## [129] "Slovak Republic"          "Bosnia and Herzegovina"  
## [131] "Cyprus"                   "United States"           
## [133] "Italy"                    "France"                  
## [135] "Greece"                   "Korea, Rep."             
## [137] "Netherlands"              "Spain"                   
## [139] "Australia"                "Singapore"               
## [141] "Slovenia"                 "Belgium"                 
## [143] "Czech Republic"           "Canada"                  
## [145] "Hong Kong SAR, China"     "Croatia"                 
## [147] "Japan"                    "Finland"                 
## [149] "Germany"                  "Denmark"                 
## [151] "Switzerland"              "Taiwan"                  
## [153] "Austria"                  "Sweden"                  
## [155] "Barbados"                 "Norway"                  
## [157] "Iceland"                  "Luxembourg"              
## [159] "China"

En aquest apartat ens centrarem en el cas d’un estat concret, Espanya, i mirarem de respondre aquestes dues preguntes:

Per poder-les respondre haurem de preparar un marc de dades a partir de la base de dades All Ginis que inclogui només les observacions del país que volem analitzar. Hem de tenir en compte que fins ara hem vist la distribució mundial de la renda en vintils (cada grup és una vintena part de la població total), però que la distribució per països es troba agrupada en decils (es divideix la població en deu grups iguals). Hem seguit el següent procediment que ha donat com a resultat la Taula 2:

  • Hem filtrat les dades de all_ginis pel país que ens interessa i pels anys 1988 i 2008. D’aquí n’ha sortit el marc de dades gini_spain.
  • Hem creat les columnes RRinc_cum i RRmean_cum. Aquestes dues columnes ens serviran per calcular més endavant l’Índex de Gini.
gini_spain <- all_ginis %>%
  filter(country == "Spain", #seleccionem el país
         bin_year %in% c(1988, 2008)) %>% #seleccionem els dos anys d'interès
  select(bin_year, group, RRinc, RRmean) %>%
  arrange(bin_year, RRinc) %>%
  group_by(bin_year) %>%
  mutate(RRinc_cum = cumsum(RRinc),
         RRmean_cum = cumsum(RRmean))
Table 2: Ingrés real a Espanya (1988 - 2008)
bin_yeargroupRRincRRmeanRRinc_cumRRmean_cum
198811989703019897030
1988233207030530914060
1988340907030939921090
19884476870301416728120
19885553470301970135150
19886638270302608342180
19887734070303342349210
19888856670304198956240
198891058670305257563270
1988101772370307029870300
20081296610725296610725
20082507810725804421450
200836442107251448632175
200847638107252212442900
200858816107253094053625
2008610130107254107064350
2008711642107255271275075
2008813458107256617085800
2008916225107258239596525
2008102485710725107252107250

Exercici 3: Examina la Taula 2 i respon a les preguntes següents:

  1. Quant guanyava un ciutadà de l’estat espanyol, de mitjana, el 1988?
  2. Quina era la mediana d’ingressos a Espanya l’any 1988?
  3. Si sabem el valor que pren la mitjana i la mediana, podem intuir quina forma pren la distribució. Serà una distribució positiva o negativa? Això significa que la major part de la població té uns ingressos inferiors o superiors a la mitjana?
  4. Explica, a partir de les dades de la taula, el significat de les columnes RRinc_cum i RRmean_cum.

Canvi de la distribució de la renda en un país

Per saber com ha canviat la distribució de la renda a Espanya de 1988 a 2008 hem de fer una operació molt semblant a la que hem realitzat per crear l’elefant. En el cas anterior, però, hem volgut visualitzar la distribució de la renda mundial i ara observarem un cas en concret.

gini_spain %>%
  select(group, bin_year, RRinc) %>%
  spread(bin_year, RRinc) %>%
  mutate(diff = (`2008` - `1988`) / `1988`) %>%
  ggplot(aes(x = group, y = diff)) +
  geom_line() + 
  scale_x_continuous(breaks = 1:10) +
  scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
  labs(x = "Income group (decile)", y = "Real income growth (%)") +
  theme_bw() +
  theme(panel.grid.minor.x = element_blank())
Evolució de la distribució de la renda a Espanya (1988-2008)

Figure 2: Evolució de la distribució de la renda a Espanya (1988-2008)

Exercici 4: Observa la Figura 2 i el codi utilitzat per reproduir-la i fes les activitats següents:

  1. Com ha evolucionat la renda a Espanya entre 1988 i 2008? Fes una descripció del gràfic.
  2. La renda real del decil més alt ha augmentat relativament menys que la resta de decils. Significa això que les desigualtats han disminuït a Espanya?
  3. Quines limitacions tenen els gràfics que representen les dades per decils? Podem saber la variació en l’ingrés real de les rendes més altes? (per exemple, el Top 1%)
  4. Escull un període i un altre país a partir de les dades disponibles i modifica el codi per obtenir una taula i un gràfic amb l’evolució de la desigualtat d’ingressos. Busca un país on el canvi en la desigualtat d’ingressos per al període seleccionat et cridi l’atenció. Explica’n el motiu i comenta la taula i el gràfic resultant.

Canvi en termes de l’Índex de Gini

La segona pregunta que ens fèiem anteriorment és com havia canviat la desigualtat mesurada en termes de l’índex de Gini. Hi ha diverses formes numèriques de calcular les desigualtats en una població. L’índex de Gini és una d’elles. En aquest curs només us demanem saber que un índex de Gini proper a 1 significa molta desigualtat mentre que un índex proper a 0 significa poca desigualtat, però si voleu saber com es calcula teniu aquest tutorial per fer el càlcul en Excel.

Font: Youtube

L’índex de Gini es calcula a partir de la corba de Lorenz, que veieu a la següent Figura 3. Per crear la figura hem utilitzat les columnes RRinc_cum i RRmean_cum, que hem creat anteriorment i que en un exercici us demanàvem que examinéssiu el seu significat. El gràfic està creat a partir d’aquestes dues variables.

  • La línia blava representa RRinc_cum.
  • La línia taronja representa RRmean_cum.
  • L’índex de Gini és la proporció que ocupa l’àrea entre la línia blava i la línia taronja (àrea A) respecte tota l’àrea del triangle inferior dret del gràfic (àrea A + B).
zeros <- tribble(~bin_year, ~group, ~RRinc, ~RRmean, ~RRinc_cum, ~RRmean_cum,
                 1988,0,0,0,0,0,
                 2008,0,0,0,0,0)
gini_spain %>%
  bind_rows(zeros) %>% #afegim el grup 0 de cada any
  ggplot(aes(x = group)) +
  geom_line(aes(y = RRinc_cum), col = "blue", lty = 2, size = 1) +
  geom_line(aes(y = RRmean_cum), col = "orange", size = 1) +
  scale_x_continuous(breaks = 0:10) +
  facet_wrap(~bin_year, scales = "free")
Corba de Lorenz a Espanya (1988, 2008)

Figure 3: Corba de Lorenz a Espanya (1988, 2008)

Exercici 5: A la Figura 3 observem la corba de Lorenz d’Espanya els anys 1988 i 2008. Respon a les següents preguntes:

  1. Observem gaires diferències entre la corba de Lorenz l’any 1988 i l’any 2008? A quin any diries, a simple vista, que hi havia més desigualtat a Espanya?
  2. Comenta el gràfic a partir de comparar el tercer, el cinquè i el novè decil de la distribució de la renda a Espanya en els dos anys.
  3. Què significaria que la línia blava i la línia taronja coincidissin?
  4. Si la línia blava fes un cercle més pronunciat (més allunyat de la línia taronja) tindríem més o menys desigualtat?

El càlcul de l’índex de Gini, doncs, parteix de la corba de Lorenz. Per obtenir-lo hem de calcular la proporció de l’àrea que es troba entre la línia blava i la línia taronja sobre l’àrea en forma de triangle entre la línia taronja i l’extrem inferior dret del gràfic. Per això farem les operacions següents:

  • Calculem B: l’àrea que forma RRinc_cum (línia blava) i l’extrem inferior dret del gràfic.
  • Calculem A: l’àrea que forma RRmean_cum (línia taronja) i l’extrem inferior dret del gràfic.
  • L’índex de Gini s’obté amb la fórmula:

\[Gini = \frac{A}{A + B} * 100\]

gini_spain %>%
  mutate(base = group - lag(group, default = 0),
         quadre = lag(RRinc_cum, default = 0) * base,
         triangle = (RRinc_cum - lag(RRinc_cum, default = 0)) / 2,
         area = quadre + triangle) %>%
  summarize(B = sum(area), #calculem B
            `A+B` = max(RRmean_cum) * max(group) / 2, #calculem A + B
            A = `A+B` - B, #calculem A
            Gini = round(A / `A+B` * 100, 1)) %>% #obtenim l'índex de Gini
  transmute(Any = bin_year, A, B, `A+B`, Gini)
Table 3: Índex de Gini a Espanya 1988-2008
AnyABA+BGini
198811171623978435150031.8
200816171737453353625030.2

EXERCICI FINAL: El codi anterior ens ha generat la Taula 3, on podem veure l’extensió de les àrees A i B i l’índex de Gini d’Espanya en els anys seleccionats.

  1. Interpreta l’índex de Gini d’Espanya. Les desigualtats han disminuït o han augmentat en el període 1988-2008?
  2. Podríem dir que l’índex de Gini és alt a Espanya en comparació als altres països del món?
  3. Quina seria l’àrea total de tot el gràfic? (pista: fa forma de quadrat)
  4. Escull un altre país en dos anys que seleccionis entre els que tens disponibles a la variable bin_year. Visualitza la corba de Lorenz i calcula l’índex de Gini. Fes un breu comentari dels resultats.

Referències

Milanovic, Branko. 2016. Global Inequality: A New Approach for the Age of. Globalization. Cambridge, MA: Harvard University Press.

  1. Aquesta activitat està elaborada amb propòsits estrictament docents. Les operacions que es realitzen no pretenen tenir cap validesa des d’un punt de vista acadèmic. Podeu ajudar-vos d’aquest RMarkdown↩︎

  2. L’única diferència és que a Global Inequalities observem el guany relatiu per vintils entre 1988 i 2008, mentre que en aquest gràfic observem el canvi relatiu en l’ingrés real per vintils entre 1988 i 2008.↩︎

Next