Democràcia binària

Els indicadors de democràcia dicotòmics o binaris (també dits minimalistes per la seva referència a aspectes únicament procedimentals) són aquells en què un règim polític només pot adoptar dos valors: 1 si és una democràcia i 0 si no ho és. No hi ha terme mig. Principalment coneixem dues bases de dades que tracten la democràcia de forma binària1:

Les bases de dades

Per treballar amb aquestes dues bases de dades haurem de carregar els paquets següents:

#recordeu que els paquets han d'estar prèviament instal·lats 
library(readr)
library(readxl)
library(foreign)
library(dplyr)
library(ggplot2)
library(tidyr)

El primer que hem de fer és importar les dues bases de dades. La DD la trobem a la pàgina web d’un dels autors José Antonio Cheibub. La DCD la trobem a la pàgina web de Michael K. Miller.

dd <- as_tibble(read.dta("https://uofi.box.com/shared/static/bba3968d7c3397c024ec.dta"))
dcd <- read_csv("https://sites.google.com/site/mkmtwo/democracy-v3.0.csv?attredirects=0")

Per a les activitats d’aquest exercici ens pot ser útil la informació sobre com explorar un marc de dades i sobre com utilitzar un llibre de codis, on s’explica específicament amb més detall la DD dataset.

DD dataset

Si teclegem head(dd) veurem les primeres files de la DD dataset, que és el que també observem a la Taula 1. Per familiaritzar-nos-hi haurem llegir el llibre de codis que trobarem a la pàgina web de Cheibub i d’explorar el marc de dades amb diverses funcions:

  • glimpse(dd): Visualitzem el marc de dades horitzontalment.
  • dim(dd): Examina les observacions i variables del marc de dades.
  • names(dd): Veiem les variables del marc de dades.
  • head(dd): Retorna les primeres observacions.
  • tail(dd): Retorna les darreres observacions.
  • unique(dd$ctryname): Retorna els valors únics de la variable ctryname.
Table 1: DD dataset
orderctrynameyearaclpcodecowcodecowcode2ccdcodeletccdcodenumaclpyearcowcode2yearcowcodeyearchgterrychgterrflagc_cowcode2flage_cowcode2entryyexitycidwdicodeimf_codepolitycodebankscodedpicodeuncodeun_regionun_region_nameun_continentun_continent_nameaclp_regionbornyearendyeardupcowdupwdidupundupdpidupimfdupbanksexseleclegseleccloseddejuredefactodefacto2lpartyincumbtype2collectnheadsnmilnheadnpostndateeheadsageehemilroyalheaddiffeheadepostedatetenure08commecens08edeathflagehdemocracyassconfidpoppreselecregimettttdttaflagcflagdemflagregagedemageregstra
1Afghanistan1946142700700AFG1142194670019467001946001019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000010Mohammad Zahir Shahking11.08.33014010Mohammad Zahir Shahking11.08.33200111000500011118180
2Afghanistan1947142700700AFG1142194770019477001947000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking015010Mohammad Zahir Shahking200110000500000019190
3Afghanistan1948142700700AFG1142194870019487001948000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking016010Mohammad Zahir Shahking200110000500000020200
4Afghanistan1949142700700AFG1142194970019497001949000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking017010Mohammad Zahir Shahking200110000500000021210
5Afghanistan1950142700700AFG1142195070019507001950000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking018010Mohammad Zahir Shahking200110000500000022220
6Afghanistan1951142700700AFG1142195170019517001951000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking019010Mohammad Zahir Shahking200110000500000023230

Exercici 1: Utilitza el llibre de codis i les funcions indicades anteriorment per respondre a les següents preguntes:

  1. Quantes observacions i quantes variables té aquest marc de dades?
  2. Per quina columna està ordenat el marc de dades? (sense comptar la columna order).
  3. Quin és l’últim país de la llista? Quin és el seu cowcode?
  4. Què significa la variable aclpyear?
  5. Indica quines són totes les columnes de codi de país que trobem en aquest marc de dades.
  6. Quantes regions diferents tenim a la columna un_region_name? I a la un_continent_name? Indica quines són.
  7. Quines són les variables del marc de dades que, combinades, formen la variable dicotòmica democracy?
  8. Quines categories pot adoptar la variable npost? Quina diferència hi ha amb la variable epost?

DCD dataset

A la Taula 2 hem reproduït les primeres files del DCD dataset. Per familiaritzar-nos-hi haurem d’explorar el marc de dades dcd i llegir el llibre de codis que trobarem a la pàgina web de Miller.

Table 2: DCD dataset
countryccodeabbreviationabbreviation_undpyeardemocracydemocracy_transdemocracy_breakdownsdemocracy_durationdemocracy_omitteddatademocracy_femalesuffrage
UNITED STATES OF AMERICA2USAUSA1800100110
UNITED STATES OF AMERICA2USAUSA1801100210
UNITED STATES OF AMERICA2USAUSA1802100310
UNITED STATES OF AMERICA2USAUSA1803100410
UNITED STATES OF AMERICA2USAUSA1804100510
UNITED STATES OF AMERICA2USAUSA1805100610

Exercici 2: Utilitza el llibre de codis i les funcions mencionades anteriorment per respondre a les següents preguntes:

  1. Quantes observacions i quantes variables té aquest marc de dades?
  2. Per quina columna està ordenat el marc de dades?
  3. Quin és l’últim país de la llista?
  4. Indica, de cada marc de dades, la columna o columnes que utilitzaries per unir-los.
  5. Descriu el significat i els valors que poden adoptar les columnes democracy_trans i democracy_breakdowns.
  6. Utilitza el codi següent per respondre: Quins són els cinc països que han tingut durant més anys el sufragi femení? Podries anomenar cinc països que no han tingut mai sufragi femení? Quin és el país que ha estat durant més anys una democràcia? Podries anomenar cinc països que no han han estat mai una democràcia?
dcd %>%
  group_by(country) %>%
  summarize(y = sum(?????????????)) %>% #introduir el nom de la variable
  arrange(desc(y)) #canvia l'ordre ascendent o descendent

Hauràs d’esbrinar com utilitzar la funció arrange() per canviar l’ordre de la columna y.

Diferències entre bases de dades

Com ja sabeu, la manera com cada base de dades registra el nombre de democràcies no és exactament igual. En la següent Figura 1 hem volgut comparar l’evolució històrica del nombre de democràcies segons cada base de dades. Per això hem fet un recompte del nombre de democràcies que hi havia cada any segons una base de dades i l’altra. Unim els nous marcs de dades que hem creat, dd1 i dcd1, i demanem un diagrama de línia amb l’any a l’eix de les x i el recompte de democràcies a l’eix de les y per a cada base de dades.

#DD: recompte de casos que democracy es 1
dd1 <- dd %>%
  filter(democracy == 1) %>%
  count(year, name = "DD") 

#DCD: recompte de casos que democracy es 1
dcd1 <- dcd %>%
  filter(year > 1945,
         democracy == 1) %>%
  count(year, name = "DCD")

dd1 %>%
  left_join(dcd1) %>% #unim bases de dades
  gather(base, num, -year) %>%
  ggplot(aes(x = year, y = num, col = base)) +
  geom_line(size = 1.5) +
  scale_color_brewer(type = "qual", palette = 7) +
  labs(x = "Any", y = "Nombre de democràcies",
       col = "Base de dades") +
  theme_light() +
  theme(legend.position = c(0.8, 0.28),
        legend.background = element_blank(),
        legend.key = element_blank(),
        legend.text = element_text(size=14))
La democràcia a les bases de dades DCD i DD

Figure 1: La democràcia a les bases de dades DCD i DD

Exercici 3: Observa la Figura 1 i respon a les següents preguntes:

  1. Fes una descripció de l’evolució de les dues línies del gràfic. Quines coincidències tenen? On divergeixen més?
  2. Sabries dir quina seria la base de dades amb uns criteris més estrictes de democràcia?
  3. En quins anys hi ha més democràcies a la base de dades DD en comparació a la base de dades DCD? Utilitza el codi següent per esbrinar-ho. Només caldrà que reprodueixis el següent codi i tot seguit teclegis years.
years <- dd1 %>%
  left_join(dcd1) %>%
  mutate(diff = DD - DCD) %>%
  filter(diff > 0) %>%
  pull(year)

Val a dir que hi ha una coincidència del 95.7% dels casos que són comuns a les dues bases de dades. Ara bé, quines són exactament les diferències entre una base de dades i l’altra? En el codi següent hem unit els marcs de dades originals, dd i dcd, i hem filtrat totes les observacions que divergeixen entre les bases de dades DCD i DD: un país és una democràcia en una base de dades però no ho és en una altra. El resultat és l’objecte dcd_dd, que mostrem parcialment a la Taula 3.

dcd_dd <- dcd %>%
  inner_join(dd, by = c("ccode" = "politycode", "year" = "year"), suffix = c("_dcd", "_dd")) %>%
  mutate(var = democracy_dcd - democracy_dd) %>%
  filter(var != 0) %>%
  select(country = ctryname, year, democracy_dcd, democracy_dd)

Amb el codi següent podem veure altres files del marc de dades. Pots navegar per les diferents files canviant els números de dins la funció slice(). Per exemple, amb slice(15:30) veuràs de la fila 15 a la fila 30. Hi ha fins a 389 observacions (procura no posar més de 20 observacions a la vegada).

dcd_dd %>%
  slice(1:15)
Table 3: Diferències entre les bases de dades DCD i DD
countryyeardemocracy_dcddemocracy_dd
Cuba195210
Antigua & Barbuda198201
Antigua & Barbuda198301
Antigua & Barbuda198401
Antigua & Barbuda198501
Antigua & Barbuda198601
Antigua & Barbuda198701
Antigua & Barbuda198801
Antigua & Barbuda198901
Antigua & Barbuda199001
Antigua & Barbuda199101
Antigua & Barbuda199201
Antigua & Barbuda199301
Antigua & Barbuda199401
Antigua & Barbuda199501

Exercici 4: Investiga el marc de dades dcd_dd i llegeix un fragment de l’article de la DD dataset (Cheibub, Gandhi, and Vreeland 2010: 69-72) i de l’article de la DCD dataset (Boix, Miller, and Rosato 2013: 14-16). Respon a les següents preguntes:

  1. Selecciona un país que no sigui ni Cuba ni Antigua & Barbuda i un any i estudia a fons per quin motiu el país és considerat una democràcia en una base de dades i una no democràcia en l’altra en aquell any concret. Pots utilitzar els articles, els llibres de codis, els marcs de dades i, si cal, fer una cerca a internet sobre la història del país. No descartis d’entrada la possibilitat que la divergència pugui ser causa d’un error en la codificació.
  2. Quins són els països on hi ha discrepància de més anys? I de menys anys? Ho pots esbrinar amb el següent codi, si saps com ordenar el recompte de casos:
dcd_dd %>%
  count(country) %>%
  ?????(????)

Sufragi femení

I el vot de les dones? Durant molts anys, hem considerat com a democràcia alguns països que només tenien en compte el sufragi masculí. Sense anar més lluny, considerem que els Estats Units són una democràcia des de fa més de dos segles, però si establíssim el sufragi femení com a una de les condicions necessàries per ser democràcia, les xifres canviarien totalment (Paxton 2000). La darrera versió de la DCD dataset inclou la variable democracy_femalesuffrage, que té en compte el sufragi femení com a criteri per considerar com a democràcia un país. En la Figura 2 observem com canvia el percentatge de democràcies sota aquest nou criteri.

dcd %>%
  group_by(year) %>%
  summarize(democracy = mean(democracy, na.rm = TRUE),
            dem_fem = mean(democracy_femalesuffrage, na.rm = TRUE)) %>%
  pivot_longer(c(democracy, dem_fem), "dem") %>%
  ggplot(aes(x = year, y = value, col = dem)) +
  geom_line(size = 1.2, alpha = 0.85) +
  scale_color_manual(values = c("purple", "blue"),
                     labels = c("Democracy", "Male Democracy")) +
  theme_minimal() + labs(y = "Percentatge", col = NULL, x = NULL) +
  theme(legend.position = "bottom")
Percentatge de democràcies al món per any

Figure 2: Percentatge de democràcies al món per any

I com canvien els nivells de democràcia d’un país determinat? La Figura 3 respon aquesta pregunta per França, Japó i els Estats Units.

dcd %>%
  filter(abbreviation %in% c("USA", "FRA", "JPN")) %>%
  mutate(dem = as.character(democracy + democracy_femalesuffrage),
         dem = case_when(dem == "2" ~ "Democracy",
                         dem == "1" ~ "Male Democracy",
                         TRUE ~ "No Democracy")) %>%
  ggplot(aes(x = abbreviation, y = year, fill = dem)) +
  geom_col(width = 0.8) +
  coord_flip() +
  scale_fill_manual(values = c("purple", "blue", "gray90")) +
  scale_y_continuous(labels = seq(min(dcd$year), max(dcd$year), 50)) +
  theme_minimal() + labs(x = NULL, y = NULL, fill = NULL) +
  theme(panel.grid = element_blank(), legend.position = "bottom")
Democràcia i sufragi femení a França, Japó i Estats Units

Figure 3: Democràcia i sufragi femení a França, Japó i Estats Units

Exercici 5: Utilitza l’article A Complete Dataset of Political Regimes, 1800-2007 (Boix, Miller, and Rosato 2013) i el llibre de codis de la DCD dataset que trobaràs a la web de Miller. Ajuda’t del codi anterior per realitzar la següent activitat:

  • Quins són els primers països que van tenir sufragi femení?
  • Com s’ha operacionalitzat el sufragi femení?
  • Crea un nou gràfic on hi figuri un dels primers països en acceptar el sufragi femení, un país africà i un país asiàtic. Fes una breu descripció del que observes. Ajuda’t dels codis següents per seleccionar el país:
sort(unique(dcd$abbreviation)) #mirar llista d'abreviatures
dcd[which(dcd$abbreviation == "MDV"),] #buscar a quin país correspon MDV

Referències

Boix, Carles, Michael K. Miller, and Sebastian Rosato. 2013. “A Complete Data Set of Political Regimes: 1800-2007.” Comparative Political Studies 46 (12): 1523–54.
Cheibub, José Antonio, Jennifer Gandhi, and James Raymond Vreeland. 2010. “Democracy and Dictatorship Revisited.” Public Choice 143 (2-1): 67–101.
Paxton, Pamela. 2000. Women’s suffrage in the measurement of democracy: Problems of operationalization.” Studies in Comparative International Development 35: 92–111.

  1. Aquesta activitat està elaborada amb propòsits estrictament docents. Les operacions que es realitzen no pretenen tenir cap validesa des d’un punt de vista acadèmic↩︎

Previous
Next