Democracia minimalista

Los indicadores de democracia minimalistas (tambien llamados dicotómicos o binarios) son aquellos en que un regimen político solo puede adoptar dos valores: 1 si es una democracia y 0 si no lo es. No hay término medio. Principalmente conocemos dos bases de datos que tratan la democracia de forma binaria1:

Las bases de datos

Para trabajar con estas dos bases de datos cargaremos los siguientes paquetes:

#rocardad que los paquetes han de estar préviamente instalados 
library(readr)
library(readxl)
library(foreign)
library(dplyr)
library(ggplot2)
library(tidyr)

En primer lugar iremos a buscar las dos bases de datos. La DD la encontraremos en la página web de uno de los autores José Antonio Cheibub. La DCD la encontramos en la pagina web de Michael K. Miller.

dd <- as_tibble(read.dta("https://uofi.box.com/shared/static/bba3968d7c3397c024ec.dta"))
dcd <- read_csv("https://sites.google.com/site/mkmtwo/democracy-v3.0.csv?attredirects=0")

Para las activitades de este ejercico nos puede ser útil la información sobre cómo explorar un marco de datos y sobre cómo utilizar un libro de códigos

DD dataset

En la Tabla 1 hemos reproducido las primeras filas del DD dataset. Para familiarizarnos con la base de datos, tendremos que explorar el marco de datos dd y leer el libro de códigos que encontraréis en la página web de Cheibub.

Table 1: DD Dataset
orderctrynameyearaclpcodecowcodecowcode2ccdcodeletccdcodenumaclpyearcowcode2yearcowcodeyearchgterrychgterrflagc_cowcode2flage_cowcode2entryyexitycidwdicodeimf_codepolitycodebankscodedpicodeuncodeun_regionun_region_nameun_continentun_continent_nameaclp_regionbornyearendyeardupcowdupwdidupundupdpidupimfdupbanksexseleclegseleccloseddejuredefactodefacto2lpartyincumbtype2collectnheadsnmilnheadnpostndateeheadsageehemilroyalheaddiffeheadepostedatetenure08commecens08edeathflagehdemocracyassconfidpoppreselecregimettttdttaflagcflagdemflagregagedemageregstra
1Afghanistan1946142700700AFG1142194670019467001946001019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000010Mohammad Zahir Shahking11.08.33014010Mohammad Zahir Shahking11.08.33200111000500011118180
2Afghanistan1947142700700AFG1142194770019477001947000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking015010Mohammad Zahir Shahking200110000500000019190
3Afghanistan1948142700700AFG1142194870019487001948000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking016010Mohammad Zahir Shahking200110000500000020200
4Afghanistan1949142700700AFG1142194970019497001949000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking017010Mohammad Zahir Shahking200110000500000021210
5Afghanistan1950142700700AFG1142195070019507001950000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking018010Mohammad Zahir Shahking200110000500000022220
6Afghanistan1951142700700AFG1142195170019517001951000019462008700AFG51270010AFG434Southern Asia142Asia919192008000000322000000000Mohammad Zahir Shahking019010Mohammad Zahir Shahking200110000500000023230

Ejercicio 1: Utiliza el libro de codigos i las funciones glimpse(), dim(), unique(), names(), head() i tail() para responder las siguientes preguntas:

  1. Cuántas observaciones i cuántas variables tiene este marco de datos?
  2. Por que columna está ordenado el marco de datos? (sin contar la columna order).
  3. Quien es el último país de la lista?
  4. Que significa la variable aclpyear?
  5. Indica cuáles son las columnes de codigo de país que encontramos en este marco de datos.
  6. Cuantas regiones diferents tenemos en la columna un_region_name? Y en la un_continent_name? Indica cuáles son.
  7. Cuáles son las variables del marco de datos que, combinadas, forman la variable dicotómica democracy?
  8. Qué categorías puede adoptar la variable npost? Qué diferencia hay con la variable epost?

DCD dataset

En la Tabla 2 hemos reproducido las primeras filas del DCD dataset. Para familiarizarnos con la base de datos, tendremos que explorar el marco de datos dcd y leer el libro de códigos que encontraréis en la página web de Miller.

Table 2: DCD Dataset
countryccodeabbreviationabbreviation_undpyeardemocracydemocracy_transdemocracy_breakdownsdemocracy_durationdemocracy_omitteddatademocracy_femalesuffrage
UNITED STATES OF AMERICA2USAUSA1800100110
UNITED STATES OF AMERICA2USAUSA1801100210
UNITED STATES OF AMERICA2USAUSA1802100310
UNITED STATES OF AMERICA2USAUSA1803100410
UNITED STATES OF AMERICA2USAUSA1804100510
UNITED STATES OF AMERICA2USAUSA1805100610

Ejercicio 2: Utiliza el libro de códigos y las funciones glimpse(), dim(), unique(), names(), head() i tail() para responder a las siguientes preguntas:

  1. Cuántas observaciones y cuantas variables tiene este marco de datos?
  2. Por qué columna está ordenado el marco de datos?
  3. Cuál es el último país de la lista?
  4. Indica, de cada marco de datos, la columna o columnas que utilizarias par unirlos.
  5. Describe el significado y los valores que pueden adoptar las columnas democracy_trans y democracy_breakdowns.
  6. Utiliza el codigo siguiente para responder: Quienes son los cinco países que han tenido durante más años sufragio femenino? Podrías mencionar cinco países que no han tenido nunca sufragio femenino? Cuál ha sido el país que ha sido durante más años una democracia? Podrías mencionar cinco países que no han sido nunca una democracia?
dcd %>%
  group_by(country) %>%
  summarize(y = sum(???????????????)) %>%
  arrange(desc(y))

Averigua como utilizar la función arrange() para cambiar la columna y.

Diferencias entre bases de datos

Como ya sabéis, la manera en la que cada base de datos registra el número de democracias no es exactamente igual. En la siguiente Figura 1 hemos querido comparar la evolución histórica del número de democracias. Por eso hemos hecho un recuento del nombre de democracias (técnicamente estamos sumando 1s) que había cada año según una base de datos y la otra. Unimos los nuevos marcos de datos que hemos creado, dd1 y dcd1, y pedimos un diagrama de línea con el año en el eje x i el recuento de democracias en el eje de las y para cada base de datos.

#DD
dd1 <- dd %>%
  filter(democracy == 1) %>%
  count(year, name = "DD")

#DCD
dcd1 <- dcd %>%
  filter(year > 1945,
         democracy == 1) %>%
  count(year, name = "DCD")

dd1 %>%
  left_join(dcd1) %>%
  gather(base, num, -year) %>%
  ggplot(aes(x = year, y = num, col = base)) +
  geom_line(size = 1.5) +
  scale_color_brewer(type = "qual", palette = 7) +
  labs(x = "Año", y = "Número de democracias",
       col = "Base de datos") +
  theme_light() +
  theme(legend.position = c(0.8, 0.28),
        legend.background = element_blank(),
        legend.key = element_blank(),
        legend.text = element_text(size=14))
La democràcia a les bases de dades DCD i DD

Figure 1: La democràcia a les bases de dades DCD i DD

Ejercicio 3: Observa la Figura 1 y responde a las seguientes preguntas:

  1. Realiza una descripción de la evolución de las dos líneas del gráfica. Que coincidencias tienen? Donde divergen más?
  2. Cuál seria la base de datos con los criterios más estrictos con la democracia?
  3. En qué años hay más democracias en la base de datos DD en comparación con la base de datos DCD? Utiliza el codigo siguiente para averiguarlo. Tan solo es necesario crear y reproducir el objeto years:
years <- dd1 %>%
  left_join(dcd1) %>%
  mutate(diff = DD - DCD) %>%
  filter(diff > 0) %>%
  pull(year)

Cuáles son exactamente las diferencias entre una base de datos y la otra? En el codigo siguiente hemos unido los marcos de datos originales, dd y dcd, y hemos filtrado todas las observaciones que divergen entre las bases de datos DCD y DD: un país es una democracia en una base datos pero no lo es en la otra. El resultado es el objeto dcd_dd, que muestra parcialmente en la Tabla 3.

dcd_dd <- dcd %>%
  inner_join(dd, by = c("ccode" = "politycode", "year" = "year"), suffix = c("_dcd", "_dd")) %>%
  mutate(var = democracy_dcd - democracy_dd) %>%
  filter(var != 0) %>%
  select(country = ctryname, year, democracy_dcd, democracy_dd)
dcd_dd %>%
  slice(1:15)
Table 3: Diferencias entre las bases de datos DCD y DD
countryyeardemocracy_dcddemocracy_dd
Cuba195210
Antigua & Barbuda198201
Antigua & Barbuda198301
Antigua & Barbuda198401
Antigua & Barbuda198501
Antigua & Barbuda198601
Antigua & Barbuda198701
Antigua & Barbuda198801
Antigua & Barbuda198901
Antigua & Barbuda199001
Antigua & Barbuda199101
Antigua & Barbuda199201
Antigua & Barbuda199301
Antigua & Barbuda199401
Antigua & Barbuda199501

Ejercicio 4: Investiga el marco de datos dcd_dd con las funciones habituales. Puedes navegar por los diferentes archivos cambiando el número de dentro de la función slice(). Por ejemplo, con slice(15:30) verás de la fila 15 a la fila 30. Hay hasta 389 observaciones (procura no poner más de 20 observaciones a la vez). Responde a las seguientes preguntas:

  1. Selecciona un país y un año y estudia a fodo por qué motivo el país es considerado una democracia en una base de datos y una no democracia en la otra base de datos en aquel año en concreto. Deberás consultar los libros de codigos y si hace falta, hacer una busqueda en internet sobre la historia del país (no descartes de entrada la posibilidad de que la divergencia pueda ser debida a un error en la forma en que el país ha sido codificado en la base de datos).
  2. Cuáles son los países en el que hay mayor discrepancia de más años? Lo puedes averiguar con el siguiente codigo, y si sabes como ordenar el recuento de casos:
dcd_dd %>%
  count(country) %>%
  ?????(????)

Referencias

Boix, Carles, Michael K. Miller, and Sebastian Rosato. 2013. “A Complete Data Set of Political Regimes: 1800-2007.” Comparative Political Studies 46 (12): 1523–54.
Cheibub, José Antonio, Jennifer Gandhi, and James Raymond Vreeland. 2010. “Democracy and Dictatorship Revisited.” Public Choice 143 (2-1): 67–101.

  1. Esta actividad está elaborada con propósitos estrictamente docentes. Las operaciones que se llevan a cabo no pretenden tener ningún tipo de validez desde un punto de vista académico↩︎

Previous
Next