Democracia minimalista
Los indicadores de democracia minimalistas (tambien llamados dicotómicos o binarios) son aquellos en que un regimen político solo puede adoptar dos valores: 1 si es una democracia y 0 si no lo es. No hay término medio. Principalmente conocemos dos bases de datos que tratan la democracia de forma binaria1:
- Democracy Dataset (DD): Conocido como el índice Cheibub-Gandhi-Vreeland (Cheibub, Gandhi, and Vreeland 2010).
- Dichotomous Coding of Democracy (DCD): Conocido como el índice Boix-Miller-Rosato (Boix, Miller, and Rosato 2013).
Las bases de datos
Para trabajar con estas dos bases de datos cargaremos los siguientes paquetes:
#rocardad que los paquetes han de estar préviamente instalados
library(readr)
library(readxl)
library(foreign)
library(dplyr)
library(ggplot2)
library(tidyr)
En primer lugar iremos a buscar las dos bases de datos. La DD la encontraremos en la página web de uno de los autores José Antonio Cheibub. La DCD la encontramos en la pagina web de Michael K. Miller.
dd <- as_tibble(read.dta("https://uofi.box.com/shared/static/bba3968d7c3397c024ec.dta"))
dcd <- read_csv("https://sites.google.com/site/mkmtwo/democracy-v3.0.csv?attredirects=0")
Para las activitades de este ejercico nos puede ser útil la información sobre cómo explorar un marco de datos y sobre cómo utilizar un libro de códigos
DD dataset
En la Tabla 1 hemos reproducido las primeras filas del DD dataset. Para familiarizarnos con la base de datos, tendremos que explorar el marco de datos dd
y leer el libro de códigos que encontraréis en la página web de Cheibub.
order | ctryname | year | aclpcode | cowcode | cowcode2 | ccdcodelet | ccdcodenum | aclpyear | cowcode2year | cowcodeyear | chgterr | ychgterr | flagc_cowcode2 | flage_cowcode2 | entryy | exity | cid | wdicode | imf_code | politycode | bankscode | dpicode | uncode | un_region | un_region_name | un_continent | un_continent_name | aclp_region | bornyear | endyear | dupcow | dupwdi | dupun | dupdpi | dupimf | dupbanks | exselec | legselec | closed | dejure | defacto | defacto2 | lparty | incumb | type2 | collect | nheads | nmil | nhead | npost | ndate | eheads | ageeh | emil | royal | headdiff | ehead | epost | edate | tenure08 | comm | ecens08 | edeath | flageh | democracy | assconfid | poppreselec | regime | tt | ttd | tta | flagc | flagdem | flagreg | agedem | agereg | stra |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Afghanistan | 1946 | 142 | 700 | 700 | AFG | 1 | 1421946 | 7001946 | 7001946 | 0 | 0 | 1 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 11.08.33 | 0 | 14 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 11.08.33 | 20 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 1 | 1 | 1 | 18 | 18 | 0 |
2 | Afghanistan | 1947 | 142 | 700 | 700 | AFG | 1 | 1421947 | 7001947 | 7001947 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 15 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 19 | 19 | 0 | ||
3 | Afghanistan | 1948 | 142 | 700 | 700 | AFG | 1 | 1421948 | 7001948 | 7001948 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 16 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 20 | 20 | 0 | ||
4 | Afghanistan | 1949 | 142 | 700 | 700 | AFG | 1 | 1421949 | 7001949 | 7001949 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 17 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 21 | 21 | 0 | ||
5 | Afghanistan | 1950 | 142 | 700 | 700 | AFG | 1 | 1421950 | 7001950 | 7001950 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 18 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 22 | 22 | 0 | ||
6 | Afghanistan | 1951 | 142 | 700 | 700 | AFG | 1 | 1421951 | 7001951 | 7001951 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 19 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 23 | 23 | 0 |
Ejercicio 1: Utiliza el libro de codigos i las funciones glimpse()
, dim()
, unique()
, names()
, head()
i tail()
para responder las siguientes preguntas:
- Cuántas observaciones i cuántas variables tiene este marco de datos?
- Por que columna está ordenado el marco de datos? (sin contar la columna order).
- Quien es el último país de la lista?
- Que significa la variable
aclpyear
? - Indica cuáles son las columnes de codigo de país que encontramos en este marco de datos.
- Cuantas regiones diferents tenemos en la columna
un_region_name
? Y en laun_continent_name
? Indica cuáles son. - Cuáles son las variables del marco de datos que, combinadas, forman la variable dicotómica
democracy
? - Qué categorías puede adoptar la variable
npost
? Qué diferencia hay con la variableepost
?
DCD dataset
En la Tabla 2 hemos reproducido las primeras filas del DCD dataset. Para familiarizarnos con la base de datos, tendremos que explorar el marco de datos dcd
y leer el libro de códigos que encontraréis en la página web de Miller.
country | ccode | abbreviation | abbreviation_undp | year | democracy | democracy_trans | democracy_breakdowns | democracy_duration | democracy_omitteddata | democracy_femalesuffrage |
---|---|---|---|---|---|---|---|---|---|---|
UNITED STATES OF AMERICA | 2 | USA | USA | 1800 | 1 | 0 | 0 | 1 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1801 | 1 | 0 | 0 | 2 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1802 | 1 | 0 | 0 | 3 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1803 | 1 | 0 | 0 | 4 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1804 | 1 | 0 | 0 | 5 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1805 | 1 | 0 | 0 | 6 | 1 | 0 |
Ejercicio 2: Utiliza el libro de códigos y las funciones glimpse()
, dim()
, unique()
, names()
, head()
i tail()
para responder a las siguientes preguntas:
- Cuántas observaciones y cuantas variables tiene este marco de datos?
- Por qué columna está ordenado el marco de datos?
- Cuál es el último país de la lista?
- Indica, de cada marco de datos, la columna o columnas que utilizarias par unirlos.
- Describe el significado y los valores que pueden adoptar las columnas
democracy_trans
ydemocracy_breakdowns
. - Utiliza el codigo siguiente para responder: Quienes son los cinco países que han tenido durante más años sufragio femenino? Podrías mencionar cinco países que no han tenido nunca sufragio femenino? Cuál ha sido el país que ha sido durante más años una democracia? Podrías mencionar cinco países que no han sido nunca una democracia?
dcd %>%
group_by(country) %>%
summarize(y = sum(???????????????)) %>%
arrange(desc(y))
Averigua como utilizar la función arrange()
para cambiar la columna y
.
Diferencias entre bases de datos
Como ya sabéis, la manera en la que cada base de datos registra el número de democracias no es exactamente igual. En la siguiente Figura 1 hemos querido comparar la evolución histórica del número de democracias. Por eso hemos hecho un recuento del nombre de democracias (técnicamente estamos sumando 1s) que había cada año según una base de datos y la otra. Unimos los nuevos marcos de datos que hemos creado, dd1
y dcd1
, y pedimos un diagrama de línea con el año en el eje x i el recuento de democracias en el eje de las y para cada base de datos.
#DD
dd1 <- dd %>%
filter(democracy == 1) %>%
count(year, name = "DD")
#DCD
dcd1 <- dcd %>%
filter(year > 1945,
democracy == 1) %>%
count(year, name = "DCD")
dd1 %>%
left_join(dcd1) %>%
gather(base, num, -year) %>%
ggplot(aes(x = year, y = num, col = base)) +
geom_line(size = 1.5) +
scale_color_brewer(type = "qual", palette = 7) +
labs(x = "Año", y = "Número de democracias",
col = "Base de datos") +
theme_light() +
theme(legend.position = c(0.8, 0.28),
legend.background = element_blank(),
legend.key = element_blank(),
legend.text = element_text(size=14))
Ejercicio 3: Observa la Figura 1 y responde a las seguientes preguntas:
- Realiza una descripción de la evolución de las dos líneas del gráfica. Que coincidencias tienen? Donde divergen más?
- Cuál seria la base de datos con los criterios más estrictos con la democracia?
- En qué años hay más democracias en la base de datos DD en comparación con la base de datos DCD? Utiliza el codigo siguiente para averiguarlo. Tan solo es necesario crear y reproducir el objeto
years
:
years <- dd1 %>%
left_join(dcd1) %>%
mutate(diff = DD - DCD) %>%
filter(diff > 0) %>%
pull(year)
Cuáles son exactamente las diferencias entre una base de datos y la otra? En el codigo siguiente hemos unido los marcos de datos originales, dd
y dcd
, y hemos filtrado todas las observaciones que divergen entre las bases de datos DCD y DD: un país es una democracia en una base datos pero no lo es en la otra. El resultado es el objeto dcd_dd
, que muestra parcialmente en la Tabla 3.
dcd_dd <- dcd %>%
inner_join(dd, by = c("ccode" = "politycode", "year" = "year"), suffix = c("_dcd", "_dd")) %>%
mutate(var = democracy_dcd - democracy_dd) %>%
filter(var != 0) %>%
select(country = ctryname, year, democracy_dcd, democracy_dd)
dcd_dd %>%
slice(1:15)
country | year | democracy_dcd | democracy_dd |
---|---|---|---|
Cuba | 1952 | 1 | 0 |
Antigua & Barbuda | 1982 | 0 | 1 |
Antigua & Barbuda | 1983 | 0 | 1 |
Antigua & Barbuda | 1984 | 0 | 1 |
Antigua & Barbuda | 1985 | 0 | 1 |
Antigua & Barbuda | 1986 | 0 | 1 |
Antigua & Barbuda | 1987 | 0 | 1 |
Antigua & Barbuda | 1988 | 0 | 1 |
Antigua & Barbuda | 1989 | 0 | 1 |
Antigua & Barbuda | 1990 | 0 | 1 |
Antigua & Barbuda | 1991 | 0 | 1 |
Antigua & Barbuda | 1992 | 0 | 1 |
Antigua & Barbuda | 1993 | 0 | 1 |
Antigua & Barbuda | 1994 | 0 | 1 |
Antigua & Barbuda | 1995 | 0 | 1 |
Ejercicio 4: Investiga el marco de datos dcd_dd
con las funciones habituales. Puedes navegar por los diferentes archivos cambiando el número de dentro de la función slice()
. Por ejemplo, con slice(15:30)
verás de la fila 15 a la fila 30. Hay hasta 389 observaciones (procura no poner más de 20 observaciones a la vez). Responde a las seguientes preguntas:
- Selecciona un país y un año y estudia a fodo por qué motivo el país es considerado una democracia en una base de datos y una no democracia en la otra base de datos en aquel año en concreto. Deberás consultar los libros de codigos y si hace falta, hacer una busqueda en internet sobre la historia del país (no descartes de entrada la posibilidad de que la divergencia pueda ser debida a un error en la forma en que el país ha sido codificado en la base de datos).
- Cuáles son los países en el que hay mayor discrepancia de más años? Lo puedes averiguar con el siguiente codigo, y si sabes como ordenar el recuento de casos:
dcd_dd %>%
count(country) %>%
?????(????)
Referencias
Esta actividad está elaborada con propósitos estrictamente docentes. Las operaciones que se llevan a cabo no pretenden tener ningún tipo de validez desde un punto de vista académico↩︎