Democràcia binària
Els indicadors de democràcia dicotòmics o binaris (també dits minimalistes per la seva referència a aspectes únicament procedimentals) són aquells en què un règim polític només pot adoptar dos valors: 1 si és una democràcia i 0 si no ho és. No hi ha terme mig. Principalment coneixem dues bases de dades que tracten la democràcia de forma binària1:
- Democracy Dataset (DD): Conegut com l’índex Cheibub-Gandhi-Vreeland (Cheibub, Gandhi, and Vreeland 2010).
- Dichotomous Coding of Democracy (DCD): Conegut com l’índex Boix-Miller-Rosato (Boix, Miller, and Rosato 2013).
Les bases de dades
Per treballar amb aquestes dues bases de dades haurem de carregar els paquets següents:
#recordeu que els paquets han d'estar prèviament instal·lats
library(readr)
library(readxl)
library(foreign)
library(dplyr)
library(ggplot2)
library(tidyr)
El primer que hem de fer és importar les dues bases de dades. La DD la trobem a la pàgina web d’un dels autors José Antonio Cheibub. La DCD la trobem a la pàgina web de Michael K. Miller.
dd <- as_tibble(read.dta("https://uofi.box.com/shared/static/bba3968d7c3397c024ec.dta"))
dcd <- read_csv("https://sites.google.com/site/mkmtwo/democracy-v3.0.csv?attredirects=0")
Per a les activitats d’aquest exercici ens pot ser útil la informació sobre com explorar un marc de dades i sobre com utilitzar un llibre de codis, on s’explica específicament amb més detall la DD dataset.
DD dataset
Si teclegem head(dd)
veurem les primeres files de la DD dataset, que és el que també observem a la Taula 1. Per familiaritzar-nos-hi haurem llegir el llibre de codis que trobarem a la pàgina web de Cheibub i d’explorar el marc de dades amb diverses funcions:
glimpse(dd)
: Visualitzem el marc de dades horitzontalment.dim(dd)
: Examina les observacions i variables del marc de dades.names(dd)
: Veiem les variables del marc de dades.head(dd)
: Retorna les primeres observacions.tail(dd)
: Retorna les darreres observacions.unique(dd$ctryname)
: Retorna els valors únics de la variablectryname
.
order | ctryname | year | aclpcode | cowcode | cowcode2 | ccdcodelet | ccdcodenum | aclpyear | cowcode2year | cowcodeyear | chgterr | ychgterr | flagc_cowcode2 | flage_cowcode2 | entryy | exity | cid | wdicode | imf_code | politycode | bankscode | dpicode | uncode | un_region | un_region_name | un_continent | un_continent_name | aclp_region | bornyear | endyear | dupcow | dupwdi | dupun | dupdpi | dupimf | dupbanks | exselec | legselec | closed | dejure | defacto | defacto2 | lparty | incumb | type2 | collect | nheads | nmil | nhead | npost | ndate | eheads | ageeh | emil | royal | headdiff | ehead | epost | edate | tenure08 | comm | ecens08 | edeath | flageh | democracy | assconfid | poppreselec | regime | tt | ttd | tta | flagc | flagdem | flagreg | agedem | agereg | stra |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | Afghanistan | 1946 | 142 | 700 | 700 | AFG | 1 | 1421946 | 7001946 | 7001946 | 0 | 0 | 1 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 11.08.33 | 0 | 14 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 11.08.33 | 20 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 1 | 1 | 1 | 18 | 18 | 0 |
2 | Afghanistan | 1947 | 142 | 700 | 700 | AFG | 1 | 1421947 | 7001947 | 7001947 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 15 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 19 | 19 | 0 | ||
3 | Afghanistan | 1948 | 142 | 700 | 700 | AFG | 1 | 1421948 | 7001948 | 7001948 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 16 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 20 | 20 | 0 | ||
4 | Afghanistan | 1949 | 142 | 700 | 700 | AFG | 1 | 1421949 | 7001949 | 7001949 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 17 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 21 | 21 | 0 | ||
5 | Afghanistan | 1950 | 142 | 700 | 700 | AFG | 1 | 1421950 | 7001950 | 7001950 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 18 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 22 | 22 | 0 | ||
6 | Afghanistan | 1951 | 142 | 700 | 700 | AFG | 1 | 1421951 | 7001951 | 7001951 | 0 | 0 | 0 | 0 | 1946 | 2008 | 700 | AFG | 512 | 700 | 10 | AFG | 4 | 34 | Southern Asia | 142 | Asia | 9 | 1919 | 2008 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 2 | 2 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | Mohammad Zahir Shah | king | 0 | 19 | 0 | 1 | 0 | Mohammad Zahir Shah | king | 20 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 23 | 23 | 0 |
Exercici 1: Utilitza el llibre de codis i les funcions indicades anteriorment per respondre a les següents preguntes:
- Quantes observacions i quantes variables té aquest marc de dades?
- Per quina columna està ordenat el marc de dades? (sense comptar la columna order).
- Quin és l’últim país de la llista? Quin és el seu
cowcode
? - Què significa la variable
aclpyear
? - Indica quines són totes les columnes de codi de país que trobem en aquest marc de dades.
- Quantes regions diferents tenim a la columna
un_region_name
? I a laun_continent_name
? Indica quines són. - Quines són les variables del marc de dades que, combinades, formen la variable dicotòmica
democracy
? - Quines categories pot adoptar la variable
npost
? Quina diferència hi ha amb la variableepost
?
DCD dataset
A la Taula 2 hem reproduït les primeres files del DCD dataset. Per familiaritzar-nos-hi haurem d’explorar el marc de dades dcd
i llegir el llibre de codis que trobarem a la pàgina web de Miller.
country | ccode | abbreviation | abbreviation_undp | year | democracy | democracy_trans | democracy_breakdowns | democracy_duration | democracy_omitteddata | democracy_femalesuffrage |
---|---|---|---|---|---|---|---|---|---|---|
UNITED STATES OF AMERICA | 2 | USA | USA | 1800 | 1 | 0 | 0 | 1 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1801 | 1 | 0 | 0 | 2 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1802 | 1 | 0 | 0 | 3 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1803 | 1 | 0 | 0 | 4 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1804 | 1 | 0 | 0 | 5 | 1 | 0 |
UNITED STATES OF AMERICA | 2 | USA | USA | 1805 | 1 | 0 | 0 | 6 | 1 | 0 |
Exercici 2: Utilitza el llibre de codis i les funcions mencionades anteriorment per respondre a les següents preguntes:
- Quantes observacions i quantes variables té aquest marc de dades?
- Per quina columna està ordenat el marc de dades?
- Quin és l’últim país de la llista?
- Indica, de cada marc de dades, la columna o columnes que utilitzaries per unir-los.
- Descriu el significat i els valors que poden adoptar les columnes
democracy_trans
idemocracy_breakdowns
. - Utilitza el codi següent per respondre: Quins són els cinc països que han tingut durant més anys el sufragi femení? Podries anomenar cinc països que no han tingut mai sufragi femení? Quin és el país que ha estat durant més anys una democràcia? Podries anomenar cinc països que no han han estat mai una democràcia?
dcd %>%
group_by(country) %>%
summarize(y = sum(?????????????)) %>% #introduir el nom de la variable
arrange(desc(y)) #canvia l'ordre ascendent o descendent
Hauràs d’esbrinar com utilitzar la funció arrange()
per canviar l’ordre de la columna y
.
Diferències entre bases de dades
Com ja sabeu, la manera com cada base de dades registra el nombre de democràcies no és exactament igual. En la següent Figura 1 hem volgut comparar l’evolució històrica del nombre de democràcies segons cada base de dades. Per això hem fet un recompte del nombre de democràcies que hi havia cada any segons una base de dades i l’altra. Unim els nous marcs de dades que hem creat, dd1
i dcd1
, i demanem un diagrama de línia amb l’any a l’eix de les x i el recompte de democràcies a l’eix de les y per a cada base de dades.
#DD: recompte de casos que democracy es 1
dd1 <- dd %>%
filter(democracy == 1) %>%
count(year, name = "DD")
#DCD: recompte de casos que democracy es 1
dcd1 <- dcd %>%
filter(year > 1945,
democracy == 1) %>%
count(year, name = "DCD")
dd1 %>%
left_join(dcd1) %>% #unim bases de dades
gather(base, num, -year) %>%
ggplot(aes(x = year, y = num, col = base)) +
geom_line(size = 1.5) +
scale_color_brewer(type = "qual", palette = 7) +
labs(x = "Any", y = "Nombre de democràcies",
col = "Base de dades") +
theme_light() +
theme(legend.position = c(0.8, 0.28),
legend.background = element_blank(),
legend.key = element_blank(),
legend.text = element_text(size=14))
Exercici 3: Observa la Figura 1 i respon a les següents preguntes:
- Fes una descripció de l’evolució de les dues línies del gràfic. Quines coincidències tenen? On divergeixen més?
- Sabries dir quina seria la base de dades amb uns criteris més estrictes de democràcia?
- En quins anys hi ha més democràcies a la base de dades DD en comparació a la base de dades DCD? Utilitza el codi següent per esbrinar-ho. Només caldrà que reprodueixis el següent codi i tot seguit teclegis
years
.
years <- dd1 %>%
left_join(dcd1) %>%
mutate(diff = DD - DCD) %>%
filter(diff > 0) %>%
pull(year)
Val a dir que hi ha una coincidència del 95.7% dels casos que són comuns a les dues bases de dades. Ara bé, quines són exactament les diferències entre una base de dades i l’altra? En el codi següent hem unit els marcs de dades originals, dd
i dcd
, i hem filtrat totes les observacions que divergeixen entre les bases de dades DCD i DD: un país és una democràcia en una base de dades però no ho és en una altra. El resultat és l’objecte dcd_dd
, que mostrem parcialment a la Taula 3.
dcd_dd <- dcd %>%
inner_join(dd, by = c("ccode" = "politycode", "year" = "year"), suffix = c("_dcd", "_dd")) %>%
mutate(var = democracy_dcd - democracy_dd) %>%
filter(var != 0) %>%
select(country = ctryname, year, democracy_dcd, democracy_dd)
Amb el codi següent podem veure altres files del marc de dades. Pots navegar per les diferents files canviant els números de dins la funció slice()
. Per exemple, amb slice(15:30)
veuràs de la fila 15 a la fila 30. Hi ha fins a 389 observacions (procura no posar més de 20 observacions a la vegada).
dcd_dd %>%
slice(1:15)
country | year | democracy_dcd | democracy_dd |
---|---|---|---|
Cuba | 1952 | 1 | 0 |
Antigua & Barbuda | 1982 | 0 | 1 |
Antigua & Barbuda | 1983 | 0 | 1 |
Antigua & Barbuda | 1984 | 0 | 1 |
Antigua & Barbuda | 1985 | 0 | 1 |
Antigua & Barbuda | 1986 | 0 | 1 |
Antigua & Barbuda | 1987 | 0 | 1 |
Antigua & Barbuda | 1988 | 0 | 1 |
Antigua & Barbuda | 1989 | 0 | 1 |
Antigua & Barbuda | 1990 | 0 | 1 |
Antigua & Barbuda | 1991 | 0 | 1 |
Antigua & Barbuda | 1992 | 0 | 1 |
Antigua & Barbuda | 1993 | 0 | 1 |
Antigua & Barbuda | 1994 | 0 | 1 |
Antigua & Barbuda | 1995 | 0 | 1 |
Exercici 4: Investiga el marc de dades dcd_dd
i llegeix un fragment de l’article de la DD dataset (Cheibub, Gandhi, and Vreeland 2010: 69-72) i de l’article de la DCD dataset (Boix, Miller, and Rosato 2013: 14-16). Respon a les següents preguntes:
- Selecciona un país que no sigui ni Cuba ni Antigua & Barbuda i un any i estudia a fons per quin motiu el país és considerat una democràcia en una base de dades i una no democràcia en l’altra en aquell any concret. Pots utilitzar els articles, els llibres de codis, els marcs de dades i, si cal, fer una cerca a internet sobre la història del país. No descartis d’entrada la possibilitat que la divergència pugui ser causa d’un error en la codificació.
- Quins són els països on hi ha discrepància de més anys? I de menys anys? Ho pots esbrinar amb el següent codi, si saps com ordenar el recompte de casos:
dcd_dd %>%
count(country) %>%
?????(????)
Sufragi femení
I el vot de les dones? Durant molts anys, hem considerat com a democràcia alguns països que només tenien en compte el sufragi masculí. Sense anar més lluny, considerem que els Estats Units són una democràcia des de fa més de dos segles, però si establíssim el sufragi femení com a una de les condicions necessàries per ser democràcia, les xifres canviarien totalment (Paxton 2000). La darrera versió de la DCD dataset inclou la variable democracy_femalesuffrage
, que té en compte el sufragi femení com a criteri per considerar com a democràcia un país. En la Figura 2 observem com canvia el percentatge de democràcies sota aquest nou criteri.
dcd %>%
group_by(year) %>%
summarize(democracy = mean(democracy, na.rm = TRUE),
dem_fem = mean(democracy_femalesuffrage, na.rm = TRUE)) %>%
pivot_longer(c(democracy, dem_fem), "dem") %>%
ggplot(aes(x = year, y = value, col = dem)) +
geom_line(size = 1.2, alpha = 0.85) +
scale_color_manual(values = c("purple", "blue"),
labels = c("Democracy", "Male Democracy")) +
theme_minimal() + labs(y = "Percentatge", col = NULL, x = NULL) +
theme(legend.position = "bottom")
I com canvien els nivells de democràcia d’un país determinat? La Figura 3 respon aquesta pregunta per França, Japó i els Estats Units.
dcd %>%
filter(abbreviation %in% c("USA", "FRA", "JPN")) %>%
mutate(dem = as.character(democracy + democracy_femalesuffrage),
dem = case_when(dem == "2" ~ "Democracy",
dem == "1" ~ "Male Democracy",
TRUE ~ "No Democracy")) %>%
ggplot(aes(x = abbreviation, y = year, fill = dem)) +
geom_col(width = 0.8) +
coord_flip() +
scale_fill_manual(values = c("purple", "blue", "gray90")) +
scale_y_continuous(labels = seq(min(dcd$year), max(dcd$year), 50)) +
theme_minimal() + labs(x = NULL, y = NULL, fill = NULL) +
theme(panel.grid = element_blank(), legend.position = "bottom")
Exercici 5: Utilitza l’article A Complete Dataset of Political Regimes, 1800-2007 (Boix, Miller, and Rosato 2013) i el llibre de codis de la DCD dataset que trobaràs a la web de Miller. Ajuda’t del codi anterior per realitzar la següent activitat:
- Quins són els primers països que van tenir sufragi femení?
- Com s’ha operacionalitzat el sufragi femení?
- Crea un nou gràfic on hi figuri un dels primers països en acceptar el sufragi femení, un país africà i un país asiàtic. Fes una breu descripció del que observes. Ajuda’t dels codis següents per seleccionar el país:
sort(unique(dcd$abbreviation)) #mirar llista d'abreviatures
dcd[which(dcd$abbreviation == "MDV"),] #buscar a quin país correspon MDV
Referències
Aquesta activitat està elaborada amb propòsits estrictament docents. Les operacions que es realitzen no pretenen tenir cap validesa des d’un punt de vista acadèmic↩︎