Anàlisi de Dades

Introducció

En aquest apartat trobareu informació de suport a l’assignatura Anàlisi de Dades1. També podeu trobar més informació en aquest llibre docent. Els principals objectius d’aquest contingut són:

  1. Dominar l’estructura de dades i el seu ús: vectors i tipus de vectors, observacions, valors, variables i tipus de variables, marcs de dades, condicions lògiques, etc.
  2. Conèixer bases de dades que continguin informació de diversa índole (econòmics, polítics, enquestes, etc.).
  3. Descarregar / importar diferents tipus de dades (.csv, .xls, .dta, .sav …) al vostre ordinador.
  4. Explorar un marc de dades i identificar els seus components principals amb operacions senzilles (str, glimpse, dim, plot, hist).
  5. Transformar un marc de dades per obtenir respostes a les vostres preguntes (majoritàriament amb el paquet dplyr però també amb tidyr i altres paquets).
  6. Visualitzar les variables utilitzant diferents gràfics com l’histograma, el diagrama de dispersió, el diagrama de caixes o el diagrama de barres.
  7. Dominar les principals tècniques d’anàlisi univariant per identificar el centre d’una distribució (mediana, mitjana, moda) i la seva dispersió (desviació típica, rang, IQR).
  8. Dominar les principals tècniques d’anàlisi bivariant per determinar l’associació i significació entre dues o més variables.
  9. Construir el nostre propi marc de dades mitjançant la unió de variables procedents de bases de dades diferents.
  10. Prendre consciència que les tècniques quantitatives no són suficients per argumentar que una variable està causada per una altra (correlació no vol dir causació). Necessitem també descartar altres hipòtesis alternatives i dotar el nostre argument de contingut teòric i, tot i així, no podrem estar segurs que aquesta causalitat sigui certa.

Materials

Els materials que trobareu en aquest apartat són:

  • Breu descripció del temari
  • Vídeos tutorials
  • Codi

Programari

Per treballar amb aquests materials necessitem tenir instal·lat el programari . Podeu descarregar-los en els següents enllaços:

  • R
  • RStudio
  • Instal·lar els següents paquets d’R:
install.packages(c("countrycode", "DescTools", "foreign", "gapminder", "ggthemes", "haven", "knitr", "readxl", "rmarkdown", "tidyverse", "unvotes", "wbstats"))

Nota important:

A cada tema del curs trobareu caixes com aquesta.
Dins de les caixes trobareu codi.
Copieu i enganxeu el codi que trobeu al vostre RStudio.

També us poden ser útils alguns cursos inicials que trobareu a Informació General.


  1. Aquests continguts han estat elaborats amb la col·laboració de Pol Olivé Busquets ↩︎