Introdução a Método Computacionais para as Ciências Sociais: Exercício 4
Introduções.
Seguimos com nossas instruções.
Entrega dos exercícios até sexta-feira, meia noite.
Entrega com documento em formato pdf.
Entrega via slack.
Divirtam-se.
Banco de dados
Neste exercícios, usaremos mais uma vez o pacote do cepesp para baixar dados eleitorais do Brasil. Portanto, rode o código abaixo para fazer o download dos bancos de dados.
Estamos utilizando os dados de candidatos e de declaração de bens. Ambos no nível do Rio de Janeiro.
# instale caso você não tenha o pacote.
# if (!require("devtools")) install.packages("devtools")
# devtools::install_github("Cepesp-Fgv/cepesp-r")
library(cepespR)
library(tidyverse)
# Banco Votos Deputado
candidatos <- get_candidates(year=2018, position="Federal Deputy") %>%
as_tibble()
# Banco Bens Candidatos
bens <- get_assets(year = 2018, state = "RJ") %>%
as_tibble()
Questão 1.
Usando o banco bens.
- Agregue o banco de dados e crie um novo banco com a soma do valor dos bens declarados por candidato.
# Dica: Use este código para limpar a variável VALOR_BEM. Tente entender o que estou fazendo neste código.
bens <- bens %>%
mutate(VALOR_BEM=str_remove_all(VALOR_BEM, "\\."),
VALOR_BEM=str_replace_all(VALOR_BEM, ",", "\\."),
VALOR_BEM=parse_number(VALOR_BEM))
# responda o restante aqui.
- Faça um merge entre o banco de candidatos e o seu nome banco de bens declarados
# Dica: O banco de candidatos é nacional e o de bens é estadual
# Dica II: O banco final terá alguns missings. Não se preocupe com isso.
# responda aqui.
Questão 2
Usando este novo banco, responda:
- Qual candidato declarou mais bens?
# responda aqui.
- Qual partido possui em números absolutos maior declaração de bens?
# Dica= Use sum(x, na.rm=TRUE) para fazer somas desconsiderando os valores missings
# responda aqui
- Quem declara mais bens, homens ou mulheres?
# Responda aqui
Questão 2
Usando o banco de dados construction do pacote tidyr
, responda:
library(tidyr)
construction
# responda aqui
Este banco de dados está no formato tidy? Sim ou não? E porquê?
Caso você responda que este banco de dados não está no formato tidy, use
pivot_longer()
para converter este banco de dados para tidy.
# Dica: A solução mais intuitiva irá usar pivot_longer duas vezes.
# Responda
Ponto Extra
Para ganhar pontos extras, use as funções do tidyr para converter o banco de dados fish_encounters abaixo para um banco no formato aberto (wide) onde a coluna station será aberta em um conjunto de variáveis dummies (valores iguais a zero ou um)
fish_encounters
# responda aqui