Ementa
Clique aqui para fazer o download em Pdf.
Instrutor
- Tiago Ventura
- Ph.D. em Ciência Política (IESP-UERJ), e Ph.D. Candidate em Governo e Política na Universidade de Maryland, College Park.
- Email: venturat@umd.edu
- Pronome: Ele/Dele
Introdução
Até alguns anos atrás, coletar dados em larga escala sobre comportamento social - por exemplo, quem você votou, quem são seus amigos mais próximos, ou quais tipos de notícias você consome, lê e compartilha - era uma atividade cara, custosa, e aberta a poucos pesquisadores e instituições. Porém, nos tempos atuais de , a situação alterou-se por completo. O mundo atualmente possui uma capacidade maior de armazenar e coletar dados do que há pesquisadores-as disponíveis para analizar este volume imenso e desorganizado de dados. E mais, a redução nos custos de adquirir, guardar e acessar dados impõe padrões mais altos para os conhecimento metodológicos e técnicos dos pesquisadores, sobretudo nas ciências sociais, e tal mudança tem introduzido desafios diversos para pesquisa em ciências sociais na era digital
Este curso busca preparar você para conduzir pesquisa em ciências sociais nesta era digital e de big data. O curso possui três objetivos principais: em primeiro lugar, iremos proporcionar ao alunos uma introdução compreensiva sobre métodos computacionais em ciências sociais. A idéa é garantir ao alunos após oito semanas de aula alguma fluência em programação, que permitirá aos mesmos usar tais técnicas em suas próprias pesquisas. A linguagem R será utilizada no curso. Em segundo lugar, iremos discutir artigos aplicados na área de mídias digitais e comunicação política. O objetivo é expor alunos ao que considero exemplos das melhores pesquisas neste campo, e que utilizam os mais atualizados recursos metodológicos. Em terceiro lugar, os alunos terão a oportunidade de aplicar as técnicas e conteúdos adquiridos ao longo do curso em uma idéia original de pesquisa.
Este curso é pensando para alunos de graduação e pós graduação. Enquanto esta ementa pode parecer um tanto longa e intimidadora, não há como adquirir o conjunto de habilidades discutidas neste curso sem um esforço considerável. Dito isto, por favor, avisem-me qualquer preocupação com o curso no decorrer do semestre. Estou aberto a ajustes e adequações a esta ementa, e o objetivo principal é preparar um curso capaz de ajudar os alunos no longo prazo.
A maior parte das leituras do curso serão em inglês. Porém, todas as aulas, códigos, e slides estarão em português. Infelizmente, as melhores pesquisas em Métodos Computacionais para Ciências Sociais, tanto teóricas quanto aplicadas, ainda encontram-se em inglês. E eu acredito firmemente que conhecer tais pesquisa pode gerar insights para suas próprias idéias.
Aulas
As aulas serão todas virtuais as segundas e quartas-feiras, das 11:10 AM até 12:50 PM.
Objetivos
Este curso não possui nenhum pré-requisito, e é desenhado para alunos com experiências variadas em métodos computacionais. Ao final do curso, eu espero que os alunos sintam-se confortáveis em programar em R e em usar este software em suas próprias pesquisas.
Mais importante, ao final deste curso, minha expectativa é que os alunos conheçam a literatura e métodos usados na fronteira do conhecimento em ciências sociais computacionais, e particularmente, em comunicação política. Estes artigos certamente guiarão alunos a densenvolver suas pŕoprias idéias no futuro.
Comunicação
Site: Uma página na internet para o curso https://fgvintrocss.netlify.app/ concentrará todos os nossos materiai. Você deve checar o site regularmente e verificar os materiais que utilizaremos ao longo do semestre.
Slack: Nosso seminário também fará uso do Slack para comunicação interna (https://join.slack.com/t/umd-apb9922/shared_invite/zt-kne0ldx2-1J9kE0FJYxjZRA11lUhhNA). A plataforma slack funciona como um fórum aberto de discussão e colaboração. Quaisquer perguntas direcionadas a mim devem ser feitas via Slack. Se você não conhece o Slack, cheque este tutorial. Na primeira aula, eu enviarei o convite para todos serem incluídos no Slack e discutiremos como usá-lo.
Avaliação
Os alunos serão avaliados de acordo com três componentes: participação, exercícios de programação, e projeto final.
Participação em Aula (10%)
Ao longo do curso, serão dadas amplas oportunidade de participação aos alunos. Tanto nas discussões sobre artigos aplicados, quanto nos exercícios de programação. Eu avaliarei os alunos com base em seu engagamento nas referidas discussões.
Durante as aulas pedimos que o vídeo dos alunos permaneça sempre ligado. O dos professores também ficará. O uso da câmera é considerado como critério de participação em aulas.
Exercícios. (40%)
Durante a primeira parte do curso (semana 1 até semana 8), os alunos trabalharão em exercícios de programação relacionados aos tópicos da semana. Cada exercício deve ser entregue até a sexta-feira da semana correspondente, até meia noite. Atraso na entrega dos exercícios será penalizado nas notas. Estes exercícios serão frequentes durante as primeiras oito semanas, porém, os farei relativamente curtos. Vocês poderão discutí-los em sala da aula comigo e com seus colegas. Eu encorajo alunos a trabalharem em grupo, porém, cada exercício deve ser submetido individualmente.
Os exercícios devem ser respondidos usando R Markdown, uma linguagem capaz de produzir documentos com bons formatos e combinando resultados, escrita e códigos de R. Para submeter seus exercícios, você precisará compilar seu arquivo de R markdown em formato pdf, e submeter via slack. Nas duas primeiras semanas, iremos praticar diversas vezes este procedimento.
Projeto Final (50%)
Nas últimas semanas do curso, os alunos trabalharão em grupos (3-4) em um projeto final de curso aplicando as técnicas discutidas no decorrer do semestre. O formato para o projeto final é bastante flexível. Os alunos podem optar por iniciar um desenho de pesquisa para um novo artigo, criar um novo banco de dados, ou qualquer outra tipo de aplicação em ciências social computacional, que receba meu aval.
Os alunos terão três semanas para desenvolver o projeto. A primeiro semana será dedicada a dividir os alunos em seus grupos e selecionar o tópico e formato do projeto final. A segunda semana será dedicada somente ao desenvolvimento do projetos, em que os alunos poderão conversar em grupos, e receber meu feedback sobre os projetos. A semana final (A2) será dedicada a apresentação dos resultados. Minha expectativa é de que estes projetos auxiliem alunos a escrever novos artigos, iniciar trabalhos relacionados aos seus TCCs e Dissertações, ou criar instrumentos capazes de auxiliar decisões de políticas públicas e transparência de dados.
Materiais
Leituras Principais
Estas são as leituras principais do curso. Todas estão disponíveis gratuitamente on-line. Eu irei prover semanalmente cópias dos artigos para as semanas específicas.
- Salganik, M. 2017. Bit by Bit: Social Research in the Digital Age. Princeton, NJ: Princeton University Press.
- Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc.
- Wickham, H. (2014). Advanced r. Chapman and Hall/CRC.
- Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political analysis, 21(3), 267-297.)
- Silge, J., & Robinson, D. (2017). Text mining with R: A tidy approach. O’Reilly Media, Inc.
Plano do Seminário
Parte I: Programando em R
As primeiras oito semanas do curso focarão em construir uma sólida base em programação em R. Neste período, não focaremos em introduçao a estatística, ou outros métodos das ciências sociais computacionais; o objetivo principal é passar aos alunos as capacidades básicas para entender R e seguir adiante com seus projetos no futuro. Cada semana será dividida em geral da seguinte forma:
Segundas: Aula em que discutirei os conceitos principais da semana, e darei vários exemplos de códidos e aplicações em R.
Quartas Sua vez! Nestes dias, será sua vez de aplicar o que discutimos na aula anterior. Você poderá rever o código, fazer perguntas, e iniciar seus exercícios de programação da semana.
Semana 1: Introdução e Festival da Instalaçao (Fevereiro 1 - 3)
Tópicos: O que é Ciência Social Computacional? Estrutura do Curso, Instalando R e todas as outras ferramentas que iremos utilizar no curso.
Leituras
- Bit by Bit, Chapter 1 and 2
Semana 2: Introdução ao R (Fevereiro 8-10)}
Tópicos: Curso Rápido em R, objetos, operações básicas, bancos de dados, R Studio.
Semana 3: Replicabilidade, Fluxo de Trabalho e Relatórios Dinâmicos. (Fevereiro 22 - 24)
Tópicos: R-projects, Rmarkdown e Rpres.
Semana 4: Manipulação de Dados (Março 1 - 3)
Tópicos: Introdução ao Tidyverse
Semana 4: Visualização de Dados (Março 8 - 10)
Tópicos: ggplot2
Semana 5: Programação Funcional em R (Março 15 - 17)
Tópicos: Funções, Loops, Purr e Processamento em Paralelo.
Semana 6: Raspagem de Dados I: Raspando Websites (Março 22- 24)
Tópicos: Rvest e Limpando arquivos Htmls and Xmls
Semana 7: Raspagem de Dados II: APIs (Março 29 - 31)
Tópicos: APIs e Arquivos Json
Parte III: Projeto Final
Semana: Projeto Final: Mãos a Obra (June 7 - 9 )
- Sessões dedicadas para vocês desenvolverem seus trabalhos finais
Semaan A2: Sem aula (June 14 - 16)
Semana Projeto Final: Apresentação (June 21)
- Apresentação Final