Ementa

Clique aqui para fazer o download em Pdf.

Instrutor

  • Tiago Ventura
  • Ph.D. em Ciência Política (IESP-UERJ), e Ph.D. Candidate em Governo e Política na Universidade de Maryland, College Park.
  • Email:
  • Pronome: Ele/Dele

Introdução

Até alguns anos atrás, coletar dados em larga escala sobre comportamento social - por exemplo, quem você votou, quem são seus amigos mais próximos, ou quais tipos de notícias você consome, lê e compartilha - era uma atividade cara, custosa, e aberta a poucos pesquisadores e instituições. Porém, nos tempos atuais de , a situação alterou-se por completo. O mundo atualmente possui uma capacidade maior de armazenar e coletar dados do que há pesquisadores-as disponíveis para analizar este volume imenso e desorganizado de dados. E mais, a redução nos custos de adquirir, guardar e acessar dados impõe padrões mais altos para os conhecimento metodológicos e técnicos dos pesquisadores, sobretudo nas ciências sociais, e tal mudança tem introduzido desafios diversos para pesquisa em ciências sociais na era digital

Este curso busca preparar você para conduzir pesquisa em ciências sociais nesta era digital e de big data. O curso possui três objetivos principais: em primeiro lugar, iremos proporcionar ao alunos uma introdução compreensiva sobre métodos computacionais em ciências sociais. A idéa é garantir ao alunos após oito semanas de aula alguma fluência em programação, que permitirá aos mesmos usar tais técnicas em suas próprias pesquisas. A linguagem R será utilizada no curso. Em segundo lugar, iremos discutir artigos aplicados na área de mídias digitais e comunicação política. O objetivo é expor alunos ao que considero exemplos das melhores pesquisas neste campo, e que utilizam os mais atualizados recursos metodológicos. Em terceiro lugar, os alunos terão a oportunidade de aplicar as técnicas e conteúdos adquiridos ao longo do curso em uma idéia original de pesquisa.

Este curso é pensando para alunos de graduação e pós graduação. Enquanto esta ementa pode parecer um tanto longa e intimidadora, não há como adquirir o conjunto de habilidades discutidas neste curso sem um esforço considerável. Dito isto, por favor, avisem-me qualquer preocupação com o curso no decorrer do semestre. Estou aberto a ajustes e adequações a esta ementa, e o objetivo principal é preparar um curso capaz de ajudar os alunos no longo prazo.

A maior parte das leituras do curso serão em inglês. Porém, todas as aulas, códigos, e slides estarão em português. Infelizmente, as melhores pesquisas em Métodos Computacionais para Ciências Sociais, tanto teóricas quanto aplicadas, ainda encontram-se em inglês. E eu acredito firmemente que conhecer tais pesquisa pode gerar insights para suas próprias idéias.

Aulas

As aulas serão todas virtuais as segundas e quartas-feiras, das 11:10 AM até 12:50 PM.

Objetivos

Este curso não possui nenhum pré-requisito, e é desenhado para alunos com experiências variadas em métodos computacionais. Ao final do curso, eu espero que os alunos sintam-se confortáveis em programar em R e em usar este software em suas próprias pesquisas.

Mais importante, ao final deste curso, minha expectativa é que os alunos conheçam a literatura e métodos usados na fronteira do conhecimento em ciências sociais computacionais, e particularmente, em comunicação política. Estes artigos certamente guiarão alunos a densenvolver suas pŕoprias idéias no futuro.

Comunicação

Site: Uma página na internet para o curso https://fgvintrocss.netlify.app/ concentrará todos os nossos materiai. Você deve checar o site regularmente e verificar os materiais que utilizaremos ao longo do semestre.

Slack: Nosso seminário também fará uso do Slack para comunicação interna (https://join.slack.com/t/umd-apb9922/shared_invite/zt-kne0ldx2-1J9kE0FJYxjZRA11lUhhNA). A plataforma slack funciona como um fórum aberto de discussão e colaboração. Quaisquer perguntas direcionadas a mim devem ser feitas via Slack. Se você não conhece o Slack, cheque este tutorial. Na primeira aula, eu enviarei o convite para todos serem incluídos no Slack e discutiremos como usá-lo.

Avaliação

Os alunos serão avaliados de acordo com três componentes: participação, exercícios de programação, e projeto final.

Participação em Aula (10%)

Ao longo do curso, serão dadas amplas oportunidade de participação aos alunos. Tanto nas discussões sobre artigos aplicados, quanto nos exercícios de programação. Eu avaliarei os alunos com base em seu engagamento nas referidas discussões.

Durante as aulas pedimos que o vídeo dos alunos permaneça sempre ligado. O dos professores também ficará. O uso da câmera é considerado como critério de participação em aulas.

Exercícios. (40%)

Durante a primeira parte do curso (semana 1 até semana 8), os alunos trabalharão em exercícios de programação relacionados aos tópicos da semana. Cada exercício deve ser entregue até a sexta-feira da semana correspondente, até meia noite. Atraso na entrega dos exercícios será penalizado nas notas. Estes exercícios serão frequentes durante as primeiras oito semanas, porém, os farei relativamente curtos. Vocês poderão discutí-los em sala da aula comigo e com seus colegas. Eu encorajo alunos a trabalharem em grupo, porém, cada exercício deve ser submetido individualmente.

Os exercícios devem ser respondidos usando R Markdown, uma linguagem capaz de produzir documentos com bons formatos e combinando resultados, escrita e códigos de R. Para submeter seus exercícios, você precisará compilar seu arquivo de R markdown em formato pdf, e submeter via slack. Nas duas primeiras semanas, iremos praticar diversas vezes este procedimento.

Projeto Final (50%)

Nas últimas semanas do curso, os alunos trabalharão em grupos (3-4) em um projeto final de curso aplicando as técnicas discutidas no decorrer do semestre. O formato para o projeto final é bastante flexível. Os alunos podem optar por iniciar um desenho de pesquisa para um novo artigo, criar um novo banco de dados, ou qualquer outra tipo de aplicação em ciências social computacional, que receba meu aval.

Os alunos terão três semanas para desenvolver o projeto. A primeiro semana será dedicada a dividir os alunos em seus grupos e selecionar o tópico e formato do projeto final. A segunda semana será dedicada somente ao desenvolvimento do projetos, em que os alunos poderão conversar em grupos, e receber meu feedback sobre os projetos. A semana final (A2) será dedicada a apresentação dos resultados. Minha expectativa é de que estes projetos auxiliem alunos a escrever novos artigos, iniciar trabalhos relacionados aos seus TCCs e Dissertações, ou criar instrumentos capazes de auxiliar decisões de políticas públicas e transparência de dados.

Materiais

Leituras Principais

Estas são as leituras principais do curso. Todas estão disponíveis gratuitamente on-line. Eu irei prover semanalmente cópias dos artigos para as semanas específicas.

  • Salganik, M. 2017. Bit by Bit: Social Research in the Digital Age. Princeton, NJ: Princeton University Press.
  • Wickham, H., & Grolemund, G. (2016). R for data science: import, tidy, transform, visualize, and model data. O’Reilly Media, Inc.
  • Wickham, H. (2014). Advanced r. Chapman and Hall/CRC.
  • Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political analysis, 21(3), 267-297.)
  • Silge, J., & Robinson, D. (2017). Text mining with R: A tidy approach. O’Reilly Media, Inc.

Plano do Seminário

Parte I: Programando em R

As primeiras oito semanas do curso focarão em construir uma sólida base em programação em R. Neste período, não focaremos em introduçao a estatística, ou outros métodos das ciências sociais computacionais; o objetivo principal é passar aos alunos as capacidades básicas para entender R e seguir adiante com seus projetos no futuro. Cada semana será dividida em geral da seguinte forma:

Segundas: Aula em que discutirei os conceitos principais da semana, e darei vários exemplos de códidos e aplicações em R.

Quartas Sua vez! Nestes dias, será sua vez de aplicar o que discutimos na aula anterior. Você poderá rever o código, fazer perguntas, e iniciar seus exercícios de programação da semana.

Semana 1: Introdução e Festival da Instalaçao (Fevereiro 1 - 3)

Tópicos: O que é Ciência Social Computacional? Estrutura do Curso, Instalando R e todas as outras ferramentas que iremos utilizar no curso.

Leituras

  • Bit by Bit, Chapter 1 and 2

Semana 2: Introdução ao R (Fevereiro 8-10)}

Tópicos: Curso Rápido em R, objetos, operações básicas, bancos de dados, R Studio.

Semana 3: Replicabilidade, Fluxo de Trabalho e Relatórios Dinâmicos. (Fevereiro 22 - 24)

Tópicos: R-projects, Rmarkdown e Rpres.

Semana 4: Manipulação de Dados (Março 1 - 3)

Tópicos: Introdução ao Tidyverse

Semana 4: Visualização de Dados (Março 8 - 10)

Tópicos: ggplot2

Semana 5: Programação Funcional em R (Março 15 - 17)

Tópicos: Funções, Loops, Purr e Processamento em Paralelo.

Semana 6: Raspagem de Dados I: Raspando Websites (Março 22- 24)

Tópicos: Rvest e Limpando arquivos Htmls and Xmls

Semana 7: Raspagem de Dados II: APIs (Março 29 - 31)

Tópicos: APIs e Arquivos Json

Parte II: Ciência Social Computacional: Artigos Aplicados

A partir daqui, avançaremos para a leitura e compreensão de artigos aplicados em Ciências Sociais Computacionais. Esta será a parte mais interessante do curso!

Selecionei tópicos e artigos que considero os melhores exemplos no uso novos métodos computacionais e respondendo a questões importantes das ciências sociais.

Durante a primeira reunião de cada semana (em geral, segundas-feiras), discutiremos juntos os artigo. Não vou fazer uma palestra sobre os artigos, esta será uma discussão aberta em que o seu envolvimento é a chave.

Cada aluno deve trazer uma pergunta e um comentário sobre o aspecto mais importante de ao menos um dos textos para cada uma de nossas aulas.

Na segunda reunião de cada semana, mostrarei como implementar alguns dos métodos usados em cada um dos artigos (programação prática).

As leituras com um asterisco (*) são obrigatórias. Você vai ler no máximo dois artigos por semana. As outras leituras são apenas sugeridas. Algumas leituras sugeridas podem ser adicionadas ao programa ao longo do curso.

Semana: Análise de Dados de Mídias Sociais (Maio 03 - 05)

Artigos Aplicados

  • Calvo, Ernesto and Natalia Aruguete. 2016. Time to Protest: Polarization and Time-to-Retweet in Argentina. Journal of Communication. *

  • SOUZA, Rafael Martins de; GRAÇA, Luís Felipe Guedes da; SILVA, Ralph dos Santos. Politics on the Web: Using Twitter to Estimate the Ideological Positions of Brazilian Representatives. Bras. Political Sci. Rev., v. 11, n. 3, e0003, Nov. 2017. https://doi.org/10.1590/1981-3821201700030003 *

  • Barberá, Pablo, John T. Jost, Jonathan Nagler, Joshua A. Tucker, and Richard Bonneau. “Tweeting from left to right: Is online political communication more than an echo chamber?.” Psychological science 26, no. 10 (2015): 1531-1542.

  • Shugars, Sarah, and Nicholas Beauchamp. “Why Keep Arguing? Predicting Engagement in Political Conversations Online.” SAGE Open 9, no. 1 (January 1, 2019): 2158244019828850. https://doi.org/10.1177/2158244019828850.

  • Bakshy, E., Messing, S., & Adamic, L. 2015. Exposure to ideologically diverse news and opinion on Facebook. science, 348(6239), 1130-1132.

Técnicas de Programação:

  • Acessando dados na API do Twitter.
  • Processando dados do Twitter.
  • Analizando Notícias e Ativação de Conteúdo com dados do Twitter.
  • Escalonamento ideológico com dados do Twitter.

Semana: Experimentos e Experimentos Digitais de Campo (Maio 10 - 12)

Aula 10 de Maio: Experimentos On-line.

  • Calvo, E., & Ventura, T. (2021). Will I Get COVID-19? Partisanship, Social Media Frames, and Perceptions of Health Risk in Brazil. Latin American Politics and Society, 63(1), 1-26.* (Resp: Jessica)

  • Guess, A. M., Lerner, M., Lyons, B., Montgomery, J. M., Nyhan, B., Reifler, J., & Sircar, N. (2020). A digital media literacy intervention increases discernment between mainstream and false news in the United States and India. Proceedings of the National Academy of Sciences, 117(27), 15536-15545.*

  • Bond, R. M., Fariss, C. J., Jones, J. J., Kramer, A. D., Marlow, C., Settle, J. E., & Fowler, J. H. (2012). A 61-million-person experiment in social influence and political mobilization. Nature, 489(7415), 295-298.

  • King, G., Pan, J., & Roberts, M. E. (2014). Reverse-engineering censorship in China: Randomized experimentation and participant observation. Science, 345(6199), 1251722.

Aula 12 de Maio: Experimentos Digitais de Campo.

  • Bail et al (2018). Exposure to opposing views on social media can increase political polarization. Proceedings of the National Academy of Sciences, 115(37): 9216-9221. *

  • Munger, K. (2017). Tweetment effects on the tweeted: Experimentally reducing racist harassment. Political Behavior, 39(3), 629–649. * (Resp: Barbara)

  • Victoria Asbury, Keng-Chi Chang, Katherine McCabe, Kevin Munger, Tiago Ventura; The Effect of Streaming Chat on Perceptions of Debates. Under Review.

Técnicas de Programação:

  • Experimentos on-line.
  • Criando Robôs no Twitter.
  • Breve Introdução ao uso de Mturk e Facebook Ads.

Semana 13: Análise de Texto: Visão Geral (Maio 17 - 19)

Applied Papers

  • Izumi, Mauricio Yoshida, and D. C. Moreira. 2018. “O Texto Como Dado: Desafios E Oportunidades Para as Ciências Sociais.” REVISTA BRASILEIRA DE INFORMAÇÃO BIBLIOGRÁFICA EM CIÊNCIAS SOCIAIS - BIB 2 (86): 138–74. * (Resp: Jessica)

  • Grimmer, J., & Stewart, B. M. (2013). Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political analysis, 21(3), 267-297.*

  • Wilkerson, J. and Casas, A. (2017). Large-Scale Computerized Text Analysis in Political Science: Opportunities and Challenges. Annual Review of Political Science, 20, 529:544.

Técnicas de Programação:

  • Tidytext e Quanteda para Análise de Texto.
  • Text mining with R: A tidy approach. O’Reilly Media, Inc.

Semana 14: Análise de Texto: Aprendizado Supervisado e Módelo de Tópicos. (Maio 24 - 26)

Artigos Aplicados:

  • Moreira, D., 2020. Com a Palavra os Nobres Deputados: Ênfase Temática dos Discursos dos Parlamentares Brasileiros. Dados, 63(1).*

  • Theocharis, Y., Barberá, P., Fazekas, Z., Popa, S. A. and Parnet, O. (2016). A Bad Workman Blames His Tweets: The Consequences of Citizens’ Uncivil Twitter Use When Interacting With Party Candidates. Journal of Communication, 66: 1007–1031.* (Resp: Barbara)

  • Barberá, Pablo, Amber E. Boydstun, Suzanna Linn, Ryan McMahon, and Jonathan Nagler. “Automated Text Classification of News Articles: A Practical Guide.” Political Analysis, undefined/ed, 1–24.

  • Roberts, M. E., Stewart, B. M., Tingley, D., Lucas, C., Leder‐Luis, J., Gadarian, S. K., & Rand, D. G. (2014). Structural Topic Models for Open‐Ended Survey Responses. American Journal of Political Science, 58(4), 1064-1082.

  • Terman, R. (2017). Islamophobia and Media Portrayals of Muslim Women: A Computational Text Analysis of US News Coverage. International Studies Quarterly, 61(2): 489-502.

Técnicas de Programação:

  • Modelo de Tópicos Estruturais em R

Semana: Bias Algorítimico (May 31 - June 2)

  • Machado, M., 2018. A teoria da antropologia digital para as humanidades digitais. Revista Z Cultural (UFRJ), Rio de Janeiro, 2, pp.1-7. *

  • SILVA, Tarcizio da. VISÃO COMPUTACIONAL E RACISMO ALGORÍTMICO: BRANQUITUDE E OPACIDADE NO APRENDIZADO DE MÁQUINA. Revista da Associação Brasileira de Pesquisadores/as Negros/as (ABPN), [S.l.], v. 12, n. 31, fev. 2020. ISSN 2177-2770.*

Artigos Aplicados:

Parte III: Projeto Final

Semana: Projeto Final: Mãos a Obra (June 7 - 9 )

  • Sessões dedicadas para vocês desenvolverem seus trabalhos finais

Semaan A2: Sem aula (June 14 - 16)

Semana Projeto Final: Apresentação (June 21)

  • Apresentação Final