class: center, middle, inverse, title-slide # Introdução a Métodos Computacionais para Ciência Sociais ## Introdução a Análise de Texto ### Tiago Ventura ### CPDOC-FGV --- ## Grimmer and Stewart: Text as Data. Política e conflitos políticos usualmente ocorrem a partir de textos: - Leis, discursos e propostas legislativas. - Tratados internacionais. - Manifestos partidários - Análise de média social. - Matérias de jornais... **Imensidão de dados** **Explosão de novos e mais eficientes métodos para análise destes dados de forma automatizada.** --- class: center, middle ```r knitr::include_graphics("figs/text.png") ``` <img src="figs/text.png" width="100%" /> --- ## Classificação <br> .center[ <img src="figs/text_cut.png" width="70%" /> ] --- ## Escalonamento <br> .center[ <img src="figs/text_scaling.png" width="70%" /> ] --- ## Quatro Principios + Um do Tiago. 1. Pense no seu objetivo e depois veja em qual caixa dos métodos você se encaixa. 2. All quantitative models of language are wrong—but some are useful. 3. Quantitative methods for text amplify resources and augment humans. 4. There is no globally best method for automated text analysis. 5. Validate, Validate, Validate. --- class: center, middle, inverse ## Perguntas --- ## Exercício. Em grupos, vocês farão o seguinte exercício: 1. Pense em um banco de dados. 2. Elabore uma pergunta para ser respondida com este banco de dados. 3. Qual método acima você usaria para responder a esta pergunta?