De tokens até stop words, passando por procedimentos de stemming e lemmatizing, dentre outros, neste artigo introduzimos as principais técnicas e conceitos de mineração de textos, preparando os dados para a análise.
Com uma matéria prima em comum, a mineração de textos e a inteligência artificial generativa usam grandes volumes de dados não estruturados para fins distintos e com aplicações em Economia, Finanças, Marketing e outras áreas. Mas quando devemos usar uma técnica e não a outra? O que é possível fazer e o que é mineração de textos? Neste artigo introduzimos estes tópicos e fornecemos alguns exemplos de aplicações.
Neste exercício de text mining, avaliamos o poder preditivo de um indicador de sentimentos construído quantitativamente com base nos textos das atas do COPOM. Usando a linguagem R, performamos o teste de causalidade de Granger e analisamos a correlação do indicador com as variáveis macroeconômicas do boletim Focus.
Previamente, construímos um indicador que quantifica o sentimento proveniente das decisões de política monetária, implícito nas atas do COPOM. Hoje, avaliaremos se o indicador provê informações úteis para tomadores de decisão, seus pontos fortes e fracos, assim como sua interpretação prática.
Neste exercício, construímos um indicador que busca quantificar o sentimento proveniente das decisões de política monetária no Brasil. Usando técnicas de mineração de texto, criamos tokens a partir das atas do Comitê de Política Monetária (COPOM) do Banco Central, o que permite classificar o sentimento implícito nos textos.