Mineração de textos do COPOM: o que os comunicados dizem?

No exercício anterior, construímos um indicador que quantifica o sentimento proveniente das decisões de política monetária, implícito nas atas do COPOM. Hoje, avaliaremos se o indicador provê informações úteis para tomadores de decisão, seus pontos fortes e fracos, assim como sua interpretação prática.

Interpretação do indicador

O indicador de sentimentos aqui abordado foi construído pelo método de contagem de palavras positivas/negativas nos textos, com o auxílio do dicionário Loughran-McDonald. Dessa forma, o indicador assume valores inteiros, {..., -2, -1, 0, 1, 2, ...}, onde valores positivos indicam sentimos positivos, valores negativos indicam sentimentos negativos e valor igual a zero indica neutralidade. O sentimento é atribuído para cada texto (ata) e informa o líquido entre as classificações das palavras no texto (positivo - negativo), após uma série de pré-processamentos.

Sendo assim, quando vemos uma coluna em azul no gráfico anterior, podemos esperar que — lendo a ata desta reunião do COPOM — os diretores usaram palavras com sentimentos/emoções mais positivos do que negativos. Tomando como exemplo a coluna mais alta do gráfico, referente a reunião nº 178 de outubro/2013, nosso algoritmo encontrou 74 palavras negativas e 152 positivas, das quais algumas destas últimas são "fortalecimento", "melhora" e "progresso".

Seguindo esse raciocínio, as colunas em vermelho indicam mais palavras com sentimentos negativos do que positivos e as observações em que a coluna possui valor zero indicam o mesmo número de palavras positivas e negativas. Isso é tudo que você consegue interpretar deste indicador. Qualquer análise além disso está sujeita a viés do analista.

Portanto, vamos falar de vieses do indicador, seus pontos fortes e fracos.

Pontos fortes e fracos

O indicador produzido é um trabalho inicial e embrionário, isto posto, destacamos brevemente algumas considerações pertinentes sobre o seu uso.

Pontos fortes:

  • Fácil interpretação;
  • Algoritmo simples de implementar e automatizável;
  • Não exige uso de modelos/estatística;
  • Apelo visual/facilidade de comunicar resultados.

Pontos fracos:

  • O número de palavras total em cada texto é desconsiderado;
  • O contexto da palavra não é levado em consideração;
  • O método não considera dependências temporais;
  • O indicador é agnóstico ao ciclo econômico.

Uma crítica que pode surgir sobre o indicador exposto é a sua divergência em relação ao ciclo econômico, conforme pontuado acima, especialmente na crise de 2014-16. O gráfico abaixo, atualizado com áreas sombreadas indicando períodos datados como recessão da economia brasileira pelo CODACE/FGV, pode ajudar a entender.

Uma expectativa razoável, para a maioria das pessoas, em relação ao indicador de sentimentos é a de que períodos recessivos estejam associados a sentimentos negativos. Nos períodos prévios a crise de 2014-16 essa relação parece se manifestar relativamente bem, ao passo que na crise a relação inverte-se. E isso pode ser resultado da simplicidade "em excesso" do indicador, conforme considerações pontuadas acima. Em outras palavras, há certamente espaço para aperfeiçoar o indicador.

Em suma, o procedimento quantitativo empregado simplifica bastante a leitura dos comunicados de política monetária, mas perde-se informações valiosas no processo.

Saiba mais

Códigos de replicação em R estão disponíveis para membros do Clube AM da Análise Macro. Se você achou o tema interessante, confira o próximo exercício onde trataremos da relação entre o indicador de sentimentos e variáveis macroeconômicas brasileiras.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como analisar o Núcleo de Inflação no Brasil usando Python?

O Python se destaca como uma ferramenta robusta para análise de dados, permitindo a aplicação de uma ampla gama de técnicas em dados econômico-financeiros. Neste exercício, destacamos como a linguagem oferece uma facilidade muito grande na coleta de dados dos núcleos do IPCA diretamente do site do Banco Central, na manipulação eficiente desses dados e na construção de gráficos que facilitam a compreensão dos indicadores.

Propensity Score com Múltiplas Variáveis no R

O escore de propensão é provavelmente a maneira mais comum de agregar múltiplas variáveis de correspondência em um único valor que pode ser correspondido, ou seja, muito útil para a realização de pareamento.

O escore de propensão é a probabilidade estimada de que uma determinada observação teria sido tratada. A correspondência de escore de propensão muitas vezes significa selecionar um conjunto de observações de controle correspondidas com valores semelhantes do escore de propensão.

Análise regional da inflação com dados do IBGE usando Python

Os dados desagregados do IPCA fornecem informações detalhadas sobre o comportamento de preços no Brasil a nível de região metropolitana e município, possibilitando ricas análises regionais de dados. Neste artigo mostramos como acessar, processar e analisar estes dados utilizando o Python.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.