Mineração de textos do COPOM: o que os comunicados dizem?

No exercício anterior, construímos um indicador que quantifica o sentimento proveniente das decisões de política monetária, implícito nas atas do COPOM. Hoje, avaliaremos se o indicador provê informações úteis para tomadores de decisão, seus pontos fortes e fracos, assim como sua interpretação prática.

Interpretação do indicador

O indicador de sentimentos aqui abordado foi construído pelo método de contagem de palavras positivas/negativas nos textos, com o auxílio do dicionário Loughran-McDonald. Dessa forma, o indicador assume valores inteiros, {..., -2, -1, 0, 1, 2, ...}, onde valores positivos indicam sentimos positivos, valores negativos indicam sentimentos negativos e valor igual a zero indica neutralidade. O sentimento é atribuído para cada texto (ata) e informa o líquido entre as classificações das palavras no texto (positivo - negativo), após uma série de pré-processamentos.

Sendo assim, quando vemos uma coluna em azul no gráfico anterior, podemos esperar que — lendo a ata desta reunião do COPOM — os diretores usaram palavras com sentimentos/emoções mais positivos do que negativos. Tomando como exemplo a coluna mais alta do gráfico, referente a reunião nº 178 de outubro/2013, nosso algoritmo encontrou 74 palavras negativas e 152 positivas, das quais algumas destas últimas são "fortalecimento", "melhora" e "progresso".

Seguindo esse raciocínio, as colunas em vermelho indicam mais palavras com sentimentos negativos do que positivos e as observações em que a coluna possui valor zero indicam o mesmo número de palavras positivas e negativas. Isso é tudo que você consegue interpretar deste indicador. Qualquer análise além disso está sujeita a viés do analista.

Portanto, vamos falar de vieses do indicador, seus pontos fortes e fracos.

Pontos fortes e fracos

O indicador produzido é um trabalho inicial e embrionário, isto posto, destacamos brevemente algumas considerações pertinentes sobre o seu uso.

Pontos fortes:

  • Fácil interpretação;
  • Algoritmo simples de implementar e automatizável;
  • Não exige uso de modelos/estatística;
  • Apelo visual/facilidade de comunicar resultados.

Pontos fracos:

  • O número de palavras total em cada texto é desconsiderado;
  • O contexto da palavra não é levado em consideração;
  • O método não considera dependências temporais;
  • O indicador é agnóstico ao ciclo econômico.

Uma crítica que pode surgir sobre o indicador exposto é a sua divergência em relação ao ciclo econômico, conforme pontuado acima, especialmente na crise de 2014-16. O gráfico abaixo, atualizado com áreas sombreadas indicando períodos datados como recessão da economia brasileira pelo CODACE/FGV, pode ajudar a entender.

Uma expectativa razoável, para a maioria das pessoas, em relação ao indicador de sentimentos é a de que períodos recessivos estejam associados a sentimentos negativos. Nos períodos prévios a crise de 2014-16 essa relação parece se manifestar relativamente bem, ao passo que na crise a relação inverte-se. E isso pode ser resultado da simplicidade "em excesso" do indicador, conforme considerações pontuadas acima. Em outras palavras, há certamente espaço para aperfeiçoar o indicador.

Em suma, o procedimento quantitativo empregado simplifica bastante a leitura dos comunicados de política monetária, mas perde-se informações valiosas no processo.

Saiba mais

Códigos de replicação em R estão disponíveis para membros do Clube AM da Análise Macro. Se você achou o tema interessante, confira o próximo exercício onde trataremos da relação entre o indicador de sentimentos e variáveis macroeconômicas brasileiras.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Qual o efeito de um choque de juros sobre a inadimplência?

Neste exercício, exploramos a relação dinâmica entre o custo do crédito (juros na ponta) e o risco realizado (taxa de inadimplência) através de uma análise exploratória de dados e modelagem econométrica utilizando a linguagem de programação R.

Qual a relação entre benefícios sociais e a taxa de participação do mercado de trabalho?

Este exercício apresenta uma investigação econométrica sobre a persistente estagnação da taxa de participação no mercado de trabalho brasileiro no período pós-pandemia. Utilizando a linguagem R e dados públicos do IBGE e Banco Central, construímos um modelo de regressão linear múltipla com correção de erros robustos (Newey-West). A análise testa a hipótese de que o aumento real das transferências de renda (Bolsa Família/Auxílio Brasil) elevou o salário de reserva, desincentivando o retorno à força de trabalho.

Estamos em pleno emprego no mercado de trabalho?

Este artigo investiga se o mercado de trabalho brasileiro atingiu o nível de pleno emprego, utilizando uma estimativa da NAIRU (Non-Accelerating Inflation Rate of Unemployment) baseada na metodologia de Ball e Mankiw (1997). Através de uma modelagem em Python que unifica dados históricos da PME e PNAD Contínua com as expectativas do Boletim Focus, comparamos a taxa de desocupação corrente com a taxa neutra estrutural. A análise visual e quantitativa sugere o fechamento do hiato de desemprego, sinalizando potenciais pressões inflacionárias. O texto detalha o tratamento de dados, a aplicação do Filtro Hodrick-Prescott e discute as vantagens e limitações da metodologia econométrica adotada.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.