Na edição 28 do Clube do Código, abordamos um problema prático: extrair tabelas de arquivos PDF. Isso pode ser um transtorno, não é mesmo? Já pensou ter que pegar dados de uma tabela, um a um, e colocar em outro programa? Com o R, isso, claro, é feito de outra forma. Utilizamos o pacote tabulizer para essa empreitada. Por exemplo, podemos estar interessados em pegar uma tabela do Relatório Trimestral de Inflação. Assim, começamos o nosso código, como abaixo.
library(tabulizer) url = 'http://www.bcb.gov.br/htms/relinf/port/2017/03/ri201703c2p.pdf' out = extract_tables(url)
Com três linhas de código, nós extraimos as tabelas do arquivo PDF. Agora, basta limpar um pouco os dados e utilizar a função stargazer para colocar essa tabela abaixo.
Trimestre | 50% Lower | 30% Lower | 10% Lower | Central | 10% Upper | 30% Upper | 50% Upper |
2017 1 | 4,6 | 4,6 | 4,6 | 4,6 | 4,6 | 4,6 | 4,6 |
2017 2 | 3,5 | 3,7 | 3,8 | 3,9 | 4,0 | 4,1 | 4,3 |
2017 3 | 2,8 | 3,1 | 3,3 | 3,4 | 3,5 | 3,7 | 4,0 |
2017 4 | 3,2 | 3,6 | 3,9 | 4,0 | 4,1 | 4,4 | 4,8 |
2018 1 | 3,5 | 3,9 | 4,2 | 4,4 | 4,6 | 4,9 | 5,3 |
2018 2 | 3,2 | 3,7 | 4,0 | 4,2 | 4,4 | 4,7 | 5,2 |
2018 3 | 3,2 | 3,7 | 4,0 | 4,2 | 4,4 | 4,7 | 5,2 |
2018 4 | 3,5 | 4,0 | 4,3 | 4,5 | 4,7 | 5,0 | 5,5 |
2019 1 | 3,6 | 4,1 | 4,4 | 4,6 | 4,8 | 5,1 | 5,6 |
Fonte: Relatório de Inflação BCB - Março de 2017. |
Aqui, para colocar no Blog, estou usando um código html. Mas é possível usar LaTeX e colocar essa tabela em outro pdf, como faço na edição 28 do Clube do Código. Bacana, não? 🙂