Dados: como são disponibilizados e como são coletados

Neste post, veremos quais são os principais formatos nos quais os dados costumam ser disponibilizados e aprenderemos, através de exemplos práticos, sobre as ferramentas de ciência de dados para coletar essas informações, sejam de fontes nacionais ou internacionais, seja usando o R ou o Python.

Formatos de dados

Não apenas na ciência de dados, mas também na economia, em finanças e em várias outras áreas, os dados costumam ser a matéria prima usada como a base para gerar e utilizar informações na resolução de problemas de negócio. No entanto, eles podem ser disponibilizados em variados formatos e cabe ao profissional de dados conhecer os detalhes técnicos para ser capaz de processar (coletar) os dados e tirar algo útil dos mesmos.

Coleta de dados é, usualmente, a primeira etapa de uma análise de dados, que envolve identificar a fonte, definir as informações de interesse e importar os dados para prosseguir com a análise. Em termos práticos, isso significa que você pega um arquivo, um banco de dados ou uma web application programming interface (API) e carrega essa informação para o ambiente de programação. Em geral, o resultado esperado é uma tabela com as variáveis e suas observações.

Existem inúmeros formatos de arquivos usados para armazenar dados, assim como um grande número de bibliotecas no R e no Python para processar estes arquivos. Abaixo resumimos os principais e, geralmente, mais usados:

Em geral, podemos agrupar essas opções formatos de arquivos e ferramentas para processá-los em dois grupos: quando os dados estão disponibilizados online ou quando estão disponibilizados offline.

A coleta de dados online é quando a fonte dos dados é um local na internet, por exemplo:

  • Links para arquivos CSV
  • Ponto de acesso para uma API
  • Web scraping de uma página

A coleta de dados offline é quando a fonte de dados é um local no seu computador, por exemplo:

  • Arquivos CSV
  • Banco de dados SQL

Fontes de dados

Além de os dados serem disponibilizados em variados formatos, existem também diversas fontes onde eles ficam armazenados. As fontes de dados são fundamentais para a coleta e análise de informações relevantes em diversos segmentos.

Vamos destacar algumas fontes de dados interessantes, divididas em dois segmentos:

  • Fontes Nacionais: importantes referências para coletar dados sobre a economia, finanças e indicadores sociais do país.
    • Banco Central do Brasil (BCB): responsável por gerir a política monetária, o câmbio e o sistema financeiro, e disponibiliza informações relevantes sobre esses temas.
    • Instituto Brasileiro de Geografia e Estatística (IBGE): responsável pela produção e análise de estatísticas socioeconômicas e demográficas, como o censo populacional, indicadores de desigualdade, renda e trabalho.
    • IPEADATA: é uma fonte especializada em dados econômicos, financeiros e sociais, oferecendo uma ampla gama de informações e séries históricas.
  • Fontes Internacionais: importantes referências para coletar dados sobre a economia global.
    • Banco Mundial (WB): fornece informações sobre a economia mundial, incluindo dados sobre comércio, finanças, pobreza e desigualdade.
    • Fundo Monetário Internacional (FMI): fornece informações sobre a economia mundial, incluindo dados sobre comércio, finanças, pobreza e desigualdade.
    • FRED: é uma base de dados mantida pela Reserva Federal dos Estados Unidos, que disponibiliza uma grande variedade de séries temporais sobre a economia dos EUA.
    • Organização para Cooperação e Desenvolvimento Econômico (OCDE): é uma organização internacional que promove a cooperação entre países em questões econômicas e sociais, e disponibiliza dados comparativos entre seus países membros, como PIB, educação, saúde e meio ambiente.

Em resumo, a coleta de dados é uma etapa crucial em qualquer análise ou tomada de decisão, e essas fontes nacionais e internacionais são de grande relevância para a obtenção de informações confiáveis e atualizadas.

Agora que entendemos quais são os principais formatos de arquivos de dados, onde eles podem estar disponíveis e quais ferramentas podem ser utilizadas para processá-los, vamos ver alguns exemplos práticos de coleta de dados.

Coleta de dados

A coleta de dados é uma etapa crucial no ciclo de análise de dados, pois é quando verificamos se os dados estão disponíveis e como efetuaremos a coleta dos mesmos para resolver um problema com análise de dados.

Não é necessário aprender sobre todas as formas de coletas de dados para todas as fontes de dados existentes por aí (você provavelmente passaria o resto da sua vida fazendo isso), mas é importante aprender as principais e os fundamentos que servem para as demais. Portanto, vamos mostrar 3 exemplos de coleta de dados usando R e Python:

  • Arquivo CSV online
  • Requisição em uma API
  • Consulta em um Banco de Dados SQL

Para reproduzir estes exemplos você vai precisar de um ambiente de programação com R e Python instalados e configurados, além dos pacotes utilizados nos exemplos.

Para acesso aos códigos faça parte do Clube AM da Análise Macro.

Importar um arquivo CSV online

Parar importar um arquivo CSV através de um link podemos usar o readr no R e o pandas no Python. Por exemplo:

R

Código
data pib
1996-01-01 99.55
1996-04-01 100.44
1996-07-01 104.38
1996-10-01 103.30
1997-01-01 104.32
1997-04-01 105.02

Python

Código
         data     pib
0  1996-01-01   99.55
1  1996-04-01  100.44
2  1996-07-01  104.38
3  1996-10-01  103.30
4  1997-01-01  104.32

Fazer uma requisição de dados de uma API

Parar consumir dados de uma API pública é necessário verificar e seguir a documentação da mesma, geralmente efetuando uma requisição para obter uma resposta (que pode ser transformada para uma tabela de dados).

Por exemplo, para coletar dados da API chamada SGS do Banco Central, devemos usar uma URL base, os parâmetros e os valores. Para tal, podemos usar o httr2 no R e o requests no Python:

R

Código
data valor
9616 14/04/2023 4.9455
9617 17/04/2023 4.9421
9618 18/04/2023 4.9678
9619 19/04/2023 5.0467
9620 20/04/2023 5.0497
9621 24/04/2023 5.0595

Python

Código
<Response [200]>
Código
            data   valor
9616  17/04/2023  4.9421
9617  18/04/2023  4.9678
9618  19/04/2023  5.0467
9619  20/04/2023  5.0497
9620  24/04/2023  5.0595

Fazer uma consulta SQL em um Banco de Dados

Para fazer uma consulta usando SQL em uma tabela de um Banco de Dados, é necessário identificar como a base está disponibilizada, verificar se o usuário possui acesso e usar a sintaxe da linguagem para obter os dados.

Por exemplo, para coletar dados de uma tabela pública do Big Query da Google, através do datalake da Base dos Dados, basta definir um ID de projeto e fazer a consulta aos dados desejados com pacotes que se integram ao Big Query (consulte documentações para detalhes). Para tal, podemos usar o pacote basedosdados no R e no Python:

R

Código
ano trimestre id_uf sigla_uf capital rm_ride id_upa id_estrato id_domicilio V1008 V1014 V1016 V1022 V1023 V1027 V1028 V1029 V1033 posest posest_sxi V2001 V2003 V2005 V2007 V2008 V20081 V20082 V2009 V2010 V3001 V3002 V3002A V3003 V3003A V3004 V3005 V3005A V3006 V3006A V3007 V3008 V3009 V3009A V3010 V3011 V3011A V3012 V3013 V3013A V3013B V3014 V4001 V4002 V4003 V4004 V4005 V4006 V4006A V4007 V4008 V40081 V40082 V40083 V4009 V4010 V4012 V40121 V4013 V40132 V40132A V4014 V4015 V40151 V401511 V401512 V4016 V40161 V40162 V40163 V4017 V40171 V401711 V4018 V40181 V40182 V40183 V4019 V4020 V4021 V4022 V4024 V4025 V4026 V4027 V4028 V4029 V4032 V4033 V40331 V403311 V403312 V40332 V403321 V403322 V40333 V403331 V4034 V40341 V403411 V403412 V40342 V403421 V403422 V4039 V4039C V4040 V40401 V40402 V40403 V4041 V4043 V40431 V4044 V4045 V4046 V4047 V4048 V4049 V4050 V40501 V405011 V405012 V40502 V405021 V405022 V40503 V405031 V4051 V40511 V405111 V405112 V40512 V405121 V405122 V4056 V4056C V4057 V4058 V40581 V405811 V405812 V40582 V405821 V405822 V40583 V405831 V40584 V4059 V40591 V405911 V405912 V40592 V405921 V405922 V4062 V4062C V4063 V4063A V4064 V4064A V4071 V4072 V4072A V4073 V4074 V4074A V4075A V4075A1 V4076 V40761 V40762 V40763 V4077 V4078 V4078A V4082 VD2002 VD2003 VD2004 VD3004 VD3005 VD3006 VD4001 VD4002 VD4003 VD4004 VD4004A VD4005 VD4007 VD4008 VD4009 VD4010 VD4011 VD4012 VD4013 VD4014 VD4015 VD4016 VD4017 VD4018 VD4019 VD4020 VD4023 VD4030 VD4031 VD4032 VD4033 VD4034 VD4035 VD4036 VD4037 V1028001 V1028002 V1028003 V1028004 V1028005 V1028006 V1028007 V1028008 V1028009 V1028010 V1028011 V1028012 V1028013 V1028014 V1028015 V1028016 V1028017 V1028018 V1028019 V1028020 V1028021 V1028022 V1028023 V1028024 V1028025 V1028026 V1028027 V1028028 V1028029 V1028030 V1028031 V1028032 V1028033 V1028034 V1028035 V1028036 V1028037 V1028038 V1028039 V1028040 V1028041 V1028042 V1028043 V1028044 V1028045 V1028046 V1028047 V1028048 V1028049 V1028050 V1028051 V1028052 V1028053 V1028054 V1028055 V1028056 V1028057 V1028058 V1028059 V1028060 V1028061 V1028062 V1028063 V1028064 V1028065 V1028066 V1028067 V1028068 V1028069 V1028070 V1028071 V1028072 V1028073 V1028074 V1028075 V1028076 V1028077 V1028078 V1028079 V1028080 V1028081 V1028082 V1028083 V1028084 V1028085 V1028086 V1028087 V1028088 V1028089 V1028090 V1028091 V1028092 V1028093 V1028094 V1028095 V1028096 V1028097 V1028098 V1028099 V1028100 V1028101 V1028102 V1028103 V1028104 V1028105 V1028106 V1028107 V1028108 V1028109 V1028110 V1028111 V1028112 V1028113 V1028114 V1028115 V1028116 V1028117 V1028118 V1028119 V1028120 V1028121 V1028122 V1028123 V1028124 V1028125 V1028126 V1028127 V1028128 V1028129 V1028130 V1028131 V1028132 V1028133 V1028134 V1028135 V1028136 V1028137 V1028138 V1028139 V1028140 V1028141 V1028142 V1028143 V1028144 V1028145 V1028146 V1028147 V1028148 V1028149 V1028150 V1028151 V1028152 V1028153 V1028154 V1028155 V1028156 V1028157 V1028158 V1028159 V1028160 V1028161 V1028162 V1028163 V1028164 V1028165 V1028166 V1028167 V1028168 V1028169 V1028170 V1028171 V1028172 V1028173 V1028174 V1028175 V1028176 V1028177 V1028178 V1028179 V1028180 V1028181 V1028182 V1028183 V1028184 V1028185 V1028186 V1028187 V1028188 V1028189 V1028190 V1028191 V1028192 V1028193 V1028194 V1028195 V1028196 V1028197 V1028198 V1028199 V1028200 habitual efetivo
2019 4 12 AC 12 NA 120015242 1210010 1200152420908 9 8 1 1 1 61.26797 64.83045 409695 1643126 121 117 2 2 2 1 16 10 1934 85 4 2 2 NA NA NA NA NA NA NA NA NA 1 NA 5 NA NA NA 1 1 NA NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA 3 2 2 2 2 2 2 2 2 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3 NA NA NA NA NA NA NA 63.86903 65.64267 185.0365 64.50184 124.0883 133.3997 133.2102 65.25986 65.73201 0 0 134.3119 0 136.9148 0 68.13626 0 62.83184 0 66.27808 61.48425 0 67.96565 64.45502 61.25296 67.60826 0 0 0 0 0 69.13735 58.83096 0 0 63.62755 66.23486 0 143.2517 65.53264 198.9179 64.54161 0 65.35311 127.5745 0 0 69.41299 195.7322 0 0 0 66.87112 127.2123 126.3805 132.4876 69.94953 0 0 64.32074 63.96362 137.1875 68.11881 121.8690 0 62.84259 0 64.57838 66.96746 0 130.7024 121.1181 121.0222 130.5296 0 0 67.28100 0 68.01746 63.05854 0 0 0 0 65.26035 0 0 66.71281 125.5650 205.3706 0 316.1280 0 0 133.4255 66.05343 69.04006 66.21370 0 0 187.6989 0 62.81199 0 0 64.47594 0 128.1786 0 0 197.0529 0 131.2463 66.13441 64.77254 67.31086 59.81129 66.77276 63.60025 263.5346 67.03723 68.91845 63.60211 135.5821 0 124.8385 255.2827 131.3648 122.2943 62.27412 140.0218 0 0 0 0 0 197.8271 127.5773 126.4249 68.19444 0 0 0 123.7960 63.23442 0 126.2033 0 65.31216 0 62.67334 180.4615 132.8245 196.4114 64.76054 131.8952 62.58826 324.6754 66.83387 128.0803 0 134.4454 0 66.91746 152.4024 65.45275 0 65.52452 0 65.70758 67.15902 0 0 65.52055 0 64.18972 0 0 65.39073 67.65944 0 70.62235 68.39929 0 66.96486 128.0909 0 202.0958 0 68.80986 0 62.88468 0 0 0 0 0 0 0 61.14169 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152421208 12 8 1 1 1 61.26797 79.18639 409695 7191532 121 201 8 8 14 2 31 8 2016 3 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 12 8 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 78.52364 79.76978 240.2904 79.90273 153.9976 159.1973 166.4456 84.40147 76.66630 0 0 159.3463 0 162.4188 0 83.90101 0 79.27181 0 78.29388 76.57450 0 78.03610 77.94927 75.15028 76.48182 0 0 0 0 0 81.03983 76.99975 0 0 77.33327 81.37409 0 164.6523 77.69179 238.1459 82.54786 0 75.29346 162.9484 0 0 84.29770 239.4368 0 0 0 81.25309 162.2447 159.0902 172.0028 82.94232 0 0 76.63792 79.10654 167.1566 81.13956 151.5994 0 77.78300 0 80.44014 80.96322 0 169.4853 156.3555 148.5443 157.5653 0 0 82.21612 0 81.37193 80.86263 0 0 0 0 79.08785 0 0 81.34887 149.4313 251.4608 0 403.9922 0 0 167.1226 76.65903 86.15850 82.03521 0 0 240.0247 0 80.00915 0 0 75.67471 0 161.9349 0 0 235.4959 0 161.2017 79.20990 80.26297 81.29310 83.53038 81.48369 81.59539 318.2580 82.59049 81.56636 83.80979 167.9023 0 155.1989 306.1122 160.7691 154.6263 78.44800 168.1611 0 0 0 0 0 241.2506 156.9650 151.6552 83.14069 0 0 0 163.7184 82.31836 0 149.9311 0 83.42517 0 78.30622 237.8006 163.7508 241.8970 83.31921 166.1381 77.60555 398.3964 78.05407 158.7254 0 168.6378 0 82.11425 171.5102 76.07722 0 81.47724 0 82.10914 83.46303 0 0 81.04937 0 78.59835 0 0 80.73276 80.68845 0 84.35981 83.93260 0 79.69400 160.4726 0 239.2649 0 82.63434 0 78.69108 0 0 0 0 0 0 0 74.92851 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420608 6 8 1 1 1 61.26797 85.92566 409695 9316281 121 204 6 5 4 2 31 10 2004 15 4 1 1 2 NA 4 NA NA NA 9 NA NA NA NA NA NA NA NA NA NA NA NA NA 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 1 NA 8 NA NA NA NA NA NA 1 NA NA 2 3 6 2 2 8 3 2 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA 85.30603 87.86257 256.0649 85.84598 167.3227 174.8761 179.8750 91.92304 82.91462 0 0 172.0235 0 173.4845 0 90.83469 0 86.34929 0 83.55809 83.99383 0 84.83527 84.55970 80.80268 83.62268 0 0 0 0 0 88.43286 80.86115 0 0 85.35505 87.09838 0 182.7960 86.26534 258.4957 87.34628 0 83.25282 176.5279 0 0 92.11410 261.1924 0 0 0 85.93500 172.8699 174.5572 185.8254 87.85963 0 0 83.59273 87.24460 179.9265 87.39491 165.2951 0 86.84117 0 86.58284 87.74192 0 182.9249 170.1580 159.9067 170.3892 0 0 87.48030 0 86.38665 86.62890 0 0 0 0 86.14705 0 0 89.10751 165.4339 272.0989 0 425.2925 0 0 183.0165 84.41294 92.27731 89.91943 0 0 259.6438 0 87.05475 0 0 81.12815 0 172.5453 0 0 255.2921 0 174.3608 88.48055 86.29391 88.57993 85.92195 87.19798 86.58922 345.9370 89.01520 90.78469 91.16107 177.8123 0 165.9180 333.2192 173.1562 165.5563 83.24655 179.2473 0 0 0 0 0 268.5856 171.0000 164.3484 86.55732 0 0 0 176.0767 86.76240 0 168.6522 0 88.30847 0 85.62723 255.4424 176.2093 264.5390 88.25141 179.7370 84.96107 438.1448 85.07878 177.6097 0 174.8787 0 89.88100 184.8875 85.00802 0 88.21314 0 88.74940 89.72490 0 0 86.96395 0 84.40211 0 0 88.20263 87.89028 0 88.41407 89.06471 0 86.53044 174.5365 0 262.7395 0 89.54268 0 83.79774 0 0 0 0 0 0 0 82.43481 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420908 9 8 1 1 1 61.26797 64.83045 409695 2674938 121 217 2 1 1 2 2 7 1932 87 1 2 2 NA NA NA NA NA NA NA NA NA 1 NA 8 NA NA NA 3 NA 1 2 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA 3 2 1 2 2 2 1 2 2 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3 NA NA NA NA NA NA NA 63.86903 65.64267 185.0365 64.50184 124.0883 133.3997 133.2102 65.25986 65.73201 0 0 134.3119 0 136.9148 0 68.13626 0 62.83184 0 66.27808 61.48425 0 67.96565 64.45502 61.25296 67.60826 0 0 0 0 0 69.13735 58.83096 0 0 63.62755 66.23486 0 143.2517 65.53264 198.9179 64.54161 0 65.35311 127.5745 0 0 69.41299 195.7322 0 0 0 66.87112 127.2123 126.3805 132.4876 69.94953 0 0 64.32074 63.96362 137.1875 68.11881 121.8690 0 62.84259 0 64.57838 66.96746 0 130.7024 121.1181 121.0222 130.5296 0 0 67.28100 0 68.01746 63.05854 0 0 0 0 65.26035 0 0 66.71281 125.5650 205.3706 0 316.1280 0 0 133.4255 66.05343 69.04006 66.21370 0 0 187.6989 0 62.81199 0 0 64.47594 0 128.1786 0 0 197.0529 0 131.2463 66.13441 64.77254 67.31086 59.81129 66.77276 63.60025 263.5346 67.03723 68.91845 63.60211 135.5821 0 124.8385 255.2827 131.3648 122.2943 62.27412 140.0218 0 0 0 0 0 197.8271 127.5773 126.4249 68.19444 0 0 0 123.7960 63.23442 0 126.2033 0 65.31216 0 62.67334 180.4615 132.8245 196.4114 64.76054 131.8952 62.58826 324.6754 66.83387 128.0803 0 134.4454 0 66.91746 152.4024 65.45275 0 65.52452 0 65.70758 67.15902 0 0 65.52055 0 64.18972 0 0 65.39073 67.65944 0 70.62235 68.39929 0 66.96486 128.0909 0 202.0958 0 68.80986 0 62.88468 0 0 0 0 0 0 0 61.14169 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420708 7 8 1 1 1 61.26797 76.89763 409695 5853655 121 212 4 1 1 2 99 99 9999 55 4 2 2 NA NA NA NA NA NA NA NA NA 2 NA NA NA NA NA NA NA NA NA NA 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 1 NA 9 NA NA NA NA NA NA 1 NA NA 2 1 4 3 1 0 1 2 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3 NA NA NA NA NA NA NA 76.92642 79.98907 228.7135 75.61636 148.9657 158.4152 159.5510 81.61941 76.01575 0 0 157.2061 0 156.4921 0 81.32390 0 76.91014 0 78.31135 73.11876 0 74.65892 75.97005 73.85771 76.28053 0 0 0 0 0 80.50647 74.22896 0 0 79.05499 82.13794 0 166.0046 76.24214 242.4354 79.38511 0 75.45479 155.7670 0 0 82.79198 238.0230 0 0 0 78.53642 152.9588 157.2895 166.8724 81.43945 0 0 75.51281 77.32912 164.2281 75.94065 144.6323 0 76.54745 0 77.97179 76.84616 0 159.6333 150.0573 148.3802 157.5805 0 0 77.03524 0 77.82730 79.14156 0 0 0 0 78.21881 0 0 80.92667 145.9332 249.8623 0 375.5819 0 0 158.9323 73.37422 83.37403 80.06125 0 0 231.5901 0 75.73578 0 0 74.60437 0 159.7831 0 0 225.8453 0 149.2091 77.98572 78.96188 79.86204 79.02556 76.97519 78.08640 323.7476 80.54319 79.64438 80.71315 167.8002 0 151.6752 296.2458 156.1124 150.9734 74.33352 162.5967 0 0 0 0 0 233.0061 155.3126 148.5744 78.08614 0 0 0 156.8516 78.12472 0 146.4627 0 79.46022 0 75.09723 225.8176 159.7128 233.4822 79.19524 164.8828 74.23080 396.5681 76.58835 157.0835 0 152.6810 0 79.55887 170.9154 73.96290 0 77.71904 0 79.50139 81.09641 0 0 76.59147 0 74.59012 0 0 76.35525 78.40625 0 79.44986 78.74268 0 78.73627 153.4598 0 228.3724 0 81.27583 0 74.80704 0 0 0 0 0 0 0 73.86956 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420608 6 8 1 1 1 61.26797 85.92566 409695 8458051 121 106 6 3 4 1 26 1 1991 28 4 1 2 NA NA NA NA NA NA NA NA NA 1 NA 10 NA NA NA 1 3 NA NA 1 1 NA NA NA NA NA NA NA NA NA NA NA 1 9313 6 NA 41000 NA 2 NA 2 NA NA NA NA NA NA NA 2 NA NA 1 1 NA NA 2 3 NA 2 NA NA NA NA NA NA 2 1 1 2 600 NA NA NA NA NA 1 1 1 300 NA NA NA 40 40 4 NA NA 3 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 NA 1 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3 6 2 5 12 5 1 1 NA NA NA NA 3 5 9 3 9 2 3 3 1 600 300 1 600 300 NA NA 40 NA NA NA 40 3 3 85.30603 87.86257 256.0649 85.84598 167.3227 174.8761 179.8750 91.92304 82.91462 0 0 172.0235 0 173.4845 0 90.83469 0 86.34929 0 83.55809 83.99383 0 84.83527 84.55970 80.80268 83.62268 0 0 0 0 0 88.43286 80.86115 0 0 85.35505 87.09838 0 182.7960 86.26534 258.4957 87.34628 0 83.25282 176.5279 0 0 92.11410 261.1924 0 0 0 85.93500 172.8699 174.5572 185.8254 87.85963 0 0 83.59273 87.24460 179.9265 87.39491 165.2951 0 86.84117 0 86.58284 87.74192 0 182.9249 170.1580 159.9067 170.3892 0 0 87.48030 0 86.38665 86.62890 0 0 0 0 86.14705 0 0 89.10751 165.4339 272.0989 0 425.2925 0 0 183.0165 84.41294 92.27731 89.91943 0 0 259.6438 0 87.05475 0 0 81.12815 0 172.5453 0 0 255.2921 0 174.3608 88.48055 86.29391 88.57993 85.92195 87.19798 86.58922 345.9370 89.01520 90.78469 91.16107 177.8123 0 165.9180 333.2192 173.1562 165.5563 83.24655 179.2473 0 0 0 0 0 268.5856 171.0000 164.3484 86.55732 0 0 0 176.0767 86.76240 0 168.6522 0 88.30847 0 85.62723 255.4424 176.2093 264.5390 88.25141 179.7370 84.96107 438.1448 85.07878 177.6097 0 174.8787 0 89.88100 184.8875 85.00802 0 88.21314 0 88.74940 89.72490 0 0 86.96395 0 84.40211 0 0 88.20263 87.89028 0 88.41407 89.06471 0 86.53044 174.5365 0 262.7395 0 89.54268 0 83.79774 0 0 0 0 0 0 0 82.43481 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420608 6 8 1 1 1 61.26797 85.92566 409695 7894407 121 209 6 1 1 2 7 3 1977 42 4 1 2 NA NA NA NA NA NA NA NA NA 1 NA 7 1 NA NA 1 5 NA NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA 1 2 1 6 2 2 6 3 2 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 85.30603 87.86257 256.0649 85.84598 167.3227 174.8761 179.8750 91.92304 82.91462 0 0 172.0235 0 173.4845 0 90.83469 0 86.34929 0 83.55809 83.99383 0 84.83527 84.55970 80.80268 83.62268 0 0 0 0 0 88.43286 80.86115 0 0 85.35505 87.09838 0 182.7960 86.26534 258.4957 87.34628 0 83.25282 176.5279 0 0 92.11410 261.1924 0 0 0 85.93500 172.8699 174.5572 185.8254 87.85963 0 0 83.59273 87.24460 179.9265 87.39491 165.2951 0 86.84117 0 86.58284 87.74192 0 182.9249 170.1580 159.9067 170.3892 0 0 87.48030 0 86.38665 86.62890 0 0 0 0 86.14705 0 0 89.10751 165.4339 272.0989 0 425.2925 0 0 183.0165 84.41294 92.27731 89.91943 0 0 259.6438 0 87.05475 0 0 81.12815 0 172.5453 0 0 255.2921 0 174.3608 88.48055 86.29391 88.57993 85.92195 87.19798 86.58922 345.9370 89.01520 90.78469 91.16107 177.8123 0 165.9180 333.2192 173.1562 165.5563 83.24655 179.2473 0 0 0 0 0 268.5856 171.0000 164.3484 86.55732 0 0 0 176.0767 86.76240 0 168.6522 0 88.30847 0 85.62723 255.4424 176.2093 264.5390 88.25141 179.7370 84.96107 438.1448 85.07878 177.6097 0 174.8787 0 89.88100 184.8875 85.00802 0 88.21314 0 88.74940 89.72490 0 0 86.96395 0 84.40211 0 0 88.20263 87.89028 0 88.41407 89.06471 0 86.53044 174.5365 0 262.7395 0 89.54268 0 83.79774 0 0 0 0 0 0 0 82.43481 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420208 2 8 1 1 1 61.26797 58.61009 409695 5853655 121 212 2 1 1 2 3 5 1961 58 4 1 2 NA NA NA NA NA NA NA NA NA 1 NA 5 NA NA NA 1 4 NA NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA 1 2 1 2 2 2 5 3 2 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 1 NA NA NA NA NA NA NA 59.45233 59.02373 176.4807 57.91910 110.1806 122.7463 118.9202 58.01660 58.94964 0 0 118.1493 0 124.4530 0 60.31685 0 56.95553 0 59.84893 55.74257 0 59.37831 59.30905 54.94881 61.42857 0 0 0 0 0 60.64123 54.07633 0 0 58.10078 61.53166 0 126.1928 58.70663 181.0527 59.83026 0 60.11148 116.5358 0 0 63.28287 180.9536 0 0 0 61.01601 116.7524 114.6653 121.8343 61.50489 0 0 57.35291 58.07196 128.0559 61.21589 107.0424 0 56.70579 0 58.72606 59.12719 0 117.3841 110.0070 107.2879 116.8989 0 0 61.18093 0 60.50899 58.44757 0 0 0 0 59.36392 0 0 61.77857 110.4889 184.6476 0 282.3712 0 0 121.4953 59.18149 62.81714 60.28942 0 0 169.4979 0 58.28686 0 0 57.67125 0 118.7869 0 0 174.1672 0 117.1767 59.08985 60.49335 60.17027 54.98516 60.59616 59.42559 236.9894 61.18349 62.67202 58.85754 123.4515 0 114.1435 230.5132 117.6588 108.7164 55.53887 127.5142 0 0 0 0 0 181.9262 113.8314 114.6338 60.94341 0 0 0 112.0998 57.93933 0 115.4977 0 59.51673 0 57.20034 162.9039 118.8328 180.0956 61.63233 121.8805 55.97168 295.7909 60.34680 115.9161 0 122.8542 0 60.31214 135.1026 57.83234 0 58.10933 0 60.90850 61.85166 0 0 59.60317 0 57.82605 0 0 60.12253 59.68561 0 62.32495 62.29260 0 60.75015 119.7363 0 179.4776 0 63.39385 0 57.04449 0 0 0 0 0 0 0 57.14853 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152421408 14 8 1 1 1 61.26797 60.02553 409695 4251707 121 113 2 1 1 1 15 11 1955 64 4 2 2 NA NA NA NA NA NA NA NA NA 1 NA 3 NA NA NA NA NA NA NA 2 2 2 2 2 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 2 NA NA 2 NA NA NA NA NA NA NA NA NA NA 3 2 1 2 2 1 0 1 2 NA 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3 NA NA NA NA NA NA NA 60.10698 61.04442 182.5150 60.50562 116.4286 120.7560 121.0939 61.96020 57.80729 0 0 124.2914 0 123.4773 0 62.49865 0 59.55819 0 59.14532 59.39649 0 59.96504 59.30026 58.44430 59.00558 0 0 0 0 0 63.27323 57.41740 0 0 57.96079 60.78915 0 124.6128 58.35740 181.5403 61.89627 0 58.97812 118.9776 0 0 61.82266 179.3906 0 0 0 62.66130 120.7939 120.0147 130.5507 62.27567 0 0 58.89329 60.09792 132.3131 61.86460 112.8305 0 59.66271 0 62.26616 60.25014 0 128.8223 114.5012 114.7544 116.3010 0 0 60.02131 0 61.01655 61.50713 0 0 0 0 58.99553 0 0 59.20278 115.1402 183.2924 0 302.1861 0 0 127.9578 59.47743 64.49008 62.53477 0 0 182.2566 0 60.12201 0 0 57.05114 0 121.2479 0 0 173.1238 0 117.5196 59.49869 60.90825 62.13823 58.47316 60.52062 63.39410 255.3604 63.72416 65.51304 62.96554 121.2724 0 115.8465 223.8806 120.9210 116.4857 57.04658 127.3346 0 0 0 0 0 180.4010 118.2198 112.7678 61.64803 0 0 0 119.1280 62.08326 0 115.0169 0 62.00032 0 60.29844 177.2259 123.1259 189.5159 61.97755 124.5345 59.40663 319.4600 58.49245 119.3334 0 125.5332 0 60.87805 133.4850 58.19273 0 62.70184 0 58.67715 62.60106 0 0 60.33789 0 56.99333 0 0 58.79199 59.77671 0 62.47112 65.62202 0 62.88012 121.0183 0 182.1174 0 63.09343 0 60.73232 0 0 0 0 0 0 0 56.49988 1.141292 1.145791
2019 4 12 AC 12 NA 120015242 1210010 1200152420608 6 8 1 1 1 61.26797 85.92566 409695 7191532 121 201 6 6 4 2 29 3 2017 2 4 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 3 6 2 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA 85.30603 87.86257 256.0649 85.84598 167.3227 174.8761 179.8750 91.92304 82.91462 0 0 172.0235 0 173.4845 0 90.83469 0 86.34929 0 83.55809 83.99383 0 84.83527 84.55970 80.80268 83.62268 0 0 0 0 0 88.43286 80.86115 0 0 85.35505 87.09838 0 182.7960 86.26534 258.4957 87.34628 0 83.25282 176.5279 0 0 92.11410 261.1924 0 0 0 85.93500 172.8699 174.5572 185.8254 87.85963 0 0 83.59273 87.24460 179.9265 87.39491 165.2951 0 86.84117 0 86.58284 87.74192 0 182.9249 170.1580 159.9067 170.3892 0 0 87.48030 0 86.38665 86.62890 0 0 0 0 86.14705 0 0 89.10751 165.4339 272.0989 0 425.2925 0 0 183.0165 84.41294 92.27731 89.91943 0 0 259.6438 0 87.05475 0 0 81.12815 0 172.5453 0 0 255.2921 0 174.3608 88.48055 86.29391 88.57993 85.92195 87.19798 86.58922 345.9370 89.01520 90.78469 91.16107 177.8123 0 165.9180 333.2192 173.1562 165.5563 83.24655 179.2473 0 0 0 0 0 268.5856 171.0000 164.3484 86.55732 0 0 0 176.0767 86.76240 0 168.6522 0 88.30847 0 85.62723 255.4424 176.2093 264.5390 88.25141 179.7370 84.96107 438.1448 85.07878 177.6097 0 174.8787 0 89.88100 184.8875 85.00802 0 88.21314 0 88.74940 89.72490 0 0 86.96395 0 84.40211 0 0 88.20263 87.89028 0 88.41407 89.06471 0 86.53044 174.5365 0 262.7395 0 89.54268 0 83.79774 0 0 0 0 0 0 0 82.43481 1.141292 1.145791

Python

Código

Downloading:   0%|          | 0/10 [00:00<?, ?rows/s]
Downloading: 100%|##########| 10/10 [00:00<00:00, 26.34rows/s]
Downloading: 100%|##########| 10/10 [00:00<00:00, 26.34rows/s]
Código
    ano  trimestre id_uf sigla_uf  ...    V1028199    V1028200 habitual efetivo
0  2022          2    23       CE  ...  208.898028  414.372321      NaN     NaN
1  2022          2    23       CE  ...  169.516832  333.114762      NaN     NaN
2  2022          2    23       CE  ...  208.443975  387.163248      NaN     NaN
3  2022          2    23       CE  ...  199.550423  412.903163      NaN     NaN
4  2022          2    23       CE  ...  208.898028  414.372321      NaN     NaN
5  2022          2    23       CE  ...  208.443975  387.163248      NaN     NaN
6  2022          2    23       CE  ...  179.147456  341.930622      NaN     NaN
7  2022          2    23       CE  ...  226.804442  465.257305      NaN     NaN
8  2022          2    23       CE  ...  187.964673  379.791755      NaN     NaN
9  2022          1    23       CE  ...  223.430006    0.000000      NaN     NaN

[10 rows x 423 columns]

Conclusão

Existem muitos formatos de arquivos pelos quais os dados podem ser disponibilizados, assim como muitas fontes, nacionais e internacionais, onde eles são armazenados. Neste post aprendemos sobre essas características dos dados e vimos exemplos práticos de como coletar tabelas de dados usando o R e o Python.

Saiba mais

Se você se interessa por análise e ciência de dados e quiser adquirir os conhecimentos e habilidades destacados neste artigo, dê uma olhadinha nessa formação especial que a Análise Macro preparou:

 

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Estimando a volatilidade da taxa de câmbio

O que é Volatilidade? Como podemos calcular essa métrica? Este artigo apresenta uma breve introdução à volatilidade, descreve como podemos calcular a volatilidade utilizando Modelos de Volatilidade Condicional e demonstra a aplicação prática dessa abordagem para estimar a volatilidade da taxa de câmbio BRL/USD por meio da linguagem de programação Python.

Como analisar o Núcleo de Inflação no Brasil usando Python?

O Python se destaca como uma ferramenta robusta para análise de dados, permitindo a aplicação de uma ampla gama de técnicas em dados econômico-financeiros. Neste exercício, destacamos como a linguagem oferece uma facilidade muito grande na coleta de dados dos núcleos do IPCA diretamente do site do Banco Central, na manipulação eficiente desses dados e na construção de gráficos que facilitam a compreensão dos indicadores.

Propensity Score com Múltiplas Variáveis no R

O escore de propensão é provavelmente a maneira mais comum de agregar múltiplas variáveis de correspondência em um único valor que pode ser correspondido, ou seja, muito útil para a realização de pareamento.

O escore de propensão é a probabilidade estimada de que uma determinada observação teria sido tratada. A correspondência de escore de propensão muitas vezes significa selecionar um conjunto de observações de controle correspondidas com valores semelhantes do escore de propensão.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.