Análise regional do mercado de trabalho com dados do CAGED usando Python

Os microdados dos CAGED fornecem informações detalhadas a nível de cidade, sexo, raça, nível de instrução, idade, salário e outras sobre os trabalhadores formais do Brasil, possibilitando ricas análises regionais de dados. Neste artigo mostramos como acessar, processar e analisar estes dados utilizando o Python.

Aprenda a coletar, processar e analisar dados na formação de Do Zero à Análise de Dados Econômicos e Financeiros com Python.

Passo 01: ambiente de programação

Requisitos: Python e Jupyter instalados e configurados no computador.

Abrir o terminal no seu computador (no Windows procure por “Command Prompt”)
Rodar o código a seguir no terminal: jupyter notebook --NotebookApp.allow_origin='https://colab.research.google.com' --port=8888 --NotebookApp.port_retries=0
Copiar o link que aparece no final da execução do código (selecione e pressione Ctrl+C
Acessar o Google Colab: https://www.colab.new/
Clicar na seta para baixo no canto superior direito do Colab
Clicar na opção “Connect to a local runtime”
Colar o link copiado na etapa 3 e pressionar o botão “Connect”

Passo 02: coleta, tratamento e análise de dados

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Escolher quais arquivos do CAGED serão analisados através da página ftp://ftp.mtps.gov.br/pdet/microdados/ e copiar os links dos mesmos
Obs: caso não consiga acessar o FTP, siga as orientações da página do MTE ou solicite o suporte de um técnico de informática de sua confiança.
Atualize o código abaixo com o link do arquivo de interesse e ajuste o código para a análise desejada:

Conclusão

Quer aprender mais?

Clique aqui para fazer seu cadastro no Boletim AM e baixar o código que produziu este exercício, além de receber novos exercícios com exemplos reais de análise de dados envolvendo as áreas de Data Science, Econometria, Machine Learning, Macroeconomia Aplicada, Finanças Quantitativas e Políticas Públicas diretamente em seu e-mail.