Hackeando o R: Como formatar datas

Todos já tiveram dificuldades ao tentar lidar com datas no R, seja por problemas de importação ou por qualquer transformação nos dados. No post de hoje, ensinamos a melhor forma de transformar dados em data no R.

No R existem diferentes tipos de dados: character, factor, logical, integer, double, date e etc. O comportamento padrão do R para reconhecimento de dados possui uma hierarquia, portanto, é possível que ao ser importado determinado conjunto de dados, eles não estejam em sua forma ideal (isto é, no seu tipo correto).

Para tanto, o pacote {lubridate} nos ajuda na missão de realizar transformações de dados em data de forma fácil funcionando em conjunto com outros pacotes da família do {tidyverse}.

No exemplo abaixo, retiramos os dados da Pesquisa Industrial Mensal direto do Sidra, utilizando o pacote {sidrar}. Na estrutura do objeto importado, vemos como o R lidou com a coluna de data, bem como o formato em que as observações estão em "anomês" (200201). O ideal é transformar no tipo de dado date e obter um formato de data mais interessante, talvez como "ano-dia-mes".

Para obter a transformação para tipo date, podemos utilizar a função ym(), que permite, através de um formato pré-estabelecido de ano e mês, como as observações se encaixam, transformar em tipo date e em um formato mais amigável (2002-01-01).

E caso não tivermos o formato de ano e mês, e sim em outro formato? Qual função ou formato podemos utilizar ? A função guess_formats() retorna o formato que o R (e consequentemente as funções do {lubridate}) reconhece para realizar a transformação. Colocamos na função os valores e a ordem do formato das observações. Com o resultado, utilizamos a função parse_date_time(), do mesmo modo que utilizamos a função ym(), porém, especificando o formato retornado por guess_formats().

Veja que utilizamos o formato "%Y%0M%, entregue por guess_formats, porém, que na prática, possui o mesmo resultado anterior.

____________________________________________

Quer saber mais?

Veja nossos cursos de R e Python aplicados para a Análise de Dados e Economia

_____________________________________________

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Retropolando a série do desemprego no Brasil

Nosso objetivo neste exercício será estender a taxa de desemprego fornecida pela Pesquisa de Nacional por Amostra de Domicílios Contínua (PNAD Contínua) através daquela fornecida pela Pesquisa Mensal de Emprego (PME). Serão construídas duas séries: uma normal, outra dessazonalizada. Faremos todo o exercício utilizando o Python.

Variáveis Instrumentais no R: qual o impacto do gasto de segurança no crime?

Diversos métodos econométricos têm como principal finalidade melhorar o processo de investigar o efeito de uma variável sobre a outra, e um importante método encontra-se no uso de Variáveis Instrumentais na análise de regressão linear. Mas como podemos utilizar essa ferramenta para auxiliar no estudo da avaliação de impacto?

Neste post, oferecemos uma breve introdução a esse importante método da área de inferência causal, acompanhado de um estudo de caso para uma compreensão mais aprofundada de sua aplicação. Os resultados foram obtidos por meio da implementação em R, como parte integrante do nosso curso sobre Avaliação de Políticas Públicas utilizando esta linguagem de programação.

Análise regional do mercado de trabalho com dados do CAGED usando Python

Os microdados dos CAGED fornecem informações detalhadas a nível de cidade, sexo, raça, nível de instrução, idade, salário e outras sobre os trabalhadores formais do Brasil, possibilitando ricas análises regionais de dados. Neste artigo mostramos como acessar, processar e analisar estes dados utilizando o Python.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.