Hackeando o R: Como formatar datas

Todos já tiveram dificuldades ao tentar lidar com datas no R, seja por problemas de importação ou por qualquer transformação nos dados. No post de hoje, ensinamos a melhor forma de transformar dados em data no R.

No R existem diferentes tipos de dados: character, factor, logical, integer, double, date e etc. O comportamento padrão do R para reconhecimento de dados possui uma hierarquia, portanto, é possível que ao ser importado determinado conjunto de dados, eles não estejam em sua forma ideal (isto é, no seu tipo correto).

Para tanto, o pacote {lubridate} nos ajuda na missão de realizar transformações de dados em data de forma fácil funcionando em conjunto com outros pacotes da família do {tidyverse}.

No exemplo abaixo, retiramos os dados da Pesquisa Industrial Mensal direto do Sidra, utilizando o pacote {sidrar}. Na estrutura do objeto importado, vemos como o R lidou com a coluna de data, bem como o formato em que as observações estão em "anomês" (200201). O ideal é transformar no tipo de dado date e obter um formato de data mais interessante, talvez como "ano-dia-mes".

Para obter a transformação para tipo date, podemos utilizar a função ym(), que permite, através de um formato pré-estabelecido de ano e mês, como as observações se encaixam, transformar em tipo date e em um formato mais amigável (2002-01-01).

E caso não tivermos o formato de ano e mês, e sim em outro formato? Qual função ou formato podemos utilizar ? A função guess_formats() retorna o formato que o R (e consequentemente as funções do {lubridate}) reconhece para realizar a transformação. Colocamos na função os valores e a ordem do formato das observações. Com o resultado, utilizamos a função parse_date_time(), do mesmo modo que utilizamos a função ym(), porém, especificando o formato retornado por guess_formats().

Veja que utilizamos o formato "%Y%0M%, entregue por guess_formats, porém, que na prática, possui o mesmo resultado anterior.

____________________________________________

Quer saber mais?

Veja nossos cursos de R e Python aplicados para a Análise de Dados e Economia

_____________________________________________

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Resultado IPCA-15 - Novembro/2024

A Análise Macro apresenta os resultados do IPCA-15 de Novembro de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Resultado PNADc Trimestral - 3° Trimestre/2024

A Análise Macro apresenta os resultados da PNADc Trimestral do 3º trimestre de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Análise exploratória para modelagem preditiva no Python

Antes de desenvolver bons modelos preditivos é necessário organizar e conhecer muito bem os dados. Neste artigo, damos algumas dicas de recursos, como gráficos, análises e estatísticas, que podem ser usados para melhorar o entendimento sobre os dados usando Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.