Por que o Excel não basta para a Ciência de Dados?

O Excel é um software, que representa, na quase totalidade, os editores de planilhas eletrônicas. Desde de sua criação, se tornou o principal aplicativo para construção de cálculos, tabelas, gráficos e consequentemente o melhor software para analisar dados. Apesar de ser extremamente intuitivo e útil, possui limitações que devem ser entendidas.

É possível realizar inúmeras análise de dados utilizando o Excel, o ponto forte é a sua facilidade de aprendizado. Com os editores gráficos, e seu formato tabular com linhas e colunas, contendo células,  é possível construir cálculos. Uma ferramenta bem conhecida para criar cálculos com agrupamento é a tabela dinâmica. 

É possível criar gráficos de diferentes formas, como por exemplo, gráficos de dispersão, linha temporal, barras e entre diversos outros.

É possível também criar análises estatísticas, tais como testes de hipóteses e regressões lineares. 

Entretanto, possui limitações, entre elas:

  • Volume de dados: planilhas eletrônicas são ótimas para armazenar dados relativamente pequenos e realizar suas análises, entretanto, a medida que mais dados de diferentes tipos são gerados, fica cada vez mais complexo a utilização com o Excel
  • Erros de Sintaxe: por mais que haja relacionamento de células no excel, a medida que análises ficam mais complexas na planilha, erros são mais suscetíveis de acontecer.
  • Reprodutibilidade: no Excel, fica cada vez mais complicado refazer cálculos de algoritmos através de projetos automatizados em diferentes máquinas de forma relativamente simples.
  • VBA: ainda que exista o VBA para melhorar a reprodutibilidade, a linguagem não contêm por padrão funções e pacotes estatísticos que melhoram significativamente o processo de análise de dados.
  • Pago: é necessário pagar um valor para que se tenha o software.

Devemos lembrar que a Ciência de Dados está preocupada com os objetivos do negócio em mente, de forma a criar produtos sofisticados, com algoritmos que predizem variáveis dentro de um sistema que gera essas previsões instantaneamente. A sua utilização é muito interligada com o uso de Machine Learning.

Por isso, as limitações acima são um empecilho enorme para aqueles que desejam utilizar o software para aplicações de Ciência de Dados.

____________________________________________________

Quer aprender mais?

Veja nosso curso de Fundamentos de Análise de Dados, onde ensinamos todo o processo para aqueles que desejam entrar na área. O curso faz parte da trilha Ciência de Dados para Economia e Finanças.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Este artigo apresenta um tutorial completo sobre como construir uma ferramenta de análise financeira de ponta. Utilizando Shiny for Python, demonstramos a automação da coleta de dados das Demonstrações Financeiras Padronizadas (DFP) da CVM e o tratamento dessas informações com Pandas. O ponto alto do projeto é a integração da IA Generativa do Google Gemini, que atua como um assistente de análise, interpretando os dados filtrados pelo usuário e fornecendo insights contábeis e financeiros em tempo real. O resultado é um dashboard dinâmico que democratiza a análise de dados complexos e acelera a tomada de decisão.

Econometria, ML ou IA para previsão da PMS?

Prever a Pesquisa Mensal de Serviços (PMS/IBGE) é um desafio por natureza: trata-se de uma série mensal, sujeita a volatilidade e choques que vão de fatores sazonais a mudanças estruturais no setor. Para enfrentar esse problema, realizamos um exercício de comparação entre três abordagens de modelagem: econometria tradicional (ARIMA), machine learning (XGBoost) e inteligência artificial (TimeGPT).

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.