Este projeto tem como objetivo aplicar os conceitos de modelagem de dados na prática, utilizando Python para manipular, transformar e entender a estrutura de um conjunto de dados fictício. O foco está na preparação dos dados para análises futuras ou uso em modelos preditivos.
Exercitar os principais conceitos de limpeza, transformação e modelagem de dados tabulares em Python, incluindo categorização, criação de novas variáveis, e manipulação com base em regras de negócio.
-
Leitura do Dataset
- Importação com
pandase análise estrutural (.info(),.head()).
- Importação com
-
Limpeza de Dados
- Tratamento de colunas desnecessárias.
- Preenchimento ou exclusão de valores nulos.
-
Transformações
- Criação de colunas com base em regras (
np.where, condições booleanas). - Renomeação de colunas e reordenação para facilitar a leitura.
- Criação de colunas com base em regras (
-
Conversões
- Ajustes nos tipos de dados (
astype) para otimização da base.
- Ajustes nos tipos de dados (
- Python (Jupyter Notebook)
- pandas, numpy
- Análise tabular com foco em estruturação
- Prática com manipulação e transformação de dados.
- Melhoria na leitura e estrutura de datasets para análises futuras.
- Aplicação de lógica de negócios em colunas derivadas.
