Skip to content

martinez-ie/python_modelagem_de_dados

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

Banner do Projeto

🧰 Projeto de Modelagem de Dados com Python

Este projeto tem como objetivo aplicar os conceitos de modelagem de dados na prática, utilizando Python para manipular, transformar e entender a estrutura de um conjunto de dados fictício. O foco está na preparação dos dados para análises futuras ou uso em modelos preditivos.


📌 Índice


🎯 Objetivo

Exercitar os principais conceitos de limpeza, transformação e modelagem de dados tabulares em Python, incluindo categorização, criação de novas variáveis, e manipulação com base em regras de negócio.


📊 Etapas do Projeto

  1. Leitura do Dataset

    • Importação com pandas e análise estrutural (.info(), .head()).
  2. Limpeza de Dados

    • Tratamento de colunas desnecessárias.
    • Preenchimento ou exclusão de valores nulos.
  3. Transformações

    • Criação de colunas com base em regras (np.where, condições booleanas).
    • Renomeação de colunas e reordenação para facilitar a leitura.
  4. Conversões

    • Ajustes nos tipos de dados (astype) para otimização da base.

🛠️ Tecnologias e Bibliotecas Utilizadas

  • Python (Jupyter Notebook)
  • pandas, numpy
  • Análise tabular com foco em estruturação

💡 Aprendizados

  • Prática com manipulação e transformação de dados.
  • Melhoria na leitura e estrutura de datasets para análises futuras.
  • Aplicação de lógica de negócios em colunas derivadas.

🔗 Acesse

📂 Repositório no GitHub

About

Data wrangling and feature engineering pipeline using Python, structured for downstream ML models.

Topics

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors