Skip to content

LeoDev91/data-extraction-python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📊 Data Extraction Python

Extração, limpeza e estruturação de dados de sistemas legados com Python — para PMEs que não conseguem aproveitar seus próprios dados.


🔴 Problema

Muitas pequenas empresas têm dados presos em:

  • Planilhas antigas e desorganizadas
  • Sistemas legados sem exportação adequada
  • PDFs, emails e formatos não estruturados
  • Bancos de dados sem padronização

Sem acessar esses dados de forma organizada, não dá para tomar decisões com base em informação real.


✅ Solução

Scripts Python que:

  1. Conectam em diversas fontes (planilhas, bancos, APIs, PDFs)
  2. Extraem e limpam os dados
  3. Padronizam e estruturam em formato útil
  4. Exportam para Google Sheets, CSV, banco de dados ou dashboard

📊 Resultado esperado

  • Dados limpos, organizados e prontos para análise
  • Relatórios automáticos sem trabalho manual
  • Base para tomada de decisão com dados reais

🛠️ Stack

  • Python — linguagem principal
  • Pandas — manipulação de dados
  • SQLAlchemy — conexão com bancos de dados
  • PostgreSQL / Informix — bancos suportados
  • Google Sheets API — exportação
  • openpyxl / pdfplumber — leitura de Excel e PDF

📁 Estrutura do projeto

data-extraction-python/
├── README.md
├── scripts/
│   ├── extract_sheets.py
│   ├── extract_database.py
│   ├── extract_pdf.py
│   └── clean_and_export.py
├── sample-data/
├── assets/
├── requirements.txt
└── docs/

🚀 Como usar

git clone https://github.com/LeoDev91/data-extraction-python
cd data-extraction-python

pip install -r requirements.txt

# Configure suas credenciais em .env
cp .env.example .env

# Execute o script desejado
python scripts/extract_sheets.py

💼 Aplicação comercial

Ideal para empresas com dados históricos parados, contabilidades, logística e operações que precisam consolidar informações de múltiplas fontes.

Quer uma versão personalizada para seu negócio?


📄 Licença

MIT License

About

Extração, limpeza e estruturação de dados de sistemas legados com Python — para PMEs que não conseguem aproveitar seus próprios dados

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages