Skip to content

Technologies-SAB/IA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

123 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🤖 Agente de IA Local Especializado (Offline, Customizado, CPU-based)

🎯 Objetivo do Projeto

Desenvolver um chatbot de IA 100% local, que funcione diretamente via CPU em um notebook pessoal, sem qualquer dependência de modelos externos (como GPT, Gemini, Claude etc.). O bot será treinado e utilizado exclusivamente com base na documentação interna da empresa Hospitality Holding Investments, Lda., especializada no setor Hoteleiro.


🧩 Funcionalidades

✅ Execução 100% offline (sem chamadas externas) ██████████ 100%

✅ Treinamento com base em documentação interna (HTML → Markdown) ██████████ 100%

✅ Geração de embeddings locais com sentence-transformers ██████████ 100%

✅ Download e gerenciamento automático de modelos (embeddings e LLM) ██████████ 100%

✅ Recuperação semântica com RAG (FAISS ou ChromaDB) ██████░░░░ 60%

✅ Interface de atendimento via chatbot (linha de comando, totalmente em português) ██████████ 100%

✅ Fine-tuning com LoRA usando peft █████░░░░░ 50%

✅ Interpretação de imagens (OCR + descrição) ░░░░░░░░░░ 0%

✅ Execução e correção de scripts SQL ░░░░░░░░░░ 0%

📁 Estrutura do Projeto

gente_ia_local/
│
├── data/                      # Documentação convertida, imagens, dados brutos ██████████ 100%
│   ├── html/                  # HTMLs baixados do Confluence
│   ├── markdown/              # Arquivos convertidos para .md
│   └── images/                # Tutoriais visuais e screenshots
│
├── log/                       # Logs de execução e erros
│
├── models/
│   ├── base/                  # Modelos LLM leves (GGUF, GPT2, etc.)
│
├── src/                       # Código-fonte principal
│   ├── ingestion/             # Scripts de ingestão e conversão de dados
│   │   ├── html_to_md.py      # Conversão HTML → Markdown            ██████████ 100%
│   │   ├── download_html.py   # Download de páginas HTML             ██████████ 100%
│   │   └── download_images.py # Download de imagens                  ██████████ 100%
│   ├── processing/            # Pré-processamento, segmentação, limpeza ░░░░░░░░░░ 0%
│   ├── embedding/             # Geração e armazenamento de embeddings ██████████ 100%
│   │   └── generate_embeddings.py #                                  ██████████ 100%
│   ├── rag/                   
│   │   └── retriever.py       # Implementação do pipeline RAG        ██████░░░░ 0%
│   ├── training/              # Download e fine-tuning de modelos    ██████████ 100%
│   │   └── download_models.py # Download automático de modelos       ██████████ 100%
│   ├── chatbot/               # Interface e lógica de interação      ██████████ 100%
│   │   ├── interface.py       # Streamlit, Gradio ou FastAPI         ░░░░░░░░░░ 0%
│   │   └── response.py        # Geração de respostas                 ██████████ 100%
│   ├── images/                # OCR e descrição de imagens           ░░░░░░░░░░ 0%
│   │   └── image_parser.py    #                                      ░░░░░░░░░░ 0%
│   ├── utils/                 # Utilitários gerais                   ██████████ 100%
│   │   ├── fetch_json.py      #                                      ██████████ 100%
│   │   ├── save_html.py       #                                      ██████████ 100%
│   │   └── clean_filename.py  #                                      ██████████ 100%
│   └── config.py              # Configurações globais do projeto     ██████████ 100%
│
├── scripts/                   # Scripts utilitários e de setup       ░░░░░░░░░░ 0%
│   └── setup_env.py           #                                      ░░░░░░░░░░ 0%
│
├── requirements.txt           # Dependências do projeto              ██████████ 100%
├── README.md                  # Documentação do projeto              ██████████ 100%
└── .env                       # Variáveis de ambiente (se necessário)██████████ 100%

⚙️ Instalação

  1. Clone o repositório:
git clone https://github.com/Hospitality-Holding-Investments/IA.git
cd IA
  1. Crie e ative um ambiente virtual:
python -m venv .venv
# No Windows:
.venv\Scripts\activate
# No Linux/Mac:
source .venv/bin/activate
  1. Instale as dependências:
pip install -r requirements.txt

🚀 Como Usar (Pipeline Completo)

Execute cada etapa do pipeline pelo terminal:

  1. Baixe a documentação do Confluence:
python src/main.py download
  1. Gere os embeddings locais:
python src/main.py embed
  1. Baixe os modelos necessários (embeddings e LLM):
python src/main.py models
  1. Inicie o chatbot (linha de comando):
python src/main.py chat
  1. Inicie o server LLM (em um novo terminal):
python src/llm_server.py

Durante o chat, digite 'sair' para encerrar a conversa.


🧠 Tecnologias Utilizadas

• Python 3.10+

• transformers, sentence-transformers

• langchain, faiss

• llama.cpp, GGUF

• streamlit, gradio, fastapi

• pytesseract, Pillow, BeautifulSoup


🛡️ Restrições Técnicas

• Nenhuma dependência de nuvem (OpenAI, Google, Microsoft, etc.)

• Execução local via CPU

• Armazenamento e inferência 100% offline


📌 Licença

Este projeto é de uso interno e de propriedade da SAB Technologies.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages