🤖 ChatRAG

Chatbot Inteligente com RAG (Retrieval-Augmented Generation)

📋 Índice

Sobre o Projeto
Características
Arquitetura
Decisões Técnicas
Tecnologias
Pré-requisitos
Instalação
Configuração
Uso
Estrutura do Projeto
API Endpoints
Desenvolvimento
Docker
Contribuindo
Licença

🎯 Sobre o Projeto

ChatRAG é uma aplicação de chatbot inteligente que combina o poder do Retrieval-Augmented Generation (RAG) com modelos de linguagem avançados. O sistema utiliza Azure AI Search para recuperação de informações e OpenAI para geração de respostas contextualizadas e precisas.

Por que ChatRAG?

🎯 Respostas Contextualizadas: Combina conhecimento recuperado com IA generativa
🔍 Busca Semântica: Utiliza embeddings para encontrar informações relevantes
🔄 Conversações com Estado: Mantém o contexto através de múltiplas interações
⚡ Performance: API rápida e eficiente construída com FastAPI
🐳 Fácil Deploy: Totalmente containerizado com Docker

✨ Características

🤖 Chatbot Inteligente com capacidade de manter contexto conversacional
🔎 RAG (Retrieval-Augmented Generation) para respostas baseadas em documentos
🧠 LangGraph para orquestração de fluxos de conversação complexos
📊 Azure AI Search para indexação e busca vetorial de alta performance
🚀 API REST completa com documentação automática (Swagger/ReDoc)
🔐 Configuração Segura via variáveis de ambiente
🐳 Docker Support com Docker Compose para deploy simplificado
✅ Health Checks para monitoramento da aplicação
🔄 CORS Configurado para integração com frontends
💬 Sistema de Clarificação Inteligente - O agente pode fazer perguntas de volta ao usuário quando precisa de mais contexto

📝 Nota sobre Clarificações: Uma "clarificação" ocorre quando a IA, ao analisar a pergunta do usuário e o contexto recuperado, identifica que precisa de informações adicionais para fornecer uma resposta precisa. Nesses casos, o agente responde com uma pergunta direcionada ao usuário. O sistema rastreia o número de clarificações para evitar loops infinitos, limitando-as a um máximo configurável (padrão: 2) antes de transferir para atendimento humano se necessário.

🏗️ Arquitetura

O projeto segue princípios de Clean Architecture e Domain-Driven Design (DDD):

┌─────────────────┐
│   API Layer     │  ← FastAPI Routes
├─────────────────┤
│  Application    │  ← Business Logic & LangGraph
├─────────────────┤
│    Domain       │  ← Core Domain Models
├─────────────────┤
│ Infrastructure  │  ← External Services (OpenAI, Azure)
└─────────────────┘

Fluxo de Conversação

graph LR
    A[Usuário] --> B[API]
    B --> C[ConversationGraph]
    C --> D[Azure AI Search]
    C --> E[OpenAI LLM]
    D --> C
    E --> C
    C --> B
    B --> A

🎓 Decisões Técnicas

Por que LangChain e LangGraph?

LangChain: O Framework Ideal para LLM Applications

O LangChain foi escolhido como base deste projeto pelos seguintes motivos:

🔗 Abstração Poderosa

Fornece componentes modulares e reutilizáveis para trabalhar com LLMs
Facilita a integração com múltiplos provedores (OpenAI, Azure, Anthropic, etc.)
Reduz significativamente o boilerplate code

🔄 RAG Simplificado

Implementação nativa de Retrieval-Augmented Generation
Suporte integrado para vector stores (Azure AI Search, Pinecone, Weaviate)
Gerenciamento automático de embeddings e similarity search

📝 Prompt Engineering

Templates de prompts estruturados e parametrizáveis
Chain of Thought e outras técnicas avançadas já implementadas
Facilita testes e versionamento de prompts

🧩 Ecosystem Rico

Mais de 700+ integrações prontas
Comunidade ativa e documentação extensa
Padrões estabelecidos e best practices

LangGraph: State Machine para Conversações Complexas

O LangGraph complementa o LangChain trazendo:

🔀 Fluxos Condicionais

Permite criar workflows complexos com branches e loops
Controle fino sobre o fluxo de conversação
Suporte a estados e transições explícitas

💾 Gerenciamento de Estado

Checkpointing automático para persistência de conversas
Memory saver integrado para contexto de longo prazo
Rollback e replay de conversações

🎯 Arquitetura de Agentes

Suporte nativo para multi-agentes
Orquestração de diferentes LLMs e ferramentas
Perfeito para implementar padrões como ReAct e Plan-and-Execute

Outras Decisões Arquiteturais

Clean Architecture + DDD

✅ Separação clara de responsabilidades
✅ Domínio isolado de detalhes de infraestrutura
✅ Facilita testes e manutenção
✅ Permite troca de dependências sem impacto no core

FastAPI como Framework Web

Performance comparável a Node.js e Go
Validação automática com Pydantic
Documentação OpenAPI gerada automaticamente
Type hints nativos para melhor DX

Azure AI Search para Vector Store

Busca híbrida (vetorial + keyword)
Escalabilidade enterprise-grade
Integração nativa com Azure ecosystem
Filtros e facetas avançadas

UV para Gerenciamento de Pacotes

10-100x mais rápido que pip
Lock file determinístico
Resolução de dependências otimizada
Compatível com pip e pyproject.toml

Docker Multi-Stage Build

Imagens otimizadas e seguras
Separação de build e runtime
Health checks integrados
Fácil deploy em qualquer ambiente

Sistema de Clarificação Inteligente

O sistema implementa um mecanismo sofisticado de clarificação:

Como Funciona:

O LLM analisa a pergunta do usuário e o contexto recuperado
Se a informação for insuficiente, o agente responde com uma contra-pergunta
O sistema rastreia o contador de clarificações para cada conversa
Após o limite (padrão: 2 clarificações), a conversa é escalada para humano

Vantagens:

✅ Evita respostas genéricas ou imprecisas
✅ Coleta informações específicas antes de responder
✅ Melhora a satisfação do usuário com respostas mais precisas
✅ Previne loops infinitos de perguntas
✅ Handover inteligente para atendimento humano quando necessário

Exemplo de Fluxo:

Usuário: "Meu sistema está lento"
Agente: "Para te ajudar melhor, qual parte do sistema está apresentando lentidão? 
         É no login, na dashboard, ou em outra funcionalidade específica?"
         [clarification_count: 1]

Usuário: "Na dashboard"
Agente: "Entendi! A lentidão na dashboard pode ser causada por... [resposta completa]"
         [clarification_count: 1, resposta final]

🛠️ Tecnologias

Core

Python 3.11+ - Linguagem de programação
FastAPI - Framework web moderno e rápido
Pydantic - Validação de dados

IA & Machine Learning

LangChain - Framework para aplicações com LLMs
LangGraph - Orquestração de agentes e workflows
OpenAI - Modelos de linguagem (GPT-4, embeddings)

Cloud & Infraestrutura

Azure AI Search - Busca semântica e vetorial
Docker - Containerização
uv - Gerenciador de pacotes Python ultrarrápido

📦 Pré-requisitos

Python 3.11 ou superior
Docker e Docker Compose (opcional, para deploy containerizado)
Conta OpenAI com API Key
Azure AI Search com índice configurado

🚀 Instalação

Opção 1: Instalação Local

Clone o repositório

git clone https://github.com/seu-usuario/chatrag.git
cd chatrag

Instale o uv (se ainda não tiver)

pip install uv

Instale as dependências

uv sync

Opção 2: Com Docker

git clone https://github.com/seu-usuario/chatrag.git
cd chatrag
docker-compose up --build

⚙️ Configuração

1. Crie um arquivo `.env`

cp .env.example .env

2. Configure as variáveis de ambiente

# OpenAI Configuration
OPENAI_API_KEY=sk-your-openai-api-key
OPENAI_EMBEDDING_MODEL=text-embedding-3-large
OPENAI_CHAT_MODEL=gpt-4

# Azure AI Search Configuration
AZURE_SEARCH_ENDPOINT=https://your-search-service.search.windows.net
AZURE_SEARCH_KEY=your-azure-search-admin-key
AZURE_SEARCH_INDEX_NAME=your-index-name

# Application Configuration
APP_HOST=0.0.0.0
APP_PORT=8000
MAX_CLARIFICATIONS=2

3. Variáveis de Ambiente Disponíveis

Variável	Descrição	Padrão
`OPENAI_API_KEY`	Chave da API OpenAI	Obrigatório
`OPENAI_EMBEDDING_MODEL`	Modelo de embeddings	`text-embedding-3-large`
`OPENAI_CHAT_MODEL`	Modelo de chat	`gpt-4`
`AZURE_SEARCH_ENDPOINT`	Endpoint do Azure AI Search	Obrigatório
`AZURE_SEARCH_KEY`	Chave de acesso do Azure Search	Obrigatório
`AZURE_SEARCH_INDEX_NAME`	Nome do índice	Obrigatório
`APP_HOST`	Host da aplicação	`0.0.0.0`
`APP_PORT`	Porta da aplicação	`8000`
`MAX_CLARIFICATIONS`	Máximo de clarificações	`2`

💻 Uso

Executar Localmente

# Ative o ambiente virtual do uv
source .venv/bin/activate  # Linux/Mac
# ou
.venv\Scripts\activate  # Windows

# Execute a aplicação
uv run fastapi dev main.py

A API estará disponível em: http://localhost:8000

Acessar a Documentação

Swagger UI: http://localhost:8000/docs
ReDoc: http://localhost:8000/redoc

Exemplo de Requisição

curl --location 'http://localhost:8000/conversations/completions' \
--header 'Content-Type: application/json' \
--data '{
  "helpdeskId": 1,
  "projectName": "tesla_motors",
  "messages": [
    {
      "role": "USER",
      "content": "Hi! What'\''s the autonomy of a Tesla car?"
    }
  ]
}'

📂 Estrutura do Projeto

chatrag/
├── 📁 src/
│   ├── 📁 api/              # Rotas e endpoints FastAPI
│   ├── 📁 application/      # Lógica de negócio e LangGraph
│   ├── 📁 domain/           # Modelos de domínio e entidades
│   └── 📁 infrastructure/   # Configurações e serviços externos
├── 📄 main.py               # Ponto de entrada da aplicação
├── 📄 pyproject.toml        # Dependências e metadados
├── 📄 Dockerfile            # Imagem Docker
├── 📄 docker-compose.yml    # Orquestração de containers
├── 📄 .env.example          # Exemplo de variáveis de ambiente
└── 📄 README.md             # Este arquivo

🌐 API Endpoints

Root

GET / - Informações da API

Health

GET /health - Status da aplicação

Conversações

POST /conversations - Enviar mensagem e receber resposta

  {
    "helpdeskId": 20,
    "projectName": "tesla_motors",
    "messages": [
      {
        "role": "USER",
        "content": "Hi! What's the autonomy of a Tesla car?"
      }
    ]
  }

Documentação

GET /docs - Swagger UI
GET /redoc - ReDoc

👨‍💻 Desenvolvimento

Instalar com dependências de desenvolvimento

uv sync

Executar em modo desenvolvimento

uv run fastapi dev main.py

Estrutura de Código

O projeto segue os princípios:

✅ Clean Architecture
✅ SOLID Principles
✅ Type Hints em todo o código
✅ Validação com Pydantic
✅ Separation of Concerns

🐳 Docker

Build da Imagem

docker build -t chatrag:latest .

Executar Container

docker run -p 8000:8000 --env-file .env chatrag:latest

Docker Compose

# Iniciar serviços
docker-compose up -d

# Ver logs
docker-compose logs -f

# Parar serviços
docker-compose down

Health Check

O container possui health check configurado:

healthcheck:
  test: python -c "import urllib.request; urllib.request.urlopen('http://localhost:8000/health').read()"
  interval: 30s
  timeout: 10s
  retries: 3
  start_period: 10s

📄 Licença

Este projeto está sob a licença MIT.

Desenvolvido com ❤️ usando Python, FastAPI e LangChain

Name		Name	Last commit message	Last commit date
Latest commit History 39 Commits
src		src
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
.python-version		.python-version
Dockerfile		Dockerfile
README.md		README.md
docker-compose.yml		docker-compose.yml
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Folders and files

Latest commit

History

Repository files navigation

🤖 ChatRAG

Chatbot Inteligente com RAG (Retrieval-Augmented Generation)

📋 Índice

🎯 Sobre o Projeto

Por que ChatRAG?

✨ Características

🏗️ Arquitetura

Fluxo de Conversação

🎓 Decisões Técnicas

Por que LangChain e LangGraph?

LangChain: O Framework Ideal para LLM Applications

LangGraph: State Machine para Conversações Complexas

Outras Decisões Arquiteturais

Clean Architecture + DDD

FastAPI como Framework Web

Azure AI Search para Vector Store

UV para Gerenciamento de Pacotes

Docker Multi-Stage Build

Sistema de Clarificação Inteligente

🛠️ Tecnologias

Core

IA & Machine Learning

Cloud & Infraestrutura

📦 Pré-requisitos

🚀 Instalação

Opção 1: Instalação Local

Opção 2: Com Docker

⚙️ Configuração

1. Crie um arquivo .env

2. Configure as variáveis de ambiente

3. Variáveis de Ambiente Disponíveis

💻 Uso

Executar Localmente

Acessar a Documentação

Exemplo de Requisição

📂 Estrutura do Projeto

🌐 API Endpoints

Root

Health

Conversações

Documentação

👨‍💻 Desenvolvimento

Instalar com dependências de desenvolvimento

Executar em modo desenvolvimento

Estrutura de Código

🐳 Docker

Build da Imagem

Executar Container

Docker Compose

Health Check

📄 Licença

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

1. Crie um arquivo `.env`

Packages