🩺 SecureMed Chat - Privacy-First Medical Intake Assistant

A privacy-focused, AI-powered medical intake system that helps patients organize their health information before doctor visits. Built with a zero-persistence architecture ensuring complete data privacy.

Live Demo: https://caazzi-securemed.hf.space/

🎯 Project Overview

SecureMed Chat is an intelligent medical anamnesis assistant that generates contextual questions based on patient symptoms, helping them prepare comprehensive health summaries for their healthcare providers. The system uses RAG (Retrieval-Augmented Generation) with medical knowledge to ensure relevant and medically-informed questioning.

🏗️ Architecture

System Components

┌─────────────────┐
│  Gradio Frontend│ ──────► HuggingFace Spaces
└────────┬────────┘
         │ HTTPS + API Key
         ▼
┌─────────────────┐
│  FastAPI Backend│ ──────► GCP Cloud Run (2Gi Memory)
└────────┬────────┘         - Auto-scaling with min 1 instance
         │                   - VPC Connector for secure DB access
         ├──────────┐
         ▼          ▼
┌─────────────┐  ┌──────────────┐
│ Vertex AI   │  │ChromaDB Vector│ ──► GCP VM Instance
│ LLM Models  │  │    Store      │     (Internal Network Only)
└─────────────┘  └──────────────┘

Technology Stack

Backend: FastAPI with async/await patterns
LLM: Google Vertex AI (Gemini 2.5 Flash Lite)
Embeddings: Gemini Embedding Model
Vector Store: ChromaDB for medical knowledge retrieval
Frontend: Gradio with internationalization (EN/PT)
PDF Generation: ReportLab (in-memory generation)
Deployment:
- API: GCP Cloud Run (Serverless)
- Vector DB: GCP Compute Engine VM
- UI: HuggingFace Spaces

🔐 Privacy & Security Architecture

Zero-Persistence Design

No Data Storage:
- All patient information exists only in memory during the session
- No database records of patient data
- No file system persistence

In-Memory PDF Generation:

# PDFs are generated in memory and streamed directly
buffer = io.BytesIO()
# ... PDF generation ...
pdf_bytes = buffer.getvalue()
buffer.close()

Structured Logging Without PII:

# Logs track operations but never patient data
logging.info(f"Streaming initial questions for new session (lang={lang}).")
# Never: logging.info(f"Patient complaint: {complaint}")

Security Measures

API Key Authentication: All endpoints protected with X-API-KEY header
Input Sanitization: All user inputs stripped and validated
Network Isolation: ChromaDB accessible only via internal VPC
Secret Management: Using GCP Secret Manager for API keys
TLS/HTTPS: All communications encrypted in transit

Privacy Features

Session-Based Processing: Data exists only for request duration
No User Accounts: No registration or login required
Explicit Disclaimers: Clear messaging that output is not medical advice
Data Minimization: Only essential information collected (age bracket, not exact age)

🔄 Request Flow

User Input → Gradio interface collects symptoms
Question Generation → RAG retrieves relevant medical context
Streaming Response → Questions streamed to user in real-time
Answer Collection → User provides detailed responses
Summarization → LLM structures information into medical format
PDF Generation → In-memory PDF creation and immediate download
Session End → All data cleared from memory

🚀 Deployment Configuration

Cloud Run Deployment

gcloud run deploy securemed-chat-service \
  --source . \
  --project=securemed-chat \
  --region=southamerica-east1 \
  --vpc-connector=api-to-db-connector \
  --memory=2Gi \
  --min-instances=1 \
  --service-account=securemed-cr-sa@securemed-chat.iam.gserviceaccount.com \
  --set-env-vars=CHROMA_HOST=securemed-chat.southamerica-east1-a.c.securemed-chat.internal,CHROMA_PORT=8000 \
  --set-secrets=SECUREMED_API_KEY=SECUREMED_API_KEY:latest

Performance Optimizations

Lazy Loading: Models initialized only on first request
MMR Retrieval: Using Maximum Marginal Relevance for diverse context
Streaming Responses: Real-time question delivery
Optimized Workers: Gunicorn with 2 workers for optimal concurrency
Multi-stage Docker: Minimized container size (~200MB)

📊 API Endpoints

Endpoint	Purpose	Privacy Consideration
`/api/initial-questions-stream`	Generate symptom questions	No data persistence
`/api/follow-up-questions-stream`	Generate medical history questions	Context exists only in request
`/api/summarize-and-generate-pdf`	Create medical summary PDF	In-memory generation, immediate disposal

🌍 Internationalization

The system supports multiple languages with complete UI and content translation:

English (en): Default language
Portuguese (pt): Full translation including PDF output
Language auto-detected from browser settings

🛡️ Security Best Practices Implemented

Principle of Least Privilege: Service accounts with minimal permissions
Defense in Depth: Multiple security layers (API key, VPC, IAM)
Input Validation: Pydantic models with field constraints
Error Handling: Graceful degradation without exposing internals
Rate Limiting: Built-in Cloud Run throttling
Secure Defaults: No default API keys in production

📈 Monitoring & Observability

Structured logging for operational insights
No PII in logs or metrics
Cloud Run automatic metrics (latency, errors, traffic)
Health check endpoint at root path

🤝 Contributing

We welcome contributions! Please:

Test the live demo: https://caazzi-securemed.hf.space/
Review the code for security and privacy improvements
Suggest enhancements via issues or pull requests

Areas for Contribution

Additional language support
Enhanced medical knowledge base
Accessibility improvements (WCAG compliance)
Performance optimizations
Security audit findings
Documentation improvements

📝 Compliance & Disclaimers

Not Medical Advice: System explicitly disclaims medical advisory capacity
Data Protection: Designed with GDPR/LGPD principles (no data retention)
Healthcare Integration: Not intended for direct EHR integration
Age Verification: System designed for adult users (18+)

🔍 Code Review Focus Areas

When reviewing the code, please pay special attention to:

Privacy Leaks: Any inadvertent data persistence
Security Vulnerabilities: Input validation, injection attacks
Performance Bottlenecks: Async operations, memory usage
Error Handling: Graceful failures, user experience
Internationalization: Translation completeness and accuracy

📖 Technical Documentation

Key Design Decisions

Why RAG over Fine-tuning?: Maintains flexibility and avoids training on patient data
Why ChromaDB?: Lightweight, efficient for medical document retrieval
Why Vertex AI?: HIPAA-compliant infrastructure, regional deployment
Why In-Memory Processing?: Absolute privacy guarantee

Performance Metrics

Cold start: ~3-5 seconds (mitigated by min-instances=1)
Question generation: <2 seconds
PDF generation: <1 second
Memory footprint: ~500MB per concurrent request

📬 Contact & Support

For questions about the architecture or to report security concerns, please open an issue with the appropriate label:

🔐 security - Security vulnerabilities (use responsible disclosure)
🔒 privacy - Privacy concerns or improvements
🏗️ architecture - Architectural suggestions
📚 documentation - Documentation improvements

Remember: This system is designed for informational purposes only and should not replace professional medical consultation. Always consult with qualified healthcare providers for medical advice.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
gradio		gradio
scripts		scripts
src/securemed_chat		src/securemed_chat
.dockerignore		.dockerignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
gradio_app.py		gradio_app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

🩺 SecureMed Chat - Privacy-First Medical Intake Assistant

🎯 Project Overview

🏗️ Architecture

System Components

Technology Stack

🔐 Privacy & Security Architecture

Zero-Persistence Design

Security Measures

Privacy Features

🔄 Request Flow

🚀 Deployment Configuration

Cloud Run Deployment

Performance Optimizations

📊 API Endpoints

🌍 Internationalization

🛡️ Security Best Practices Implemented

📈 Monitoring & Observability

🤝 Contributing

Areas for Contribution

📝 Compliance & Disclaimers

🔍 Code Review Focus Areas

📖 Technical Documentation

Key Design Decisions

Performance Metrics

📬 Contact & Support

About

Uh oh!

Contributors 2

Uh oh!

Languages

caazzi/securemed_chat

Folders and files

Latest commit

History

Repository files navigation

🩺 SecureMed Chat - Privacy-First Medical Intake Assistant

🎯 Project Overview

🏗️ Architecture

System Components

Technology Stack

🔐 Privacy & Security Architecture

Zero-Persistence Design

Security Measures

Privacy Features

🔄 Request Flow

🚀 Deployment Configuration

Cloud Run Deployment

Performance Optimizations

📊 API Endpoints

🌍 Internationalization

🛡️ Security Best Practices Implemented

📈 Monitoring & Observability

🤝 Contributing

Areas for Contribution

📝 Compliance & Disclaimers

🔍 Code Review Focus Areas

📖 Technical Documentation

Key Design Decisions

Performance Metrics

📬 Contact & Support

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Contributors 2

Uh oh!

Languages