✨ Damit kannst du Modelle direkt auf deinem eigenen Rechner ausprobieren – perfekt zum Experimentieren ohne Cloud-Abhängigkeit.
Wir verwenden vLLM: 🔗 vLLM Projekt auf GitHub
⚡ vLLM sorgt für hochperformante Inferenzierung und effiziente Nutzung deiner Server-Ressourcen.
- 📊 Benchmarks: LiveBench
- 📂 Modelle beziehen: Hugging Face
- 🤖 Derzeit im Einsatz: Qwen3-235B-A22B-GPTQ-Int4
🔍 Benchmarks helfen bei der Auswahl. Hugging Face ist die zentrale Plattform für open Source Modelle.
- Proxy-AI
- Coming Soon: JetBrains AI Assistant
💡 JetBrains zieht nach – bald auch mit Nutzung eigener LLMS via OpenAI-API.
🌍 Damit bekommst du ein schickes Web-Interface und kannst eigene LLMS via OpenAI-API anbinden.
📖 RAG erweitert dein LLM mit eigenem Wissen – nutze Dokumente, Datenbanken oder Firmenwissen für bessere Antworten.
- Model Context Protocol auf GitHub
- Öffentliche MCP-Server: mcp.so
🧩 Mit MCP kannst du Tools, APIs und externe Datenquellen direkt ins LLM integrieren.