今天把 API 用于 roo code,在配置好 GLM-5 模型之后,开始聊天:
问题1:聊天内容的开头突兀,重复 API 请求导致聊天的回复重复
问题2: roo code 会因以下原因导致重复尝试请求
# .env
# ===================
# 服务器配置
# ===================
PORT=9090
# ===================
# API 配置
# ===================
# API 端点地址
API_ENDPOINT=https://chat.z.ai/api/v2/chat/completions
# 认证令牌(支持多个,逗号分隔)
# 用于验证客户端请求
AUTH_TOKEN=sk-your-token-here
# 备用令牌(支持多个,逗号分隔)
# 用于多模态请求
BACKUP_TOKEN=
# ===================
# 模型配置
# ===================
# 主模型
#PRIMARY_MODEL=GLM-4.5
# 思考模型
#THINKING_MODEL=GLM-4.5-Thinking
# 搜索模型
#SEARCH_MODEL=GLM-4.5-Search
# 轻量模型
#AIR_MODEL=GLM-4.5-Air
# 新版模型(可选)
#PRIMARY_MODEL_NEW=GLM-4.6
#THINKING_MODEL_NEW=GLM-4.6-Thinking
#SEARCH_MODEL_NEW=GLM-4.6-Search
# ===================
# 功能配置
# ===================
# 调试日志
DEBUG_LOGGING=true
# 匿名模式
ANONYMOUS_MODE=true
# 工具调用支持
TOOL_SUPPORT=true
# 跳过认证令牌验证
SKIP_AUTH_TOKEN=true
# 思考过程处理方式: think, strip, raw
THINKING_PROCESSING=think
# 扫描限制(字符数)
SCAN_LIMIT=200000
# 日志级别: debug, info, warn, error
LOG_LEVEL=info
# ===================
# 显示配置
# ===================
# 多行备注,在 / 端点显示
# 支持 | 或 \n 作为换行符
# 示例: NOTE=第一行|第二行|第三行
NOTE=
// roo code 测试配置
"Local-9090": {
"diffEnabled": true,
"todoListEnabled": true,
"fuzzyMatchThreshold": 1,
"modelTemperature": 0.7,
"rateLimitSeconds": 1,
"consecutiveMistakeLimit": 3,
"enableReasoningEffort": true,
"openAiBaseUrl": "http://127.0.0.1:9090/v1",
"openAiApiKey": "",
"openAiLegacyFormat": false,
"openAiR1FormatEnabled": false,
"openAiModelId": "GLM-5",
"openAiHeaders": {},
"apiProvider": "openai",
"id": "bi5qqv9dpxb"
},
今天把 API 用于
roo code,在配置好GLM-5模型之后,开始聊天:问题1:聊天内容的开头突兀,重复 API 请求导致聊天的回复重复
问题2:
roo code会因以下原因导致重复尝试请求