最近使用 ollama 部署了 qwen3.5,该模型默认开启思考模式,是可以通过参数切换为非思考模式的。思考模式下,一句简单的消息都要数分钟才回复,影响模型使用体验。 希望能增加模型提供商 ollama 关闭思考模式的配置!
最近使用 ollama 部署了 qwen3.5,该模型默认开启思考模式,是可以通过参数切换为非思考模式的。思考模式下,一句简单的消息都要数分钟才回复,影响模型使用体验。
希望能增加模型提供商 ollama 关闭思考模式的配置!