Skip to content

[Bug]: Intermittent Deterministic Output Divergence Following Service Restart #571

@yuerqiqi

Description

@yuerqiqi

Prerequisites

  • I have searched the existing issues and confirmed this is not a duplicate.
  • I am using the latest version of the MLLM framework.

Bug Description

该问题发生在基于Go语言服务端通过CGO接口调用底层C++推理引擎的环境中,使用的模型配置为Qwen3-0.6B以及deepseekOCR。
故障在服务器进程重启后以一定概率随机出现。一旦触发,模型输出虽为错误,但生成的Token序列在不同终端设备上完全一致(具有跨设备的确定性)。偏差通常从生成的第一个 Token 即开始出现。进程不会崩溃,但会持续输出上述稳定且错误的推理结果。

Steps to Reproduce

1.按照tasks/build_android.yaml编译 C++ 核心库,并使用tasks/build_android_mllm_server.yaml交叉编译 Go 服务端。
2.将编译生成的 .so 库文件(libMllmRT, libMllmCPUBackend 等)及mllm_web_server二进制文件推送到Android设备。
3.在设备端设置 LD_LIBRARY_PATH=.并启动服务端

./mllm_web_server \
    --model-path /path/to/your/qwen3_model_dir \
    --ocr-model-path /path/to/your/deepseek_ocr_model_dir

4.因为是随机出现,所以可能需要多次重启服务器结合chatbox才能观察到bug,如果重启后输出正常请关掉服务器重启。多次重复就会观察到这个bug。
详细步骤可参考: https://ubiquitouslearning.github.io/mllm/service/mllm_cli.html

Expected Behavior

bug出现时qwen3输出为:
保证女您ailand[](_plugins.exportsafkatranisper[](_plugins.exportsafkatranisper[](_plugins.exportsafkatranisper[](_plugins.exportsafkatranisper[](_plugins.exportsafkatranisper[](_plugins.exportsafkatranisper[]
deepseekOCR输出为:
−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|>−1 <|ref|></td−1

Operating System

Android

Device

两部测试手机均出现了这个随机出现但确定性问题

MLLM Framework Version

mllm v2.0

Model Information

Qwen3-0.6B以及deepseekOCR

Additional Context

No response

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't working

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions