您好,我看到您代码中针对Qwen base model采用的Prompt也是要求其输出<think><answer>格式,是否有考虑过若base model未采用这种格式训练,使用此prompt可能会得到比正常prompt较低的分数?