您好, 我测试的Llama-3.1-8B-Instruct 结果如下: Model Overall Easy Hard Short Medium Long Llama-3.1-8B-Instruct 29.0 30.7 28.0 33.9 25.6 27.8 和排行榜中的Overall 有一个点的差距(29.0 vs 30.0),我的环境如下: vllm==0.5.3.post1 transformers==4.45.0 请问测试Llama-3.1-8B-Instruct 还需要什么特殊处理吗
您好,
我测试的Llama-3.1-8B-Instruct 结果如下:
Model Overall Easy Hard Short Medium Long
Llama-3.1-8B-Instruct 29.0 30.7 28.0 33.9 25.6 27.8
和排行榜中的Overall 有一个点的差距(29.0 vs 30.0),我的环境如下:
vllm==0.5.3.post1
transformers==4.45.0
请问测试Llama-3.1-8B-Instruct 还需要什么特殊处理吗