- [ ] 优化图顺序,多流并行 #15850 - [ ] ROPE算子:MROPE模式支持 - [ ] ROPE算子:VISION模式支持 - [ ] ROPE算子:支持部分headSize旋转(n_dims <= src0->ne0) - [ ] CONV_TRANSPOSE_1D算子:支持 (op->src[0]->ne[0] - 1) > 255 场景 - [ ] OUT_PROD算子:新算子支持 - [ ] GATED_LINEAR_ATTN算子:新算子支持 - [ ] L2_NORM算子:新算子支持 - [ ] CROSS_ENTROPY_LOSS算子:新算子支持 - [ ] RWKV_WKV6算子:新算子支持 - [ ] RWKV_WKV7算子:新算子支持 - [ ] SSM_CONV算子:新算子支持 - [ ] SSM_SCAN算子:新算子支持 - [ ] 重构:acl graph中,将图命中的校验沉淀至lru cache中 - [ ] 针对某些特殊模型,支持使用aclnnRopeWithSinCosCache融合算子(工作量较大) - [x] 优化set_device - [ ] 新增量化方法支持Q4_1,Q8_1 - [ ] 重构:所有调用aclnn的方法,全部提供静态方法和注释进行封装,并替换之前的使用 后续维护在:https://github.com/noemotiovon/llama.cpp/issues/1
后续维护在:noemotiovon/llama.cpp#1