support/fix more IQ OPs by NeoZhangJianyu · Pull Request #6521 · ggml-org/llama.cpp

NeoZhangJianyu · 2024-04-07T02:18:16Z

support/fix the more OPs:

GGML_TYPE_IQ4_NL
GGML_TYPE_IQ4_XS
GGML_TYPE_IQ3_XXS
GGML_TYPE_IQ3_S
GGML_TYPE_IQ2_XXS
GGML_TYPE_IQ2_XS
GGML_TYPE_IQ2_S
GGML_TYPE_IQ1_S
GGML_TYPE_IQ1_M.

fix the all fault Unit-test cases.
except:
- all MUL_MAT_ID cases, due to the interface is changed.
- MUL_MAT(type_a=iq4_nl,type_b=f32,m=16,n=1,k=256,bs=[1,1],nr=[1,1]): [MUL_MAT] NMSE = 0.292746658 > 0.000500000 FAIL
  above fault cases will be fixed later.

…, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M

…, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M (ggml-org#6521)

support/fix OPs GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_XS, GGML_TYPE_IQ3_XXS…

f381347

…, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M

NeoZhangJianyu requested a review from airMeng April 7, 2024 02:18

airMeng mentioned this pull request Apr 7, 2024

[SYCL] Support newer non linear quantization #5674

Closed

airMeng approved these changes Apr 7, 2024

View reviewed changes

NeoZhangJianyu merged commit d4f220a into ggml-org:master Apr 7, 2024

This was referenced Apr 7, 2024

[SYCL] Update unsupported quantization types #5750

Closed

IQ1_S: attempt to fix SYCL #6014

Closed

[SYCL] iq2_s #6052

Closed

[SYCL] Iq4 nl #6363

Closed

[SYCL] refactor #6408

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

support/fix more IQ OPs#6521

support/fix more IQ OPs#6521
NeoZhangJianyu merged 1 commit intoggml-org:masterfrom
NeoZhangJianyu:support_more_IQ_ops

NeoZhangJianyu commented Apr 7, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

NeoZhangJianyu commented Apr 7, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants