LLM - GPT-4o - Llama 3.2-Vision SoM - Magma model - Omniparser
LLM
SoM