[VL] Gluten write more shuffle data than vanilla Spark

### Backend

VL (Velox)

### Bug description

I can see that for the same record numbers, gluten always write much larger shuffle data than vanilla, why? From my understanding, gluten should use less storage since it's written in columnar format.

gluten

![Image](https://github.com/user-attachments/assets/3d74f63f-ac27-4852-a585-dc07e46a4e89)

vanilla

![Image](https://github.com/user-attachments/assets/e6d35121-3347-4a69-89a0-d9bc87072a8a)

### Spark version

Spark-3.2.x

### Spark configurations

_No response_

### System information

gluten version: 1.3.0

### Relevant logs

```bash

```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[VL] Gluten write more shuffle data than vanilla Spark #8833

Backend

Bug description

Spark version

Spark configurations

System information

Relevant logs

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

[VL] Gluten write more shuffle data than vanilla Spark #8833

Description

Backend

Bug description

Spark version

Spark configurations

System information

Relevant logs

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions