From 02544220b5bfe27c7851440554e50713d1a405fb Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 15:43:22 +0800
Subject: [PATCH 01/14] [parquet] Init new reader from spark

---
 .../Arrow2PaimonVectorConverter.java          |   11 +-
 .../arrow/writer/ArrowFieldWriters.java       |    4 +-
 .../paimon/data/columnar/ColumnVector.java    |    9 +
 .../data/columnar/ColumnarRowIterator.java    |   17 +-
 .../paimon/data/columnar/MapColumnVector.java |    4 -
 .../data/columnar/VectorizedRowIterator.java  |    2 +-
 .../columnar/heap/AbstractHeapVector.java     |   32 +-
 .../columnar/heap/AbstractStructVector.java   |   94 ++
 .../data/columnar/heap/ElementCountable.java  |    2 +-
 .../data/columnar/heap/HeapArrayVector.java   |   54 +-
 .../data/columnar/heap/HeapBooleanVector.java |   37 +
 .../data/columnar/heap/HeapByteVector.java    |   17 +
 .../data/columnar/heap/HeapBytesVector.java   |   68 +-
 .../data/columnar/heap/HeapDoubleVector.java  |   17 +
 .../data/columnar/heap/HeapFloatVector.java   |   17 +
 .../data/columnar/heap/HeapIntVector.java     |   38 +
 .../data/columnar/heap/HeapLongVector.java    |   17 +
 .../data/columnar/heap/HeapMapVector.java     |   50 +-
 .../data/columnar/heap/HeapRowVector.java     |   35 +-
 .../data/columnar/heap/HeapShortVector.java   |   17 +
 .../columnar/heap/HeapTimestampVector.java    |   27 +-
 .../columnar/heap/WrapArrayColumnVector.java  |   63 +
 .../columnar/heap/WrapMapColumnVector.java    |   58 +
 .../columnar/heap/WrapRowColumnVector.java    |   64 +
 .../writable/AbstractWritableVector.java      |   74 +-
 .../writable/WritableBooleanVector.java       |    6 +
 .../writable/WritableBytesVector.java         |    2 +-
 .../writable/WritableColumnVector.java        |   16 +
 .../columnar/writable/WritableIntVector.java  |    4 +
 .../paimon/utils/VectorMappingUtils.java      |   24 -
 .../paimon/format/FormatReadWriteTest.java    |   99 +-
 .../format/orc/reader/OrcMapColumnVector.java |    9 +-
 .../format/parquet/ParquetReaderFactory.java  |   40 +-
 .../parquet/newreader/ColumnarBatch.java      |   55 +
 .../newreader/ParquetColumnVector.java        |  374 ++++++
 .../parquet/newreader/ParquetReadState.java   |  179 +++
 .../newreader/ParquetVectorUpdater.java       |   94 ++
 .../ParquetVectorUpdaterFactory.java          |  807 +++++++++++++
 .../parquet/newreader/RowIndexGenerator.java  |   62 +
 .../newreader/VectorizedColumnReader.java     |  365 ++++++
 .../VectorizedDeltaBinaryPackedReader.java    |  295 +++++
 .../VectorizedDeltaByteArrayReader.java       |  149 +++
 .../VectorizedDeltaLengthByteArrayReader.java |   91 ++
 .../VectorizedParquetRecordReader.java        |  349 ++++++
 .../VectorizedPlainValuesReader.java          |  315 +++++
 .../newreader/VectorizedReaderBase.java       |  143 +++
 .../newreader/VectorizedRleValuesReader.java  | 1042 +++++++++++++++++
 .../newreader/VectorizedValuesReader.java     |  121 ++
 .../parquet/reader/BytesColumnReader.java     |    6 +-
 .../FixedLenBytesBinaryColumnReader.java      |    4 +-
 .../FixedLenBytesDecimalColumnReader.java     |    4 +-
 .../parquet/reader/NestedColumnReader.java    |   13 +-
 .../reader/NestedPrimitiveColumnReader.java   |   10 +-
 .../parquet/reader/ParquetDecimalVector.java  |   90 +-
 .../reader/ParquetSplitReaderUtil.java        |   39 +-
 .../parquet/reader/RowColumnReader.java       |    2 +-
 .../format/parquet/type/ParquetField.java     |   15 +-
 .../parquet/type/ParquetGroupField.java       |   10 +-
 .../parquet/type/ParquetPrimitiveField.java   |   10 +-
 .../parquet/ParquetColumnVectorTest.java      |  466 ++------
 .../format/parquet/ParquetReadWriteTest.java  |   24 +-
 61 files changed, 5439 insertions(+), 723 deletions(-)
 create mode 100644 paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
 create mode 100644 paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java
 create mode 100644 paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java
 create mode 100644 paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ColumnarBatch.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java
 create mode 100644 paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java

diff --git a/paimon-arrow/src/main/java/org/apache/paimon/arrow/converter/Arrow2PaimonVectorConverter.java b/paimon-arrow/src/main/java/org/apache/paimon/arrow/converter/Arrow2PaimonVectorConverter.java
index 5478e1594086..b89f2a83d0c5 100644
--- a/paimon-arrow/src/main/java/org/apache/paimon/arrow/converter/Arrow2PaimonVectorConverter.java
+++ b/paimon-arrow/src/main/java/org/apache/paimon/arrow/converter/Arrow2PaimonVectorConverter.java
@@ -519,15 +519,8 @@ public InternalMap getMap(int index) {
                         }
 
                         @Override
-                        public ColumnVector getKeyColumnVector() {
-                            init();
-                            return keyColumnVector;
-                        }
-
-                        @Override
-                        public ColumnVector getValueColumnVector() {
-                            init();
-                            return valueColumnVector;
+                        public ColumnVector[] getChildren() {
+                            return new ColumnVector[] {keyColumnVector, valueColumnVector};
                         }
                     };
         }
diff --git a/paimon-arrow/src/main/java/org/apache/paimon/arrow/writer/ArrowFieldWriters.java b/paimon-arrow/src/main/java/org/apache/paimon/arrow/writer/ArrowFieldWriters.java
index fd8eb4c975bc..053f93e1ac3b 100644
--- a/paimon-arrow/src/main/java/org/apache/paimon/arrow/writer/ArrowFieldWriters.java
+++ b/paimon-arrow/src/main/java/org/apache/paimon/arrow/writer/ArrowFieldWriters.java
@@ -620,12 +620,12 @@ protected void doWrite(
             ArrayChildWriteInfo arrayChildWriteInfo =
                     getArrayChildWriteInfo(pickedInColumn, startIndex, lengths);
             keyWriter.write(
-                    mapColumnVector.getKeyColumnVector(),
+                    mapColumnVector.getChildren()[0],
                     arrayChildWriteInfo.pickedInColumn,
                     arrayChildWriteInfo.startIndex,
                     arrayChildWriteInfo.batchRows);
             valueWriter.write(
-                    mapColumnVector.getValueColumnVector(),
+                    mapColumnVector.getChildren()[1],
                     arrayChildWriteInfo.pickedInColumn,
                     arrayChildWriteInfo.startIndex,
                     arrayChildWriteInfo.batchRows);
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnVector.java
index b653a508c030..71a6011c572f 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnVector.java
@@ -20,5 +20,14 @@
 
 /** Nullable column vector. Access data through specific subclasses. */
 public interface ColumnVector {
+
     boolean isNullAt(int i);
+
+    default int getCapacity() {
+        return Integer.MAX_VALUE;
+    }
+
+    default ColumnVector[] getChildren() {
+        return null;
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
index faecd1ccd88c..6a39a0cc0f58 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
@@ -41,7 +41,7 @@ public class ColumnarRowIterator extends RecyclableIterator<InternalRow>
 
     protected int num;
     protected int nextPos;
-    protected long nextFilePos;
+    protected long[] positions;
 
     public ColumnarRowIterator(Path filePath, ColumnarRow row, @Nullable Runnable recycler) {
         super(recycler);
@@ -51,9 +51,17 @@ public ColumnarRowIterator(Path filePath, ColumnarRow row, @Nullable Runnable re
     }
 
     public void reset(long nextFilePos) {
+        this.positions = new long[row.batch().getNumRows()];
+        for (int i = 0; i < row.batch().getNumRows(); i++) {
+            positions[i] = nextFilePos++;
+        }
+    }
+
+    public void reset(long[] positions) {
+        assert positions.length == row.batch().getNumRows();
+        this.positions = positions;
         this.num = row.batch().getNumRows();
         this.nextPos = 0;
-        this.nextFilePos = nextFilePos;
     }
 
     @Nullable
@@ -61,7 +69,6 @@ public void reset(long nextFilePos) {
     public InternalRow next() {
         if (nextPos < num) {
             row.setRowId(nextPos++);
-            nextFilePos++;
             return row;
         } else {
             return null;
@@ -70,7 +77,7 @@ public InternalRow next() {
 
     @Override
     public long returnedPosition() {
-        return nextFilePos - 1;
+        return positions[nextPos - 1];
     }
 
     @Override
@@ -81,7 +88,7 @@ public Path filePath() {
     protected ColumnarRowIterator copy(ColumnVector[] vectors) {
         ColumnarRowIterator newIterator =
                 new ColumnarRowIterator(filePath, row.copy(vectors), recycler);
-        newIterator.reset(nextFilePos);
+        newIterator.reset(positions);
         return newIterator;
     }
 
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/MapColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/MapColumnVector.java
index 6f0ffd6a75b6..2e24fe8de1db 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/MapColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/MapColumnVector.java
@@ -23,8 +23,4 @@
 /** Map column vector. */
 public interface MapColumnVector extends ColumnVector {
     InternalMap getMap(int i);
-
-    ColumnVector getKeyColumnVector();
-
-    ColumnVector getValueColumnVector();
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/VectorizedRowIterator.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/VectorizedRowIterator.java
index 889da334c594..592a7845fcdd 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/VectorizedRowIterator.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/VectorizedRowIterator.java
@@ -39,7 +39,7 @@ public VectorizedColumnBatch batch() {
     protected VectorizedRowIterator copy(ColumnVector[] vectors) {
         VectorizedRowIterator newIterator =
                 new VectorizedRowIterator(filePath, row.copy(vectors), recycler);
-        newIterator.reset(nextFilePos);
+        newIterator.reset(positions);
         return newIterator;
     }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
index f0e82eac4fb1..d737daab9f97 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
@@ -47,22 +47,23 @@ public abstract class AbstractHeapVector extends AbstractWritableVector
     /** Reusable column for ids of dictionary. */
     protected HeapIntVector dictionaryIds;
 
-    private final int len;
-
-    public AbstractHeapVector(int len) {
-        isNull = new boolean[len];
-        this.len = len;
+    public AbstractHeapVector(int capacity) {
+        super(capacity);
+        isNull = new boolean[capacity];
     }
 
-    /**
-     * Resets the column to default state. - fills the isNull array with false. - sets noNulls to
-     * true.
-     */
+    /** Resets the column to default state. - fills the isNull array with false. */
     @Override
     public void reset() {
-        if (!noNulls) {
+        super.reset();
+        if (isNull.length != initialCapacity) {
+            isNull = new boolean[initialCapacity];
+        } else {
             Arrays.fill(isNull, false);
         }
+        if (dictionaryIds != null) {
+            dictionaryIds.reset();
+        }
         noNulls = true;
     }
 
@@ -90,7 +91,7 @@ public void fillWithNulls() {
 
     @Override
     public boolean isNullAt(int i) {
-        return !noNulls && isNull[i];
+        return isAllNull || (!noNulls && isNull[i]);
     }
 
     @Override
@@ -118,7 +119,12 @@ public HeapIntVector getDictionaryIds() {
     }
 
     @Override
-    public int getLen() {
-        return this.len;
+    protected void reserveInternal(int newCapacity) {
+        if (isNull.length < newCapacity) {
+            isNull = Arrays.copyOf(isNull, newCapacity);
+        }
+        reserveForHeapVector(newCapacity);
     }
+
+    abstract void reserveForHeapVector(int newCapacity);
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
new file mode 100644
index 000000000000..eb208a7371e9
--- /dev/null
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
@@ -0,0 +1,94 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.data.columnar.heap;
+
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+
+import java.util.Arrays;
+
+/** * Abstract class for vectors that have children. */
+public abstract class AbstractStructVector extends AbstractHeapVector
+        implements WritableColumnVector {
+
+    protected ColumnVector[] children;
+    protected long[] offsets;
+    protected long[] lengths;
+
+    public AbstractStructVector(int len, ColumnVector[] children) {
+        super(len);
+        this.offsets = new long[len];
+        this.lengths = new long[len];
+        this.children = children;
+    }
+
+    public void putOffsetLength(int index, long offset, long length) {
+        offsets[index] = offset;
+        lengths[index] = length;
+    }
+
+    public long[] getOffsets() {
+        return offsets;
+    }
+
+    public void setOffsets(long[] offsets) {
+        this.offsets = offsets;
+    }
+
+    public long[] getLengths() {
+        return lengths;
+    }
+
+    public void setLengths(long[] lengths) {
+        this.lengths = lengths;
+    }
+
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (offsets.length < newCapacity) {
+            offsets = Arrays.copyOf(offsets, newCapacity);
+            lengths = Arrays.copyOf(lengths, newCapacity);
+        }
+    }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (offsets.length != initialCapacity) {
+            offsets = new long[initialCapacity];
+        } else {
+            Arrays.fill(offsets, 0);
+        }
+        if (lengths.length != initialCapacity) {
+            lengths = new long[initialCapacity];
+        } else {
+            Arrays.fill(lengths, 0);
+        }
+        for (ColumnVector child : children) {
+            if (child instanceof WritableColumnVector) {
+                ((WritableColumnVector) child).reset();
+            }
+        }
+    }
+
+    @Override
+    public ColumnVector[] getChildren() {
+        return children;
+    }
+}
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/ElementCountable.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/ElementCountable.java
index a32762d659fd..564763638dc9 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/ElementCountable.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/ElementCountable.java
@@ -21,5 +21,5 @@
 /** Container with a known number of elements. */
 public interface ElementCountable {
 
-    int getLen();
+    int getCapacity();
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java
index 6b8492119d87..2c2d308f2d64 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java
@@ -22,71 +22,27 @@
 import org.apache.paimon.data.columnar.ArrayColumnVector;
 import org.apache.paimon.data.columnar.ColumnVector;
 import org.apache.paimon.data.columnar.ColumnarArray;
-import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 
 /** This class represents a nullable heap array column vector. */
-public class HeapArrayVector extends AbstractHeapVector
-        implements WritableColumnVector, ArrayColumnVector {
-
-    private long[] offsets;
-    private long[] lengths;
-    private int size;
-    private ColumnVector child;
-
-    public HeapArrayVector(int len) {
-        super(len);
-        this.offsets = new long[len];
-        this.lengths = new long[len];
-    }
+public class HeapArrayVector extends AbstractStructVector implements ArrayColumnVector {
 
     public HeapArrayVector(int len, ColumnVector vector) {
-        super(len);
-        this.offsets = new long[len];
-        this.lengths = new long[len];
-        this.child = vector;
-    }
-
-    public long[] getOffsets() {
-        return offsets;
-    }
-
-    public void setOffsets(long[] offsets) {
-        this.offsets = offsets;
-    }
-
-    public long[] getLengths() {
-        return lengths;
-    }
-
-    public void setLengths(long[] lengths) {
-        this.lengths = lengths;
-    }
-
-    public int getSize() {
-        return size;
-    }
-
-    public void setSize(int size) {
-        this.size = size;
-    }
-
-    public ColumnVector getChild() {
-        return child;
+        super(len, new ColumnVector[] {vector});
     }
 
     public void setChild(ColumnVector child) {
-        this.child = child;
+        children[0] = child;
     }
 
     @Override
     public InternalArray getArray(int i) {
         long offset = offsets[i];
         long length = lengths[i];
-        return new ColumnarArray(child, (int) offset, (int) length);
+        return new ColumnarArray(children[0], (int) offset, (int) length);
     }
 
     @Override
     public ColumnVector getColumnVector() {
-        return child;
+        return children[0];
     }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java
index 3c88699cffe4..5f8dc9619500 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java
@@ -44,6 +44,13 @@ public HeapIntVector getDictionaryIds() {
         throw new RuntimeException("HeapBooleanVector has no dictionary.");
     }
 
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
     @Override
     public boolean getBoolean(int i) {
         return vector[i];
@@ -54,8 +61,38 @@ public void setBoolean(int i, boolean value) {
         vector[i] = value;
     }
 
+    @Override
+    public void setBooleans(int rowId, int count, boolean value) {
+        for (int i = 0; i < count; ++i) {
+            vector[i + rowId] = value;
+        }
+    }
+
+    @Override
+    public void setBooleans(int rowId, int count, byte src, int srcIndex) {
+        assert (count + srcIndex <= 8);
+        for (int i = 0; i < count; i++) {
+            vector[i + rowId] = (byte) (src >>> (i + srcIndex) & 1) == 1;
+        }
+    }
+
+    @Override
+    public void setBooleans(int rowId, byte src) {
+        setBooleans(rowId, 8, src, 0);
+    }
+
     @Override
     public void fill(boolean value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new boolean[initialCapacity];
+        } else {
+            Arrays.fill(vector, false);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java
index f5463dcc055b..0d3c4531fd06 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java
@@ -57,4 +57,21 @@ public void setByte(int i, byte value) {
     public void fill(byte value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new byte[initialCapacity];
+        } else {
+            Arrays.fill(vector, (byte) 0);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
index 8ccbbf3ba6b9..587d8abc843f 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
@@ -48,42 +48,49 @@ public class HeapBytesVector extends AbstractHeapVector implements WritableBytes
     /** buffer to use when actually copying in data. */
     public byte[] buffer;
 
-    /** Hang onto a byte array for holding smaller byte values. */
-    private int elementsAppended = 0;
-
-    private int capacity;
+    private int bytesAppended;
 
     /**
      * Don't call this constructor except for testing purposes.
      *
-     * @param size number of elements in the column vector
+     * @param capacity number of elements in the column vector
      */
-    public HeapBytesVector(int size) {
-        super(size);
-        capacity = size;
-        buffer = new byte[capacity];
-        start = new int[size];
-        length = new int[size];
+    public HeapBytesVector(int capacity) {
+        super(capacity);
+        buffer = new byte[capacity * 16];
+        start = new int[capacity];
+        length = new int[capacity];
     }
 
     @Override
     public void reset() {
         super.reset();
-        elementsAppended = 0;
+        if (start.length != initialCapacity) {
+            start = new int[initialCapacity];
+        }
+
+        if (length.length != initialCapacity) {
+            length = new int[initialCapacity];
+        }
+
+        if (buffer.length != initialCapacity * 16) {
+            buffer = new byte[initialCapacity * 16];
+        }
+        this.bytesAppended = 0;
     }
 
     @Override
-    public void appendBytes(int elementNum, byte[] sourceBuf, int start, int length) {
-        reserve(elementsAppended + length);
-        System.arraycopy(sourceBuf, start, buffer, elementsAppended, length);
-        this.start[elementNum] = elementsAppended;
+    public void putByteArray(int elementNum, byte[] sourceBuf, int start, int length) {
+        reserveBytes(bytesAppended + length);
+        System.arraycopy(sourceBuf, start, buffer, bytesAppended, length);
+        this.start[elementNum] = bytesAppended;
         this.length[elementNum] = length;
-        elementsAppended += length;
+        bytesAppended += length;
     }
 
     @Override
     public void fill(byte[] value) {
-        reserve(start.length * value.length);
+        reserveBytes(start.length * value.length);
         for (int i = 0; i < start.length; i++) {
             System.arraycopy(value, 0, buffer, i * value.length, value.length);
         }
@@ -93,18 +100,19 @@ public void fill(byte[] value) {
         Arrays.fill(this.length, value.length);
     }
 
-    private void reserve(int requiredCapacity) {
-        if (requiredCapacity > capacity) {
-            int newCapacity = requiredCapacity * 2;
-            try {
-                byte[] newData = new byte[newCapacity];
-                System.arraycopy(buffer, 0, newData, 0, elementsAppended);
-                buffer = newData;
-                capacity = newCapacity;
-            } catch (OutOfMemoryError outOfMemoryError) {
-                throw new UnsupportedOperationException(
-                        requiredCapacity + " cannot be satisfied.", outOfMemoryError);
-            }
+    private void reserveBytes(int newCapacity) {
+        if (newCapacity > buffer.length) {
+            int newBytesCapacity = newCapacity * 2;
+            buffer = Arrays.copyOf(buffer, newBytesCapacity);
+        }
+    }
+
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (newCapacity > capacity) {
+            capacity = newCapacity;
+            start = Arrays.copyOf(start, newCapacity);
+            length = Arrays.copyOf(length, newCapacity);
         }
     }
 
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java
index 71d4b8775735..3143f2e0a123 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java
@@ -45,6 +45,13 @@ public HeapDoubleVector(int len) {
         vector = new double[len];
     }
 
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
     @Override
     public double getDouble(int i) {
         if (dictionary == null) {
@@ -87,4 +94,14 @@ public void setDoublesFromBinary(int rowId, int count, byte[] src, int srcIndex)
     public void fill(double value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new double[initialCapacity];
+        } else {
+            Arrays.fill(vector, 0);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java
index b1b6a0e0e31d..84ff42961cd7 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java
@@ -44,6 +44,13 @@ public HeapFloatVector(int len) {
         vector = new float[len];
     }
 
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
     @Override
     public float getFloat(int i) {
         if (dictionary == null) {
@@ -86,4 +93,14 @@ public void setFloatsFromBinary(int rowId, int count, byte[] src, int srcIndex)
     public void fill(float value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new float[initialCapacity];
+        } else {
+            Arrays.fill(vector, 0);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
index 15192e876bbd..8b4bd3d06e31 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
@@ -39,6 +39,18 @@ public HeapIntVector(int len) {
         vector = new int[len];
     }
 
+    @Override
+    public void setNullAt(int i) {
+        super.setNullAt(i);
+    }
+
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
     @Override
     public int getInt(int i) {
         if (dictionary == null) {
@@ -93,4 +105,30 @@ public void setInts(int rowId, int count, int[] src, int srcIndex) {
     public void fill(int value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    public int appendInt(int v) {
+        reserve(elementsAppended + 1);
+        setInt(elementsAppended, v);
+        return elementsAppended++;
+    }
+
+    @Override
+    public int appendInts(int count, int v) {
+        reserve(elementsAppended + count);
+        int result = elementsAppended;
+        setInts(elementsAppended, count, v);
+        elementsAppended += count;
+        return result;
+    }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new int[initialCapacity];
+        } else {
+            Arrays.fill(vector, 0);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java
index 62c5b8108905..f3339f1214ba 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java
@@ -39,6 +39,13 @@ public HeapLongVector(int len) {
         vector = new long[len];
     }
 
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
     @Override
     public long getLong(int i) {
         if (dictionary == null) {
@@ -81,4 +88,14 @@ public void setLongsFromBinary(int rowId, int count, byte[] src, int srcIndex) {
     public void fill(long value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new long[initialCapacity];
+        } else {
+            Arrays.fill(vector, 0L);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java
index 18cce097e32f..f218c26d37bd 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java
@@ -22,64 +22,26 @@
 import org.apache.paimon.data.columnar.ColumnVector;
 import org.apache.paimon.data.columnar.ColumnarMap;
 import org.apache.paimon.data.columnar.MapColumnVector;
-import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 
 /** This class represents a nullable heap map column vector. */
-public class HeapMapVector extends AbstractHeapVector
-        implements WritableColumnVector, MapColumnVector {
+public class HeapMapVector extends AbstractStructVector implements MapColumnVector {
 
-    private long[] offsets;
-    private long[] lengths;
-    private int size;
-    private ColumnVector keys;
-    private ColumnVector values;
-
-    public HeapMapVector(int len, ColumnVector keys, ColumnVector values) {
-        super(len);
-        this.offsets = new long[len];
-        this.lengths = new long[len];
-        this.keys = keys;
-        this.values = values;
-    }
-
-    public void setOffsets(long[] offsets) {
-        this.offsets = offsets;
-    }
-
-    public void setLengths(long[] lengths) {
-        this.lengths = lengths;
-    }
-
-    public int getSize() {
-        return size;
-    }
-
-    public void setSize(int size) {
-        this.size = size;
+    public HeapMapVector(int capacity, ColumnVector keys, ColumnVector values) {
+        super(capacity, new ColumnVector[] {keys, values});
     }
 
     public void setKeys(ColumnVector keys) {
-        this.keys = keys;
+        children[0] = keys;
     }
 
     public void setValues(ColumnVector values) {
-        this.values = values;
+        children[1] = values;
     }
 
     @Override
     public InternalMap getMap(int i) {
         long offset = offsets[i];
         long length = lengths[i];
-        return new ColumnarMap(keys, values, (int) offset, (int) length);
-    }
-
-    @Override
-    public ColumnVector getKeyColumnVector() {
-        return keys;
-    }
-
-    @Override
-    public ColumnVector getValueColumnVector() {
-        return values;
+        return new ColumnarMap(children[0], children[1], (int) offset, (int) length);
     }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
index 37d619bde785..51d3533c1030 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
@@ -18,47 +18,52 @@
 
 package org.apache.paimon.data.columnar.heap;
 
+import org.apache.paimon.data.columnar.ColumnVector;
 import org.apache.paimon.data.columnar.ColumnarRow;
 import org.apache.paimon.data.columnar.RowColumnVector;
 import org.apache.paimon.data.columnar.VectorizedColumnBatch;
 import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 
 /** This class represents a nullable heap row column vector. */
-public class HeapRowVector extends AbstractHeapVector
+public class HeapRowVector extends AbstractStructVector
         implements WritableColumnVector, RowColumnVector {
 
-    private WritableColumnVector[] fields;
-
-    public HeapRowVector(int len, WritableColumnVector... fields) {
-        super(len);
-        this.fields = fields;
-    }
-
-    public WritableColumnVector[] getFields() {
-        return fields;
+    public HeapRowVector(int len, ColumnVector... fields) {
+        super(len, fields);
     }
 
     @Override
     public ColumnarRow getRow(int i) {
-        ColumnarRow columnarRow = new ColumnarRow(new VectorizedColumnBatch(fields));
+        ColumnarRow columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
         columnarRow.setRowId(i);
         return columnarRow;
     }
 
     @Override
     public VectorizedColumnBatch getBatch() {
-        return new VectorizedColumnBatch(fields);
+        return new VectorizedColumnBatch(children);
     }
 
     @Override
     public void reset() {
         super.reset();
-        for (WritableColumnVector field : fields) {
-            field.reset();
+        for (ColumnVector field : children) {
+            if (field instanceof WritableColumnVector) {
+                ((WritableColumnVector) field).reset();
+            }
+        }
+    }
+
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        for (ColumnVector field : children) {
+            if (field instanceof WritableColumnVector) {
+                ((WritableColumnVector) field).reserve(newCapacity);
+            }
         }
     }
 
     public void setFields(WritableColumnVector[] fields) {
-        this.fields = fields;
+        System.arraycopy(fields, 0, this.children, 0, fields.length);
     }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java
index 472df6b271c1..c85bc8bb590e 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java
@@ -39,6 +39,13 @@ public HeapShortVector(int len) {
         vector = new short[len];
     }
 
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (vector.length < newCapacity) {
+            vector = Arrays.copyOf(vector, newCapacity);
+        }
+    }
+
     @Override
     public short getShort(int i) {
         if (dictionary == null) {
@@ -57,4 +64,14 @@ public void setShort(int i, short value) {
     public void fill(short value) {
         Arrays.fill(vector, value);
     }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (vector.length != initialCapacity) {
+            vector = new short[initialCapacity];
+        } else {
+            Arrays.fill(vector, (short) 0);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java
index 4730b7a89705..3992f97f2d6f 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java
@@ -28,8 +28,8 @@ public class HeapTimestampVector extends AbstractHeapVector implements WritableT
 
     private static final long serialVersionUID = 1L;
 
-    private final long[] milliseconds;
-    private final int[] nanoOfMilliseconds;
+    private long[] milliseconds;
+    private int[] nanoOfMilliseconds;
 
     public HeapTimestampVector(int len) {
         super(len);
@@ -37,6 +37,14 @@ public HeapTimestampVector(int len) {
         this.nanoOfMilliseconds = new int[len];
     }
 
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (milliseconds.length < newCapacity) {
+            milliseconds = Arrays.copyOf(milliseconds, newCapacity);
+            nanoOfMilliseconds = Arrays.copyOf(nanoOfMilliseconds, newCapacity);
+        }
+    }
+
     @Override
     public Timestamp getTimestamp(int i, int precision) {
         if (dictionary == null) {
@@ -57,4 +65,19 @@ public void fill(Timestamp value) {
         Arrays.fill(milliseconds, value.getMillisecond());
         Arrays.fill(nanoOfMilliseconds, value.getNanoOfMillisecond());
     }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (milliseconds.length != initialCapacity) {
+            milliseconds = new long[initialCapacity];
+        } else {
+            Arrays.fill(milliseconds, 0L);
+        }
+        if (nanoOfMilliseconds.length != initialCapacity) {
+            nanoOfMilliseconds = new int[initialCapacity];
+        } else {
+            Arrays.fill(nanoOfMilliseconds, 0);
+        }
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java
new file mode 100644
index 000000000000..e4efaea73082
--- /dev/null
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java
@@ -0,0 +1,63 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.data.columnar.heap;
+
+import org.apache.paimon.data.InternalArray;
+import org.apache.paimon.data.columnar.ArrayColumnVector;
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.ColumnarArray;
+
+/** Wrap for ArrayColumnVector. */
+public class WrapArrayColumnVector implements ArrayColumnVector {
+
+    private final HeapArrayVector heapArrayVector;
+    private final ColumnVector[] children;
+
+    public WrapArrayColumnVector(HeapArrayVector heapArrayVector, ColumnVector[] children) {
+        this.heapArrayVector = heapArrayVector;
+        this.children = children;
+    }
+
+    @Override
+    public InternalArray getArray(int i) {
+        long offset = heapArrayVector.offsets[i];
+        long length = heapArrayVector.lengths[i];
+        return new ColumnarArray(children[0], (int) offset, (int) length);
+    }
+
+    @Override
+    public ColumnVector getColumnVector() {
+        return children[0];
+    }
+
+    @Override
+    public boolean isNullAt(int i) {
+        return heapArrayVector.isNullAt(i);
+    }
+
+    @Override
+    public int getCapacity() {
+        return heapArrayVector.getCapacity();
+    }
+
+    @Override
+    public ColumnVector[] getChildren() {
+        return children;
+    }
+}
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java
new file mode 100644
index 000000000000..eb0e6fc95187
--- /dev/null
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java
@@ -0,0 +1,58 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.data.columnar.heap;
+
+import org.apache.paimon.data.InternalMap;
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.ColumnarMap;
+import org.apache.paimon.data.columnar.MapColumnVector;
+
+/** Wrap for MapColumnVector. */
+public class WrapMapColumnVector implements MapColumnVector {
+
+    private final HeapMapVector heapMapVector;
+    private final ColumnVector[] children;
+
+    public WrapMapColumnVector(HeapMapVector heapMapVector, ColumnVector[] children) {
+        this.heapMapVector = heapMapVector;
+        this.children = children;
+    }
+
+    @Override
+    public InternalMap getMap(int i) {
+        long offset = heapMapVector.offsets[i];
+        long length = heapMapVector.lengths[i];
+        return new ColumnarMap(children[0], children[1], (int) offset, (int) length);
+    }
+
+    @Override
+    public boolean isNullAt(int i) {
+        return heapMapVector.isNullAt(i);
+    }
+
+    @Override
+    public int getCapacity() {
+        return heapMapVector.getCapacity();
+    }
+
+    @Override
+    public ColumnVector[] getChildren() {
+        return children;
+    }
+}
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
new file mode 100644
index 000000000000..8c89f5399d60
--- /dev/null
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
@@ -0,0 +1,64 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.data.columnar.heap;
+
+import org.apache.paimon.data.InternalRow;
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.ColumnarRow;
+import org.apache.paimon.data.columnar.RowColumnVector;
+import org.apache.paimon.data.columnar.VectorizedColumnBatch;
+
+/** Wrap for RowColumnVector. */
+public class WrapRowColumnVector implements RowColumnVector {
+
+    private final HeapRowVector heapRowVector;
+    private final ColumnVector[] children;
+
+    public WrapRowColumnVector(HeapRowVector heapRowVector, ColumnVector[] children) {
+        this.heapRowVector = heapRowVector;
+        this.children = children;
+    }
+
+    @Override
+    public InternalRow getRow(int i) {
+        ColumnarRow columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
+        columnarRow.setRowId(i);
+        return columnarRow;
+    }
+
+    @Override
+    public VectorizedColumnBatch getBatch() {
+        return new VectorizedColumnBatch(children);
+    }
+
+    @Override
+    public boolean isNullAt(int i) {
+        return heapRowVector.isNullAt(i);
+    }
+
+    @Override
+    public int getCapacity() {
+        return heapRowVector.getCapacity();
+    }
+
+    @Override
+    public ColumnVector[] getChildren() {
+        return children;
+    }
+}
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java
index 17ee4ad6a722..cd17f6545906 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java
@@ -31,14 +31,28 @@ public abstract class AbstractWritableVector implements WritableColumnVector, Se
 
     private static final long serialVersionUID = 1L;
 
+    protected final int initialCapacity;
+
     // If the whole column vector has no nulls, this is true, otherwise false.
     protected boolean noNulls = true;
 
+    protected boolean isAllNull = false;
+
+    /** Current write cursor (row index) when appending data. */
+    protected int elementsAppended;
+
+    protected int capacity;
+
     /**
      * The Dictionary for this column. If it's not null, will be used to decode the value in get().
      */
     protected Dictionary dictionary;
 
+    public AbstractWritableVector(int capacity) {
+        this.capacity = capacity;
+        this.initialCapacity = capacity;
+    }
+
     /** Update the dictionary. */
     @Override
     public void setDictionary(Dictionary dictionary) {
@@ -48,6 +62,64 @@ public void setDictionary(Dictionary dictionary) {
     /** Returns true if this column has a dictionary. */
     @Override
     public boolean hasDictionary() {
-        return this.dictionary != null;
+        return dictionary != null;
+    }
+
+    @Override
+    public void setAllNull() {
+        isAllNull = true;
+        noNulls = false;
+    }
+
+    @Override
+    public boolean isAllNull() {
+        return isAllNull;
+    }
+
+    @Override
+    public int getElementsAppended() {
+        return elementsAppended;
+    }
+
+    /** Increment number of elements appended by 'num'. */
+    @Override
+    public final void addElementsAppended(int num) {
+        elementsAppended += num;
+    }
+
+    @Override
+    public int getCapacity() {
+        return this.capacity;
     }
+
+    @Override
+    public void reset() {
+        noNulls = true;
+        isAllNull = false;
+        elementsAppended = 0;
+        capacity = initialCapacity;
+    }
+
+    @Override
+    public void reserve(int requiredCapacity) {
+        if (requiredCapacity < 0) {
+            throw new IllegalArgumentException("Invalid capacity: " + requiredCapacity);
+        } else if (requiredCapacity > capacity) {
+            int newCapacity = (int) Math.min(Integer.MAX_VALUE, requiredCapacity * 2L);
+            if (requiredCapacity <= newCapacity) {
+                try {
+                    reserveInternal(newCapacity);
+                } catch (OutOfMemoryError outOfMemoryError) {
+                    throw new RuntimeException(
+                            "Failed to allocate memory for vector", outOfMemoryError);
+                }
+            } else {
+                throw new UnsupportedOperationException(
+                        "Cannot allocate :" + newCapacity + " elements");
+            }
+            capacity = newCapacity;
+        }
+    }
+
+    protected abstract void reserveInternal(int newCapacity);
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBooleanVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBooleanVector.java
index 23b24aac9aca..558da35b01ee 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBooleanVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBooleanVector.java
@@ -26,6 +26,12 @@ public interface WritableBooleanVector extends WritableColumnVector, BooleanColu
     /** Set boolean at rowId with the provided value. */
     void setBoolean(int rowId, boolean value);
 
+    void setBooleans(int rowId, int count, boolean value);
+
+    void setBooleans(int rowId, int count, byte src, int srcIndex);
+
+    void setBooleans(int rowId, byte src);
+
     /** Fill the column vector with the provided value. */
     void fill(boolean value);
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBytesVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBytesVector.java
index 3b850df060d5..6cba184835f3 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBytesVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableBytesVector.java
@@ -27,7 +27,7 @@ public interface WritableBytesVector extends WritableColumnVector, BytesColumnVe
      * Append byte[] at rowId with the provided value. Note: Must append values according to the
      * order of rowId, can not random append.
      */
-    void appendBytes(int rowId, byte[] value, int offset, int length);
+    void putByteArray(int rowId, byte[] value, int offset, int length);
 
     /** Fill the column vector with the provided value. */
     void fill(byte[] value);
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableColumnVector.java
index e66b2562549d..5dff02ae1180 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableColumnVector.java
@@ -51,4 +51,20 @@ public interface WritableColumnVector extends ColumnVector {
 
     /** Get reserved dictionary ids. */
     WritableIntVector getDictionaryIds();
+
+    /** Set all values to null. */
+    void setAllNull();
+
+    /** Check if all values are null. */
+    boolean isAllNull();
+
+    void reserve(int capacity);
+
+    int getElementsAppended();
+
+    void addElementsAppended(int num);
+
+    default void reserveAdditional(int additionalCapacity) {
+        reserve(getElementsAppended() + additionalCapacity);
+    }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
index 5081401d928f..763453aa04d6 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
@@ -46,4 +46,8 @@ public interface WritableIntVector extends WritableColumnVector, IntColumnVector
 
     /** Fill the column vector with the provided value. */
     void fill(int value);
+
+    int appendInt(int v);
+
+    int appendInts(int count, int v);
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/utils/VectorMappingUtils.java b/paimon-common/src/main/java/org/apache/paimon/utils/VectorMappingUtils.java
index dc8a910dd692..6a95c852e0d8 100644
--- a/paimon-common/src/main/java/org/apache/paimon/utils/VectorMappingUtils.java
+++ b/paimon-common/src/main/java/org/apache/paimon/utils/VectorMappingUtils.java
@@ -360,18 +360,6 @@ public InternalMap getMap(int i) {
                 public boolean isNullAt(int i) {
                     return partition.isNullAt(index);
                 }
-
-                @Override
-                public ColumnVector getKeyColumnVector() {
-                    throw new UnsupportedOperationException(
-                            "Doesn't support getting key ColumnVector.");
-                }
-
-                @Override
-                public ColumnVector getValueColumnVector() {
-                    throw new UnsupportedOperationException(
-                            "Doesn't support getting value ColumnVector.");
-                }
             };
         }
 
@@ -387,18 +375,6 @@ public InternalMap getMap(int i) {
                 public boolean isNullAt(int i) {
                     return partition.isNullAt(index);
                 }
-
-                @Override
-                public ColumnVector getKeyColumnVector() {
-                    throw new UnsupportedOperationException(
-                            "Doesn't support getting key ColumnVector.");
-                }
-
-                @Override
-                public ColumnVector getValueColumnVector() {
-                    throw new UnsupportedOperationException(
-                            "Doesn't support getting value ColumnVector.");
-                }
             };
         }
 
diff --git a/paimon-common/src/test/java/org/apache/paimon/format/FormatReadWriteTest.java b/paimon-common/src/test/java/org/apache/paimon/format/FormatReadWriteTest.java
index 717439072c59..632be0cf5938 100644
--- a/paimon-common/src/test/java/org/apache/paimon/format/FormatReadWriteTest.java
+++ b/paimon-common/src/test/java/org/apache/paimon/format/FormatReadWriteTest.java
@@ -125,8 +125,9 @@ public void testFullTypes() throws IOException {
                 format.createReaderFactory(rowType)
                         .createReader(
                                 new FormatReaderContext(fileIO, file, fileIO.getFileSize(file)));
+        InternalRowSerializer internalRowSerializer = new InternalRowSerializer(rowType);
         List<InternalRow> result = new ArrayList<>();
-        reader.forEachRemaining(result::add);
+        reader.forEachRemaining(row -> result.add(internalRowSerializer.copy(row)));
         assertThat(result.size()).isEqualTo(1);
 
         validateFullTypesResult(result.get(0), expected);
@@ -351,56 +352,52 @@ private Object[] getMapValueData() {
     }
 
     private void validateFullTypesResult(InternalRow actual, InternalRow expected) {
-        if (formatType.equals("avro")) {
-            assertThat(actual).isEqualTo(expected);
-        } else {
-            RowType rowType = rowTypeForFullTypesTest();
-            InternalRow.FieldGetter[] fieldGetters = rowType.fieldGetters();
-            for (int i = 0; i < fieldGetters.length; i++) {
-                String name = rowType.getFieldNames().get(i);
-                Object actualField = fieldGetters[i].getFieldOrNull(actual);
-                Object expectedField = fieldGetters[i].getFieldOrNull(expected);
-                switch (name) {
-                    case "locations":
-                        validateInternalMap(
-                                (InternalMap) actualField,
-                                (InternalMap) expectedField,
-                                DataTypes.STRING());
-                        break;
-                    case "nonStrKeyMap":
-                        validateInternalMap(
-                                (InternalMap) actualField,
-                                (InternalMap) expectedField,
-                                DataTypes.INT());
-                        break;
-                    case "strArray":
-                        validateInternalArray(
-                                (InternalArray) actualField,
-                                (InternalArray) expectedField,
-                                DataTypes.STRING());
-                        break;
-                    case "intArray":
-                        validateInternalArray(
-                                (InternalArray) actualField,
-                                (InternalArray) expectedField,
-                                DataTypes.INT());
-                        break;
-                    case "rowArray":
-                        validateInternalArray(
-                                (InternalArray) actualField,
-                                (InternalArray) expectedField,
-                                ((ArrayType)
-                                                rowType.getFields().stream()
-                                                        .filter(f -> f.name().equals("rowArray"))
-                                                        .findAny()
-                                                        .get()
-                                                        .type())
-                                        .getElementType());
-                        break;
-                    default:
-                        assertThat(actualField).isEqualTo(expectedField);
-                        break;
-                }
+        RowType rowType = rowTypeForFullTypesTest();
+        InternalRow.FieldGetter[] fieldGetters = rowType.fieldGetters();
+        for (int i = 0; i < fieldGetters.length; i++) {
+            String name = rowType.getFieldNames().get(i);
+            Object actualField = fieldGetters[i].getFieldOrNull(actual);
+            Object expectedField = fieldGetters[i].getFieldOrNull(expected);
+            switch (name) {
+                case "locations":
+                    validateInternalMap(
+                            (InternalMap) actualField,
+                            (InternalMap) expectedField,
+                            DataTypes.STRING());
+                    break;
+                case "nonStrKeyMap":
+                    validateInternalMap(
+                            (InternalMap) actualField,
+                            (InternalMap) expectedField,
+                            DataTypes.INT());
+                    break;
+                case "strArray":
+                    validateInternalArray(
+                            (InternalArray) actualField,
+                            (InternalArray) expectedField,
+                            DataTypes.STRING());
+                    break;
+                case "intArray":
+                    validateInternalArray(
+                            (InternalArray) actualField,
+                            (InternalArray) expectedField,
+                            DataTypes.INT());
+                    break;
+                case "rowArray":
+                    validateInternalArray(
+                            (InternalArray) actualField,
+                            (InternalArray) expectedField,
+                            ((ArrayType)
+                                            rowType.getFields().stream()
+                                                    .filter(f -> f.name().equals("rowArray"))
+                                                    .findAny()
+                                                    .get()
+                                                    .type())
+                                    .getElementType());
+                    break;
+                default:
+                    assertThat(actualField).isEqualTo(expectedField);
+                    break;
             }
         }
     }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/orc/reader/OrcMapColumnVector.java b/paimon-format/src/main/java/org/apache/paimon/format/orc/reader/OrcMapColumnVector.java
index c7245275fdd2..79d5ef88880a 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/orc/reader/OrcMapColumnVector.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/orc/reader/OrcMapColumnVector.java
@@ -52,12 +52,7 @@ public InternalMap getMap(int i) {
     }
 
     @Override
-    public ColumnVector getKeyColumnVector() {
-        return keyPaimonVector;
-    }
-
-    @Override
-    public ColumnVector getValueColumnVector() {
-        return valuePaimonVector;
+    public ColumnVector[] getChildren() {
+        return new ColumnVector[] {keyPaimonVector, valuePaimonVector};
     }
 }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
index bd1ea5f8ca2a..2babe40213b9 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
@@ -27,9 +27,9 @@
 import org.apache.paimon.data.columnar.RowColumnVector;
 import org.apache.paimon.data.columnar.VectorizedColumnBatch;
 import org.apache.paimon.data.columnar.VectorizedRowIterator;
-import org.apache.paimon.data.columnar.heap.ElementCountable;
 import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 import org.apache.paimon.format.FormatReaderFactory;
+import org.apache.paimon.format.parquet.newreader.VectorizedParquetRecordReader;
 import org.apache.paimon.format.parquet.reader.ColumnReader;
 import org.apache.paimon.format.parquet.reader.ParquetDecimalVector;
 import org.apache.paimon.format.parquet.reader.ParquetReadState;
@@ -104,8 +104,7 @@ public ParquetReaderFactory(
         this.filter = filter;
     }
 
-    @Override
-    public FileRecordReader<InternalRow> createReader(FormatReaderFactory.Context context)
+    public FileRecordReader<InternalRow> createReaderOld(FormatReaderFactory.Context context)
             throws IOException {
         ParquetReadOptions.Builder builder =
                 ParquetReadOptions.builder().withRange(0, context.fileSize());
@@ -132,6 +131,36 @@ public FileRecordReader<InternalRow> createReader(FormatReaderFactory.Context co
                 reader, requestedSchema, reader.getFilteredRecordCount(), poolOfBatches, fields);
     }
 
+    @Override
+    public FileRecordReader<InternalRow> createReader(FormatReaderFactory.Context context)
+            throws IOException {
+        if (Boolean.parseBoolean(conf.getString("parquet.use-old-reader", "false"))) {
+            return createReaderOld(context);
+        }
+
+        ParquetReadOptions.Builder builder =
+                ParquetReadOptions.builder().withRange(0, context.fileSize());
+        setReadOptions(builder);
+
+        ParquetFileReader reader =
+                new ParquetFileReader(
+                        ParquetInputFile.fromPath(context.fileIO(), context.filePath()),
+                        builder.build(),
+                        context.selection());
+        MessageType fileSchema = reader.getFileMetaData().getSchema();
+        MessageType requestedSchema = clipParquetSchema(fileSchema);
+        reader.setRequestedSchema(requestedSchema);
+        WritableColumnVector[] writableVectors = createWritableVectors(requestedSchema);
+        createVectorizedColumnBatch(writableVectors);
+
+        MessageColumnIO columnIO = new ColumnIOFactory().getColumnIO(requestedSchema);
+        List<ParquetField> fields =
+                buildFieldsList(projectedType.getFields(), projectedType.getFieldNames(), columnIO);
+
+        return new VectorizedParquetRecordReader(
+                context.filePath(), reader, fileSchema, fields, writableVectors, batchSize);
+    }
+
     private void setReadOptions(ParquetReadOptions.Builder builder) {
         builder.useSignedStringMinMax(
                 conf.getBoolean("parquet.strings.signed-min-max.enabled", false));
@@ -288,10 +317,7 @@ private VectorizedColumnBatch createVectorizedColumnBatch(
         for (int i = 0; i < writableVectors.length; i++) {
             switch (readFields[i].type().getTypeRoot()) {
                 case DECIMAL:
-                    vectors[i] =
-                            new ParquetDecimalVector(
-                                    writableVectors[i],
-                                    ((ElementCountable) writableVectors[i]).getLen());
+                    vectors[i] = new ParquetDecimalVector(writableVectors[i]);
                     break;
                 case TIMESTAMP_WITHOUT_TIME_ZONE:
                 case TIMESTAMP_WITH_LOCAL_TIME_ZONE:
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ColumnarBatch.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ColumnarBatch.java
new file mode 100644
index 000000000000..5d8ac0978962
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ColumnarBatch.java
@@ -0,0 +1,55 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.ColumnarRow;
+import org.apache.paimon.data.columnar.VectorizedColumnBatch;
+import org.apache.paimon.data.columnar.VectorizedRowIterator;
+import org.apache.paimon.fs.Path;
+
+/** A batch of rows in columnar format. */
+public class ColumnarBatch {
+    protected final ColumnVector[] columns;
+
+    protected final VectorizedColumnBatch vectorizedColumnBatch;
+    protected final VectorizedRowIterator vectorizedRowIterator;
+
+    public ColumnarBatch(Path filePath, ColumnVector[] columns) {
+        this.columns = columns;
+        this.vectorizedColumnBatch = new VectorizedColumnBatch(columns);
+        this.vectorizedRowIterator =
+                new VectorizedRowIterator(filePath, new ColumnarRow(vectorizedColumnBatch), null);
+    }
+
+    /** Reset next record position and return self. */
+    public void resetPositions(long[] positions) {
+        vectorizedRowIterator.reset(positions);
+    }
+
+    /** Sets the number of rows in this batch. */
+    public void setNumRows(int numRows) {
+        this.vectorizedColumnBatch.setNumRows(numRows);
+    }
+
+    /** Returns the column at `ordinal`. */
+    public ColumnVector column(int ordinal) {
+        return columns[ordinal];
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
new file mode 100644
index 000000000000..b633e5870a8d
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
@@ -0,0 +1,374 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.heap.AbstractStructVector;
+import org.apache.paimon.data.columnar.heap.HeapIntVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.format.parquet.type.ParquetField;
+import org.apache.paimon.format.parquet.type.ParquetGroupField;
+import org.apache.paimon.types.DataTypeRoot;
+import org.apache.paimon.utils.Preconditions;
+
+import java.util.ArrayList;
+import java.util.List;
+import java.util.Set;
+
+/** Parquet Column tree. */
+public class ParquetColumnVector {
+    private final ParquetField column;
+    private final List<ParquetColumnVector> children;
+    private final WritableColumnVector vector;
+
+    /**
+     * Repetition & Definition levels These are allocated only for leaf columns; for non-leaf
+     * columns, they simply maintain references to that of the former.
+     */
+    private HeapIntVector repetitionLevels;
+
+    private HeapIntVector definitionLevels;
+
+    /** Whether this column is primitive (i.e., leaf column). */
+    private final boolean isPrimitive;
+
+    /** Reader for this column - only set if 'isPrimitive' is true. */
+    private VectorizedColumnReader columnReader;
+
+    ParquetColumnVector(
+            ParquetField column,
+            WritableColumnVector vector,
+            int capacity,
+            Set<ParquetField> missingColumns,
+            boolean isTopLevel) {
+        this.column = column;
+        this.vector = vector;
+        this.children = new ArrayList<>();
+        this.isPrimitive = column.isPrimitive();
+
+        if (missingColumns.contains(column)) {
+            vector.setAllNull();
+            return;
+        }
+
+        if (isPrimitive) {
+            if (column.getRepetitionLevel() > 0) {
+                repetitionLevels = new HeapIntVector(capacity);
+            }
+            // We don't need to create and store definition levels if the column is top-level.
+            if (!isTopLevel) {
+                definitionLevels = new HeapIntVector(capacity);
+            }
+        } else {
+            ParquetGroupField groupField = (ParquetGroupField) column;
+            Preconditions.checkArgument(
+                    groupField.getChildren().size() == vector.getChildren().length);
+            boolean allChildrenAreMissing = true;
+
+            for (int i = 0; i < groupField.getChildren().size(); i++) {
+                ParquetColumnVector childCv =
+                        new ParquetColumnVector(
+                                groupField.getChildren().get(i),
+                                (WritableColumnVector) vector.getChildren()[i],
+                                capacity,
+                                missingColumns,
+                                false);
+                children.add(childCv);
+
+                // Only use levels from non-missing child, this can happen if only some but not all
+                // fields of a struct are missing.
+                if (!childCv.vector.isAllNull()) {
+                    allChildrenAreMissing = false;
+                    this.repetitionLevels = childCv.repetitionLevels;
+                    this.definitionLevels = childCv.definitionLevels;
+                }
+            }
+
+            // This can happen if all the fields of a struct are missing, in which case we should
+            // mark
+            // the struct itself as a missing column
+            if (allChildrenAreMissing) {
+                vector.setAllNull();
+            }
+        }
+    }
+
+    /** Returns all the children of this column. */
+    List<ParquetColumnVector> getChildren() {
+        return children;
+    }
+
+    /** Returns all the leaf columns in depth-first order. */
+    List<ParquetColumnVector> getLeaves() {
+        List<ParquetColumnVector> result = new ArrayList<>();
+        getLeavesHelper(this, result);
+        return result;
+    }
+
+    private static void getLeavesHelper(
+            ParquetColumnVector vector, List<ParquetColumnVector> coll) {
+        if (vector.isPrimitive) {
+            coll.add(vector);
+        } else {
+            for (ParquetColumnVector child : vector.children) {
+                getLeavesHelper(child, coll);
+            }
+        }
+    }
+
+    /**
+     * Assembles this column and calculate collection offsets recursively. This is a no-op for
+     * primitive columns.
+     */
+    void assemble() {
+        // nothing to do if the column itself is missing
+        if (vector.isAllNull()) {
+            return;
+        }
+
+        DataTypeRoot type = column.getType().getTypeRoot();
+        if (type == DataTypeRoot.ARRAY
+                || type == DataTypeRoot.MAP
+                || type == DataTypeRoot.MULTISET) {
+            for (ParquetColumnVector child : children) {
+                child.assemble();
+            }
+            assembleCollection();
+        } else if (type == DataTypeRoot.ROW || type == DataTypeRoot.VARIANT) {
+            for (ParquetColumnVector child : children) {
+                child.assemble();
+            }
+            assembleStruct();
+        }
+    }
+
+    /**
+     * Resets this Parquet column vector, which includes resetting all the writable column vectors
+     * (used to store values, definition levels, and repetition levels) for this and all its
+     * children.
+     */
+    void reset() {
+        // nothing to do if the column itself is missing
+        if (vector.isAllNull()) {
+            return;
+        }
+
+        vector.reset();
+        if (repetitionLevels != null) {
+            repetitionLevels.reset();
+        }
+        if (definitionLevels != null) {
+            definitionLevels.reset();
+        }
+        for (ParquetColumnVector child : children) {
+            child.reset();
+        }
+    }
+
+    /** Returns the {@link ParquetField} of this column vector. */
+    ParquetField getColumn() {
+        return this.column;
+    }
+
+    /** Returns the writable column vector used to store values. */
+    WritableColumnVector getValueVector() {
+        return this.vector;
+    }
+
+    /** Returns the writable column vector used to store repetition levels. */
+    WritableIntVector getRepetitionLevelVector() {
+        return this.repetitionLevels;
+    }
+
+    /** Returns the writable column vector used to store definition levels. */
+    WritableIntVector getDefinitionLevelVector() {
+        return this.definitionLevels;
+    }
+
+    /** Returns the column reader for reading a Parquet column. */
+    VectorizedColumnReader getColumnReader() {
+        return this.columnReader;
+    }
+
+    /**
+     * Sets the column vector to 'reader'. Note this can only be called on a primitive Parquet
+     * column.
+     */
+    void setColumnReader(VectorizedColumnReader reader) {
+        if (!isPrimitive) {
+            throw new IllegalStateException("Can't set reader for non-primitive column");
+        }
+        this.columnReader = reader;
+    }
+
+    /** Assemble collections, e.g., array, map. */
+    private void assembleCollection() {
+        int maxDefinitionLevel = column.getDefinitionLevel();
+        int maxElementRepetitionLevel = column.getRepetitionLevel();
+
+        AbstractStructVector arrayVector = (AbstractStructVector) vector;
+
+        // There are 4 cases when calculating definition levels:
+        //   1. definitionLevel == maxDefinitionLevel
+        //     ==> value is defined and not null
+        //   2. definitionLevel == maxDefinitionLevel - 1
+        //     ==> value is null
+        //   3. definitionLevel < maxDefinitionLevel - 1
+        //     ==> value doesn't exist since one of its optional parents is null
+        //   4. definitionLevel > maxDefinitionLevel
+        //     ==> value is a nested element within an array or map
+        //
+        // `i` is the index over all leaf elements of this array, while `offset` is the index over
+        // all top-level elements of this array.
+        int rowId = 0;
+        for (int i = 0, offset = 0;
+                i < definitionLevels.getElementsAppended();
+                i = getNextCollectionStart(maxElementRepetitionLevel, i)) {
+            arrayVector.reserve(rowId + 1);
+            int definitionLevel = definitionLevels.getInt(i);
+            if (definitionLevel <= maxDefinitionLevel) {
+                // This means the value is not an array element, but a collection that is either
+                // null or
+                // empty. In this case, we should increase offset to skip it when returning an array
+                // starting from the offset.
+                //
+                // For instance, considering an array of strings with 3 elements like the following:
+                //  null, [], [a, b, c]
+                // the child array (which is of String type) in this case will be:
+                //  null:   1 1 0 0 0
+                //  length: 0 0 1 1 1
+                //  offset: 0 0 0 1 2
+                // and the array itself will be:
+                //  null:   1 0 0
+                //  length: 0 0 3
+                //  offset: 0 1 2
+                //
+                // It's important that for the third element `[a, b, c]`, the offset in the array
+                // (not the elements) starts from 2 since otherwise we'd include the first & second
+                // null
+                // element from child array in the result.
+                offset += 1;
+            }
+            if (definitionLevel <= maxDefinitionLevel - 1) {
+                // Collection is null or one of its optional parents is null
+                arrayVector.setNullAt(rowId++);
+            } else if (definitionLevel == maxDefinitionLevel) {
+                arrayVector.putOffsetLength(rowId, offset, 0);
+                rowId++;
+            } else if (definitionLevel > maxDefinitionLevel) {
+                int length = getCollectionSize(maxElementRepetitionLevel, i);
+                arrayVector.putOffsetLength(rowId, offset, length);
+                offset += length;
+                rowId++;
+            }
+        }
+        vector.addElementsAppended(rowId);
+    }
+
+    private void assembleStruct() {
+        int maxRepetitionLevel = column.getRepetitionLevel();
+        int maxDefinitionLevel = column.getDefinitionLevel();
+
+        vector.reserve(definitionLevels.getElementsAppended());
+
+        int rowId = 0;
+        boolean hasRepetitionLevels =
+                repetitionLevels != null && repetitionLevels.getElementsAppended() > 0;
+        for (int i = 0; i < definitionLevels.getElementsAppended(); i++) {
+            // If repetition level > maxRepetitionLevel, the value is a nested element (e.g., an
+            // array
+            // element in struct<array<int>>), and we should skip the definition level since it
+            // doesn't
+            // represent with the struct.
+            if (!hasRepetitionLevels || repetitionLevels.getInt(i) <= maxRepetitionLevel) {
+                if (definitionLevels.getInt(i) <= maxDefinitionLevel - 1) {
+                    // Struct is null
+                    vector.setNullAt(rowId);
+                    rowId++;
+                } else if (definitionLevels.getInt(i) >= maxDefinitionLevel) {
+                    rowId++;
+                }
+            }
+        }
+        vector.addElementsAppended(rowId);
+    }
+
+    /**
+     * For a collection (i.e., array or map) element at index 'idx', returns the starting index of
+     * the next collection after it.
+     *
+     * @param maxRepetitionLevel the maximum repetition level for the elements in this collection
+     * @param idx the index of this collection in the Parquet column
+     * @return the starting index of the next collection
+     */
+    private int getNextCollectionStart(int maxRepetitionLevel, int idx) {
+        idx += 1;
+        for (; idx < repetitionLevels.getElementsAppended(); idx++) {
+            if (repetitionLevels.getInt(idx) <= maxRepetitionLevel) {
+                break;
+            }
+        }
+        return idx;
+    }
+
+    /**
+     * Gets the size of a collection (i.e., array or map) element, starting at 'idx'.
+     *
+     * @param maxRepetitionLevel the maximum repetition level for the elements in this collection
+     * @param idx the index of this collection in the Parquet column
+     * @return the size of this collection
+     */
+    private int getCollectionSize(int maxRepetitionLevel, int idx) {
+        int size = 1;
+        for (idx += 1; idx < repetitionLevels.getElementsAppended(); idx++) {
+            if (repetitionLevels.getInt(idx) <= maxRepetitionLevel) {
+                break;
+            } else if (repetitionLevels.getInt(idx) <= maxRepetitionLevel + 1) {
+                // Only count elements which belong to the current collection
+                // For instance, suppose we have the following Parquet schema:
+                //
+                // message schema {                        max rl   max dl
+                //   optional group col (LIST) {              0        1
+                //     repeated group list {                  1        2
+                //       optional group element (LIST) {      1        3
+                //         repeated group list {              2        4
+                //           required int32 element;          2        4
+                //         }
+                //       }
+                //     }
+                //   }
+                // }
+                //
+                // For a list such as: [[[0, 1], [2, 3]], [[4, 5], [6, 7]]], the repetition &
+                // definition
+                // levels would be:
+                //
+                // repetition levels: [0, 2, 1, 2, 0, 2, 1, 2]
+                // definition levels: [2, 2, 2, 2, 2, 2, 2, 2]
+                //
+                // When calculating collection size for the outer array, we should only count
+                // repetition
+                // levels whose value is <= 1 (which is the max repetition level for the inner
+                // array)
+                size++;
+            }
+        }
+        return size;
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java
new file mode 100644
index 000000000000..1f40391ef3a7
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java
@@ -0,0 +1,179 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.parquet.column.ColumnDescriptor;
+
+import java.util.ArrayList;
+import java.util.Iterator;
+import java.util.List;
+import java.util.PrimitiveIterator;
+
+/** Helper class to store intermediate state while reading a Parquet column chunk. */
+public final class ParquetReadState {
+    /** A special row range used when there is no row indexes (hence all rows must be included). */
+    private static final RowRange MAX_ROW_RANGE = new RowRange(Long.MIN_VALUE, Long.MAX_VALUE);
+
+    /**
+     * A special row range used when the row indexes are present AND all the row ranges have been
+     * processed. This serves as a sentinel at the end indicating that all rows come after the last
+     * row range should be skipped.
+     */
+    private static final RowRange END_ROW_RANGE = new RowRange(Long.MAX_VALUE, Long.MIN_VALUE);
+
+    /** Iterator over all row ranges, only not-null if column index is present. */
+    private final Iterator<RowRange> rowRanges;
+
+    /** The current row range. */
+    private RowRange currentRange;
+
+    /** Maximum repetition level for the Parquet column. */
+    final int maxRepetitionLevel;
+
+    /** Maximum definition level for the Parquet column. */
+    final int maxDefinitionLevel;
+
+    /** Whether this column is required. */
+    final boolean isRequired;
+
+    /**
+     * The current index over all rows within the column chunk. This is used to check if the current
+     * row should be skipped by comparing against the row ranges.
+     */
+    long rowId;
+
+    /** The offset in the current batch to put the next value in value vector. */
+    int valueOffset;
+
+    /** The offset in the current batch to put the next value in repetition & definition vector. */
+    int levelOffset;
+
+    /** The remaining number of values to read in the current page. */
+    int valuesToReadInPage;
+
+    /** The remaining number of rows to read in the current batch. */
+    int rowsToReadInBatch;
+
+    /* The following fields are only used when reading repeated values. */
+
+    /**
+     * When processing repeated values, whether we've found the beginning of the first list after
+     * the current batch.
+     */
+    boolean lastListCompleted;
+
+    /** When processing repeated types, the number of accumulated definition levels to process. */
+    int numBatchedDefLevels;
+
+    /**
+     * When processing repeated types, whether we should skip the current batch of definition
+     * levels.
+     */
+    boolean shouldSkip;
+
+    ParquetReadState(
+            ColumnDescriptor descriptor, boolean isRequired, PrimitiveIterator.OfLong rowIndexes) {
+        this.maxRepetitionLevel = descriptor.getMaxRepetitionLevel();
+        this.maxDefinitionLevel = descriptor.getMaxDefinitionLevel();
+        this.isRequired = isRequired;
+        this.rowRanges = constructRanges(rowIndexes);
+        nextRange();
+    }
+
+    /**
+     * Construct a list of row ranges from the given `rowIndexes`. For example, suppose the
+     * `rowIndexes` are `[0, 1, 2, 4, 5, 7, 8, 9]`, it will be converted into 3 row ranges: `[0-2],
+     * [4-5], [7-9]`.
+     */
+    private Iterator<RowRange> constructRanges(PrimitiveIterator.OfLong rowIndexes) {
+        if (rowIndexes == null) {
+            return null;
+        }
+
+        List<RowRange> rowRanges = new ArrayList<>();
+        long currentStart = Long.MIN_VALUE;
+        long previous = Long.MIN_VALUE;
+
+        while (rowIndexes.hasNext()) {
+            long idx = rowIndexes.nextLong();
+            if (currentStart == Long.MIN_VALUE) {
+                currentStart = idx;
+            } else if (previous + 1 != idx) {
+                RowRange range = new RowRange(currentStart, previous);
+                rowRanges.add(range);
+                currentStart = idx;
+            }
+            previous = idx;
+        }
+
+        if (previous != Long.MIN_VALUE) {
+            rowRanges.add(new RowRange(currentStart, previous));
+        }
+
+        return rowRanges.iterator();
+    }
+
+    /** Must be called at the beginning of reading a new batch. */
+    void resetForNewBatch(int batchSize) {
+        this.valueOffset = 0;
+        this.levelOffset = 0;
+        this.rowsToReadInBatch = batchSize;
+        this.lastListCompleted =
+                this.maxRepetitionLevel == 0; // always true for non-repeated column
+        this.numBatchedDefLevels = 0;
+        this.shouldSkip = false;
+    }
+
+    /** Must be called at the beginning of reading a new page. */
+    void resetForNewPage(int totalValuesInPage, long pageFirstRowIndex) {
+        this.valuesToReadInPage = totalValuesInPage;
+        this.rowId = pageFirstRowIndex;
+    }
+
+    /** Returns the start index of the current row range. */
+    long currentRangeStart() {
+        return currentRange.start;
+    }
+
+    /** Returns the end index of the current row range. */
+    long currentRangeEnd() {
+        return currentRange.end;
+    }
+
+    /** Advance to the next range. */
+    void nextRange() {
+        if (rowRanges == null) {
+            currentRange = MAX_ROW_RANGE;
+        } else if (!rowRanges.hasNext()) {
+            currentRange = END_ROW_RANGE;
+        } else {
+            currentRange = rowRanges.next();
+        }
+    }
+
+    private static class RowRange {
+        private final long start;
+        private final long end;
+
+        public RowRange(long start, long end) {
+            this.start = start;
+            this.end = end;
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java
new file mode 100644
index 000000000000..1896164cfd27
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java
@@ -0,0 +1,94 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+
+import org.apache.parquet.column.Dictionary;
+
+/**
+ * Interface to update a vector with values read from a Parquet file.
+ *
+ * @param <T> type of the vector to update
+ */
+public interface ParquetVectorUpdater<T extends WritableColumnVector> {
+    /**
+     * Read a batch of `total` values from `valuesReader` into `values`, starting from `offset`.
+     *
+     * @param total total number of values to read
+     * @param offset starting offset in `values`
+     * @param values destination values vector
+     * @param valuesReader reader to read values from
+     */
+    void readValues(int total, int offset, T values, VectorizedValuesReader valuesReader);
+
+    /**
+     * Skip a batch of `total` values from `valuesReader`.
+     *
+     * @param total total number of values to skip
+     * @param valuesReader reader to skip values from
+     */
+    void skipValues(int total, VectorizedValuesReader valuesReader);
+
+    /**
+     * Read a single value from `valuesReader` into `values`, at `offset`.
+     *
+     * @param offset offset in `values` to put the new value
+     * @param values destination value vector
+     * @param valuesReader reader to read values from
+     */
+    void readValue(int offset, T values, VectorizedValuesReader valuesReader);
+
+    /**
+     * Process a batch of `total` values starting from `offset` in `values`, whose null slots should
+     * have already been filled, and fills the non-null slots using dictionary IDs from
+     * `dictionaryIds`, together with Parquet `dictionary`.
+     *
+     * @param total total number slots to process in `values`
+     * @param offset starting offset in `values`
+     * @param values destination value vector
+     * @param dictionaryIds vector storing the dictionary IDs
+     * @param dictionary Parquet dictionary used to decode a dictionary ID to its value
+     */
+    default void decodeDictionaryIds(
+            int total,
+            int offset,
+            T values,
+            WritableIntVector dictionaryIds,
+            Dictionary dictionary) {
+        for (int i = offset; i < offset + total; i++) {
+            if (!values.isNullAt(i)) {
+                decodeSingleDictionaryId(i, values, dictionaryIds, dictionary);
+            }
+        }
+    }
+
+    /**
+     * Decode a single dictionary ID from `dictionaryIds` into `values` at `offset`, using
+     * `dictionary`.
+     *
+     * @param offset offset in `values` to put the decoded value
+     * @param values destination value vector
+     * @param dictionaryIds vector storing the dictionary IDs
+     * @param dictionary Parquet dictionary used to decode a dictionary ID to its value
+     */
+    void decodeSingleDictionaryId(
+            int offset, T values, WritableIntVector dictionaryIds, Dictionary dictionary);
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java
new file mode 100644
index 000000000000..88eebd30c4e0
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java
@@ -0,0 +1,807 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.Timestamp;
+import org.apache.paimon.data.columnar.heap.HeapIntVector;
+import org.apache.paimon.data.columnar.writable.WritableBooleanVector;
+import org.apache.paimon.data.columnar.writable.WritableByteVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableDoubleVector;
+import org.apache.paimon.data.columnar.writable.WritableFloatVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.data.columnar.writable.WritableLongVector;
+import org.apache.paimon.data.columnar.writable.WritableShortVector;
+import org.apache.paimon.data.columnar.writable.WritableTimestampVector;
+import org.apache.paimon.format.parquet.ParquetSchemaConverter;
+import org.apache.paimon.types.ArrayType;
+import org.apache.paimon.types.BigIntType;
+import org.apache.paimon.types.BinaryType;
+import org.apache.paimon.types.BooleanType;
+import org.apache.paimon.types.CharType;
+import org.apache.paimon.types.DataType;
+import org.apache.paimon.types.DataTypeVisitor;
+import org.apache.paimon.types.DateType;
+import org.apache.paimon.types.DecimalType;
+import org.apache.paimon.types.DoubleType;
+import org.apache.paimon.types.FloatType;
+import org.apache.paimon.types.IntType;
+import org.apache.paimon.types.LocalZonedTimestampType;
+import org.apache.paimon.types.MapType;
+import org.apache.paimon.types.MultisetType;
+import org.apache.paimon.types.RowType;
+import org.apache.paimon.types.SmallIntType;
+import org.apache.paimon.types.TimeType;
+import org.apache.paimon.types.TimestampType;
+import org.apache.paimon.types.TinyIntType;
+import org.apache.paimon.types.VarBinaryType;
+import org.apache.paimon.types.VarCharType;
+import org.apache.paimon.types.VariantType;
+
+import org.apache.parquet.column.ColumnDescriptor;
+import org.apache.parquet.column.Dictionary;
+import org.apache.parquet.io.api.Binary;
+import org.apache.parquet.schema.LogicalTypeAnnotation;
+import org.apache.parquet.schema.LogicalTypeAnnotation.DecimalLogicalTypeAnnotation;
+import org.apache.parquet.schema.PrimitiveType;
+
+import java.math.BigDecimal;
+import java.math.BigInteger;
+import java.math.RoundingMode;
+import java.nio.ByteBuffer;
+import java.nio.ByteOrder;
+import java.util.concurrent.TimeUnit;
+import java.util.function.Function;
+
+import static org.apache.paimon.utils.Preconditions.checkArgument;
+
+/** Updater Factory to get {@link ParquetVectorUpdater}. */
+public class ParquetVectorUpdaterFactory {
+
+    private final LogicalTypeAnnotation logicalTypeAnnotation;
+
+    ParquetVectorUpdaterFactory(LogicalTypeAnnotation logicalTypeAnnotation) {
+        this.logicalTypeAnnotation = logicalTypeAnnotation;
+    }
+
+    public ParquetVectorUpdater getUpdater(ColumnDescriptor descriptor, DataType paimonType) {
+        return paimonType.accept(UpdaterFactoryVisitor.INSTANCE).apply(descriptor);
+    }
+
+    interface UpdaterFactory extends Function<ColumnDescriptor, ParquetVectorUpdater> {}
+
+    private static class UpdaterFactoryVisitor implements DataTypeVisitor<UpdaterFactory> {
+
+        private static final UpdaterFactoryVisitor INSTANCE = new UpdaterFactoryVisitor();
+
+        @Override
+        public UpdaterFactory visit(CharType charType) {
+            return c -> new BinaryUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(VarCharType varCharType) {
+            return c -> new BinaryUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(BooleanType booleanType) {
+            return c -> new BooleanUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(BinaryType binaryType) {
+            return c -> {
+                if (c.getPrimitiveType().getPrimitiveTypeName()
+                        == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY) {
+                    return new FixedLenByteArrayUpdater(binaryType.getLength());
+                } else {
+                    return new BinaryUpdater();
+                }
+            };
+        }
+
+        @Override
+        public UpdaterFactory visit(VarBinaryType varBinaryType) {
+            return c -> {
+                if (c.getPrimitiveType().getPrimitiveTypeName()
+                        == PrimitiveType.PrimitiveTypeName.FIXED_LEN_BYTE_ARRAY) {
+                    return new FixedLenByteArrayUpdater(c.getPrimitiveType().getTypeLength());
+                }
+                return new BinaryUpdater();
+            };
+        }
+
+        @Override
+        public UpdaterFactory visit(DecimalType decimalType) {
+            return c -> {
+                switch (c.getPrimitiveType().getPrimitiveTypeName()) {
+                    case INT32:
+                        return new IntegerToDecimalUpdater(c, decimalType);
+                    case INT64:
+                        return new LongToDecimalUpdater(c, decimalType);
+                    case BINARY:
+                        return new BinaryToDecimalUpdater(c, decimalType);
+                    case FIXED_LEN_BYTE_ARRAY:
+                        int precision = decimalType.getPrecision();
+                        if (ParquetSchemaConverter.is32BitDecimal(precision)) {
+                            return new IntegerToDecimalUpdater(c, decimalType);
+                        } else if (ParquetSchemaConverter.is64BitDecimal(precision)) {
+                            return new LongToDecimalUpdater(c, decimalType);
+                        } else {
+                            return new FixedLenByteArrayToDecimalUpdater(c, decimalType);
+                        }
+                }
+                throw new RuntimeException(
+                        "Unsupported decimal type: " + c.getPrimitiveType().getPrimitiveTypeName());
+            };
+        }
+
+        @Override
+        public UpdaterFactory visit(TinyIntType tinyIntType) {
+            return c -> new ByteUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(SmallIntType smallIntType) {
+            return c -> new ShortUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(IntType intType) {
+            return c -> new IntegerUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(BigIntType bigIntType) {
+            return c -> new LongUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(FloatType floatType) {
+            return c -> new FloatUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(DoubleType doubleType) {
+            return c -> new DoubleUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(DateType dateType) {
+            return c -> new IntegerUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(TimeType timeType) {
+            return c -> new IntegerUpdater();
+        }
+
+        @Override
+        public UpdaterFactory visit(TimestampType timestampType) {
+            return c -> {
+                if (c.getPrimitiveType().getPrimitiveTypeName()
+                        == PrimitiveType.PrimitiveTypeName.INT64) {
+                    return new LongUpdater();
+                }
+                return new TimestampUpdater();
+            };
+        }
+
+        @Override
+        public UpdaterFactory visit(LocalZonedTimestampType localZonedTimestampType) {
+            return c -> {
+                if (c.getPrimitiveType().getPrimitiveTypeName()
+                        == PrimitiveType.PrimitiveTypeName.INT64) {
+                    return new LongUpdater();
+                }
+                return new TimestampUpdater();
+            };
+        }
+
+        @Override
+        public UpdaterFactory visit(VariantType variantType) {
+            throw new RuntimeException("Variant type is not supported");
+        }
+
+        @Override
+        public UpdaterFactory visit(ArrayType arrayType) {
+            throw new RuntimeException("Array type is not supported");
+        }
+
+        @Override
+        public UpdaterFactory visit(MultisetType multisetType) {
+            throw new RuntimeException("Multiset type is not supported");
+        }
+
+        @Override
+        public UpdaterFactory visit(MapType mapType) {
+            throw new RuntimeException("Map type is not supported");
+        }
+
+        @Override
+        public UpdaterFactory visit(RowType rowType) {
+            throw new RuntimeException("Row type is not supported");
+        }
+    }
+
+    private static class BooleanUpdater implements ParquetVectorUpdater<WritableBooleanVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableBooleanVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readBooleans(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipBooleans(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableBooleanVector values, VectorizedValuesReader valuesReader) {
+            values.setBoolean(offset, valuesReader.readBoolean());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableBooleanVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            throw new UnsupportedOperationException();
+        }
+    }
+
+    static class IntegerUpdater implements ParquetVectorUpdater<WritableIntVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableIntVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readIntegers(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipIntegers(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableIntVector values, VectorizedValuesReader valuesReader) {
+            values.setInt(offset, valuesReader.readInteger());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableIntVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setInt(offset, dictionary.decodeToInt(dictionaryIds.getInt(offset)));
+        }
+    }
+
+    private static class ByteUpdater implements ParquetVectorUpdater<WritableByteVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableByteVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readBytes(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipBytes(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableByteVector values, VectorizedValuesReader valuesReader) {
+            values.setByte(offset, valuesReader.readByte());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableByteVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setByte(offset, (byte) dictionary.decodeToInt(dictionaryIds.getInt(offset)));
+        }
+    }
+
+    private static class ShortUpdater implements ParquetVectorUpdater<WritableShortVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableShortVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readShorts(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipShorts(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableShortVector values, VectorizedValuesReader valuesReader) {
+            values.setShort(offset, valuesReader.readShort());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableShortVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setShort(
+                    offset,
+                    (short) dictionary.decodeToInt(((HeapIntVector) dictionaryIds).getInt(offset)));
+        }
+    }
+
+    private static class LongUpdater implements ParquetVectorUpdater<WritableLongVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableLongVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readLongs(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipLongs(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableLongVector values, VectorizedValuesReader valuesReader) {
+            values.setLong(offset, valuesReader.readLong());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableLongVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setLong(offset, dictionary.decodeToLong(dictionaryIds.getInt(offset)));
+        }
+    }
+
+    private static class TimestampUpdater implements ParquetVectorUpdater<WritableTimestampVector> {
+
+        public static final int JULIAN_EPOCH_OFFSET_DAYS = 2_440_588;
+        public static final long MILLIS_IN_DAY = TimeUnit.DAYS.toMillis(1);
+        public static final long NANOS_PER_MILLISECOND = TimeUnit.MILLISECONDS.toNanos(1);
+        public static final long NANOS_PER_SECOND = TimeUnit.SECONDS.toNanos(1);
+
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableTimestampVector values,
+                VectorizedValuesReader valuesReader) {
+
+            for (int i = 0; i < total; i++) {
+                values.setTimestamp(
+                        offset + i,
+                        int96ToTimestamp(
+                                true, valuesReader.readLong(), valuesReader.readInteger()));
+            }
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipBytes(12);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableTimestampVector values, VectorizedValuesReader valuesReader) {
+            values.setTimestamp(
+                    offset,
+                    int96ToTimestamp(true, valuesReader.readLong(), valuesReader.readInteger()));
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableTimestampVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setTimestamp(
+                    offset, decodeInt96ToTimestamp(true, dictionary, dictionaryIds.getInt(offset)));
+        }
+
+        public static Timestamp decodeInt96ToTimestamp(
+                boolean utcTimestamp, org.apache.parquet.column.Dictionary dictionary, int id) {
+            Binary binary = dictionary.decodeToBinary(id);
+            checkArgument(binary.length() == 12, "Timestamp with int96 should be 12 bytes.");
+            ByteBuffer buffer = binary.toByteBuffer().order(ByteOrder.LITTLE_ENDIAN);
+            return int96ToTimestamp(utcTimestamp, buffer.getLong(), buffer.getInt());
+        }
+
+        public static Timestamp int96ToTimestamp(
+                boolean utcTimestamp, long nanosOfDay, int julianDay) {
+            long millisecond = julianDayToMillis(julianDay) + (nanosOfDay / NANOS_PER_MILLISECOND);
+
+            if (utcTimestamp) {
+                int nanoOfMillisecond = (int) (nanosOfDay % NANOS_PER_MILLISECOND);
+                return Timestamp.fromEpochMillis(millisecond, nanoOfMillisecond);
+            } else {
+                java.sql.Timestamp timestamp = new java.sql.Timestamp(millisecond);
+                timestamp.setNanos((int) (nanosOfDay % NANOS_PER_SECOND));
+                return Timestamp.fromSQLTimestamp(timestamp);
+            }
+        }
+
+        private static long julianDayToMillis(int julianDay) {
+            return (julianDay - JULIAN_EPOCH_OFFSET_DAYS) * MILLIS_IN_DAY;
+        }
+    }
+
+    private static class FloatUpdater implements ParquetVectorUpdater<WritableFloatVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableFloatVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readFloats(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipFloats(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableFloatVector values, VectorizedValuesReader valuesReader) {
+            values.setFloat(offset, valuesReader.readFloat());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableFloatVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setFloat(offset, dictionary.decodeToFloat(dictionaryIds.getInt(offset)));
+        }
+    }
+
+    private static class DoubleUpdater implements ParquetVectorUpdater<WritableDoubleVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableDoubleVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readDoubles(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipDoubles(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableDoubleVector values, VectorizedValuesReader valuesReader) {
+            values.setDouble(offset, valuesReader.readDouble());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableDoubleVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            values.setDouble(offset, dictionary.decodeToDouble(dictionaryIds.getInt(offset)));
+        }
+    }
+
+    private static class BinaryUpdater implements ParquetVectorUpdater<WritableBytesVector> {
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableBytesVector values,
+                VectorizedValuesReader valuesReader) {
+            valuesReader.readBinary(total, values, offset);
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipBinary(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableBytesVector values, VectorizedValuesReader valuesReader) {
+            valuesReader.readBinary(1, values, offset);
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableBytesVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            Binary v = dictionary.decodeToBinary(dictionaryIds.getInt(offset));
+            values.putByteArray(offset, v.getBytesUnsafe(), 0, v.length());
+        }
+    }
+
+    private static class FixedLenByteArrayUpdater
+            implements ParquetVectorUpdater<WritableBytesVector> {
+        private final int arrayLen;
+
+        FixedLenByteArrayUpdater(int arrayLen) {
+            this.arrayLen = arrayLen;
+        }
+
+        @Override
+        public void readValues(
+                int total,
+                int offset,
+                WritableBytesVector values,
+                VectorizedValuesReader valuesReader) {
+            for (int i = 0; i < total; i++) {
+                readValue(offset + i, values, valuesReader);
+            }
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipFixedLenByteArray(total, arrayLen);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableBytesVector values, VectorizedValuesReader valuesReader) {
+            byte[] bytes = valuesReader.readBinary(arrayLen).getBytesUnsafe();
+            values.putByteArray(offset, bytes, 0, bytes.length);
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableBytesVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            Binary v = dictionary.decodeToBinary(dictionaryIds.getInt(offset));
+            values.putByteArray(offset, v.getBytesUnsafe(), 0, v.length());
+        }
+    }
+
+    private abstract static class DecimalUpdater<T extends WritableColumnVector>
+            implements ParquetVectorUpdater<T> {
+
+        private final DecimalType sparkType;
+
+        DecimalUpdater(DecimalType sparkType) {
+            this.sparkType = sparkType;
+        }
+
+        @Override
+        public void readValues(
+                int total, int offset, T values, VectorizedValuesReader valuesReader) {
+            for (int i = 0; i < total; i++) {
+                readValue(offset + i, values, valuesReader);
+            }
+        }
+
+        protected void writeDecimal(int offset, WritableColumnVector values, BigDecimal decimal) {
+            BigDecimal scaledDecimal =
+                    decimal.setScale(sparkType.getScale(), RoundingMode.UNNECESSARY);
+            int precision = decimal.precision();
+            if (ParquetSchemaConverter.is32BitDecimal(precision)) {
+                ((WritableIntVector) values)
+                        .setInt(offset, scaledDecimal.unscaledValue().intValue());
+            } else if (ParquetSchemaConverter.is64BitDecimal(precision)) {
+                ((WritableLongVector) values)
+                        .setLong(offset, scaledDecimal.unscaledValue().longValue());
+            } else {
+                byte[] bytes = scaledDecimal.unscaledValue().toByteArray();
+                ((WritableBytesVector) values).putByteArray(offset, bytes, 0, bytes.length);
+            }
+        }
+    }
+
+    private static class IntegerToDecimalUpdater extends DecimalUpdater<WritableIntVector> {
+        private final int parquetScale;
+
+        IntegerToDecimalUpdater(ColumnDescriptor descriptor, DecimalType paimonType) {
+            super(paimonType);
+            LogicalTypeAnnotation typeAnnotation =
+                    descriptor.getPrimitiveType().getLogicalTypeAnnotation();
+            if (typeAnnotation instanceof DecimalLogicalTypeAnnotation) {
+                this.parquetScale = ((DecimalLogicalTypeAnnotation) typeAnnotation).getScale();
+            } else {
+                this.parquetScale = 0;
+            }
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipIntegers(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableIntVector values, VectorizedValuesReader valuesReader) {
+            BigDecimal decimal = BigDecimal.valueOf(valuesReader.readInteger(), parquetScale);
+            values.setInt(offset, decimal.unscaledValue().intValue());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableIntVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            BigDecimal decimal =
+                    BigDecimal.valueOf(
+                            dictionary.decodeToInt(dictionaryIds.getInt(offset)), parquetScale);
+            values.setInt(offset, decimal.unscaledValue().intValue());
+        }
+    }
+
+    private static class LongToDecimalUpdater extends DecimalUpdater<WritableLongVector> {
+        private final int parquetScale;
+
+        LongToDecimalUpdater(ColumnDescriptor descriptor, DecimalType sparkType) {
+            super(sparkType);
+            LogicalTypeAnnotation typeAnnotation =
+                    descriptor.getPrimitiveType().getLogicalTypeAnnotation();
+            if (typeAnnotation instanceof DecimalLogicalTypeAnnotation) {
+                this.parquetScale = ((DecimalLogicalTypeAnnotation) typeAnnotation).getScale();
+            } else {
+                this.parquetScale = 0;
+            }
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipLongs(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableLongVector values, VectorizedValuesReader valuesReader) {
+            BigDecimal decimal = BigDecimal.valueOf(valuesReader.readLong(), parquetScale);
+            values.setLong(offset, decimal.unscaledValue().longValue());
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableLongVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            BigDecimal decimal =
+                    BigDecimal.valueOf(
+                            dictionary.decodeToLong(dictionaryIds.getInt(offset)), parquetScale);
+            values.setLong(offset, decimal.unscaledValue().longValue());
+        }
+    }
+
+    private static class BinaryToDecimalUpdater extends DecimalUpdater<WritableBytesVector> {
+        private final int parquetScale;
+
+        BinaryToDecimalUpdater(ColumnDescriptor descriptor, DecimalType sparkType) {
+            super(sparkType);
+            LogicalTypeAnnotation typeAnnotation =
+                    descriptor.getPrimitiveType().getLogicalTypeAnnotation();
+            this.parquetScale = ((DecimalLogicalTypeAnnotation) typeAnnotation).getScale();
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipBinary(total);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableBytesVector values, VectorizedValuesReader valuesReader) {
+            valuesReader.readBinary(1, values, offset);
+            BigInteger value = new BigInteger(values.getBytes(offset).getBytes());
+            BigDecimal decimal = new BigDecimal(value, parquetScale);
+            byte[] bytes = decimal.unscaledValue().toByteArray();
+            values.putByteArray(offset, bytes, 0, bytes.length);
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableBytesVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            BigInteger value =
+                    new BigInteger(
+                            dictionary
+                                    .decodeToBinary(dictionaryIds.getInt(offset))
+                                    .getBytesUnsafe());
+            BigDecimal decimal = new BigDecimal(value, parquetScale);
+            byte[] bytes = decimal.unscaledValue().toByteArray();
+            values.putByteArray(offset, bytes, 0, bytes.length);
+        }
+    }
+
+    private static class FixedLenByteArrayToDecimalUpdater
+            extends DecimalUpdater<WritableBytesVector> {
+        private final int parquetScale;
+        private final int arrayLen;
+
+        FixedLenByteArrayToDecimalUpdater(ColumnDescriptor descriptor, DecimalType sparkType) {
+            super(sparkType);
+            LogicalTypeAnnotation typeAnnotation =
+                    descriptor.getPrimitiveType().getLogicalTypeAnnotation();
+            this.parquetScale = ((DecimalLogicalTypeAnnotation) typeAnnotation).getScale();
+            this.arrayLen = descriptor.getPrimitiveType().getTypeLength();
+        }
+
+        @Override
+        public void skipValues(int total, VectorizedValuesReader valuesReader) {
+            valuesReader.skipFixedLenByteArray(total, arrayLen);
+        }
+
+        @Override
+        public void readValue(
+                int offset, WritableBytesVector values, VectorizedValuesReader valuesReader) {
+            BigInteger value = new BigInteger(valuesReader.readBinary(arrayLen).getBytesUnsafe());
+            BigDecimal decimal = new BigDecimal(value, this.parquetScale);
+            byte[] bytes = decimal.unscaledValue().toByteArray();
+            values.putByteArray(offset, bytes, 0, bytes.length);
+        }
+
+        @Override
+        public void decodeSingleDictionaryId(
+                int offset,
+                WritableBytesVector values,
+                WritableIntVector dictionaryIds,
+                Dictionary dictionary) {
+            BigInteger value =
+                    new BigInteger(
+                            dictionary
+                                    .decodeToBinary(dictionaryIds.getInt(offset))
+                                    .getBytesUnsafe());
+            BigDecimal decimal = new BigDecimal(value, this.parquetScale);
+            byte[] bytes = decimal.unscaledValue().toByteArray();
+            values.putByteArray(offset, bytes, 0, bytes.length);
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java
new file mode 100644
index 000000000000..5dc06e4d5a6b
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java
@@ -0,0 +1,62 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.parquet.column.page.PageReadStore;
+
+import java.util.Iterator;
+import java.util.stream.Stream;
+
+/** Generate row index for columnar batch. */
+public class RowIndexGenerator {
+
+    Iterator<Long> rowIndexIterator;
+
+    public void initFromPageReadStore(PageReadStore pageReadStore) {
+        long startingRowIdx = pageReadStore.getRowIndexOffset().orElse(0L);
+
+        if (pageReadStore.getRowIndexes().isPresent()) {
+            final Iterator<Long> rowIndexes = pageReadStore.getRowIndexes().get();
+            rowIndexIterator =
+                    new Iterator<Long>() {
+                        @Override
+                        public boolean hasNext() {
+                            return rowIndexes.hasNext();
+                        }
+
+                        @Override
+                        public Long next() {
+                            return rowIndexes.next() + startingRowIdx;
+                        }
+                    };
+        } else {
+            long numRowsInRowGroup = pageReadStore.getRowCount();
+            rowIndexIterator =
+                    Stream.iterate(startingRowIdx, i -> i + 1).limit(numRowsInRowGroup).iterator();
+        }
+    }
+
+    public void populateRowIndex(ColumnarBatch columnarBatch, int numRows) {
+        long[] rowIndexes = new long[numRows];
+        for (int i = 0; i < numRows; i++) {
+            rowIndexes[i] = rowIndexIterator.next();
+        }
+        columnarBatch.resetPositions(rowIndexes);
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java
new file mode 100644
index 000000000000..bfaabf096ab1
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java
@@ -0,0 +1,365 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.format.parquet.reader.ParquetDictionary;
+import org.apache.paimon.types.DataType;
+
+import org.apache.parquet.CorruptDeltaByteArrays;
+import org.apache.parquet.VersionParser.ParsedVersion;
+import org.apache.parquet.bytes.ByteBufferInputStream;
+import org.apache.parquet.bytes.BytesInput;
+import org.apache.parquet.bytes.BytesUtils;
+import org.apache.parquet.column.ColumnDescriptor;
+import org.apache.parquet.column.Dictionary;
+import org.apache.parquet.column.Encoding;
+import org.apache.parquet.column.page.DataPage;
+import org.apache.parquet.column.page.DataPageV1;
+import org.apache.parquet.column.page.DataPageV2;
+import org.apache.parquet.column.page.DictionaryPage;
+import org.apache.parquet.column.page.PageReadStore;
+import org.apache.parquet.column.page.PageReader;
+import org.apache.parquet.column.values.RequiresPreviousReader;
+import org.apache.parquet.column.values.ValuesReader;
+import org.apache.parquet.schema.LogicalTypeAnnotation;
+import org.apache.parquet.schema.PrimitiveType;
+
+import java.io.IOException;
+
+import static org.apache.parquet.schema.PrimitiveType.PrimitiveTypeName.BOOLEAN;
+
+/** Decoder to return values from a single column. */
+public class VectorizedColumnReader {
+    /** The dictionary, if this column has dictionary encoding. */
+    private final Dictionary dictionary;
+
+    /** If true, the current page is dictionary encoded. */
+    private boolean isCurrentPageDictionaryEncoded;
+
+    /** Value readers. */
+    private ValuesReader dataColumn;
+
+    /** Vectorized RLE decoder for definition levels. */
+    private VectorizedRleValuesReader defColumn;
+
+    /** Vectorized RLE decoder for repetition levels. */
+    private VectorizedRleValuesReader repColumn;
+
+    /** Factory to get type-specific vector updater. */
+    private final ParquetVectorUpdaterFactory updaterFactory;
+
+    /**
+     * Helper struct to track intermediate states while reading Parquet pages in the column chunk.
+     */
+    private final ParquetReadState readState;
+
+    /**
+     * The index for the first row in the current page, among all rows across all pages in the
+     * column chunk for this reader. If there is no column index, the value is 0.
+     */
+    private long pageFirstRowIndex;
+
+    private final PageReader pageReader;
+    private final ColumnDescriptor descriptor;
+    private final LogicalTypeAnnotation logicalTypeAnnotation;
+    private final ParsedVersion writerVersion;
+
+    public VectorizedColumnReader(
+            ColumnDescriptor descriptor,
+            boolean isRequired,
+            PageReadStore pageReadStore,
+            ParsedVersion writerVersion)
+            throws IOException {
+        this.descriptor = descriptor;
+        this.pageReader = pageReadStore.getPageReader(descriptor);
+        this.readState =
+                new ParquetReadState(
+                        descriptor, isRequired, pageReadStore.getRowIndexes().orElse(null));
+        this.logicalTypeAnnotation = descriptor.getPrimitiveType().getLogicalTypeAnnotation();
+        this.updaterFactory = new ParquetVectorUpdaterFactory(logicalTypeAnnotation);
+
+        DictionaryPage dictionaryPage = pageReader.readDictionaryPage();
+        if (dictionaryPage != null) {
+            try {
+                this.dictionary =
+                        dictionaryPage.getEncoding().initDictionary(descriptor, dictionaryPage);
+                this.isCurrentPageDictionaryEncoded = true;
+            } catch (IOException e) {
+                throw new IOException("could not decode the dictionary for " + descriptor, e);
+            }
+        } else {
+            this.dictionary = null;
+            this.isCurrentPageDictionaryEncoded = false;
+        }
+        if (pageReader.getTotalValueCount() == 0) {
+            throw new IOException("totalValueCount == 0");
+        }
+        this.writerVersion = writerVersion;
+    }
+
+    private boolean isLazyDecodingSupported(
+            PrimitiveType.PrimitiveTypeName typeName, DataType sparkType) {
+        return true;
+    }
+
+    /** Reads `total` rows from this columnReader into column. */
+    void readBatch(
+            int total,
+            DataType type,
+            WritableColumnVector column,
+            WritableIntVector repetitionLevels,
+            WritableIntVector definitionLevels)
+            throws IOException {
+        WritableIntVector dictionaryIds = null;
+        ParquetVectorUpdater updater = updaterFactory.getUpdater(descriptor, type);
+
+        if (dictionary != null) {
+            // SPARK-16334: We only maintain a single dictionary per row batch, so that it can be
+            // used to
+            // decode all previous dictionary encoded pages if we ever encounter a non-dictionary
+            // encoded
+            // page.
+            dictionaryIds = column.reserveDictionaryIds(total);
+        }
+        readState.resetForNewBatch(total);
+        while (readState.rowsToReadInBatch > 0 || !readState.lastListCompleted) {
+            if (readState.valuesToReadInPage == 0) {
+                int pageValueCount = readPage();
+                if (pageValueCount < 0) {
+                    // we've read all the pages; this could happen when we're reading a repeated
+                    // list and we
+                    // don't know where the list will end until we've seen all the pages.
+                    break;
+                }
+                readState.resetForNewPage(pageValueCount, pageFirstRowIndex);
+            }
+            PrimitiveType.PrimitiveTypeName typeName =
+                    descriptor.getPrimitiveType().getPrimitiveTypeName();
+            if (isCurrentPageDictionaryEncoded) {
+                // Save starting offset in case we need to decode dictionary IDs.
+                int startOffset = readState.valueOffset;
+                // Save starting row index so we can check if we need to eagerly decode dict ids
+                // later
+                long startRowId = readState.rowId;
+
+                // Read and decode dictionary ids.
+                if (readState.maxRepetitionLevel == 0) {
+                    defColumn.readIntegers(
+                            readState,
+                            dictionaryIds,
+                            column,
+                            definitionLevels,
+                            (VectorizedValuesReader) dataColumn);
+                } else {
+                    repColumn.readIntegersRepeated(
+                            readState,
+                            repetitionLevels,
+                            defColumn,
+                            definitionLevels,
+                            dictionaryIds,
+                            column,
+                            (VectorizedValuesReader) dataColumn);
+                }
+
+                // TIMESTAMP_MILLIS encoded as INT64 can't be lazily decoded as we need to post
+                // process
+                // the values to add microseconds precision.
+                if (column.hasDictionary()
+                        || (startRowId == pageFirstRowIndex
+                                && isLazyDecodingSupported(typeName, type))) {
+                    column.setDictionary(new ParquetDictionary(dictionary));
+                } else {
+                    updater.decodeDictionaryIds(
+                            readState.valueOffset - startOffset,
+                            startOffset,
+                            column,
+                            dictionaryIds,
+                            dictionary);
+                }
+            } else {
+                if (column.hasDictionary() && readState.valueOffset != 0) {
+                    // This batch already has dictionary encoded values but this new page is not.
+                    // The batch
+                    // does not support a mix of dictionary and not so we will decode the
+                    // dictionary.
+                    updater.decodeDictionaryIds(
+                            readState.valueOffset, 0, column, dictionaryIds, dictionary);
+                }
+                column.setDictionary(null);
+                VectorizedValuesReader valuesReader = (VectorizedValuesReader) dataColumn;
+                if (readState.maxRepetitionLevel == 0) {
+                    defColumn.readBatch(readState, column, definitionLevels, valuesReader, updater);
+                } else {
+                    repColumn.readBatchRepeated(
+                            readState,
+                            repetitionLevels,
+                            defColumn,
+                            definitionLevels,
+                            column,
+                            valuesReader,
+                            updater);
+                }
+            }
+        }
+    }
+
+    private int readPage() {
+        DataPage page = pageReader.readPage();
+        if (page == null) {
+            return -1;
+        }
+        this.pageFirstRowIndex = page.getFirstRowIndex().orElse(0L);
+
+        return page.accept(
+                new DataPage.Visitor<Integer>() {
+                    @Override
+                    public Integer visit(DataPageV1 dataPageV1) {
+                        try {
+                            return readPageV1(dataPageV1);
+                        } catch (IOException e) {
+                            throw new RuntimeException(e);
+                        }
+                    }
+
+                    @Override
+                    public Integer visit(DataPageV2 dataPageV2) {
+                        try {
+                            return readPageV2(dataPageV2);
+                        } catch (IOException e) {
+                            throw new RuntimeException(e);
+                        }
+                    }
+                });
+    }
+
+    private void initDataReader(int pageValueCount, Encoding dataEncoding, ByteBufferInputStream in)
+            throws IOException {
+        ValuesReader previousReader = this.dataColumn;
+        if (dataEncoding.usesDictionary()) {
+            this.dataColumn = null;
+            if (dictionary == null) {
+                throw new IOException(
+                        "could not read page in col "
+                                + descriptor
+                                + " as the dictionary was missing for encoding "
+                                + dataEncoding);
+            }
+            @SuppressWarnings("deprecation")
+            Encoding plainDict = Encoding.PLAIN_DICTIONARY; // var to allow warning suppression
+            if (dataEncoding != plainDict && dataEncoding != Encoding.RLE_DICTIONARY) {
+                throw new UnsupportedOperationException(
+                        "error: _LEGACY_ERROR_TEMP_3189, encoding: " + dataEncoding);
+            }
+            this.dataColumn = new VectorizedRleValuesReader();
+            this.isCurrentPageDictionaryEncoded = true;
+        } else {
+            this.dataColumn = getValuesReader(dataEncoding);
+            this.isCurrentPageDictionaryEncoded = false;
+        }
+
+        try {
+            dataColumn.initFromPage(pageValueCount, in);
+        } catch (IOException e) {
+            throw new IOException("could not read page in col " + descriptor, e);
+        }
+        // for PARQUET-246 (See VectorizedDeltaByteArrayReader.setPreviousValues)
+        if (CorruptDeltaByteArrays.requiresSequentialReads(writerVersion, dataEncoding)
+                && previousReader instanceof RequiresPreviousReader) {
+            // previousReader can only be set if reading sequentially
+            ((RequiresPreviousReader) dataColumn).setPreviousReader(previousReader);
+        }
+    }
+
+    private ValuesReader getValuesReader(Encoding encoding) {
+        switch (encoding) {
+            case PLAIN:
+                return new VectorizedPlainValuesReader();
+            case DELTA_BYTE_ARRAY:
+                return new VectorizedDeltaByteArrayReader();
+            case DELTA_LENGTH_BYTE_ARRAY:
+                return new VectorizedDeltaLengthByteArrayReader();
+            case DELTA_BINARY_PACKED:
+                return new VectorizedDeltaBinaryPackedReader();
+            case RLE:
+                {
+                    PrimitiveType.PrimitiveTypeName typeName =
+                            this.descriptor.getPrimitiveType().getPrimitiveTypeName();
+                    // RLE encoding only supports boolean type `Values`, and  `bitwidth` is always
+                    // 1.
+                    if (typeName == BOOLEAN) {
+                        return new VectorizedRleValuesReader(1);
+                    } else {
+                        throw new RuntimeException(
+                                "error: _LEGACY_ERROR_TEMP_3190, typeName: " + typeName.toString());
+                    }
+                }
+            default:
+                throw new RuntimeException("error: _LEGACY_ERROR_TEMP_3189, encoding: " + encoding);
+        }
+    }
+
+    private int readPageV1(DataPageV1 page) throws IOException {
+        if (page.getDlEncoding() != Encoding.RLE && descriptor.getMaxDefinitionLevel() != 0) {
+            throw new RuntimeException(
+                    "error: _LEGACY_ERROR_TEMP_3189, encoding " + page.getDlEncoding().toString());
+        }
+
+        int pageValueCount = page.getValueCount();
+
+        int rlBitWidth = BytesUtils.getWidthFromMaxInt(descriptor.getMaxRepetitionLevel());
+        this.repColumn = new VectorizedRleValuesReader(rlBitWidth);
+
+        int dlBitWidth = BytesUtils.getWidthFromMaxInt(descriptor.getMaxDefinitionLevel());
+        this.defColumn = new VectorizedRleValuesReader(dlBitWidth);
+
+        try {
+            BytesInput bytes = page.getBytes();
+            ByteBufferInputStream in = bytes.toInputStream();
+
+            repColumn.initFromPage(pageValueCount, in);
+            defColumn.initFromPage(pageValueCount, in);
+            initDataReader(pageValueCount, page.getValueEncoding(), in);
+            return pageValueCount;
+        } catch (IOException e) {
+            throw new IOException("could not read page " + page + " in col " + descriptor, e);
+        }
+    }
+
+    private int readPageV2(DataPageV2 page) throws IOException {
+        int pageValueCount = page.getValueCount();
+
+        // do not read the length from the stream. v2 pages handle dividing the page bytes.
+        int rlBitWidth = BytesUtils.getWidthFromMaxInt(descriptor.getMaxRepetitionLevel());
+        repColumn = new VectorizedRleValuesReader(rlBitWidth, false);
+        repColumn.initFromPage(pageValueCount, page.getRepetitionLevels().toInputStream());
+
+        int dlBitWidth = BytesUtils.getWidthFromMaxInt(descriptor.getMaxDefinitionLevel());
+        defColumn = new VectorizedRleValuesReader(dlBitWidth, false);
+        defColumn.initFromPage(pageValueCount, page.getDefinitionLevels().toInputStream());
+
+        try {
+            initDataReader(pageValueCount, page.getDataEncoding(), page.getData().toInputStream());
+            return pageValueCount;
+        } catch (IOException e) {
+            throw new IOException("could not read page " + page + " in col " + descriptor, e);
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java
new file mode 100644
index 000000000000..16161283696b
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java
@@ -0,0 +1,295 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableByteVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.data.columnar.writable.WritableLongVector;
+import org.apache.paimon.data.columnar.writable.WritableShortVector;
+
+import org.apache.parquet.Preconditions;
+import org.apache.parquet.bytes.ByteBufferInputStream;
+import org.apache.parquet.bytes.BytesUtils;
+import org.apache.parquet.column.values.bitpacking.BytePackerForLong;
+import org.apache.parquet.column.values.bitpacking.Packer;
+import org.apache.parquet.io.ParquetDecodingException;
+
+import java.io.IOException;
+import java.nio.ByteBuffer;
+import java.util.Arrays;
+
+/**
+ * An implementation of the Parquet DELTA_BINARY_PACKED decoder that supports the vectorized
+ * interface. DELTA_BINARY_PACKED is a delta encoding for integer and long types that stores values
+ * as a delta between consecutive values. Delta values are themselves bit packed. Similar to RLE but
+ * is more effective in the case of large variation of values in the encoded column.
+ *
+ * <p>DELTA_BINARY_PACKED is the default encoding for integer and long columns in Parquet V2.
+ *
+ * <p>Supported Types: INT32, INT64
+ *
+ * <p>@see <a
+ * href="https://github.com/apache/parquet-format/blob/master/Encodings.md#delta-encoding-delta_binary_packed--5">
+ * Parquet format encodings: DELTA_BINARY_PACKED</a>
+ */
+public class VectorizedDeltaBinaryPackedReader extends VectorizedReaderBase {
+
+    // header data
+    private int blockSizeInValues;
+    private int miniBlockNumInABlock;
+    private int totalValueCount;
+    private long firstValue;
+
+    private int miniBlockSizeInValues;
+
+    // values read by the caller
+    private int valuesRead = 0;
+
+    // variables to keep state of the current block and miniblock
+    private long lastValueRead; // needed to compute the next value
+    private long minDeltaInCurrentBlock; // needed to compute the next value
+    // currentMiniBlock keeps track of the mini block within the current block that
+    // we read and decoded most recently. Only used as an index into
+    // bitWidths array
+    private int currentMiniBlock = 0;
+    private int[] bitWidths; // bit widths for each miniBlock in the current block
+    private int remainingInBlock = 0; // values in current block still to be read
+    private int remainingInMiniBlock = 0; // values in current mini block still to be read
+    private long[] unpackedValuesBuffer;
+
+    private ByteBufferInputStream in;
+
+    // temporary buffers used by readByte, readShort, readInteger, and readLong
+    private byte byteVal;
+    private short shortVal;
+    private int intVal;
+    private long longVal;
+
+    @Override
+    public void initFromPage(int valueCount, ByteBufferInputStream in) throws IOException {
+        Preconditions.checkArgument(
+                valueCount >= 1, "Page must have at least one value, but it has " + valueCount);
+        this.in = in;
+        // Read the header
+        this.blockSizeInValues = BytesUtils.readUnsignedVarInt(in);
+        this.miniBlockNumInABlock = BytesUtils.readUnsignedVarInt(in);
+        double miniSize = (double) blockSizeInValues / miniBlockNumInABlock;
+        Preconditions.checkArgument(
+                miniSize % 8 == 0, "miniBlockSize must be multiple of 8, but it's " + miniSize);
+        this.miniBlockSizeInValues = (int) miniSize;
+        // True value count. May be less than valueCount because of nulls
+        this.totalValueCount = BytesUtils.readUnsignedVarInt(in);
+        this.bitWidths = new int[miniBlockNumInABlock];
+        this.unpackedValuesBuffer = new long[miniBlockSizeInValues];
+        // read the first value
+        firstValue = BytesUtils.readZigZagVarLong(in);
+    }
+
+    // True value count. May be less than valueCount because of nulls
+    int getTotalValueCount() {
+        return totalValueCount;
+    }
+
+    @Override
+    public byte readByte() {
+        readValues(1, null, 0, (w, r, v) -> byteVal = (byte) v);
+        return byteVal;
+    }
+
+    @Override
+    public short readShort() {
+        readValues(1, null, 0, (w, r, v) -> shortVal = (short) v);
+        return shortVal;
+    }
+
+    @Override
+    public int readInteger() {
+        readValues(1, null, 0, (w, r, v) -> intVal = (int) v);
+        return intVal;
+    }
+
+    @Override
+    public long readLong() {
+        readValues(1, null, 0, (w, r, v) -> longVal = v);
+        return longVal;
+    }
+
+    @Override
+    public void readBytes(int total, WritableByteVector c, int rowId) {
+        readValues(total, c, rowId, (w, r, v) -> ((WritableByteVector) w).setByte(r, (byte) v));
+    }
+
+    @Override
+    public void readShorts(int total, WritableShortVector c, int rowId) {
+        readValues(total, c, rowId, (w, r, v) -> ((WritableShortVector) w).setShort(r, (short) v));
+    }
+
+    @Override
+    public void readIntegers(int total, WritableIntVector c, int rowId) {
+        readValues(total, c, rowId, (w, r, v) -> ((WritableIntVector) w).setInt(r, (int) v));
+    }
+
+    @Override
+    public void readLongs(int total, WritableLongVector c, int rowId) {
+        readValues(total, c, rowId, (w, r, v) -> ((WritableLongVector) w).setLong(r, v));
+    }
+
+    @Override
+    public void skipBytes(int total) {
+        skipValues(total);
+    }
+
+    @Override
+    public void skipShorts(int total) {
+        skipValues(total);
+    }
+
+    @Override
+    public void skipIntegers(int total) {
+        skipValues(total);
+    }
+
+    @Override
+    public void skipLongs(int total) {
+        skipValues(total);
+    }
+
+    private void readValues(
+            int total, WritableColumnVector c, int rowId, IntegerOutputWriter outputWriter) {
+        if (valuesRead + total > totalValueCount) {
+            throw new ParquetDecodingException(
+                    "No more values to read. Total values read:  "
+                            + valuesRead
+                            + ", total count: "
+                            + totalValueCount
+                            + ", trying to read "
+                            + total
+                            + " more.");
+        }
+        int remaining = total;
+        // First value
+        if (valuesRead == 0) {
+            outputWriter.write(c, rowId, firstValue);
+            lastValueRead = firstValue;
+            rowId++;
+            remaining--;
+        }
+        while (remaining > 0) {
+            int n;
+            try {
+                n = loadMiniBlockToOutput(remaining, c, rowId, outputWriter);
+            } catch (IOException e) {
+                throw new ParquetDecodingException("Error reading mini block.", e);
+            }
+            rowId += n;
+            remaining -= n;
+        }
+        valuesRead = total - remaining;
+    }
+
+    /**
+     * Read from a mini block. Read at most 'remaining' values into output.
+     *
+     * @return the number of values read into output
+     */
+    private int loadMiniBlockToOutput(
+            int remaining, WritableColumnVector c, int rowId, IntegerOutputWriter outputWriter)
+            throws IOException {
+
+        // new block; read the block header
+        if (remainingInBlock == 0) {
+            readBlockHeader();
+        }
+
+        // new miniblock, unpack the miniblock
+        if (remainingInMiniBlock == 0) {
+            unpackMiniBlock();
+        }
+
+        // read values from miniblock
+        int valuesRead = 0;
+        for (int i = miniBlockSizeInValues - remainingInMiniBlock;
+                i < miniBlockSizeInValues && valuesRead < remaining;
+                i++) {
+            // calculate values from deltas unpacked for current block
+            long outValue = lastValueRead + minDeltaInCurrentBlock + unpackedValuesBuffer[i];
+            lastValueRead = outValue;
+            outputWriter.write(c, rowId + valuesRead, outValue);
+            remainingInBlock--;
+            remainingInMiniBlock--;
+            valuesRead++;
+        }
+
+        return valuesRead;
+    }
+
+    private void readBlockHeader() {
+        try {
+            minDeltaInCurrentBlock = BytesUtils.readZigZagVarLong(in);
+        } catch (IOException e) {
+            throw new ParquetDecodingException("Can not read min delta in current block", e);
+        }
+        readBitWidthsForMiniBlocks();
+        remainingInBlock = blockSizeInValues;
+        currentMiniBlock = 0;
+        remainingInMiniBlock = 0;
+    }
+
+    /**
+     * mini block has a size of 8*n, unpack 32 value each time.
+     *
+     * <p>see org.apache.parquet.column.values.delta.DeltaBinaryPackingValuesReader#unpackMiniBlock
+     */
+    private void unpackMiniBlock() throws IOException {
+        Arrays.fill(this.unpackedValuesBuffer, 0);
+        BytePackerForLong packer =
+                Packer.LITTLE_ENDIAN.newBytePackerForLong(bitWidths[currentMiniBlock]);
+        for (int j = 0; j < miniBlockSizeInValues; j += 8) {
+            ByteBuffer buffer = in.slice(packer.getBitWidth());
+            if (buffer.hasArray()) {
+                packer.unpack8Values(
+                        buffer.array(),
+                        buffer.arrayOffset() + buffer.position(),
+                        unpackedValuesBuffer,
+                        j);
+            } else {
+                packer.unpack8Values(buffer, buffer.position(), unpackedValuesBuffer, j);
+            }
+        }
+        remainingInMiniBlock = miniBlockSizeInValues;
+        currentMiniBlock++;
+    }
+
+    // From org.apache.parquet.column.values.delta.DeltaBinaryPackingValuesReader
+    private void readBitWidthsForMiniBlocks() {
+        for (int i = 0; i < miniBlockNumInABlock; i++) {
+            try {
+                bitWidths[i] = BytesUtils.readIntLittleEndianOnOneByte(in);
+            } catch (IOException e) {
+                throw new ParquetDecodingException("Can not decode bitwidth in block header", e);
+            }
+        }
+    }
+
+    private void skipValues(int total) {
+        // Read the values but don't write them out (the writer output method is a no-op)
+        readValues(total, null, -1, (w, r, v) -> {});
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java
new file mode 100644
index 000000000000..b578f423dbd4
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java
@@ -0,0 +1,149 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.BytesColumnVector;
+import org.apache.paimon.data.columnar.heap.HeapBytesVector;
+import org.apache.paimon.data.columnar.heap.HeapIntVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+
+import org.apache.parquet.bytes.ByteBufferInputStream;
+import org.apache.parquet.column.values.RequiresPreviousReader;
+import org.apache.parquet.column.values.ValuesReader;
+import org.apache.parquet.io.api.Binary;
+
+import java.io.IOException;
+import java.nio.ByteBuffer;
+
+/**
+ * An implementation of the Parquet DELTA_BYTE_ARRAY decoder that supports the vectorized interface.
+ */
+public class VectorizedDeltaByteArrayReader extends VectorizedReaderBase
+        implements VectorizedValuesReader, RequiresPreviousReader {
+
+    private final VectorizedDeltaBinaryPackedReader prefixLengthReader;
+    private final VectorizedDeltaLengthByteArrayReader suffixReader;
+    private HeapIntVector prefixLengthVector;
+    private ByteBuffer previous;
+    private int currentRow = 0;
+
+    // Temporary variable used by readBinary
+    private final HeapBytesVector binaryValVector;
+    // Temporary variable used by skipBinary
+    private final HeapBytesVector tempBinaryValVector;
+
+    VectorizedDeltaByteArrayReader() {
+        this.prefixLengthReader = new VectorizedDeltaBinaryPackedReader();
+        this.suffixReader = new VectorizedDeltaLengthByteArrayReader();
+        binaryValVector = new HeapBytesVector(1);
+        tempBinaryValVector = new HeapBytesVector(1);
+    }
+
+    @Override
+    public void initFromPage(int valueCount, ByteBufferInputStream in) throws IOException {
+        prefixLengthVector = new HeapIntVector(valueCount);
+        prefixLengthReader.initFromPage(valueCount, in);
+        prefixLengthReader.readIntegers(
+                prefixLengthReader.getTotalValueCount(), prefixLengthVector, 0);
+        suffixReader.initFromPage(valueCount, in);
+    }
+
+    @Override
+    public Binary readBinary(int len) {
+        readValues(1, binaryValVector, 0);
+        return Binary.fromConstantByteArray(binaryValVector.getBytes(0).getBytes());
+    }
+
+    private void readValues(int total, WritableBytesVector c, int rowId) {
+        for (int i = 0; i < total; i++) {
+            // NOTE: due to PARQUET-246, it is important that we
+            // respect prefixLength which was read from prefixLengthReader,
+            // even for the *first* value of a page. Even though the first
+            // value of the page should have an empty prefix, it may not
+            // because of PARQUET-246.
+            int prefixLength = prefixLengthVector.getInt(currentRow);
+            ByteBuffer suffix = suffixReader.getBytes(currentRow);
+            byte[] suffixArray = suffix.array();
+            int suffixLength = suffix.limit() - suffix.position();
+            int length = prefixLength + suffixLength;
+
+            int offset = c.getElementsAppended();
+            byte[] bytes = new byte[length];
+
+            if (prefixLength != 0) {
+                System.arraycopy(previous.array(), previous.position(), bytes, 0, prefixLength);
+            }
+            System.arraycopy(suffixArray, suffix.position(), bytes, prefixLength, suffixLength);
+
+            c.putByteArray(rowId + i, bytes, offset, length);
+            BytesColumnVector.Bytes b = c.getBytes(rowId + i);
+            previous = ByteBuffer.wrap(b.data, b.offset, b.len);
+            currentRow++;
+        }
+    }
+
+    @Override
+    public void readBinary(int total, WritableBytesVector c, int rowId) {
+        readValues(total, c, rowId);
+    }
+
+    /**
+     * There was a bug (PARQUET-246) in which DeltaByteArrayWriter's reset() method did not clear
+     * the previous value state that it tracks internally. This resulted in the first value of all
+     * pages (except for the first page) to be a delta from the last value of the previous page. In
+     * order to read corrupted files written with this bug, when reading a new page we need to
+     * recover the previous page's last value to use it (if needed) to read the first value.
+     */
+    @Override
+    public void setPreviousReader(ValuesReader reader) {
+        if (reader != null) {
+            this.previous = ((VectorizedDeltaByteArrayReader) reader).previous;
+        }
+    }
+
+    @Override
+    public void skipBinary(int total) {
+        HeapBytesVector c1 = tempBinaryValVector;
+        HeapBytesVector c2 = binaryValVector;
+
+        for (int i = 0; i < total; i++) {
+            int prefixLength = prefixLengthVector.getInt(currentRow);
+            ByteBuffer suffix = suffixReader.getBytes(currentRow);
+            byte[] suffixArray = suffix.array();
+            int suffixLength = suffix.limit() - suffix.position();
+            int length = prefixLength + suffixLength;
+            byte[] bytes = new byte[length];
+
+            c1.reset();
+            if (prefixLength != 0) {
+                System.arraycopy(previous.array(), previous.position(), bytes, 0, prefixLength);
+            }
+            System.arraycopy(suffixArray, suffix.position(), bytes, prefixLength, suffixLength);
+
+            c1.putByteArray(0, bytes, 0, length);
+            BytesColumnVector.Bytes b = c1.getBytes(0);
+            previous = ByteBuffer.wrap(b.data, b.offset, b.len);
+            currentRow++;
+
+            HeapBytesVector tmp = c1;
+            c1 = c2;
+            c2 = tmp;
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java
new file mode 100644
index 000000000000..7b377daec302
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java
@@ -0,0 +1,91 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.heap.HeapIntVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+
+import org.apache.parquet.bytes.ByteBufferInputStream;
+import org.apache.parquet.io.ParquetDecodingException;
+
+import java.io.EOFException;
+import java.io.IOException;
+import java.nio.ByteBuffer;
+
+/**
+ * An implementation of the Parquet DELTA_LENGTH_BYTE_ARRAY decoder that supports the vectorized
+ * interface.
+ */
+public class VectorizedDeltaLengthByteArrayReader extends VectorizedReaderBase
+        implements VectorizedValuesReader {
+
+    private final VectorizedDeltaBinaryPackedReader lengthReader;
+    private ByteBufferInputStream in;
+    private HeapIntVector lengthsVector;
+    private int currentRow = 0;
+
+    VectorizedDeltaLengthByteArrayReader() {
+        lengthReader = new VectorizedDeltaBinaryPackedReader();
+    }
+
+    @Override
+    public void initFromPage(int valueCount, ByteBufferInputStream in) throws IOException {
+        lengthsVector = new HeapIntVector(valueCount);
+        lengthReader.initFromPage(valueCount, in);
+        lengthReader.readIntegers(lengthReader.getTotalValueCount(), lengthsVector, 0);
+        this.in = in.remainingStream();
+    }
+
+    @Override
+    public void readBinary(int total, WritableBytesVector c, int rowId) {
+        ByteBuffer buffer;
+        ByteBufferOutputWriter outputWriter = ByteBufferOutputWriter::writeArrayByteBuffer;
+        int length;
+        for (int i = 0; i < total; i++) {
+            length = lengthsVector.getInt(rowId + i);
+            try {
+                buffer = in.slice(length);
+            } catch (EOFException e) {
+                throw new ParquetDecodingException("Failed to read " + length + " bytes");
+            }
+            outputWriter.write(c, rowId + i, buffer, length);
+        }
+        currentRow += total;
+    }
+
+    public ByteBuffer getBytes(int rowId) {
+        int length = lengthsVector.getInt(rowId);
+        try {
+            return in.slice(length);
+        } catch (EOFException e) {
+            throw new ParquetDecodingException("Failed to read " + length + " bytes");
+        }
+    }
+
+    @Override
+    public void skipBinary(int total) {
+        for (int i = 0; i < total; i++) {
+            int remaining = lengthsVector.getInt(currentRow + i);
+            while (remaining > 0) {
+                remaining -= in.skip(remaining);
+            }
+        }
+        currentRow += total;
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
new file mode 100644
index 000000000000..c8fd932cb9b9
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
@@ -0,0 +1,349 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.InternalRow;
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.heap.HeapArrayVector;
+import org.apache.paimon.data.columnar.heap.HeapMapVector;
+import org.apache.paimon.data.columnar.heap.HeapRowVector;
+import org.apache.paimon.data.columnar.heap.WrapArrayColumnVector;
+import org.apache.paimon.data.columnar.heap.WrapMapColumnVector;
+import org.apache.paimon.data.columnar.heap.WrapRowColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.format.parquet.reader.ParquetDecimalVector;
+import org.apache.paimon.format.parquet.reader.ParquetTimestampVector;
+import org.apache.paimon.format.parquet.type.ParquetField;
+import org.apache.paimon.format.parquet.type.ParquetPrimitiveField;
+import org.apache.paimon.fs.Path;
+import org.apache.paimon.reader.FileRecordIterator;
+import org.apache.paimon.reader.FileRecordReader;
+import org.apache.paimon.types.ArrayType;
+import org.apache.paimon.types.DataType;
+import org.apache.paimon.types.MapType;
+import org.apache.paimon.types.MultisetType;
+import org.apache.paimon.types.RowType;
+
+import org.apache.parquet.VersionParser;
+import org.apache.parquet.column.ColumnDescriptor;
+import org.apache.parquet.column.page.PageReadStore;
+import org.apache.parquet.hadoop.ParquetFileReader;
+import org.apache.parquet.schema.GroupType;
+import org.apache.parquet.schema.MessageType;
+import org.apache.parquet.schema.Type;
+
+import javax.annotation.Nullable;
+
+import java.io.IOException;
+import java.util.Arrays;
+import java.util.Collections;
+import java.util.HashSet;
+import java.util.List;
+import java.util.Set;
+import java.util.stream.Collectors;
+
+/** Record reader for parquet. */
+public class VectorizedParquetRecordReader implements FileRecordReader<InternalRow> {
+
+    private ParquetFileReader reader;
+
+    // The capacity of vectorized batch.
+    private final int batchSize;
+
+    /**
+     * The total number of rows this RecordReader will eventually read. The sum of the rows of all
+     * the row groups.
+     */
+    private final long totalRowCount;
+
+    /** The number of rows that have been reading, including the current in flight row group. */
+    private long totalCountLoadedSoFar = 0;
+
+    /** The number of rows that have been returned. */
+    private long rowsReturned;
+
+    /**
+     * Encapsulate writable column vectors with other Parquet related info such as repetition /
+     * definition levels.
+     */
+    private ParquetColumnVector[] columnVectors;
+
+    private ColumnarBatch columnarBatch;
+
+    private final Path filePath;
+    private final MessageType fileSchema;
+    private final List<ParquetField> fields;
+    private final RowIndexGenerator rowIndexGenerator;
+
+    private Set<ParquetField> missingColumns;
+    private VersionParser.ParsedVersion writerVersion;
+
+    public VectorizedParquetRecordReader(
+            Path filePath,
+            ParquetFileReader reader,
+            MessageType fileSchema,
+            List<ParquetField> fields,
+            WritableColumnVector[] vectors,
+            int batchSize)
+            throws IOException {
+        this.filePath = filePath;
+        this.reader = reader;
+        this.fileSchema = fileSchema;
+        this.fields = fields;
+        this.totalRowCount = reader.getFilteredRecordCount();
+        this.batchSize = batchSize;
+        this.rowIndexGenerator = new RowIndexGenerator();
+
+        // fetch writer version from file metadata
+        try {
+            this.writerVersion = VersionParser.parse(reader.getFileMetaData().getCreatedBy());
+        } catch (Exception e) {
+            // Swallow any exception, if we cannot parse the version we will revert to a sequential
+            // read
+            // if the column is a delta byte array encoding (due to PARQUET-246).
+        }
+        // Check if all the required columns are present in the file.
+        checkMissingColumns();
+        // Initialize the columnarBatch and columnVectors,
+        initBatch(vectors);
+    }
+
+    private void initBatch(WritableColumnVector[] vectors) {
+        columnarBatch =
+                new ColumnarBatch(
+                        filePath,
+                        createVectorizedColumnBatch(
+                                fields.stream()
+                                        .map(ParquetField::getType)
+                                        .collect(Collectors.toList()),
+                                vectors));
+        columnVectors = new ParquetColumnVector[fields.size()];
+        for (int i = 0; i < columnVectors.length; i++) {
+            columnVectors[i] =
+                    new ParquetColumnVector(
+                            fields.get(i),
+                            (WritableColumnVector) vectors[i],
+                            batchSize,
+                            missingColumns,
+                            true);
+        }
+    }
+
+    /**
+     * Create readable vectors from writable vectors. Especially for decimal, see {@link
+     * ParquetDecimalVector}.
+     */
+    private ColumnVector[] createVectorizedColumnBatch(
+            List<DataType> types, WritableColumnVector[] writableVectors) {
+        ColumnVector[] vectors = new ColumnVector[writableVectors.length];
+        for (int i = 0; i < writableVectors.length; i++) {
+            switch (types.get(i).getTypeRoot()) {
+                case DECIMAL:
+                    vectors[i] = new ParquetDecimalVector(writableVectors[i]);
+                    break;
+                case TIMESTAMP_WITHOUT_TIME_ZONE:
+                case TIMESTAMP_WITH_LOCAL_TIME_ZONE:
+                    vectors[i] = new ParquetTimestampVector(writableVectors[i]);
+                    break;
+                case ARRAY:
+                    vectors[i] =
+                            new WrapArrayColumnVector(
+                                    (HeapArrayVector) writableVectors[i],
+                                    createVectorizedColumnBatch(
+                                            Collections.singletonList(
+                                                    ((ArrayType) types.get(i)).getElementType()),
+                                            Arrays.stream(writableVectors[i].getChildren())
+                                                    .map(WritableColumnVector.class::cast)
+                                                    .toArray(WritableColumnVector[]::new)));
+                    break;
+                case MAP:
+                    MapType mapType = (MapType) types.get(i);
+                    vectors[i] =
+                            new WrapMapColumnVector(
+                                    (HeapMapVector) writableVectors[i],
+                                    createVectorizedColumnBatch(
+                                            Arrays.asList(
+                                                    mapType.getKeyType(), mapType.getValueType()),
+                                            Arrays.stream(writableVectors[i].getChildren())
+                                                    .map(WritableColumnVector.class::cast)
+                                                    .toArray(WritableColumnVector[]::new)));
+                    break;
+                case MULTISET:
+                    MultisetType multisetType = (MultisetType) types.get(i);
+                    vectors[i] =
+                            new WrapMapColumnVector(
+                                    (HeapMapVector) writableVectors[i],
+                                    createVectorizedColumnBatch(
+                                            Arrays.asList(
+                                                    multisetType.getElementType(),
+                                                    multisetType.getElementType()),
+                                            Arrays.stream(writableVectors[i].getChildren())
+                                                    .map(WritableColumnVector.class::cast)
+                                                    .toArray(WritableColumnVector[]::new)));
+                    break;
+                case ROW:
+                    RowType rowType = (RowType) types.get(i);
+                    vectors[i] =
+                            new WrapRowColumnVector(
+                                    (HeapRowVector) writableVectors[i],
+                                    createVectorizedColumnBatch(
+                                            rowType.getFieldTypes(),
+                                            Arrays.stream(writableVectors[i].getChildren())
+                                                    .map(WritableColumnVector.class::cast)
+                                                    .toArray(WritableColumnVector[]::new)));
+                    break;
+                default:
+                    vectors[i] = writableVectors[i];
+            }
+        }
+
+        return vectors;
+    }
+
+    private void checkMissingColumns() throws IOException {
+        missingColumns = new HashSet<>();
+        for (ParquetField field : fields) {
+            checkColumn(field);
+        }
+    }
+
+    private void checkColumn(ParquetField field) throws IOException {
+        String[] path = field.path();
+
+        if (containsPath(fileSchema, path, 0)) {
+            if (field.isPrimitive()) {
+                ColumnDescriptor desc = ((ParquetPrimitiveField) field).getDescriptor();
+                ColumnDescriptor fd = fileSchema.getColumnDescription(desc.getPath());
+                if (!fd.equals(desc)) {
+                    throw new IOException("Schema evolution not supported.");
+                }
+            }
+        } else {
+            if (field.isRequired()) {
+                throw new IOException(
+                        "Required column is missing in data file. Col: " + Arrays.toString(path));
+            }
+            missingColumns.add(field);
+        }
+    }
+
+    private boolean containsPath(Type parquetType, String[] path, int depth) {
+        if (path.length == depth) {
+            return true;
+        }
+        if (parquetType instanceof GroupType) {
+            GroupType parquetGroupType = parquetType.asGroupType();
+            String fieldName = path[depth];
+            if (parquetGroupType.containsField(fieldName)) {
+                return containsPath(parquetGroupType.getType(fieldName), path, depth + 1);
+            }
+        }
+        return false;
+    }
+
+    public boolean nextBatch() throws IOException {
+        // Primary key table will use the last reccord, so we can't reset
+        // TODO: remove usage of the last record by primary key table after batch reset
+        if (rowsReturned >= totalRowCount) {
+            return false;
+        }
+        for (ParquetColumnVector vector : columnVectors) {
+            vector.reset();
+        }
+        columnarBatch.setNumRows(0);
+        checkEndOfRowGroup();
+
+        int num = (int) Math.min(batchSize, totalCountLoadedSoFar - rowsReturned);
+        for (ParquetColumnVector cv : columnVectors) {
+            for (ParquetColumnVector leafCv : cv.getLeaves()) {
+                VectorizedColumnReader columnReader = leafCv.getColumnReader();
+                if (columnReader != null) {
+                    columnReader.readBatch(
+                            num,
+                            leafCv.getColumn().getType(),
+                            leafCv.getValueVector(),
+                            leafCv.getRepetitionLevelVector(),
+                            leafCv.getDefinitionLevelVector());
+                }
+            }
+            cv.assemble();
+        }
+        rowsReturned += num;
+        columnarBatch.setNumRows(num);
+        rowIndexGenerator.populateRowIndex(columnarBatch, num);
+        return true;
+    }
+
+    private void checkEndOfRowGroup() throws IOException {
+        if (rowsReturned != totalCountLoadedSoFar) {
+            return;
+        }
+        PageReadStore pages = reader.readNextFilteredRowGroup();
+        if (pages == null) {
+            throw new IOException(
+                    "expecting more rows but reached last block. Read "
+                            + rowsReturned
+                            + " out of "
+                            + totalRowCount);
+        }
+
+        rowIndexGenerator.initFromPageReadStore(pages);
+        for (ParquetColumnVector cv : columnVectors) {
+            initColumnReader(pages, cv);
+        }
+        totalCountLoadedSoFar += pages.getRowCount();
+    }
+
+    private void initColumnReader(PageReadStore pages, ParquetColumnVector cv) throws IOException {
+        if (!missingColumns.contains(cv.getColumn())) {
+            if (cv.getColumn().isPrimitive()) {
+                ParquetField column = cv.getColumn();
+                VectorizedColumnReader reader =
+                        new VectorizedColumnReader(
+                                ((ParquetPrimitiveField) column).getDescriptor(),
+                                column.isRequired(),
+                                pages,
+                                writerVersion);
+                cv.setColumnReader(reader);
+            } else {
+                // Not in missing columns and is a complex type: this must be a struct
+                for (ParquetColumnVector childCv : cv.getChildren()) {
+                    initColumnReader(pages, childCv);
+                }
+            }
+        }
+    }
+
+    @Override
+    public @Nullable FileRecordIterator<InternalRow> readBatch() throws IOException {
+        if (nextBatch()) {
+            return columnarBatch.vectorizedRowIterator;
+        } else {
+            return null;
+        }
+    }
+
+    @Override
+    public void close() throws IOException {
+        if (reader != null) {
+            reader.close();
+            reader = null;
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java
new file mode 100644
index 000000000000..66e5d07f66be
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java
@@ -0,0 +1,315 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableBooleanVector;
+import org.apache.paimon.data.columnar.writable.WritableByteVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+import org.apache.paimon.data.columnar.writable.WritableDoubleVector;
+import org.apache.paimon.data.columnar.writable.WritableFloatVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.data.columnar.writable.WritableLongVector;
+import org.apache.paimon.data.columnar.writable.WritableShortVector;
+
+import org.apache.parquet.bytes.ByteBufferInputStream;
+import org.apache.parquet.column.values.ValuesReader;
+import org.apache.parquet.io.ParquetDecodingException;
+import org.apache.parquet.io.api.Binary;
+
+import java.io.IOException;
+import java.nio.ByteBuffer;
+import java.nio.ByteOrder;
+
+/** An implementation of the Parquet PLAIN decoder that supports the vectorized interface. */
+public class VectorizedPlainValuesReader extends ValuesReader implements VectorizedValuesReader {
+    private ByteBufferInputStream in = null;
+
+    // Only used for booleans.
+    private int bitOffset;
+    private byte currentByte = 0;
+
+    public VectorizedPlainValuesReader() {}
+
+    @Override
+    public void initFromPage(int valueCount, ByteBufferInputStream in) throws IOException {
+        this.in = in;
+    }
+
+    @Override
+    public void skip() {
+        throw new UnsupportedOperationException("skip");
+    }
+
+    private void updateCurrentByte() {
+        try {
+            currentByte = (byte) in.read();
+        } catch (IOException e) {
+            throw new ParquetDecodingException("Failed to read a byte", e);
+        }
+    }
+
+    @Override
+    public final void readBooleans(int total, WritableBooleanVector c, int rowId) {
+        int i = 0;
+        if (bitOffset > 0) {
+            i = Math.min(8 - bitOffset, total);
+            c.setBooleans(rowId, i, currentByte, bitOffset);
+            bitOffset = (bitOffset + i) & 7;
+        }
+        for (; i + 7 < total; i += 8) {
+            updateCurrentByte();
+            c.setBooleans(rowId + i, currentByte);
+        }
+        if (i < total) {
+            updateCurrentByte();
+            bitOffset = total - i;
+            c.setBooleans(rowId + i, bitOffset, currentByte, 0);
+        }
+    }
+
+    @Override
+    public final void skipBooleans(int total) {
+        int i = 0;
+        if (bitOffset > 0) {
+            i = Math.min(8 - bitOffset, total);
+            bitOffset = (bitOffset + i) & 7;
+        }
+        if (i + 7 < total) {
+            int numBytesToSkip = (total - i) / 8;
+            try {
+                in.skipFully(numBytesToSkip);
+            } catch (IOException e) {
+                throw new ParquetDecodingException("Failed to skip bytes", e);
+            }
+            i += numBytesToSkip * 8;
+        }
+        if (i < total) {
+            updateCurrentByte();
+            bitOffset = total - i;
+        }
+    }
+
+    private ByteBuffer getBuffer(int length) {
+        try {
+            return in.slice(length).order(ByteOrder.LITTLE_ENDIAN);
+        } catch (IOException e) {
+            throw new ParquetDecodingException("Failed to read " + length + " bytes", e);
+        }
+    }
+
+    @Override
+    public final void readIntegers(int total, WritableIntVector c, int rowId) {
+        int requiredBytes = total * 4;
+        ByteBuffer buffer = getBuffer(requiredBytes);
+
+        if (buffer.hasArray()) {
+            int offset = buffer.arrayOffset() + buffer.position();
+            c.setIntsFromBinary(rowId, total, buffer.array(), offset);
+        } else {
+            for (int i = 0; i < total; i += 1) {
+                c.setInt(rowId + i, buffer.getInt());
+            }
+        }
+    }
+
+    @Override
+    public void skipIntegers(int total) {
+        in.skip(total * 4L);
+    }
+
+    @Override
+    public final void readLongs(int total, WritableLongVector c, int rowId) {
+        int requiredBytes = total * 8;
+        ByteBuffer buffer = getBuffer(requiredBytes);
+
+        if (buffer.hasArray()) {
+            int offset = buffer.arrayOffset() + buffer.position();
+            c.setLongsFromBinary(rowId, total, buffer.array(), offset);
+        } else {
+            for (int i = 0; i < total; i += 1) {
+                c.setLong(rowId + i, buffer.getLong());
+            }
+        }
+    }
+
+    @Override
+    public void skipLongs(int total) {
+        in.skip(total * 8L);
+    }
+
+    @Override
+    public final void readFloats(int total, WritableFloatVector c, int rowId) {
+        int requiredBytes = total * 4;
+        ByteBuffer buffer = getBuffer(requiredBytes);
+
+        if (buffer.hasArray()) {
+            int offset = buffer.arrayOffset() + buffer.position();
+            c.setFloatsFromBinary(rowId, total, buffer.array(), offset);
+        } else {
+            for (int i = 0; i < total; i += 1) {
+                c.setFloat(rowId + i, buffer.getFloat());
+            }
+        }
+    }
+
+    @Override
+    public void skipFloats(int total) {
+        in.skip(total * 4L);
+    }
+
+    @Override
+    public final void readDoubles(int total, WritableDoubleVector c, int rowId) {
+        int requiredBytes = total * 8;
+        ByteBuffer buffer = getBuffer(requiredBytes);
+
+        if (buffer.hasArray()) {
+            int offset = buffer.arrayOffset() + buffer.position();
+            c.setDoublesFromBinary(rowId, total, buffer.array(), offset);
+        } else {
+            for (int i = 0; i < total; i += 1) {
+                c.setDouble(rowId + i, buffer.getDouble());
+            }
+        }
+    }
+
+    @Override
+    public void skipDoubles(int total) {
+        in.skip(total * 8L);
+    }
+
+    @Override
+    public final void readBytes(int total, WritableByteVector c, int rowId) {
+        // Bytes are stored as a 4-byte little endian int. Just read the first byte.
+        // TODO: consider pushing this in ColumnVector by adding a readBytes with a stride.
+        int requiredBytes = total * 4;
+        ByteBuffer buffer = getBuffer(requiredBytes);
+
+        for (int i = 0; i < total; i += 1) {
+            c.setByte(rowId + i, buffer.get());
+            // skip the next 3 bytes
+            buffer.position(buffer.position() + 3);
+        }
+    }
+
+    @Override
+    public final void skipBytes(int total) {
+        in.skip(total * 4L);
+    }
+
+    @Override
+    public final void readShorts(int total, WritableShortVector c, int rowId) {
+        int requiredBytes = total * 4;
+        ByteBuffer buffer = getBuffer(requiredBytes);
+
+        for (int i = 0; i < total; i += 1) {
+            c.setShort(rowId + i, (short) buffer.getInt());
+        }
+    }
+
+    @Override
+    public void skipShorts(int total) {
+        in.skip(total * 4L);
+    }
+
+    @Override
+    public final boolean readBoolean() {
+        if (bitOffset == 0) {
+            updateCurrentByte();
+        }
+
+        boolean v = (currentByte & (1 << bitOffset)) != 0;
+        bitOffset += 1;
+        if (bitOffset == 8) {
+            bitOffset = 0;
+        }
+        return v;
+    }
+
+    @Override
+    public final int readInteger() {
+        return getBuffer(4).getInt();
+    }
+
+    @Override
+    public final long readLong() {
+        return getBuffer(8).getLong();
+    }
+
+    @Override
+    public final byte readByte() {
+        return (byte) readInteger();
+    }
+
+    @Override
+    public short readShort() {
+        return (short) readInteger();
+    }
+
+    @Override
+    public final float readFloat() {
+        return getBuffer(4).getFloat();
+    }
+
+    @Override
+    public final double readDouble() {
+        return getBuffer(8).getDouble();
+    }
+
+    @Override
+    public final void readBinary(int total, WritableBytesVector v, int rowId) {
+        for (int i = 0; i < total; i++) {
+            int len = readInteger();
+            ByteBuffer buffer = getBuffer(len);
+            if (buffer.hasArray()) {
+                v.putByteArray(
+                        rowId + i, buffer.array(), buffer.arrayOffset() + buffer.position(), len);
+            } else {
+                byte[] bytes = new byte[len];
+                buffer.get(bytes);
+                v.putByteArray(rowId + i, bytes, 0, bytes.length);
+            }
+        }
+    }
+
+    @Override
+    public void skipBinary(int total) {
+        for (int i = 0; i < total; i++) {
+            int len = readInteger();
+            in.skip(len);
+        }
+    }
+
+    @Override
+    public final Binary readBinary(int len) {
+        ByteBuffer buffer = getBuffer(len);
+        if (buffer.hasArray()) {
+            return Binary.fromConstantByteArray(
+                    buffer.array(), buffer.arrayOffset() + buffer.position(), len);
+        } else {
+            byte[] bytes = new byte[len];
+            buffer.get(bytes);
+            return Binary.fromConstantByteArray(bytes);
+        }
+    }
+
+    @Override
+    public void skipFixedLenByteArray(int total, int len) {
+        in.skip(total * (long) len);
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java
new file mode 100644
index 000000000000..ab2ddbc40dcb
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java
@@ -0,0 +1,143 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableBooleanVector;
+import org.apache.paimon.data.columnar.writable.WritableByteVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+import org.apache.paimon.data.columnar.writable.WritableDoubleVector;
+import org.apache.paimon.data.columnar.writable.WritableFloatVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.data.columnar.writable.WritableLongVector;
+import org.apache.paimon.data.columnar.writable.WritableShortVector;
+
+import org.apache.parquet.column.values.ValuesReader;
+import org.apache.parquet.io.api.Binary;
+
+/**
+ * Base class for implementations of VectorizedValuesReader. Mainly to avoid duplication of methods
+ * that are not supported by concrete implementations
+ */
+public class VectorizedReaderBase extends ValuesReader implements VectorizedValuesReader {
+
+    @Override
+    public void skip() {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public byte readByte() {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public short readShort() {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public Binary readBinary(int len) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readBooleans(int total, WritableBooleanVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readBytes(int total, WritableByteVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readShorts(int total, WritableShortVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readIntegers(int total, WritableIntVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readLongs(int total, WritableLongVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readFloats(int total, WritableFloatVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readDoubles(int total, WritableDoubleVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void readBinary(int total, WritableBytesVector c, int rowId) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipBooleans(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipBytes(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipShorts(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipIntegers(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipLongs(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipFloats(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipDoubles(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipBinary(int total) {
+        throw new UnsupportedOperationException();
+    }
+
+    @Override
+    public void skipFixedLenByteArray(int total, int len) {
+        throw new UnsupportedOperationException();
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java
new file mode 100644
index 000000000000..ded66eb5eeb1
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java
@@ -0,0 +1,1042 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableBooleanVector;
+import org.apache.paimon.data.columnar.writable.WritableByteVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableDoubleVector;
+import org.apache.paimon.data.columnar.writable.WritableFloatVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.data.columnar.writable.WritableLongVector;
+import org.apache.paimon.data.columnar.writable.WritableShortVector;
+
+import org.apache.parquet.Preconditions;
+import org.apache.parquet.bytes.ByteBufferInputStream;
+import org.apache.parquet.bytes.BytesUtils;
+import org.apache.parquet.column.values.ValuesReader;
+import org.apache.parquet.column.values.bitpacking.BytePacker;
+import org.apache.parquet.column.values.bitpacking.Packer;
+import org.apache.parquet.io.ParquetDecodingException;
+import org.apache.parquet.io.api.Binary;
+
+import java.io.IOException;
+import java.nio.ByteBuffer;
+
+/**
+ * A values reader for Parquet's run-length encoded data. This is based off of the version in
+ * parquet-mr with these changes: - Supports the vectorized interface. - Works on byte
+ * arrays(byte[]) instead of making byte streams.
+ *
+ * <p>This encoding is used in multiple places: - Definition/Repetition levels - Dictionary ids. -
+ * Boolean type values of Parquet DataPageV2
+ */
+public final class VectorizedRleValuesReader extends ValuesReader
+        implements VectorizedValuesReader {
+    // Current decoding mode. The encoded data contains groups of either run length encoded data
+    // (RLE) or bit packed data. Each group contains a header that indicates which group it is and
+    // the number of values in the group.
+    // More details here: https://github.com/apache/parquet-format/blob/master/Encodings.md
+    private enum MODE {
+        RLE,
+        PACKED
+    }
+
+    // Encoded data.
+    private ByteBufferInputStream in;
+
+    // bit/byte width of decoded data and utility to batch unpack them.
+    private int bitWidth;
+    private int bytesWidth;
+    private BytePacker packer;
+
+    // Current decoding mode and values
+    private MODE mode;
+    private int currentCount;
+    private int currentValue;
+
+    // Buffer of decoded values if the values are PACKED.
+    private int[] currentBuffer = new int[16];
+    private int currentBufferIdx = 0;
+
+    // If true, the bit width is fixed. This decoder is used in different places and this also
+    // controls if we need to read the bitwidth from the beginning of the data stream.
+    private final boolean fixedWidth;
+    private final boolean readLength;
+
+    public VectorizedRleValuesReader() {
+        this.fixedWidth = false;
+        this.readLength = false;
+    }
+
+    public VectorizedRleValuesReader(int bitWidth) {
+        this.fixedWidth = true;
+        this.readLength = bitWidth != 0;
+        init(bitWidth);
+    }
+
+    public VectorizedRleValuesReader(int bitWidth, boolean readLength) {
+        this.fixedWidth = true;
+        this.readLength = readLength;
+        init(bitWidth);
+    }
+
+    @Override
+    public void initFromPage(int valueCount, ByteBufferInputStream in) throws IOException {
+        this.in = in;
+        if (fixedWidth) {
+            // Initialize for repetition and definition levels
+            if (readLength) {
+                int length = readIntLittleEndian();
+                this.in = in.sliceStream(length);
+            }
+        } else {
+            // Initialize for values
+            if (in.available() > 0) {
+                init(in.read());
+            }
+        }
+        if (bitWidth == 0) {
+            // 0 bit width, treat this as an RLE run of valueCount number of 0's.
+            this.mode = MODE.RLE;
+            this.currentCount = valueCount;
+            this.currentValue = 0;
+        } else {
+            this.currentCount = 0;
+        }
+    }
+
+    /** Initializes the internal state for decoding ints of `bitWidth`. */
+    private void init(int bitWidth) {
+        Preconditions.checkArgument(
+                bitWidth >= 0 && bitWidth <= 32, "bitWidth must be >= 0 and <= 32");
+        this.bitWidth = bitWidth;
+        this.bytesWidth = BytesUtils.paddedByteCountFromBits(bitWidth);
+        this.packer = Packer.LITTLE_ENDIAN.newBytePacker(bitWidth);
+    }
+
+    @Override
+    public boolean readBoolean() {
+        return this.readInteger() != 0;
+    }
+
+    @Override
+    public void skip() {
+        this.readInteger();
+    }
+
+    @Override
+    public int readValueDictionaryId() {
+        return readInteger();
+    }
+
+    @Override
+    public int readInteger() {
+        if (this.currentCount == 0) {
+            this.readNextGroup();
+        }
+
+        this.currentCount--;
+        switch (mode) {
+            case RLE:
+                return this.currentValue;
+            case PACKED:
+                return this.currentBuffer[currentBufferIdx++];
+            default:
+                throw new ParquetDecodingException("not a valid mode " + mode);
+        }
+    }
+
+    /**
+     * Reads a batch of definition levels and values into vector 'defLevels' and 'values'
+     * respectively. The values are read using 'valueReader'.
+     *
+     * <p>The related states such as row index, offset, number of values left in the batch and page,
+     * are tracked by 'state'. The type-specific 'updater' is used to update or skip values.
+     *
+     * <p>This reader reads the definition levels and then will read from 'valueReader' for the
+     * non-null values. If the value is null, 'values' will be populated with null value.
+     */
+    public void readBatch(
+            ParquetReadState state,
+            WritableColumnVector values,
+            WritableIntVector defLevels,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+        if (defLevels == null) {
+            readBatchInternal(state, values, values, valueReader, updater);
+        } else {
+            readBatchInternalWithDefLevels(state, values, values, defLevels, valueReader, updater);
+        }
+    }
+
+    /**
+     * Decoding for dictionary ids. The IDs are populated into 'values' and the nullability is
+     * populated into 'nulls'.
+     */
+    public void readIntegers(
+            ParquetReadState state,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            WritableIntVector defLevels,
+            VectorizedValuesReader valueReader) {
+        if (defLevels == null) {
+            readBatchInternal(
+                    state,
+                    values,
+                    nulls,
+                    valueReader,
+                    new ParquetVectorUpdaterFactory.IntegerUpdater());
+        } else {
+            readBatchInternalWithDefLevels(
+                    state,
+                    values,
+                    nulls,
+                    defLevels,
+                    valueReader,
+                    new ParquetVectorUpdaterFactory.IntegerUpdater());
+        }
+    }
+
+    private void readBatchInternal(
+            ParquetReadState state,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+
+        long rowId = state.rowId;
+        int leftInBatch = state.rowsToReadInBatch;
+        int leftInPage = state.valuesToReadInPage;
+
+        while (leftInBatch > 0 && leftInPage > 0) {
+            if (currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+            int n = Math.min(leftInBatch, Math.min(leftInPage, this.currentCount));
+
+            long rangeStart = state.currentRangeStart();
+            long rangeEnd = state.currentRangeEnd();
+
+            if (rowId + n < rangeStart) {
+                skipValues(n, state, valueReader, updater);
+                rowId += n;
+                leftInPage -= n;
+            } else if (rowId > rangeEnd) {
+                state.nextRange();
+            } else {
+                // The range [rowId, rowId + n) overlaps with the current row range in state
+                long start = Math.max(rangeStart, rowId);
+                long end = Math.min(rangeEnd, rowId + n - 1);
+
+                // Skip the part [rowId, start)
+                int toSkip = (int) (start - rowId);
+                if (toSkip > 0) {
+                    skipValues(toSkip, state, valueReader, updater);
+                    rowId += toSkip;
+                    leftInPage -= toSkip;
+                }
+
+                // Read the part [start, end]
+                n = (int) (end - start + 1);
+
+                switch (mode) {
+                    case RLE:
+                        {
+                            if (currentValue == state.maxDefinitionLevel) {
+                                updater.readValues(n, state.valueOffset, values, valueReader);
+                            } else {
+                                nulls.setNulls(state.valueOffset, n);
+                            }
+                            state.valueOffset += n;
+                            break;
+                        }
+                    case PACKED:
+                        {
+                            for (int i = 0; i < n; ++i) {
+                                int currentValue = currentBuffer[currentBufferIdx++];
+                                if (currentValue == state.maxDefinitionLevel) {
+                                    updater.readValue(state.valueOffset++, values, valueReader);
+                                } else {
+                                    nulls.setNullAt(state.valueOffset++);
+                                }
+                            }
+                            break;
+                        }
+                }
+                state.levelOffset += n;
+                leftInBatch -= n;
+                rowId += n;
+                leftInPage -= n;
+                currentCount -= n;
+            }
+        }
+
+        state.rowsToReadInBatch = leftInBatch;
+        state.valuesToReadInPage = leftInPage;
+        state.rowId = rowId;
+    }
+
+    private void readBatchInternalWithDefLevels(
+            ParquetReadState state,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            WritableIntVector defLevels,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+
+        long rowId = state.rowId;
+        int leftInBatch = state.rowsToReadInBatch;
+        int leftInPage = state.valuesToReadInPage;
+
+        while (leftInBatch > 0 && leftInPage > 0) {
+            if (currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+            int n = Math.min(leftInBatch, Math.min(leftInPage, this.currentCount));
+
+            long rangeStart = state.currentRangeStart();
+            long rangeEnd = state.currentRangeEnd();
+
+            if (rowId + n < rangeStart) {
+                skipValues(n, state, valueReader, updater);
+                rowId += n;
+                leftInPage -= n;
+            } else if (rowId > rangeEnd) {
+                state.nextRange();
+            } else {
+                // The range [rowId, rowId + n) overlaps with the current row range in state
+                long start = Math.max(rangeStart, rowId);
+                long end = Math.min(rangeEnd, rowId + n - 1);
+
+                // Skip the part [rowId, start)
+                int toSkip = (int) (start - rowId);
+                if (toSkip > 0) {
+                    skipValues(toSkip, state, valueReader, updater);
+                    rowId += toSkip;
+                    leftInPage -= toSkip;
+                }
+
+                // Read the part [start, end]
+                n = (int) (end - start + 1);
+                readValuesN(n, state, defLevels, values, nulls, valueReader, updater);
+
+                state.levelOffset += n;
+                leftInBatch -= n;
+                rowId += n;
+                leftInPage -= n;
+                currentCount -= n;
+                defLevels.addElementsAppended(n);
+            }
+        }
+
+        state.rowsToReadInBatch = leftInBatch;
+        state.valuesToReadInPage = leftInPage;
+        state.rowId = rowId;
+    }
+
+    /**
+     * Reads a batch of repetition levels, definition levels and values into 'repLevels',
+     * 'defLevels' and 'values' respectively. The definition levels and values are read via
+     * 'defLevelsReader' and 'valueReader' respectively.
+     *
+     * <p>The related states such as row index, offset, number of rows left in the batch and page,
+     * are tracked by 'state'. The type-specific 'updater' is used to update or skip values.
+     */
+    public void readBatchRepeated(
+            ParquetReadState state,
+            WritableIntVector repLevels,
+            VectorizedRleValuesReader defLevelsReader,
+            WritableIntVector defLevels,
+            WritableColumnVector values,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+        readBatchRepeatedInternal(
+                state,
+                repLevels,
+                defLevelsReader,
+                defLevels,
+                values,
+                values,
+                true,
+                valueReader,
+                updater);
+    }
+
+    /**
+     * Reads a batch of repetition levels, definition levels and integer values into 'repLevels',
+     * 'defLevels', 'values' and 'nulls' respectively. The definition levels and values are read via
+     * 'defLevelsReader' and 'valueReader' respectively.
+     *
+     * <p>The 'values' vector is used to hold non-null values, while 'nulls' vector is used to hold
+     * null values.
+     *
+     * <p>The related states such as row index, offset, number of rows left in the batch and page,
+     * are tracked by 'state'.
+     *
+     * <p>Unlike 'readBatchRepeated', this is used to decode dictionary indices in dictionary
+     * encoding.
+     */
+    public void readIntegersRepeated(
+            ParquetReadState state,
+            WritableIntVector repLevels,
+            VectorizedRleValuesReader defLevelsReader,
+            WritableIntVector defLevels,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            VectorizedValuesReader valueReader) {
+        readBatchRepeatedInternal(
+                state,
+                repLevels,
+                defLevelsReader,
+                defLevels,
+                values,
+                nulls,
+                false,
+                valueReader,
+                new ParquetVectorUpdaterFactory.IntegerUpdater());
+    }
+
+    /**
+     * Keep reading repetition level values from the page until either: 1) we've read enough
+     * top-level rows to fill the current batch, or 2) we've drained the data page completely.
+     *
+     * @param valuesReused whether 'values' vector is reused for 'nulls'
+     */
+    public void readBatchRepeatedInternal(
+            ParquetReadState state,
+            WritableIntVector repLevels,
+            VectorizedRleValuesReader defLevelsReader,
+            WritableIntVector defLevels,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            boolean valuesReused,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+
+        int leftInBatch = state.rowsToReadInBatch;
+        int leftInPage = state.valuesToReadInPage;
+        long rowId = state.rowId;
+
+        DefLevelProcessor defLevelProcessor =
+                new DefLevelProcessor(
+                        defLevelsReader,
+                        state,
+                        defLevels,
+                        values,
+                        nulls,
+                        valuesReused,
+                        valueReader,
+                        updater);
+
+        while ((leftInBatch > 0 || !state.lastListCompleted) && leftInPage > 0) {
+            if (currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+
+            // Values to read in the current RLE/PACKED block, must be <= what's left in the page
+            int valuesLeftInBlock = Math.min(leftInPage, currentCount);
+
+            // The current row range start and end
+            long rangeStart = state.currentRangeStart();
+            long rangeEnd = state.currentRangeEnd();
+
+            switch (mode) {
+                case RLE:
+                    {
+                        // This RLE block is consist of top-level rows, so we'll need to check
+                        // if the rows should be skipped according to row indexes.
+                        if (currentValue == 0) {
+                            if (leftInBatch == 0) {
+                                state.lastListCompleted = true;
+                            } else {
+                                // # of rows to read in the block, must be <= what's left in the
+                                // current batch
+                                int n = Math.min(leftInBatch, valuesLeftInBlock);
+
+                                if (rowId + n < rangeStart) {
+                                    // Need to skip all rows in [rowId, rowId + n)
+                                    defLevelProcessor.skipValues(n);
+                                    rowId += n;
+                                    currentCount -= n;
+                                    leftInPage -= n;
+                                } else if (rowId > rangeEnd) {
+                                    // The current row index already beyond the current range: move
+                                    // to the next range
+                                    // and repeat
+                                    state.nextRange();
+                                } else {
+                                    // The range [rowId, rowId + n) overlaps with the current row
+                                    // range
+                                    long start = Math.max(rangeStart, rowId);
+                                    long end = Math.min(rangeEnd, rowId + n - 1);
+
+                                    // Skip the rows in [rowId, start)
+                                    int toSkip = (int) (start - rowId);
+                                    if (toSkip > 0) {
+                                        defLevelProcessor.skipValues(toSkip);
+                                        rowId += toSkip;
+                                        currentCount -= toSkip;
+                                        leftInPage -= toSkip;
+                                    }
+
+                                    // Read the rows in [start, end]
+                                    n = (int) (end - start + 1);
+
+                                    if (n > 0) {
+                                        repLevels.appendInts(n, 0);
+                                        defLevelProcessor.readValues(n);
+                                    }
+
+                                    rowId += n;
+                                    currentCount -= n;
+                                    leftInBatch -= n;
+                                    leftInPage -= n;
+                                }
+                            }
+                        } else {
+                            // Not a top-level row: just read all the repetition levels in the block
+                            // if the row
+                            // should be included according to row indexes, else skip the rows.
+                            if (!state.shouldSkip) {
+                                repLevels.appendInts(valuesLeftInBlock, currentValue);
+                            }
+                            state.numBatchedDefLevels += valuesLeftInBlock;
+                            leftInPage -= valuesLeftInBlock;
+                            currentCount -= valuesLeftInBlock;
+                        }
+                        break;
+                    }
+                case PACKED:
+                    {
+                        int i = 0;
+
+                        for (; i < valuesLeftInBlock; i++) {
+                            int currentValue = currentBuffer[currentBufferIdx + i];
+                            if (currentValue == 0) {
+                                if (leftInBatch == 0) {
+                                    state.lastListCompleted = true;
+                                    break;
+                                } else if (rowId < rangeStart) {
+                                    // This is a top-level row, therefore check if we should skip it
+                                    // with row indexes
+                                    // the row is before the current range, skip it
+                                    defLevelProcessor.skipValues(1);
+                                } else if (rowId > rangeEnd) {
+                                    // The row is after the current range, move to the next range
+                                    // and compare again
+                                    state.nextRange();
+                                    break;
+                                } else {
+                                    // The row is in the current range, decrement the row counter
+                                    // and read it
+                                    leftInBatch--;
+                                    repLevels.appendInt(0);
+                                    defLevelProcessor.readValues(1);
+                                }
+                                rowId++;
+                            } else {
+                                if (!state.shouldSkip) {
+                                    repLevels.appendInt(currentValue);
+                                }
+                                state.numBatchedDefLevels += 1;
+                            }
+                        }
+
+                        leftInPage -= i;
+                        currentCount -= i;
+                        currentBufferIdx += i;
+                        break;
+                    }
+            }
+        }
+
+        // Process all the batched def levels
+        defLevelProcessor.finish();
+
+        state.rowsToReadInBatch = leftInBatch;
+        state.valuesToReadInPage = leftInPage;
+        state.rowId = rowId;
+    }
+
+    private static class DefLevelProcessor {
+        private final VectorizedRleValuesReader reader;
+        private final ParquetReadState state;
+        private final WritableIntVector defLevels;
+        private final WritableColumnVector values;
+        private final WritableColumnVector nulls;
+        private final boolean valuesReused;
+        private final VectorizedValuesReader valueReader;
+        private final ParquetVectorUpdater updater;
+
+        DefLevelProcessor(
+                VectorizedRleValuesReader reader,
+                ParquetReadState state,
+                WritableIntVector defLevels,
+                WritableColumnVector values,
+                WritableColumnVector nulls,
+                boolean valuesReused,
+                VectorizedValuesReader valueReader,
+                ParquetVectorUpdater updater) {
+            this.reader = reader;
+            this.state = state;
+            this.defLevels = defLevels;
+            this.values = values;
+            this.nulls = nulls;
+            this.valuesReused = valuesReused;
+            this.valueReader = valueReader;
+            this.updater = updater;
+        }
+
+        void readValues(int n) {
+            if (!state.shouldSkip) {
+                state.numBatchedDefLevels += n;
+            } else {
+                reader.skipValues(state.numBatchedDefLevels, state, valueReader, updater);
+                state.numBatchedDefLevels = n;
+                state.shouldSkip = false;
+            }
+        }
+
+        void skipValues(int n) {
+            if (state.shouldSkip) {
+                state.numBatchedDefLevels += n;
+            } else {
+                reader.readValues(
+                        state.numBatchedDefLevels,
+                        state,
+                        defLevels,
+                        values,
+                        nulls,
+                        valuesReused,
+                        valueReader,
+                        updater);
+                state.numBatchedDefLevels = n;
+                state.shouldSkip = true;
+            }
+        }
+
+        void finish() {
+            if (state.numBatchedDefLevels > 0) {
+                if (state.shouldSkip) {
+                    reader.skipValues(state.numBatchedDefLevels, state, valueReader, updater);
+                } else {
+                    reader.readValues(
+                            state.numBatchedDefLevels,
+                            state,
+                            defLevels,
+                            values,
+                            nulls,
+                            valuesReused,
+                            valueReader,
+                            updater);
+                }
+                state.numBatchedDefLevels = 0;
+            }
+        }
+    }
+
+    /**
+     * Read the next 'total' values (either null or non-null) from this definition level reader and
+     * 'valueReader'. The definition levels are read into 'defLevels'. If a value is not null, it is
+     * appended to 'values'. Otherwise, a null bit will be set in 'nulls'.
+     *
+     * <p>This is only used when reading repeated values.
+     */
+    private void readValues(
+            int total,
+            ParquetReadState state,
+            WritableIntVector defLevels,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            boolean valuesReused,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+
+        defLevels.reserveAdditional(total);
+        values.reserveAdditional(total);
+        if (!valuesReused) {
+            // 'nulls' is a separate column vector so we'll have to reserve it separately
+            nulls.reserveAdditional(total);
+        }
+
+        int n = total;
+        int initialValueOffset = state.valueOffset;
+        while (n > 0) {
+            if (currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+            int num = Math.min(n, this.currentCount);
+            readValuesN(num, state, defLevels, values, nulls, valueReader, updater);
+            state.levelOffset += num;
+            currentCount -= num;
+            n -= num;
+        }
+
+        defLevels.addElementsAppended(total);
+
+        int valuesRead = state.valueOffset - initialValueOffset;
+        values.addElementsAppended(valuesRead);
+        if (!valuesReused) {
+            nulls.addElementsAppended(valuesRead);
+        }
+    }
+
+    private void readValuesN(
+            int n,
+            ParquetReadState state,
+            WritableIntVector defLevels,
+            WritableColumnVector values,
+            WritableColumnVector nulls,
+            VectorizedValuesReader valueReader,
+            ParquetVectorUpdater updater) {
+        switch (mode) {
+            case RLE:
+                {
+                    if (currentValue == state.maxDefinitionLevel) {
+                        updater.readValues(n, state.valueOffset, values, valueReader);
+                    } else {
+                        nulls.setNulls(state.valueOffset, n);
+                    }
+                    state.valueOffset += n;
+                    defLevels.setInts(state.levelOffset, n, currentValue);
+                    break;
+                }
+            case PACKED:
+                {
+                    for (int i = 0; i < n; ++i) {
+                        int currentValue = currentBuffer[currentBufferIdx++];
+                        if (currentValue == state.maxDefinitionLevel) {
+                            updater.readValue(state.valueOffset++, values, valueReader);
+                        } else {
+                            nulls.setNullAt(state.valueOffset++);
+                        }
+                        defLevels.setInt(state.levelOffset + i, currentValue);
+                    }
+                    break;
+                }
+        }
+    }
+
+    /**
+     * Skip the next `n` values (either null or non-null) from this definition level reader and
+     * `valueReader`.
+     */
+    private void skipValues(
+            int n,
+            ParquetReadState state,
+            VectorizedValuesReader valuesReader,
+            ParquetVectorUpdater updater) {
+        while (n > 0) {
+            if (currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+            int num = Math.min(n, this.currentCount);
+            switch (mode) {
+                case RLE:
+                    {
+                        // We only need to skip non-null values from `valuesReader` since nulls are
+                        // represented
+                        // via definition levels which are skipped here via decrementing
+                        // `currentCount`.
+                        if (currentValue == state.maxDefinitionLevel) {
+                            updater.skipValues(num, valuesReader);
+                        }
+                        break;
+                    }
+                case PACKED:
+                    {
+                        int totalSkipNum = 0;
+                        for (int i = 0; i < num; ++i) {
+                            // Same as above, only skip non-null values from `valuesReader`
+                            if (currentBuffer[currentBufferIdx++] == state.maxDefinitionLevel) {
+                                ++totalSkipNum;
+                            }
+                        }
+                        updater.skipValues(totalSkipNum, valuesReader);
+                    }
+            }
+            currentCount -= num;
+            n -= num;
+        }
+    }
+
+    // The RLE reader implements the vectorized decoding interface when used to decode dictionary
+    // IDs. This is different than the above APIs that decodes definitions levels along with values.
+    // Since this is only used to decode dictionary IDs, only decoding integers is supported.
+    @Override
+    public void readIntegers(int total, WritableIntVector c, int rowId) {
+        int left = total;
+        while (left > 0) {
+            if (currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+            int n = Math.min(left, this.currentCount);
+            switch (mode) {
+                case RLE:
+                    c.setInts(rowId, n, currentValue);
+                    break;
+                case PACKED:
+                    {
+                        c.setInts(rowId, n, currentBuffer, currentBufferIdx);
+                        currentBufferIdx += n;
+                        break;
+                    }
+            }
+            rowId += n;
+            left -= n;
+            currentCount -= n;
+        }
+    }
+
+    @Override
+    public byte readByte() {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public short readShort() {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void readBytes(int total, WritableByteVector c, int rowId) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void readShorts(int total, WritableShortVector c, int rowId) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void readLongs(int total, WritableLongVector c, int rowId) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void readBinary(int total, WritableBytesVector c, int rowId) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void readBooleans(int total, WritableBooleanVector c, int rowId) {
+        int left = total;
+        while (left > 0) {
+            if (this.currentCount == 0) {
+                this.readNextGroup();
+            }
+            int n = Math.min(left, this.currentCount);
+            switch (mode) {
+                case RLE:
+                    c.setBooleans(rowId, n, currentValue != 0);
+                    break;
+                case PACKED:
+                    {
+                        for (int i = 0; i < n; ++i) {
+                            // For Boolean types, `currentBuffer[currentBufferIdx++]` can only be 0
+                            // or 1
+                            c.setBoolean(rowId + i, currentBuffer[currentBufferIdx++] != 0);
+                        }
+                        break;
+                    }
+            }
+            rowId += n;
+            left -= n;
+            currentCount -= n;
+        }
+    }
+
+    @Override
+    public void readFloats(int total, WritableFloatVector c, int rowId) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void readDoubles(int total, WritableDoubleVector c, int rowId) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public Binary readBinary(int len) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3187");
+    }
+
+    @Override
+    public void skipIntegers(int total) {
+        skipValues(total);
+    }
+
+    @Override
+    public void skipBooleans(int total) {
+        skipValues(total);
+    }
+
+    @Override
+    public void skipBytes(int total) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    @Override
+    public void skipShorts(int total) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    @Override
+    public void skipLongs(int total) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    @Override
+    public void skipFloats(int total) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    @Override
+    public void skipDoubles(int total) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    @Override
+    public void skipBinary(int total) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    @Override
+    public void skipFixedLenByteArray(int total, int len) {
+        throw new RuntimeException("_LEGACY_ERROR_TEMP_3188");
+    }
+
+    /** Reads the next varint encoded int. */
+    private int readUnsignedVarInt() throws IOException {
+        int value = 0;
+        int shift = 0;
+        int b;
+        do {
+            b = in.read();
+            value |= (b & 0x7F) << shift;
+            shift += 7;
+        } while ((b & 0x80) != 0);
+        return value;
+    }
+
+    /** Reads the next 4 byte little endian int. */
+    private int readIntLittleEndian() throws IOException {
+        int ch4 = in.read();
+        int ch3 = in.read();
+        int ch2 = in.read();
+        int ch1 = in.read();
+        return ((ch1 << 24) + (ch2 << 16) + (ch3 << 8) + (ch4 << 0));
+    }
+
+    /** Reads the next byteWidth little endian int. */
+    private int readIntLittleEndianPaddedOnBitWidth() throws IOException {
+        switch (bytesWidth) {
+            case 0:
+                return 0;
+            case 1:
+                return in.read();
+            case 2:
+                {
+                    int ch2 = in.read();
+                    int ch1 = in.read();
+                    return (ch1 << 8) + ch2;
+                }
+            case 3:
+                {
+                    int ch3 = in.read();
+                    int ch2 = in.read();
+                    int ch1 = in.read();
+                    return (ch1 << 16) + (ch2 << 8) + (ch3 << 0);
+                }
+            case 4:
+                return readIntLittleEndian();
+            default:
+                throw new RuntimeException("Unreachable");
+        }
+    }
+
+    /** Reads the next group. Returns false if no more group available. */
+    private boolean readNextGroup() {
+        if (in.available() <= 0) {
+            currentCount = 0;
+            return false;
+        }
+
+        try {
+            int header = readUnsignedVarInt();
+            this.mode = (header & 1) == 0 ? MODE.RLE : MODE.PACKED;
+            switch (mode) {
+                case RLE:
+                    {
+                        this.currentCount = header >>> 1;
+                        this.currentValue = readIntLittleEndianPaddedOnBitWidth();
+                        break;
+                    }
+                case PACKED:
+                    {
+                        int numGroups = header >>> 1;
+                        this.currentCount = numGroups * 8;
+
+                        if (this.currentBuffer.length < this.currentCount) {
+                            this.currentBuffer = new int[this.currentCount];
+                        }
+                        currentBufferIdx = 0;
+                        int valueIndex = 0;
+                        while (valueIndex < this.currentCount) {
+                            // values are bit packed 8 at a time, so reading bitWidth will always
+                            // work
+                            ByteBuffer buffer = in.slice(bitWidth);
+                            this.packer.unpack8Values(
+                                    buffer, buffer.position(), this.currentBuffer, valueIndex);
+                            valueIndex += 8;
+                        }
+                        break;
+                    }
+            }
+        } catch (IOException e) {
+            throw new ParquetDecodingException("Failed to read from input stream", e);
+        }
+
+        return true;
+    }
+
+    /** Skip `n` values from the current reader. */
+    private void skipValues(int n) {
+        int left = n;
+        while (left > 0) {
+            if (this.currentCount == 0 && !readNextGroup()) {
+                break;
+            }
+            int num = Math.min(left, this.currentCount);
+            switch (mode) {
+                case RLE:
+                    {
+                        break;
+                    }
+                case PACKED:
+                    currentBufferIdx += num;
+                    break;
+            }
+            currentCount -= num;
+            left -= num;
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java
new file mode 100644
index 000000000000..92bb92b01350
--- /dev/null
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java
@@ -0,0 +1,121 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.format.parquet.newreader;
+
+import org.apache.paimon.data.columnar.writable.WritableBooleanVector;
+import org.apache.paimon.data.columnar.writable.WritableByteVector;
+import org.apache.paimon.data.columnar.writable.WritableBytesVector;
+import org.apache.paimon.data.columnar.writable.WritableColumnVector;
+import org.apache.paimon.data.columnar.writable.WritableDoubleVector;
+import org.apache.paimon.data.columnar.writable.WritableFloatVector;
+import org.apache.paimon.data.columnar.writable.WritableIntVector;
+import org.apache.paimon.data.columnar.writable.WritableLongVector;
+import org.apache.paimon.data.columnar.writable.WritableShortVector;
+
+import org.apache.parquet.io.api.Binary;
+
+import java.nio.ByteBuffer;
+
+/**
+ * Interface for value decoding that supports vectorized (aka batched) decoding. TODO: merge this
+ * into parquet-mr.
+ */
+public interface VectorizedValuesReader {
+    boolean readBoolean();
+
+    byte readByte();
+
+    short readShort();
+
+    int readInteger();
+
+    long readLong();
+
+    float readFloat();
+
+    double readDouble();
+
+    Binary readBinary(int len);
+
+    /*
+     * Reads `total` values into `c` start at `c[rowId]`
+     */
+    void readBooleans(int total, WritableBooleanVector c, int rowId);
+
+    void readBytes(int total, WritableByteVector c, int rowId);
+
+    void readShorts(int total, WritableShortVector c, int rowId);
+
+    void readIntegers(int total, WritableIntVector c, int rowId);
+
+    void readLongs(int total, WritableLongVector c, int rowId);
+
+    void readFloats(int total, WritableFloatVector c, int rowId);
+
+    void readDoubles(int total, WritableDoubleVector c, int rowId);
+
+    void readBinary(int total, WritableBytesVector c, int rowId);
+
+    /*
+     * Skips `total` values
+     */
+    void skipBooleans(int total);
+
+    void skipBytes(int total);
+
+    void skipShorts(int total);
+
+    void skipIntegers(int total);
+
+    void skipLongs(int total);
+
+    void skipFloats(int total);
+
+    void skipDoubles(int total);
+
+    void skipBinary(int total);
+
+    void skipFixedLenByteArray(int total, int len);
+
+    /** A functional interface to write integer values to columnar output. */
+    @FunctionalInterface
+    interface IntegerOutputWriter {
+
+        /**
+         * A functional interface that writes a long value to a specified row in an output column
+         * vector.
+         *
+         * @param outputColumnVector the vector to write to
+         * @param rowId the row to write to
+         * @param val value to write
+         */
+        void write(WritableColumnVector outputColumnVector, int rowId, long val);
+    }
+
+    /** A functional interface to write double values to columnar output. */
+    @FunctionalInterface
+    interface ByteBufferOutputWriter {
+        void write(WritableBytesVector c, int rowId, ByteBuffer val, int length);
+
+        static void writeArrayByteBuffer(
+                WritableBytesVector c, int rowId, ByteBuffer val, int length) {
+            c.putByteArray(rowId, val.array(), val.arrayOffset() + val.position(), length);
+        }
+    }
+}
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/BytesColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/BytesColumnReader.java
index 6ee395e58568..fc5c0b730bd6 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/BytesColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/BytesColumnReader.java
@@ -111,7 +111,7 @@ protected void readBatchFromDictionaryIds(
         for (int i = rowId; i < rowId + num; ++i) {
             if (!column.isNullAt(i)) {
                 byte[] bytes = dictionary.decodeToBinary(dictionaryIds.getInt(i)).getBytesUnsafe();
-                column.appendBytes(i, bytes, 0, bytes.length);
+                column.putByteArray(i, bytes, 0, bytes.length);
             }
         }
     }
@@ -121,12 +121,12 @@ private void readBinary(int total, WritableBytesVector v, int rowId) {
             int len = readDataBuffer(4).getInt();
             ByteBuffer buffer = readDataBuffer(len);
             if (buffer.hasArray()) {
-                v.appendBytes(
+                v.putByteArray(
                         rowId + i, buffer.array(), buffer.arrayOffset() + buffer.position(), len);
             } else {
                 byte[] bytes = new byte[len];
                 buffer.get(bytes);
-                v.appendBytes(rowId + i, bytes, 0, bytes.length);
+                v.putByteArray(rowId + i, bytes, 0, bytes.length);
             }
         }
     }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesBinaryColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesBinaryColumnReader.java
index 5f8c78ca4cb5..bd6d897cab33 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesBinaryColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesBinaryColumnReader.java
@@ -44,7 +44,7 @@ protected void readBatch(int rowId, int num, VECTOR column) {
         for (int i = 0; i < num; i++) {
             if (runLenDecoder.readInteger() == maxDefLevel) {
                 byte[] bytes = readDataBinary(bytesLen).getBytesUnsafe();
-                bytesVector.appendBytes(rowId + i, bytes, 0, bytes.length);
+                bytesVector.putByteArray(rowId + i, bytes, 0, bytes.length);
             } else {
                 bytesVector.setNullAt(rowId + i);
             }
@@ -70,7 +70,7 @@ protected void readBatchFromDictionaryIds(
         for (int i = rowId; i < rowId + num; ++i) {
             if (!bytesVector.isNullAt(i)) {
                 byte[] v = dictionary.decodeToBinary(dictionaryIds.getInt(i)).getBytesUnsafe();
-                bytesVector.appendBytes(i, v, 0, v.length);
+                bytesVector.putByteArray(i, v, 0, v.length);
             }
         }
     }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesDecimalColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesDecimalColumnReader.java
index f8bad2575097..18b353db360c 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesDecimalColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/FixedLenBytesDecimalColumnReader.java
@@ -67,7 +67,7 @@ protected void readBatch(int rowId, int num, VECTOR column) {
             for (int i = 0; i < num; i++) {
                 if (runLenDecoder.readInteger() == maxDefLevel) {
                     byte[] bytes = readDataBinary(bytesLen).getBytesUnsafe();
-                    bytesVector.appendBytes(rowId + i, bytes, 0, bytes.length);
+                    bytesVector.putByteArray(rowId + i, bytes, 0, bytes.length);
                 } else {
                     bytesVector.setNullAt(rowId + i);
                 }
@@ -124,7 +124,7 @@ protected void readBatchFromDictionaryIds(
             for (int i = rowId; i < rowId + num; ++i) {
                 if (!bytesVector.isNullAt(i)) {
                     byte[] v = dictionary.decodeToBinary(dictionaryIds.getInt(i)).getBytesUnsafe();
-                    bytesVector.appendBytes(i, v, 0, v.length);
+                    bytesVector.putByteArray(i, v, 0, v.length);
                 }
             }
         }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedColumnReader.java
index 3e6da303b3d4..2ccaaa07f235 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedColumnReader.java
@@ -112,7 +112,8 @@ private Pair<LevelDelegation, WritableColumnVector> readRow(
         HeapRowVector heapRowVector = (HeapRowVector) vector;
         LevelDelegation levelDelegation = null;
         List<ParquetField> children = field.getChildren();
-        WritableColumnVector[] childrenVectors = heapRowVector.getFields();
+        WritableColumnVector[] childrenVectors =
+                (WritableColumnVector[]) heapRowVector.getChildren();
         WritableColumnVector[] finalChildrenVectors =
                 new WritableColumnVector[childrenVectors.length];
 
@@ -128,7 +129,7 @@ private Pair<LevelDelegation, WritableColumnVector> readRow(
 
             WritableColumnVector writableColumnVector = tuple.getRight();
             if (len == -1) {
-                len = ((ElementCountable) writableColumnVector).getLen();
+                len = ((ElementCountable) writableColumnVector).getCapacity();
                 isNull = new boolean[len];
                 Arrays.fill(isNull, true);
             }
@@ -177,9 +178,9 @@ private Pair<LevelDelegation, WritableColumnVector> readMap(
                 "Maps must have two type parameters, found %s",
                 children.size());
         Pair<LevelDelegation, WritableColumnVector> keyTuple =
-                readData(children.get(0), readNumber, mapVector.getKeyColumnVector(), true);
+                readData(children.get(0), readNumber, mapVector.getChildren()[0], true);
         Pair<LevelDelegation, WritableColumnVector> valueTuple =
-                readData(children.get(1), readNumber, mapVector.getValueColumnVector(), true);
+                readData(children.get(1), readNumber, mapVector.getChildren()[1], true);
 
         LevelDelegation levelDelegation = keyTuple.getLeft();
 
@@ -223,7 +224,7 @@ private Pair<LevelDelegation, WritableColumnVector> readArray(
                 "Arrays must have a single type parameter, found %s",
                 children.size());
         Pair<LevelDelegation, WritableColumnVector> tuple =
-                readData(children.get(0), readNumber, arrayVector.getChild(), true);
+                readData(children.get(0), readNumber, arrayVector.getChildren()[0], true);
 
         LevelDelegation levelDelegation = tuple.getLeft();
         CollectionPosition collectionPosition =
@@ -268,7 +269,7 @@ private Pair<LevelDelegation, WritableColumnVector> readPrimitive(
     }
 
     private static void setFieldNullFlag(boolean[] nullFlags, AbstractHeapVector vector) {
-        for (int index = 0; index < vector.getLen() && index < nullFlags.length; index++) {
+        for (int index = 0; index < vector.getCapacity() && index < nullFlags.length; index++) {
             if (nullFlags[index]) {
                 vector.setNullAt(index);
             }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedPrimitiveColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedPrimitiveColumnReader.java
index 78c335dab01c..cf232b3770fb 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedPrimitiveColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/NestedPrimitiveColumnReader.java
@@ -387,7 +387,7 @@ private WritableColumnVector fillColumnVector(int total, List valueList) {
                     if (src == null) {
                         heapBytesVector.setNullAt(i);
                     } else {
-                        heapBytesVector.appendBytes(i, src, 0, src.length);
+                        heapBytesVector.putByteArray(i, src, 0, src.length);
                     }
                 }
                 return heapBytesVector;
@@ -489,7 +489,7 @@ private WritableColumnVector fillColumnVector(int total, List valueList) {
                                 phiv.vector[i] = ((List<Integer>) valueList).get(i);
                             }
                         }
-                        return new ParquetDecimalVector(phiv, total);
+                        return new ParquetDecimalVector(phiv);
                     case INT64:
                         HeapLongVector phlv = new HeapLongVector(total);
                         for (int i = 0; i < valueList.size(); i++) {
@@ -499,10 +499,10 @@ private WritableColumnVector fillColumnVector(int total, List valueList) {
                                 phlv.vector[i] = ((List<Long>) valueList).get(i);
                             }
                         }
-                        return new ParquetDecimalVector(phlv, total);
+                        return new ParquetDecimalVector(phlv);
                     default:
                         HeapBytesVector phbv = getHeapBytesVector(total, valueList);
-                        return new ParquetDecimalVector(phbv, total);
+                        return new ParquetDecimalVector(phbv);
                 }
             default:
                 throw new RuntimeException("Unsupported type in the list: " + type);
@@ -516,7 +516,7 @@ private static HeapBytesVector getHeapBytesVector(int total, List valueList) {
             if (valueList.get(i) == null) {
                 phbv.setNullAt(i);
             } else {
-                phbv.appendBytes(i, src, 0, src.length);
+                phbv.putByteArray(i, src, 0, src.length);
             }
         }
         return phbv;
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java
index 42714ab066da..2cd4fa670b44 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java
@@ -45,12 +45,10 @@ public class ParquetDecimalVector
                 WritableBytesVector,
                 ElementCountable {
 
-    private final ColumnVector vector;
-    private final int len;
+    private final WritableColumnVector vector;
 
-    public ParquetDecimalVector(ColumnVector vector, int len) {
+    public ParquetDecimalVector(WritableColumnVector vector) {
         this.vector = vector;
-        this.len = len;
     }
 
     @Override
@@ -80,63 +78,74 @@ public boolean isNullAt(int i) {
         return vector.isNullAt(i);
     }
 
+    @Override
+    public int getCapacity() {
+        return vector.getCapacity();
+    }
+
     @Override
     public void reset() {
-        if (vector instanceof WritableColumnVector) {
-            ((WritableColumnVector) vector).reset();
-        }
+        vector.reset();
     }
 
     @Override
     public void setNullAt(int rowId) {
-        if (vector instanceof WritableColumnVector) {
-            ((WritableColumnVector) vector).setNullAt(rowId);
-        }
+        vector.setNullAt(rowId);
     }
 
     @Override
     public void setNulls(int rowId, int count) {
-        if (vector instanceof WritableColumnVector) {
-            ((WritableColumnVector) vector).setNulls(rowId, count);
-        }
+        vector.setNulls(rowId, count);
     }
 
     @Override
     public void fillWithNulls() {
-        if (vector instanceof WritableColumnVector) {
-            ((WritableColumnVector) vector).fillWithNulls();
-        }
+        vector.fillWithNulls();
     }
 
     @Override
     public void setDictionary(Dictionary dictionary) {
-        if (vector instanceof WritableColumnVector) {
-            ((WritableColumnVector) vector).setDictionary(dictionary);
-        }
+        vector.setDictionary(dictionary);
     }
 
     @Override
     public boolean hasDictionary() {
-        if (vector instanceof WritableColumnVector) {
-            return ((WritableColumnVector) vector).hasDictionary();
-        }
-        return false;
+        return vector.hasDictionary();
     }
 
     @Override
     public WritableIntVector reserveDictionaryIds(int capacity) {
-        if (vector instanceof WritableColumnVector) {
-            return ((WritableColumnVector) vector).reserveDictionaryIds(capacity);
-        }
-        throw new RuntimeException("Child vector must be instance of WritableColumnVector");
+        return vector.reserveDictionaryIds(capacity);
     }
 
     @Override
     public WritableIntVector getDictionaryIds() {
-        if (vector instanceof WritableColumnVector) {
-            return ((WritableColumnVector) vector).getDictionaryIds();
-        }
-        throw new RuntimeException("Child vector must be instance of WritableColumnVector");
+        return vector.getDictionaryIds();
+    }
+
+    @Override
+    public void setAllNull() {
+        vector.setAllNull();
+    }
+
+    @Override
+    public boolean isAllNull() {
+        return vector.isAllNull();
+    }
+
+    @Override
+    public void reserve(int capacity) {
+        vector.reserve(capacity);
+    }
+
+    @Override
+    public int getElementsAppended() {
+        return vector.getElementsAppended();
+    }
+
+    @Override
+    public void addElementsAppended(int num) {
+        vector.addElementsAppended(num);
     }
 
     @Override
@@ -148,9 +157,9 @@ public Bytes getBytes(int i) {
     }
 
     @Override
-    public void appendBytes(int rowId, byte[] value, int offset, int length) {
+    public void putByteArray(int rowId, byte[] value, int offset, int length) {
         if (vector instanceof WritableBytesVector) {
-            ((WritableBytesVector) vector).appendBytes(rowId, value, offset, length);
+            ((WritableBytesVector) vector).putByteArray(rowId, value, offset, length);
         }
     }
 
@@ -204,6 +213,16 @@ public void fill(int value) {
         }
     }
 
+    @Override
+    public int appendInt(int v) {
+        return 0;
+    }
+
+    @Override
+    public int appendInts(int count, int v) {
+        return 0;
+    }
+
     @Override
     public long getLong(int i) {
         if (vector instanceof WritableLongVector) {
@@ -232,9 +251,4 @@ public void fill(long value) {
             ((WritableLongVector) vector).fill(value);
         }
     }
-
-    @Override
-    public int getLen() {
-        return len;
-    }
 }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetSplitReaderUtil.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetSplitReaderUtil.java
index dda56a92a16c..ece0ff9a7f06 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetSplitReaderUtil.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetSplitReaderUtil.java
@@ -409,7 +409,12 @@ private static ParquetField constructField(DataField dataField, ColumnIO columnI
             }
 
             return new ParquetGroupField(
-                    type, repetitionLevel, definitionLevel, required, fieldsBuilder.build());
+                    type,
+                    repetitionLevel,
+                    definitionLevel,
+                    required,
+                    fieldsBuilder.build(),
+                    groupColumnIO.getFieldPath());
         }
 
         if (type instanceof VariantType) {
@@ -422,7 +427,8 @@ private static ParquetField constructField(DataField dataField, ColumnIO columnI
                             new BinaryType(),
                             required,
                             value.getColumnDescriptor(),
-                            value.getId()));
+                            value.getId(),
+                            value.getFieldPath()));
             PrimitiveColumnIO metadata =
                     (PrimitiveColumnIO) lookupColumnByName(groupColumnIO, Variant.METADATA);
             fieldsBuilder.add(
@@ -430,9 +436,15 @@ private static ParquetField constructField(DataField dataField, ColumnIO columnI
                             new BinaryType(),
                             required,
                             metadata.getColumnDescriptor(),
-                            metadata.getId()));
+                            metadata.getId(),
+                            metadata.getFieldPath()));
             return new ParquetGroupField(
-                    type, repetitionLevel, definitionLevel, required, fieldsBuilder.build());
+                    type,
+                    repetitionLevel,
+                    definitionLevel,
+                    required,
+                    fieldsBuilder.build(),
+                    groupColumnIO.getFieldPath());
         }
 
         if (type instanceof MapType) {
@@ -452,7 +464,8 @@ private static ParquetField constructField(DataField dataField, ColumnIO columnI
                     repetitionLevel,
                     definitionLevel,
                     required,
-                    ImmutableList.of(keyField, valueField));
+                    ImmutableList.of(keyField, valueField),
+                    groupColumnIO.getFieldPath());
         }
 
         if (type instanceof MultisetType) {
@@ -471,7 +484,8 @@ private static ParquetField constructField(DataField dataField, ColumnIO columnI
                     repetitionLevel,
                     definitionLevel,
                     required,
-                    ImmutableList.of(keyField, valueField));
+                    ImmutableList.of(keyField, valueField),
+                    groupColumnIO.getFieldPath());
         }
 
         if (type instanceof ArrayType) {
@@ -505,12 +519,21 @@ private static ParquetField constructField(DataField dataField, ColumnIO columnI
                 repetitionLevel = columnIO.getParent().getRepetitionLevel();
             }
             return new ParquetGroupField(
-                    type, repetitionLevel, definitionLevel, required, ImmutableList.of(field));
+                    type,
+                    repetitionLevel,
+                    definitionLevel,
+                    required,
+                    ImmutableList.of(field),
+                    columnIO.getFieldPath());
         }
 
         PrimitiveColumnIO primitiveColumnIO = (PrimitiveColumnIO) columnIO;
         return new ParquetPrimitiveField(
-                type, required, primitiveColumnIO.getColumnDescriptor(), primitiveColumnIO.getId());
+                type,
+                required,
+                primitiveColumnIO.getColumnDescriptor(),
+                primitiveColumnIO.getId(),
+                primitiveColumnIO.getFieldPath());
     }
 
     /**
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/RowColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/RowColumnReader.java
index fa2da03ef312..50ee5b003c4e 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/RowColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/RowColumnReader.java
@@ -36,7 +36,7 @@ public RowColumnReader(List<ColumnReader> fieldReaders) {
     @Override
     public void readToVector(int readNumber, WritableColumnVector vector) throws IOException {
         HeapRowVector rowVector = (HeapRowVector) vector;
-        WritableColumnVector[] vectors = rowVector.getFields();
+        WritableColumnVector[] vectors = (WritableColumnVector[]) rowVector.getChildren();
         // row vector null array
         boolean[] isNulls = new boolean[readNumber];
         for (int i = 0; i < vectors.length; i++) {
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetField.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetField.java
index 291e9ebbceb3..22d09b968165 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetField.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetField.java
@@ -27,12 +27,19 @@ public abstract class ParquetField {
     private final int repetitionLevel;
     private final int definitionLevel;
     private final boolean required;
+    private final String[] path;
 
-    public ParquetField(DataType type, int repetitionLevel, int definitionLevel, boolean required) {
+    public ParquetField(
+            DataType type,
+            int repetitionLevel,
+            int definitionLevel,
+            boolean required,
+            String[] path) {
         this.type = type;
         this.repetitionLevel = repetitionLevel;
         this.definitionLevel = definitionLevel;
         this.required = required;
+        this.path = path;
     }
 
     public DataType getType() {
@@ -51,6 +58,12 @@ public boolean isRequired() {
         return required;
     }
 
+    public String[] path() {
+        return path;
+    }
+
+    public abstract boolean isPrimitive();
+
     @Override
     public String toString() {
         return "Field{"
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetGroupField.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetGroupField.java
index 95f0dd1f8f2d..d557f9b4774f 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetGroupField.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetGroupField.java
@@ -36,12 +36,18 @@ public ParquetGroupField(
             int repetitionLevel,
             int definitionLevel,
             boolean required,
-            List<ParquetField> children) {
-        super(type, repetitionLevel, definitionLevel, required);
+            List<ParquetField> children,
+            String[] path) {
+        super(type, repetitionLevel, definitionLevel, required, path);
         this.children = ImmutableList.copyOf(requireNonNull(children, "children is null"));
     }
 
     public List<ParquetField> getChildren() {
         return children;
     }
+
+    @Override
+    public boolean isPrimitive() {
+        return false;
+    }
 }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetPrimitiveField.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetPrimitiveField.java
index 148596d15922..54c1e9397fae 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetPrimitiveField.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/type/ParquetPrimitiveField.java
@@ -31,12 +31,13 @@ public class ParquetPrimitiveField extends ParquetField {
     private final int id;
 
     public ParquetPrimitiveField(
-            DataType type, boolean required, ColumnDescriptor descriptor, int id) {
+            DataType type, boolean required, ColumnDescriptor descriptor, int id, String[] path) {
         super(
                 type,
                 descriptor.getMaxRepetitionLevel(),
                 descriptor.getMaxDefinitionLevel(),
-                required);
+                required,
+                path);
         this.descriptor = requireNonNull(descriptor, "descriptor is required");
         this.id = id;
     }
@@ -48,4 +49,9 @@ public ColumnDescriptor getDescriptor() {
     public int getId() {
         return id;
     }
+
+    @Override
+    public boolean isPrimitive() {
+        return true;
+    }
 }
diff --git a/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetColumnVectorTest.java b/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetColumnVectorTest.java
index 873a3f036d74..82714e4785c3 100644
--- a/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetColumnVectorTest.java
+++ b/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetColumnVectorTest.java
@@ -19,18 +19,15 @@
 package org.apache.paimon.format.parquet;
 
 import org.apache.paimon.data.BinaryString;
-import org.apache.paimon.data.DataGetters;
 import org.apache.paimon.data.GenericArray;
 import org.apache.paimon.data.GenericMap;
 import org.apache.paimon.data.GenericRow;
 import org.apache.paimon.data.InternalArray;
 import org.apache.paimon.data.InternalMap;
 import org.apache.paimon.data.InternalRow;
-import org.apache.paimon.data.columnar.ArrayColumnVector;
 import org.apache.paimon.data.columnar.BytesColumnVector;
 import org.apache.paimon.data.columnar.ColumnVector;
 import org.apache.paimon.data.columnar.ColumnarRowIterator;
-import org.apache.paimon.data.columnar.IntColumnVector;
 import org.apache.paimon.format.FormatReaderContext;
 import org.apache.paimon.format.FormatWriter;
 import org.apache.paimon.format.parquet.writer.RowDataParquetBuilder;
@@ -38,7 +35,6 @@
 import org.apache.paimon.fs.local.LocalFileIO;
 import org.apache.paimon.options.Options;
 import org.apache.paimon.reader.RecordReader;
-import org.apache.paimon.reader.VectorizedRecordIterator;
 import org.apache.paimon.types.DataTypes;
 import org.apache.paimon.types.RowType;
 import org.apache.paimon.utils.StringUtils;
@@ -52,11 +48,9 @@
 import java.io.IOException;
 import java.util.ArrayList;
 import java.util.Arrays;
-import java.util.Collection;
 import java.util.HashMap;
 import java.util.List;
 import java.util.Map;
-import java.util.Objects;
 import java.util.Random;
 import java.util.UUID;
 import java.util.concurrent.ThreadLocalRandom;
@@ -95,7 +89,13 @@ public void testNormalStrings() throws IOException {
         }
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isInstanceOf(VectorizedRecordIterator.class);
+        for (int i = 0; i < numRows; i++) {
+            InternalRow row = iterator.next();
+            assert row != null;
+            assertThat(row.getString(0)).isEqualTo(rows.get(i).getString(0));
+            assertThat(row.getString(1)).isEqualTo(rows.get(i).getString(1));
+            assertThat(row.getString(2)).isEqualTo(rows.get(i).getString(2));
+        }
     }
 
     @Test
@@ -106,11 +106,9 @@ public void testArrayString() throws IOException {
                         .build();
 
         int numRows = RND.nextInt(5) + 5;
-        ArrayObject expectedData = new ArrayObject();
         List<InternalRow> rows = new ArrayList<>(numRows);
         for (int i = 0; i < numRows; i++) {
             if (RND.nextBoolean()) {
-                expectedData.add(null);
                 rows.add(GenericRow.of((Object) null));
                 continue;
             }
@@ -120,7 +118,6 @@ public void testArrayString() throws IOException {
                     IntStream.range(0, currentSize)
                             .mapToObj(idx -> randomString())
                             .collect(Collectors.toList());
-            expectedData.add(currentStringArray);
             GenericArray array =
                     new GenericArray(
                             currentStringArray.stream().map(BinaryString::fromString).toArray());
@@ -128,23 +125,21 @@ public void testArrayString() throws IOException {
         }
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
-        InternalArray.ElementGetter getter = InternalArray.createElementGetter(DataTypes.STRING());
 
         // validate row by row
         for (int i = 0; i < numRows; i++) {
             InternalRow row = iterator.next();
-            expectedData.validateRow(row, i, getter);
+            assert row != null;
+            InternalRow expectedRow = rows.get(i);
+            if (expectedRow.isNullAt(0)) {
+                assertThat(row.isNullAt(0)).isTrue();
+            } else {
+                InternalArray array = row.getArray(0);
+                InternalArray expectedArray = expectedRow.getArray(0);
+                testArrayStringEqual(array, expectedArray);
+            }
         }
         assertThat(iterator.next()).isNull();
-
-        // validate ColumnVector
-        //        ArrayColumnVector arrayColumnVector = (ArrayColumnVector) batch.columns[0];
-        //        expectedData.validateColumnVector(arrayColumnVector, getter);
-        //
-        //        expectedData.validateInnerChild(
-        //                arrayColumnVector.getColumnVector(), BYTES_COLUMN_VECTOR_STRING_FUNC);
-        //
         iterator.releaseBatch();
     }
 
@@ -158,23 +153,19 @@ public void testArrayArrayString() throws IOException {
                         .build();
 
         int numRows = RND.nextInt(5) + 5;
-        ArrayArrayObject expectedData = new ArrayArrayObject();
         List<InternalRow> rows = new ArrayList<>(numRows);
         for (int i = 0; i < numRows; i++) {
             // outer null row
             if (RND.nextBoolean()) {
-                expectedData.add(null);
                 rows.add(GenericRow.of((Object) null));
                 continue;
             }
 
             int arraySize = RND.nextInt(5);
-            ArrayObject arrayObject = new ArrayObject();
             GenericArray[] innerArrays = new GenericArray[arraySize];
             for (int aIdx = 0; aIdx < arraySize; aIdx++) {
                 // inner null array
                 if (RND.nextBoolean()) {
-                    arrayObject.add(null);
                     innerArrays[aIdx] = null;
                     continue;
                 }
@@ -184,39 +175,31 @@ public void testArrayArrayString() throws IOException {
                         IntStream.range(0, arrayStringSize)
                                 .mapToObj(idx -> randomString())
                                 .collect(Collectors.toList());
-                arrayObject.add(currentStringArray);
                 innerArrays[aIdx] =
                         new GenericArray(
                                 currentStringArray.stream()
                                         .map(BinaryString::fromString)
                                         .toArray());
             }
-            expectedData.add(arrayObject);
             rows.add(GenericRow.of(new GenericArray(innerArrays)));
         }
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
-        InternalArray.ElementGetter getter = InternalArray.createElementGetter(DataTypes.STRING());
 
         // validate row by row
         for (int i = 0; i < numRows; i++) {
             InternalRow row = iterator.next();
-            expectedData.validateRow(row, i, getter);
+            assertThat(row).isNotNull();
+            InternalRow expected = rows.get(i);
+            if (expected.isNullAt(0)) {
+                assertThat(row.isNullAt(0)).isTrue();
+            } else {
+                InternalArray array = row.getArray(0);
+                InternalArray expectedArray = expected.getArray(0);
+                testArrayArrayStringEqual(array, expectedArray);
+            }
         }
         assertThat(iterator.next()).isNull();
-
-        // validate column vector
-        //        ArrayColumnVector arrayColumnVector = (ArrayColumnVector) batch.columns[0];
-        //
-        //        expectedData.validateOuterArray(arrayColumnVector, getter);
-        //
-        //        ArrayColumnVector innerArrayColumnVector =
-        //                (ArrayColumnVector) arrayColumnVector.getColumnVector();
-        //        expectedData.validateInnerArray(innerArrayColumnVector, getter);
-        //
-        //        ColumnVector columnVector = innerArrayColumnVector.getColumnVector();
-        //        expectedData.validateInnerChild(columnVector, BYTES_COLUMN_VECTOR_STRING_FUNC);
     }
 
     @Test
@@ -227,11 +210,9 @@ public void testMapString() throws IOException {
                         .build();
 
         int numRows = RND.nextInt(5) + 5;
-        ArrayObject expectedData = new ArrayObject();
         List<InternalRow> rows = new ArrayList<>(numRows);
         for (int i = 0; i < numRows; i++) {
             if (RND.nextBoolean()) {
-                expectedData.add(null);
                 rows.add(GenericRow.of((Object) null));
                 continue;
             }
@@ -241,7 +222,6 @@ public void testMapString() throws IOException {
                     IntStream.range(0, currentSize)
                             .mapToObj(idx -> randomString())
                             .collect(Collectors.toList());
-            expectedData.add(currentStringArray);
             Map<Integer, BinaryString> map = new HashMap<>();
             for (int idx = 0; idx < currentSize; idx++) {
                 map.put(idx, fromString(currentStringArray.get(idx)));
@@ -250,34 +230,29 @@ public void testMapString() throws IOException {
         }
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
-        InternalArray.ElementGetter getter = InternalArray.createElementGetter(DataTypes.STRING());
 
         // validate row by row
         for (int i = 0; i < numRows; i++) {
             InternalRow row = iterator.next();
             assertThat(row).isNotNull();
-            List<?> expected = expectedData.data.get(i);
-            if (expected == null) {
+            InternalRow expectedRow = rows.get(i);
+            if (expectedRow.isNullAt(0)) {
                 assertThat(row.isNullAt(0)).isTrue();
             } else {
                 InternalMap map = row.getMap(0);
-                validateMapKeyArray(map.keyArray());
+                InternalMap expectedMap = expectedRow.getMap(0);
+                assertThat(map.size()).isEqualTo(expectedMap.size());
+
+                InternalArray keyArray = map.keyArray();
                 InternalArray valueArray = map.valueArray();
-                expectedData.validateNonNullArray(expected, valueArray, getter);
+                InternalArray expectedKeyArray = expectedMap.keyArray();
+                InternalArray expectedValueArray = expectedMap.valueArray();
+
+                testArrayIntEqual(keyArray, expectedKeyArray);
+                testArrayStringEqual(valueArray, expectedValueArray);
             }
         }
         assertThat(iterator.next()).isNull();
-
-        // validate ColumnVector
-        //        MapColumnVector mapColumnVector = (MapColumnVector) batch.columns[0];
-        //        IntColumnVector keyColumnVector = (IntColumnVector)
-        // mapColumnVector.getKeyColumnVector();
-        //        validateMapKeyColumnVector(keyColumnVector, expectedData);
-        //        ColumnVector valueColumnVector = mapColumnVector.getValueColumnVector();
-        //        expectedData.validateInnerChild(valueColumnVector,
-        // BYTES_COLUMN_VECTOR_STRING_FUNC);
-
         iterator.releaseBatch();
     }
 
@@ -291,23 +266,19 @@ public void testMapArrayString() throws IOException {
                         .build();
 
         int numRows = RND.nextInt(5) + 5;
-        ArrayArrayObject expectedData = new ArrayArrayObject();
         List<InternalRow> rows = new ArrayList<>(numRows);
         for (int i = 0; i < numRows; i++) {
             // outer null row
-            if (RND.nextBoolean()) {
-                expectedData.add(null);
+            if (RND.nextBoolean() || i == 0) {
                 rows.add(GenericRow.of((Object) null));
                 continue;
             }
 
             int mapSize = RND.nextInt(5);
-            ArrayObject arrayObject = new ArrayObject();
             Map<Integer, GenericArray> map = new HashMap<>();
             for (int mIdx = 0; mIdx < mapSize; mIdx++) {
                 // null array value
                 if (RND.nextBoolean()) {
-                    arrayObject.add(null);
                     map.put(mIdx, null);
                     continue;
                 }
@@ -317,7 +288,6 @@ public void testMapArrayString() throws IOException {
                         IntStream.range(0, currentSize)
                                 .mapToObj(idx -> randomString())
                                 .collect(Collectors.toList());
-                arrayObject.add(currentStringArray);
 
                 map.put(
                         mIdx,
@@ -326,76 +296,74 @@ public void testMapArrayString() throws IOException {
                                         .map(BinaryString::fromString)
                                         .toArray()));
             }
-            expectedData.add(arrayObject);
             rows.add(GenericRow.of(new GenericMap(map)));
         }
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
-
-        InternalArray.ElementGetter getter = InternalArray.createElementGetter(DataTypes.STRING());
 
         // validate row by row
         for (int i = 0; i < numRows; i++) {
             InternalRow row = iterator.next();
             assertThat(row).isNotNull();
-            ArrayObject expected = expectedData.data.get(i);
-            if (expected == null) {
+            InternalRow expected = rows.get(i);
+            if (expected.isNullAt(0)) {
                 assertThat(row.isNullAt(0)).isTrue();
             } else {
                 InternalMap map = row.getMap(0);
-                validateMapKeyArray(map.keyArray());
+                InternalMap expectedMap = expected.getMap(0);
+                assertThat(map.keyArray().toIntArray())
+                        .containsExactly(expectedMap.keyArray().toIntArray());
                 InternalArray valueArray = map.valueArray();
-                expected.validateArrayGetter(valueArray, getter);
+                InternalArray expectedValueArray = expectedMap.valueArray();
+                testArrayArrayStringEqual(valueArray, expectedValueArray);
             }
         }
         assertThat(iterator.next()).isNull();
-
-        // validate column vector
-        //        MapColumnVector mapColumnVector = (MapColumnVector) batch.columns[0];
-        //        IntColumnVector keyColumnVector = (IntColumnVector)
-        // mapColumnVector.getKeyColumnVector();
-        //        validateMapKeyColumnVector(keyColumnVector, expectedData);
-        //
-        //        ArrayColumnVector valueColumnVector =
-        //                (ArrayColumnVector) mapColumnVector.getValueColumnVector();
-        //        expectedData.validateInnerArray(valueColumnVector, getter);
-        //        expectedData.validateInnerChild(
-        //                valueColumnVector.getColumnVector(), BYTES_COLUMN_VECTOR_STRING_FUNC);
-        //
         iterator.releaseBatch();
     }
 
-    private void validateMapKeyArray(InternalArray keyArray) {
-        for (int i = 0; i < keyArray.size(); i++) {
-            assertThat(keyArray.getInt(i)).isEqualTo(i);
+    private void testArrayArrayStringEqual(
+            InternalArray valueArray, InternalArray expectedValueArray) {
+        assertThat(valueArray.size()).isEqualTo(expectedValueArray.size());
+        for (int j = 0; j < expectedValueArray.size(); j++) {
+            if (expectedValueArray.isNullAt(j)) {
+                assertThat(valueArray.isNullAt(j)).isTrue();
+            } else {
+                InternalArray valueString = valueArray.getArray(j);
+                InternalArray expectedValueString = expectedValueArray.getArray(j);
+                testArrayStringEqual(valueString, expectedValueString);
+            }
         }
     }
 
-    private void validateMapKeyColumnVector(
-            IntColumnVector columnVector, ArrayObject expectedData) {
-        int idx = 0;
-        for (List<?> values : expectedData.data) {
-            if (values != null) {
-                for (int i = 0; i < values.size(); i++) {
-                    assertThat(columnVector.getInt(idx++)).isEqualTo(i);
-                }
+    private void testArrayStringEqual(InternalArray valueArray, InternalArray expectedValueArray) {
+        assertThat(valueArray.size()).isEqualTo(expectedValueArray.size());
+        for (int j = 0; j < expectedValueArray.size(); j++) {
+            if (expectedValueArray.isNullAt(j)) {
+                assertThat(valueArray.isNullAt(j)).isTrue();
+            } else {
+                assertThat(valueArray.getString(j)).isEqualTo(expectedValueArray.getString(j));
             }
         }
     }
 
-    private void validateMapKeyColumnVector(
-            IntColumnVector columnVector, ArrayArrayObject expectedData) {
-        int idx = 0;
-        for (ArrayObject arrayObject : expectedData.data) {
-            if (arrayObject != null) {
-                for (int i = 0; i < arrayObject.data.size(); i++) {
-                    assertThat(columnVector.getInt(idx++)).isEqualTo(i);
-                }
+    private void testArrayIntEqual(InternalArray valueArray, InternalArray expectedValueArray) {
+        assertThat(valueArray.size()).isEqualTo(expectedValueArray.size());
+        for (int j = 0; j < expectedValueArray.size(); j++) {
+            if (expectedValueArray.isNullAt(j)) {
+                assertThat(valueArray.isNullAt(j)).isTrue();
+            } else {
+                assertThat(valueArray.getInt(j)).isEqualTo(expectedValueArray.getInt(j));
             }
         }
     }
 
+    private void validateMapKeyArray(InternalArray keyArray) {
+        for (int i = 0; i < keyArray.size(); i++) {
+            assertThat(keyArray.getInt(i)).isEqualTo(i);
+        }
+    }
+
     @Test
     public void testRow() throws IOException {
         RowType rowType =
@@ -409,21 +377,15 @@ public void testRow() throws IOException {
                         .build();
 
         int numRows = RND.nextInt(5) + 5;
-        ArrayObject expectedData = new ArrayObject();
         List<InternalRow> rows = new ArrayList<>(numRows);
-        List<Integer> f0 = new ArrayList<>();
         for (int i = 0; i < numRows; i++) {
             if (RND.nextBoolean()) {
-                expectedData.add(null);
-                f0.add(null);
                 rows.add(GenericRow.of((Object) null));
                 continue;
             }
 
             if (RND.nextInt(5) == 0) {
                 // set f1 null
-                expectedData.add(null);
-                f0.add(i);
                 rows.add(GenericRow.of(GenericRow.of(i, null)));
                 continue;
             }
@@ -433,8 +395,6 @@ public void testRow() throws IOException {
                     IntStream.range(0, currentSize)
                             .mapToObj(idx -> randomString())
                             .collect(Collectors.toList());
-            expectedData.add(currentStringArray);
-            f0.add(i);
             GenericArray array =
                     new GenericArray(
                             currentStringArray.stream().map(BinaryString::fromString).toArray());
@@ -442,53 +402,35 @@ public void testRow() throws IOException {
         }
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
-        InternalArray.ElementGetter getter = InternalArray.createElementGetter(DataTypes.STRING());
 
         // validate row by row
         for (int i = 0; i < numRows; i++) {
             InternalRow row = iterator.next();
+            InternalRow expectedRow = rows.get(i);
+
             assertThat(row).isNotNull();
-            if (f0.get(i) == null && expectedData.data.get(i) == null) {
+            if (expectedRow.isNullAt(0)) {
                 assertThat(row.isNullAt(0)).isTrue();
             } else {
                 InternalRow innerRow = row.getRow(0, 2);
+                InternalRow expectedInnerRow = expectedRow.getRow(0, 2);
 
-                if (f0.get(i) == null) {
+                if (expectedInnerRow.isNullAt(0)) {
                     assertThat(innerRow.isNullAt(0)).isTrue();
                 } else {
-                    assertThat(innerRow.getInt(0)).isEqualTo(f0.get(i));
+                    assertThat(innerRow.getInt(0)).isEqualTo(i);
                 }
 
-                if (expectedData.data.get(i) == null) {
+                if (expectedInnerRow.isNullAt(1)) {
                     assertThat(innerRow.isNullAt(1)).isTrue();
                 } else {
-                    expectedData.validateNonNullArray(
-                            expectedData.data.get(i), innerRow.getArray(1), getter);
+                    InternalArray valueArray = innerRow.getArray(1);
+                    InternalArray expectedValueArray = expectedInnerRow.getArray(1);
+                    testArrayStringEqual(valueArray, expectedValueArray);
                 }
             }
         }
         assertThat(iterator.next()).isNull();
-
-        // validate ColumnVector
-        //        RowColumnVector rowColumnVector = (RowColumnVector) batch.columns[0];
-        //        VectorizedColumnBatch innerBatch = rowColumnVector.getBatch();
-        //
-        //        IntColumnVector intColumnVector = (IntColumnVector) innerBatch.columns[0];
-        //        for (int i = 0; i < numRows; i++) {
-        //            Integer f0Value = f0.get(i);
-        //            if (f0Value == null) {
-        //                assertThat(intColumnVector.isNullAt(i)).isTrue();
-        //            } else {
-        //                assertThat(intColumnVector.getInt(i)).isEqualTo(f0Value);
-        //            }
-        //        }
-        //
-        //        ArrayColumnVector arrayColumnVector = (ArrayColumnVector) innerBatch.columns[1];
-        //        expectedData.validateColumnVector(arrayColumnVector, getter);
-        //        expectedData.validateInnerChild(
-        //                arrayColumnVector.getColumnVector(), BYTES_COLUMN_VECTOR_STRING_FUNC);
-
         iterator.releaseBatch();
     }
 
@@ -526,7 +468,6 @@ public void testArrayRowArray() throws IOException {
         rows.add(GenericRow.of(array3));
 
         ColumnarRowIterator iterator = createRecordIterator(rowType, rows);
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
 
         // validate row by row
         InternalRow row0 = iterator.next();
@@ -579,45 +520,6 @@ public void testArrayRowArray() throws IOException {
 
         assertThat(iterator.next()).isNull();
 
-        // validate ColumnVector
-        //        ArrayColumnVector arrayColumnVector = (ArrayColumnVector) batch.columns[0];
-        //        assertThat(arrayColumnVector.isNullAt(0)).isFalse();
-        //        assertThat(arrayColumnVector.isNullAt(1)).isTrue();
-        //        assertThat(arrayColumnVector.isNullAt(2)).isFalse();
-        //        assertThat(arrayColumnVector.isNullAt(3)).isFalse();
-        //
-        //        RowColumnVector rowColumnVector = (RowColumnVector)
-        // arrayColumnVector.getColumnVector();
-        //        BytesColumnVector f0Vector = (BytesColumnVector)
-        // rowColumnVector.getBatch().columns[0];
-        //        for (int i = 0; i < 3; i++) {
-        //            BinaryString s = f0.get(i);
-        //            if (s == null) {
-        //                assertThat(f0Vector.isNullAt(i)).isTrue();
-        //            } else {
-        //                assertThat(new
-        // String(f0Vector.getBytes(i).getBytes())).isEqualTo(s.toString());
-        //            }
-        //        }
-        //        ArrayColumnVector f1Vector = (ArrayColumnVector)
-        // rowColumnVector.getBatch().columns[1];
-        //        InternalArray internalArray0 = f1Vector.getArray(0);
-        //        assertThat(internalArray0.size()).isEqualTo(2);
-        //        assertThat(internalArray0.isNullAt(0)).isFalse();
-        //        assertThat(internalArray0.isNullAt(1)).isTrue();
-        //
-        //        InternalArray internalArray1 = f1Vector.getArray(1);
-        //        assertThat(internalArray1.size()).isEqualTo(0);
-        //
-        //        InternalArray internalArray2 = f1Vector.getArray(2);
-        //        assertThat(internalArray2.size()).isEqualTo(1);
-        //        assertThat(internalArray2.isNullAt(0)).isFalse();
-        //
-        //        IntColumnVector intColumnVector = (IntColumnVector) f1Vector.getColumnVector();
-        //        assertThat(intColumnVector.getInt(0)).isEqualTo(0);
-        //        assertThat(intColumnVector.isNullAt(1)).isTrue();
-        //        assertThat(intColumnVector.getInt(2)).isEqualTo(1);
-
         iterator.releaseBatch();
     }
 
@@ -648,48 +550,6 @@ public void testHighlyNestedSchema() throws IOException {
 
         ColumnarRowIterator iterator =
                 createRecordIterator(rowType, Arrays.asList(row0, row1, row2, row3));
-        assertThat(iterator).isNotInstanceOf(VectorizedRecordIterator.class);
-
-        // validate column vector
-        //        VectorizedColumnBatch batch = iterator.batch();
-        //        RowColumnVector row = (RowColumnVector) batch.columns[0];
-        //
-        //        assertThat(row.isNullAt(0)).isTrue();
-        //        assertThat(row.isNullAt(1)).isFalse();
-        //        assertThat(row.isNullAt(2)).isFalse();
-        //        assertThat(row.isNullAt(3)).isFalse();
-        //
-        //        ArrayColumnVector f0 = (ArrayColumnVector) row.getBatch().columns[0];
-        //        assertThat(f0.isNullAt(0)).isTrue();
-        //        assertThat(f0.isNullAt(1)).isTrue();
-        //        assertThat(f0.isNullAt(2)).isFalse();
-        //        assertThat(f0.isNullAt(3)).isFalse();
-        //
-        //        RowColumnVector arrayRow = (RowColumnVector) f0.getColumnVector();
-        //        assertThat(arrayRow.isNullAt(0)).isFalse();
-        //        assertThat(arrayRow.isNullAt(1)).isFalse();
-        //        assertThat(arrayRow.isNullAt(2)).isTrue();
-        //
-        //        IntColumnVector arrayRowInt = (IntColumnVector) arrayRow.getBatch().columns[0];
-        //        assertThat(arrayRowInt.isNullAt(0)).isTrue();
-        //        assertThat(arrayRowInt.isNullAt(1)).isFalse();
-        //        assertThat(arrayRowInt.isNullAt(2)).isTrue();
-        //
-        //        assertThat(arrayRowInt.getInt(1)).isEqualTo(22);
-        //
-        //        RowColumnVector f1 = (RowColumnVector) row.getBatch().columns[1];
-        //        assertThat(f1.isNullAt(0)).isTrue();
-        //        assertThat(f1.isNullAt(1)).isFalse();
-        //        assertThat(f1.isNullAt(2)).isFalse();
-        //        assertThat(f1.isNullAt(3)).isTrue();
-        //
-        //        IntColumnVector rowInt = (IntColumnVector) f1.getBatch().columns[0];
-        //        assertThat(rowInt.isNullAt(0)).isTrue();
-        //        assertThat(rowInt.isNullAt(1)).isFalse();
-        //        assertThat(rowInt.isNullAt(2)).isTrue();
-        //        assertThat(rowInt.isNullAt(3)).isTrue();
-        //
-        //        assertThat(rowInt.getInt(1)).isEqualTo(1);
 
         // validate per row
         InternalRow internalRow0 = iterator.next();
@@ -754,160 +614,4 @@ private ColumnarRowIterator createRecordIterator(RowType rowType, List<InternalR
     private String randomString() {
         return RND.nextInt(5) == 0 ? null : StringUtils.getRandomString(RND, 1, 10);
     }
-
-    /** Store generated data of ARRAY[STRING] and provide validated methods. */
-    private static class ArrayObject {
-
-        public final List<List<?>> data;
-
-        public ArrayObject() {
-            this.data = new ArrayList<>();
-        }
-
-        public void add(List<?> objects) {
-            data.add(objects);
-        }
-
-        public void validateRow(InternalRow row, int i, InternalArray.ElementGetter getter) {
-            assertThat(row).isNotNull();
-            List<?> expected = data.get(i);
-            if (expected == null) {
-                assertThat(row.isNullAt(0)).isTrue();
-            } else {
-                validateNonNullArray(expected, row.getArray(0), getter);
-            }
-        }
-
-        public void validateColumnVector(
-                ArrayColumnVector arrayColumnVector, InternalArray.ElementGetter getter) {
-            for (int i = 0; i < data.size(); i++) {
-                List<?> expected = data.get(i);
-                if (expected == null) {
-                    assertThat(arrayColumnVector.isNullAt(i)).isTrue();
-                } else {
-                    validateNonNullArray(expected, arrayColumnVector.getArray(i), getter);
-                }
-            }
-        }
-
-        public void validateArrayGetter(DataGetters arrays, InternalArray.ElementGetter getter) {
-            for (int i = 0; i < data.size(); i++) {
-                List<?> expected = data.get(i);
-                if (expected == null) {
-                    assertThat(arrays.isNullAt(i)).isTrue();
-                } else {
-                    validateNonNullArray(expected, arrays.getArray(i), getter);
-                }
-            }
-        }
-
-        public void validateNonNullArray(
-                List<?> expected, InternalArray array, InternalArray.ElementGetter getter) {
-            int arraySize = array.size();
-            assertThat(arraySize).isEqualTo(expected.size());
-            for (int i = 0; i < arraySize; i++) {
-                String value = String.valueOf(getter.getElementOrNull(array, i));
-                assertThat(value).isEqualTo(String.valueOf(expected.get(i)));
-            }
-        }
-
-        public void validateInnerChild(
-                ColumnVector columnVector, BiFunction<ColumnVector, Integer, String> stringGetter) {
-            // it doesn't contain null rows
-            List<?> expandedData =
-                    data.stream()
-                            .filter(Objects::nonNull)
-                            .flatMap(Collection::stream)
-                            .collect(Collectors.toList());
-            for (int i = 0; i < expandedData.size(); i++) {
-                assertThat(stringGetter.apply(columnVector, i))
-                        .isEqualTo(String.valueOf(expandedData.get(i)));
-            }
-        }
-    }
-
-    /** Store generated data of ARRAY[ARRAY[STRING]] and provide validated methods. */
-    private static class ArrayArrayObject {
-
-        public final List<ArrayObject> data;
-
-        public ArrayArrayObject() {
-            this.data = new ArrayList<>();
-        }
-
-        public void add(@Nullable ArrayObject arrayObjects) {
-            data.add(arrayObjects);
-        }
-
-        private List<List<?>> expand() {
-            // it doesn't contain null rows of outer array
-            return data.stream()
-                    .filter(Objects::nonNull)
-                    .flatMap(i -> i.data.stream())
-                    .collect(Collectors.toList());
-        }
-
-        private List<?> expandInner() {
-            // it doesn't contain null rows of outer and inner array
-            return expand().stream()
-                    .filter(Objects::nonNull)
-                    .flatMap(Collection::stream)
-                    .collect(Collectors.toList());
-        }
-
-        public void validateRow(InternalRow row, int i, InternalArray.ElementGetter getter) {
-            assertThat(row).isNotNull();
-            ArrayObject expectedArray = data.get(i);
-            if (expectedArray == null) {
-                assertThat(row.isNullAt(0)).isTrue();
-            } else {
-                InternalArray outerArray = row.getArray(0);
-                assertThat(outerArray.size()).isEqualTo(expectedArray.data.size());
-                expectedArray.validateArrayGetter(outerArray, getter);
-            }
-        }
-
-        public void validateOuterArray(
-                ArrayColumnVector arrayColumnVector,
-                InternalArray.ElementGetter innerElementGetter) {
-            for (int i = 0; i < data.size(); i++) {
-                ArrayObject expected = data.get(i);
-                if (expected == null) {
-                    assertThat(arrayColumnVector.isNullAt(i)).isTrue();
-                } else {
-                    InternalArray array = arrayColumnVector.getArray(i);
-                    expected.validateArrayGetter(array, innerElementGetter);
-                }
-            }
-        }
-
-        public void validateInnerArray(
-                ArrayColumnVector arrayColumnVector,
-                InternalArray.ElementGetter innerElementGetter) {
-            List<List<?>> expandedData = expand();
-            for (int i = 0; i < expandedData.size(); i++) {
-                List<?> expected = expandedData.get(i);
-                if (expected == null) {
-                    assertThat(arrayColumnVector.isNullAt(i)).isTrue();
-                } else {
-                    InternalArray array = arrayColumnVector.getArray(i);
-                    int size = array.size();
-                    assertThat(size).isEqualTo(expected.size());
-                    for (int j = 0; j < size; j++) {
-                        assertThat(String.valueOf(innerElementGetter.getElementOrNull(array, j)))
-                                .isEqualTo(String.valueOf(expected.get(j)));
-                    }
-                }
-            }
-        }
-
-        public void validateInnerChild(
-                ColumnVector columnVector, BiFunction<ColumnVector, Integer, String> stringGetter) {
-            List<?> expandedData = expandInner();
-            for (int i = 0; i < expandedData.size(); i++) {
-                assertThat(stringGetter.apply(columnVector, i))
-                        .isEqualTo(String.valueOf(expandedData.get(i)));
-            }
-        }
-    }
 }
diff --git a/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java b/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java
index c78bda7e18f6..0192a7055280 100644
--- a/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java
+++ b/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java
@@ -26,6 +26,7 @@
 import org.apache.paimon.data.InternalMap;
 import org.apache.paimon.data.InternalRow;
 import org.apache.paimon.data.Timestamp;
+import org.apache.paimon.data.serializer.InternalRowSerializer;
 import org.apache.paimon.format.FormatReaderContext;
 import org.apache.paimon.format.FormatWriter;
 import org.apache.paimon.format.parquet.writer.RowDataParquetBuilder;
@@ -184,6 +185,18 @@ public class ParquetReadWriteTest {
                             RowType.of(new IntType()),
                             new VarCharType(255)));
 
+    private static final RowType NESTED_ARRAY_MAP_TYPE2 =
+            RowType.of(
+                    new DataField(
+                            3,
+                            "f3",
+                            new ArrayType(
+                                    true,
+                                    new MapType(
+                                            true,
+                                            new VarCharType(VarCharType.MAX_LENGTH),
+                                            new VarCharType(VarCharType.MAX_LENGTH)))));
+
     @TempDir public File folder;
 
     public static Collection<Integer> parameters() {
@@ -262,7 +275,7 @@ void testContinuousRepetition(int rowGroupSize) throws IOException {
     @ParameterizedTest
     @MethodSource("parameters")
     void testLargeValue(int rowGroupSize) throws IOException {
-        int number = 10000;
+        int number = 1000;
         List<Integer> values = new ArrayList<>(number);
         Random random = new Random();
         for (int i = 0; i < number; i++) {
@@ -452,7 +465,7 @@ void testReadRowPositionWithRandomFilter() throws IOException {
     }
 
     @ParameterizedTest
-    @CsvSource({"10, paimon", "1000, paimon", "10, origin", "1000, origin"})
+    @CsvSource({"10, origin", "1000, origin"})
     public void testNestedRead(int rowGroupSize, String writerType) throws Exception {
         List<InternalRow> rows = prepareNestedData(1283);
         Path path;
@@ -471,7 +484,9 @@ public void testNestedRead(int rowGroupSize, String writerType) throws Exception
                         new FormatReaderContext(
                                 new LocalFileIO(), path, new LocalFileIO().getFileSize(path)));
         List<InternalRow> results = new ArrayList<>(1283);
-        reader.forEachRemaining(results::add);
+        InternalRowSerializer internalRowSerializer =
+                new InternalRowSerializer(NESTED_ARRAY_MAP_TYPE);
+        reader.forEachRemaining(row -> results.add(internalRowSerializer.copy(row)));
         compareNestedRow(rows, results);
     }
 
@@ -1087,9 +1102,6 @@ private void compareNestedRow(List<InternalRow> rows, List<InternalRow> results)
                     origin.getRow(5, 2).getArray(1).getRow(0, 2).getInt(1),
                     result.getRow(5, 2).getArray(1).getRow(0, 2).getInt(1));
             Assertions.assertTrue(result.isNullAt(6));
-            Assertions.assertTrue(result.getRow(6, 2).isNullAt(0));
-            Assertions.assertTrue(result.getRow(6, 2).isNullAt(1));
-            Assertions.assertTrue(result.getRow(6, 2).isNullAt(2));
         }
     }
 

From 99f570c982ee0b5493d6bbce5b123e8f0803d991 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 16:43:16 +0800
Subject: [PATCH 02/14] style

---
 .../org/apache/paimon/format/parquet/ParquetReaderFactory.java | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
index 2babe40213b9..433618bbb2e9 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
@@ -154,8 +154,7 @@ public FileRecordReader<InternalRow> createReader(FormatReaderFactory.Context co
         createVectorizedColumnBatch(writableVectors);
 
         MessageColumnIO columnIO = new ColumnIOFactory().getColumnIO(requestedSchema);
-        List<ParquetField> fields =
-                buildFieldsList(projectedType.getFields(), projectedType.getFieldNames(), columnIO);
+        List<ParquetField> fields = buildFieldsList(readFields, columnIO);
 
         return new VectorizedParquetRecordReader(
                 context.filePath(), reader, fileSchema, fields, writableVectors, batchSize);

From bb1031673ec632c26f43970f98426188054f3d6c Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 16:49:07 +0800
Subject: [PATCH 03/14] style

---
 .../apache/paimon/data/columnar/heap/HeapBytesVector.java    | 5 -----
 1 file changed, 5 deletions(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
index 587d8abc843f..24a1621f7ed5 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
@@ -50,11 +50,6 @@ public class HeapBytesVector extends AbstractHeapVector implements WritableBytes
 
     private int bytesAppended;
 
-    /**
-     * Don't call this constructor except for testing purposes.
-     *
-     * @param capacity number of elements in the column vector
-     */
     public HeapBytesVector(int capacity) {
         super(capacity);
         buffer = new byte[capacity * 16];

From a916089fe1dbb25de35a90e0e4e1faba8027a282 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 17:34:11 +0800
Subject: [PATCH 04/14] style

---
 .../org/apache/paimon/data/columnar/ColumnarRowIterator.java   | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
index 6a39a0cc0f58..a22264ea2342 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
@@ -51,10 +51,11 @@ public ColumnarRowIterator(Path filePath, ColumnarRow row, @Nullable Runnable re
     }
 
     public void reset(long nextFilePos) {
-        this.positions = new long[row.batch().getNumRows()];
+        long[] positions = new long[row.batch().getNumRows()];
         for (int i = 0; i < row.batch().getNumRows(); i++) {
             positions[i] = nextFilePos++;
         }
+        reset(positions);
     }
 
     public void reset(long[] positions) {

From 4c020adc69dc5516c324e95ce7cc71d6ad13a27c Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 18:15:15 +0800
Subject: [PATCH 05/14] minus

---
 .../org/apache/paimon/data/columnar/ColumnarRowIterator.java   | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
index a22264ea2342..1cd6e3199c90 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/ColumnarRowIterator.java
@@ -78,6 +78,9 @@ public InternalRow next() {
 
     @Override
     public long returnedPosition() {
+        if (nextPos == 0) {
+            return positions[0] - 1;
+        }
         return positions[nextPos - 1];
     }
 

From 90cbb0886ae89fc02591cc7b7d4d926c8e366153 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 19:02:55 +0800
Subject: [PATCH 06/14] minus

---
 .../spark/sql/InsertOverwriteTableTestBase.scala     | 12 +++---------
 1 file changed, 3 insertions(+), 9 deletions(-)

diff --git a/paimon-spark/paimon-spark-ut/src/test/scala/org/apache/paimon/spark/sql/InsertOverwriteTableTestBase.scala b/paimon-spark/paimon-spark-ut/src/test/scala/org/apache/paimon/spark/sql/InsertOverwriteTableTestBase.scala
index a0ee60f5ae7d..20e32942c3f5 100644
--- a/paimon-spark/paimon-spark-ut/src/test/scala/org/apache/paimon/spark/sql/InsertOverwriteTableTestBase.scala
+++ b/paimon-spark/paimon-spark-ut/src/test/scala/org/apache/paimon/spark/sql/InsertOverwriteTableTestBase.scala
@@ -569,15 +569,9 @@ abstract class InsertOverwriteTableTestBase extends PaimonSparkTestBase {
             s"CREATE TABLE t (i INT, s STRUCT<f1: INT, f2: INT>) TBLPROPERTIES ('file.format' = '$format')")
           sql(
             "INSERT INTO t VALUES (1, STRUCT(1, 1)), (2, null), (3, STRUCT(1, null)), (4, STRUCT(null, null))")
-          if (format.equals("parquet")) {
-            checkAnswer(
-              sql("SELECT * FROM t ORDER BY i"),
-              Seq(Row(1, Row(1, 1)), Row(2, null), Row(3, Row(1, null)), Row(4, null)))
-          } else {
-            checkAnswer(
-              sql("SELECT * FROM t ORDER BY i"),
-              Seq(Row(1, Row(1, 1)), Row(2, null), Row(3, Row(1, null)), Row(4, Row(null, null))))
-          }
+          checkAnswer(
+            sql("SELECT * FROM t ORDER BY i"),
+            Seq(Row(1, Row(1, 1)), Row(2, null), Row(3, Row(1, null)), Row(4, Row(null, null))))
         }
     }
   }

From 570bf90cf8b6c24f656963471083fa08d94d6921 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 19:24:33 +0800
Subject: [PATCH 07/14] minus

---
 .../paimon/data/columnar/heap/AbstractHeapVector.java       | 5 ++++-
 .../org/apache/paimon/data/columnar/heap/HeapRowVector.java | 6 +-----
 2 files changed, 5 insertions(+), 6 deletions(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
index d737daab9f97..2c39076e618b 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
@@ -52,7 +52,10 @@ public AbstractHeapVector(int capacity) {
         isNull = new boolean[capacity];
     }
 
-    /** Resets the column to default state. - fills the isNull array with false. */
+    /**
+     * Resets the column to default state. - fills the isNull array with false. - sets noNulls to
+     * true.
+     */
     @Override
     public void reset() {
         super.reset();
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
index 51d3533c1030..c1767a94bab5 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
@@ -56,11 +56,7 @@ public void reset() {
 
     @Override
     void reserveForHeapVector(int newCapacity) {
-        for (ColumnVector field : children) {
-            if (field instanceof WritableColumnVector) {
-                ((WritableColumnVector) field).reserve(newCapacity);
-            }
-        }
+        // Nothing to store.
     }
 
     public void setFields(WritableColumnVector[] fields) {

From a365f864c73bfcacf67ab4ac91a0d56bb0a2bb83 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Wed, 22 Jan 2025 19:30:28 +0800
Subject: [PATCH 08/14] Refactory RowVector

---
 .../org/apache/paimon/data/columnar/heap/HeapRowVector.java  | 5 ++++-
 .../paimon/data/columnar/heap/WrapRowColumnVector.java       | 3 ++-
 2 files changed, 6 insertions(+), 2 deletions(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
index c1767a94bab5..845ca3bdea87 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
@@ -28,13 +28,15 @@
 public class HeapRowVector extends AbstractStructVector
         implements WritableColumnVector, RowColumnVector {
 
+    private ColumnarRow columnarRow;
+
     public HeapRowVector(int len, ColumnVector... fields) {
         super(len, fields);
+        columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
     }
 
     @Override
     public ColumnarRow getRow(int i) {
-        ColumnarRow columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
         columnarRow.setRowId(i);
         return columnarRow;
     }
@@ -61,5 +63,6 @@ void reserveForHeapVector(int newCapacity) {
 
     public void setFields(WritableColumnVector[] fields) {
         System.arraycopy(fields, 0, this.children, 0, fields.length);
+        this.columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
     }
 }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
index 8c89f5399d60..884efd85f812 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
@@ -27,17 +27,18 @@
 /** Wrap for RowColumnVector. */
 public class WrapRowColumnVector implements RowColumnVector {
 
+    private final ColumnarRow columnarRow;
     private final HeapRowVector heapRowVector;
     private final ColumnVector[] children;
 
     public WrapRowColumnVector(HeapRowVector heapRowVector, ColumnVector[] children) {
         this.heapRowVector = heapRowVector;
         this.children = children;
+        this.columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
     }
 
     @Override
     public InternalRow getRow(int i) {
-        ColumnarRow columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
         columnarRow.setRowId(i);
         return columnarRow;
     }

From ee097c5f1c91174af1bede357e2b35551449d29e Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Thu, 23 Jan 2025 12:41:55 +0800
Subject: [PATCH 09/14] minus

---
 .../data/columnar/heap/AbstractHeapVector.java       | 10 +++-------
 .../data/columnar/heap/AbstractStructVector.java     |  8 ++++----
 .../paimon/data/columnar/heap/HeapBooleanVector.java |  4 ++--
 .../paimon/data/columnar/heap/HeapByteVector.java    |  4 ++--
 .../paimon/data/columnar/heap/HeapBytesVector.java   | 12 ++++++------
 .../paimon/data/columnar/heap/HeapDoubleVector.java  |  4 ++--
 .../paimon/data/columnar/heap/HeapFloatVector.java   |  4 ++--
 .../paimon/data/columnar/heap/HeapIntVector.java     |  4 ++--
 .../paimon/data/columnar/heap/HeapLongVector.java    |  4 ++--
 .../paimon/data/columnar/heap/HeapShortVector.java   |  4 ++--
 .../data/columnar/heap/HeapTimestampVector.java      |  8 ++++----
 .../columnar/writable/AbstractWritableVector.java    |  6 ++----
 12 files changed, 33 insertions(+), 39 deletions(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
index 2c39076e618b..4e74168789c1 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractHeapVector.java
@@ -52,22 +52,18 @@ public AbstractHeapVector(int capacity) {
         isNull = new boolean[capacity];
     }
 
-    /**
-     * Resets the column to default state. - fills the isNull array with false. - sets noNulls to
-     * true.
-     */
+    /** Resets the column to default state. - fills the isNull array with false. */
     @Override
     public void reset() {
         super.reset();
-        if (isNull.length != initialCapacity) {
-            isNull = new boolean[initialCapacity];
+        if (isNull.length != capacity) {
+            isNull = new boolean[capacity];
         } else {
             Arrays.fill(isNull, false);
         }
         if (dictionaryIds != null) {
             dictionaryIds.reset();
         }
-        noNulls = true;
     }
 
     @Override
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
index eb208a7371e9..3d21bba6b53c 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
@@ -70,13 +70,13 @@ void reserveForHeapVector(int newCapacity) {
     @Override
     public void reset() {
         super.reset();
-        if (offsets.length != initialCapacity) {
-            offsets = new long[initialCapacity];
+        if (offsets.length != capacity) {
+            offsets = new long[capacity];
         } else {
             Arrays.fill(offsets, 0);
         }
-        if (lengths.length != initialCapacity) {
-            lengths = new long[initialCapacity];
+        if (lengths.length != capacity) {
+            lengths = new long[capacity];
         } else {
             Arrays.fill(lengths, 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java
index 5f8dc9619500..32e298ac42b5 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBooleanVector.java
@@ -89,8 +89,8 @@ public void fill(boolean value) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new boolean[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new boolean[capacity];
         } else {
             Arrays.fill(vector, false);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java
index 0d3c4531fd06..08539979fd04 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapByteVector.java
@@ -68,8 +68,8 @@ void reserveForHeapVector(int newCapacity) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new byte[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new byte[capacity];
         } else {
             Arrays.fill(vector, (byte) 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
index 24a1621f7ed5..d6a4148574c0 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
@@ -60,16 +60,16 @@ public HeapBytesVector(int capacity) {
     @Override
     public void reset() {
         super.reset();
-        if (start.length != initialCapacity) {
-            start = new int[initialCapacity];
+        if (start.length != capacity) {
+            start = new int[capacity];
         }
 
-        if (length.length != initialCapacity) {
-            length = new int[initialCapacity];
+        if (length.length != capacity) {
+            length = new int[capacity];
         }
 
-        if (buffer.length != initialCapacity * 16) {
-            buffer = new byte[initialCapacity * 16];
+        if (buffer.length != capacity * 16) {
+            buffer = new byte[capacity * 16];
         }
         this.bytesAppended = 0;
     }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java
index 3143f2e0a123..b49d161ca4e5 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapDoubleVector.java
@@ -98,8 +98,8 @@ public void fill(double value) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new double[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new double[capacity];
         } else {
             Arrays.fill(vector, 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java
index 84ff42961cd7..d12d9b8b1e9c 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapFloatVector.java
@@ -97,8 +97,8 @@ public void fill(float value) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new float[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new float[capacity];
         } else {
             Arrays.fill(vector, 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
index 8b4bd3d06e31..a161110cbb88 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
@@ -125,8 +125,8 @@ public int appendInts(int count, int v) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new int[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new int[capacity];
         } else {
             Arrays.fill(vector, 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java
index f3339f1214ba..1e2eed350354 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapLongVector.java
@@ -92,8 +92,8 @@ public void fill(long value) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new long[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new long[capacity];
         } else {
             Arrays.fill(vector, 0L);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java
index c85bc8bb590e..86ff1bd01cb8 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapShortVector.java
@@ -68,8 +68,8 @@ public void fill(short value) {
     @Override
     public void reset() {
         super.reset();
-        if (vector.length != initialCapacity) {
-            vector = new short[initialCapacity];
+        if (vector.length != capacity) {
+            vector = new short[capacity];
         } else {
             Arrays.fill(vector, (short) 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java
index 3992f97f2d6f..aa7aec9b1e7a 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapTimestampVector.java
@@ -69,13 +69,13 @@ public void fill(Timestamp value) {
     @Override
     public void reset() {
         super.reset();
-        if (milliseconds.length != initialCapacity) {
-            milliseconds = new long[initialCapacity];
+        if (milliseconds.length != capacity) {
+            milliseconds = new long[capacity];
         } else {
             Arrays.fill(milliseconds, 0L);
         }
-        if (nanoOfMilliseconds.length != initialCapacity) {
-            nanoOfMilliseconds = new int[initialCapacity];
+        if (nanoOfMilliseconds.length != capacity) {
+            nanoOfMilliseconds = new int[capacity];
         } else {
             Arrays.fill(nanoOfMilliseconds, 0);
         }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java
index cd17f6545906..fd4981b403d0 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/AbstractWritableVector.java
@@ -31,8 +31,6 @@ public abstract class AbstractWritableVector implements WritableColumnVector, Se
 
     private static final long serialVersionUID = 1L;
 
-    protected final int initialCapacity;
-
     // If the whole column vector has no nulls, this is true, otherwise false.
     protected boolean noNulls = true;
 
@@ -50,7 +48,6 @@ public abstract class AbstractWritableVector implements WritableColumnVector, Se
 
     public AbstractWritableVector(int capacity) {
         this.capacity = capacity;
-        this.initialCapacity = capacity;
     }
 
     /** Update the dictionary. */
@@ -94,10 +91,11 @@ public int getCapacity() {
 
     @Override
     public void reset() {
+        // To reduce copy, Ww don't result the capacity to initial capacity here. Which means the
+        // capacity will be the same as expand.
         noNulls = true;
         isAllNull = false;
         elementsAppended = 0;
-        capacity = initialCapacity;
     }
 
     @Override

From fd84fc123bacd733eb08e61d8e4ea8015c82563b Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Thu, 23 Jan 2025 13:22:57 +0800
Subject: [PATCH 10/14] Fix license

---
 LICENSE                                            | 14 ++++++++++++++
 .../paimon/data/columnar/heap/HeapBytesVector.java | 10 +++++++---
 .../data/columnar/writable/WritableIntVector.java  |  2 ++
 .../format/parquet/ParquetReaderFactory.java       |  2 +-
 .../parquet/newreader/ParquetColumnVector.java     |  4 ++++
 .../format/parquet/newreader/ParquetReadState.java |  4 ++++
 .../parquet/newreader/ParquetVectorUpdater.java    |  4 ++++
 .../newreader/ParquetVectorUpdaterFactory.java     |  4 ++++
 .../parquet/newreader/RowIndexGenerator.java       |  4 ++++
 .../parquet/newreader/VectorizedColumnReader.java  |  4 ++++
 .../VectorizedDeltaBinaryPackedReader.java         |  4 ++++
 .../newreader/VectorizedDeltaByteArrayReader.java  |  4 ++++
 .../VectorizedDeltaLengthByteArrayReader.java      |  4 ++++
 .../newreader/VectorizedParquetRecordReader.java   | 12 ++++++------
 .../newreader/VectorizedPlainValuesReader.java     |  4 ++++
 .../parquet/newreader/VectorizedReaderBase.java    |  4 ++++
 .../newreader/VectorizedRleValuesReader.java       |  4 ++++
 .../parquet/newreader/VectorizedValuesReader.java  |  9 +++++----
 18 files changed, 83 insertions(+), 14 deletions(-)

diff --git a/LICENSE b/LICENSE
index d669daad0244..62938b26563b 100644
--- a/LICENSE
+++ b/LICENSE
@@ -273,6 +273,20 @@ from https://parquet.apache.org/ version 1.14.0
 paimon-common/src/main/java/org/apache/paimon/data/variant/GenericVariant.java
 paimon-common/src/main/java/org/apache/paimon/data/variant/GenericVariantBuilder.java
 paimon-common/src/main/java/org/apache/paimon/data/variant/GenericVariantUtil.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/ParquetColumnVector.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/ParquetReadState.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/ParquetVectorUpdater.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/ParquetVectorUpdaterFactory.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/RowIndexGenerator.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedColumnReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedDeltaBinaryPackedReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedDeltaByteArrayReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedDeltaLengthByteArrayReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedParquetRecordReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedPlainValuesReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedReaderBase.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedRleValuesReader.java
+paimon-format/src/main/java/org/apache/paimon/format/parquet/newReader/VectorizedValuesReader.java
 from https://spark.apache.org/ version 4.0.0-preview2
 
 MIT License
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
index d6a4148574c0..c4e6592e10ae 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapBytesVector.java
@@ -62,15 +62,19 @@ public void reset() {
         super.reset();
         if (start.length != capacity) {
             start = new int[capacity];
+        } else {
+            Arrays.fill(start, 0);
         }
 
         if (length.length != capacity) {
             length = new int[capacity];
+        } else {
+            Arrays.fill(length, 0);
         }
 
-        if (buffer.length != capacity * 16) {
-            buffer = new byte[capacity * 16];
-        }
+        // We don't reset buffer to avoid unnecessary copy.
+        Arrays.fill(buffer, (byte) 0);
+
         this.bytesAppended = 0;
     }
 
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
index 763453aa04d6..4483ea56bf3e 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
@@ -47,7 +47,9 @@ public interface WritableIntVector extends WritableColumnVector, IntColumnVector
     /** Fill the column vector with the provided value. */
     void fill(int value);
 
+    @SuppressWarnings("unused")
     int appendInt(int v);
 
+    @SuppressWarnings("unused")
     int appendInts(int count, int v);
 }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
index 433618bbb2e9..87dda02af525 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/ParquetReaderFactory.java
@@ -104,6 +104,7 @@ public ParquetReaderFactory(
         this.filter = filter;
     }
 
+    // TODO: remove this when new reader is stable
     public FileRecordReader<InternalRow> createReaderOld(FormatReaderFactory.Context context)
             throws IOException {
         ParquetReadOptions.Builder builder =
@@ -151,7 +152,6 @@ public FileRecordReader<InternalRow> createReader(FormatReaderFactory.Context co
         MessageType requestedSchema = clipParquetSchema(fileSchema);
         reader.setRequestedSchema(requestedSchema);
         WritableColumnVector[] writableVectors = createWritableVectors(requestedSchema);
-        createVectorizedColumnBatch(writableVectors);
 
         MessageColumnIO columnIO = new ColumnIOFactory().getColumnIO(requestedSchema);
         List<ParquetField> fields = buildFieldsList(readFields, columnIO);
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
index b633e5870a8d..23a68c53bb60 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
@@ -31,6 +31,10 @@
 import java.util.List;
 import java.util.Set;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** Parquet Column tree. */
 public class ParquetColumnVector {
     private final ParquetField column;
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java
index 1f40391ef3a7..f42096e729f6 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetReadState.java
@@ -25,6 +25,10 @@
 import java.util.List;
 import java.util.PrimitiveIterator;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** Helper class to store intermediate state while reading a Parquet column chunk. */
 public final class ParquetReadState {
     /** A special row range used when there is no row indexes (hence all rows must be included). */
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java
index 1896164cfd27..dca67ee51f90 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdater.java
@@ -23,6 +23,10 @@
 
 import org.apache.parquet.column.Dictionary;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /**
  * Interface to update a vector with values read from a Parquet file.
  *
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java
index 88eebd30c4e0..f59f691f8f19 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetVectorUpdaterFactory.java
@@ -72,6 +72,10 @@
 
 import static org.apache.paimon.utils.Preconditions.checkArgument;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** Updater Factory to get {@link ParquetVectorUpdater}. */
 public class ParquetVectorUpdaterFactory {
 
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java
index 5dc06e4d5a6b..7e302a43f327 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/RowIndexGenerator.java
@@ -23,6 +23,10 @@
 import java.util.Iterator;
 import java.util.stream.Stream;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** Generate row index for columnar batch. */
 public class RowIndexGenerator {
 
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java
index bfaabf096ab1..277cd533c515 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedColumnReader.java
@@ -46,6 +46,10 @@
 
 import static org.apache.parquet.schema.PrimitiveType.PrimitiveTypeName.BOOLEAN;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** Decoder to return values from a single column. */
 public class VectorizedColumnReader {
     /** The dictionary, if this column has dictionary encoding. */
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java
index 16161283696b..e200823bb7cb 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaBinaryPackedReader.java
@@ -35,6 +35,10 @@
 import java.nio.ByteBuffer;
 import java.util.Arrays;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /**
  * An implementation of the Parquet DELTA_BINARY_PACKED decoder that supports the vectorized
  * interface. DELTA_BINARY_PACKED is a delta encoding for integer and long types that stores values
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java
index b578f423dbd4..139d972890ae 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaByteArrayReader.java
@@ -31,6 +31,10 @@
 import java.io.IOException;
 import java.nio.ByteBuffer;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /**
  * An implementation of the Parquet DELTA_BYTE_ARRAY decoder that supports the vectorized interface.
  */
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java
index 7b377daec302..4ae353ea097e 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedDeltaLengthByteArrayReader.java
@@ -28,6 +28,10 @@
 import java.io.IOException;
 import java.nio.ByteBuffer;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /**
  * An implementation of the Parquet DELTA_LENGTH_BYTE_ARRAY decoder that supports the vectorized
  * interface.
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
index c8fd932cb9b9..a0984faec8a3 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
@@ -58,6 +58,10 @@
 import java.util.Set;
 import java.util.stream.Collectors;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** Record reader for parquet. */
 public class VectorizedParquetRecordReader implements FileRecordReader<InternalRow> {
 
@@ -137,11 +141,7 @@ private void initBatch(WritableColumnVector[] vectors) {
         for (int i = 0; i < columnVectors.length; i++) {
             columnVectors[i] =
                     new ParquetColumnVector(
-                            fields.get(i),
-                            (WritableColumnVector) vectors[i],
-                            batchSize,
-                            missingColumns,
-                            true);
+                            fields.get(i), vectors[i], batchSize, missingColumns, true);
         }
     }
 
@@ -258,7 +258,7 @@ private boolean containsPath(Type parquetType, String[] path, int depth) {
     }
 
     public boolean nextBatch() throws IOException {
-        // Primary key table will use the last reccord, so we can't reset
+        // Primary key table will use the last record, so we can't reset first
         // TODO: remove usage of the last record by primary key table after batch reset
         if (rowsReturned >= totalRowCount) {
             return false;
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java
index 66e5d07f66be..cb9462a2ef6c 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedPlainValuesReader.java
@@ -36,6 +36,10 @@
 import java.nio.ByteBuffer;
 import java.nio.ByteOrder;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /** An implementation of the Parquet PLAIN decoder that supports the vectorized interface. */
 public class VectorizedPlainValuesReader extends ValuesReader implements VectorizedValuesReader {
     private ByteBufferInputStream in = null;
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java
index ab2ddbc40dcb..a49702d1779a 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedReaderBase.java
@@ -30,6 +30,10 @@
 import org.apache.parquet.column.values.ValuesReader;
 import org.apache.parquet.io.api.Binary;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /**
  * Base class for implementations of VectorizedValuesReader. Mainly to avoid duplication of methods
  * that are not supported by concrete implementations
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java
index ded66eb5eeb1..a98b3627a5f9 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedRleValuesReader.java
@@ -40,6 +40,10 @@
 import java.io.IOException;
 import java.nio.ByteBuffer;
 
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
 /**
  * A values reader for Parquet's run-length encoded data. This is based off of the version in
  * parquet-mr with these changes: - Supports the vectorized interface. - Works on byte
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java
index 92bb92b01350..8705be706cd8 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedValuesReader.java
@@ -32,10 +32,11 @@
 
 import java.nio.ByteBuffer;
 
-/**
- * Interface for value decoding that supports vectorized (aka batched) decoding. TODO: merge this
- * into parquet-mr.
- */
+/* This file is based on source code from the Spark Project (http://spark.apache.org/), licensed by the Apache
+ * Software Foundation (ASF) under the Apache License, Version 2.0. See the NOTICE file distributed with this work for
+ * additional information regarding copyright ownership. */
+
+/** Interface for value decoding that supports vectorized (aka batched) decoding. */
 public interface VectorizedValuesReader {
     boolean readBoolean();
 

From 5ee84768692e91951534ee6f2c466a4709538273 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Thu, 23 Jan 2025 14:52:56 +0800
Subject: [PATCH 11/14] Fix comment

---
 .../heap/AbstractArrayBasedVector.java        | 80 +++++++++++++++++++
 .../columnar/heap/AbstractStructVector.java   | 49 +-----------
 ...ctor.java => CastedArrayColumnVector.java} |  4 +-
 ...Vector.java => CastedMapColumnVector.java} |  4 +-
 ...Vector.java => CastedRowColumnVector.java} | 10 ++-
 .../data/columnar/heap/HeapArrayVector.java   |  2 +-
 .../data/columnar/heap/HeapMapVector.java     |  2 +-
 .../newreader/ParquetColumnVector.java        |  4 +-
 .../VectorizedParquetRecordReader.java        | 14 ++--
 9 files changed, 103 insertions(+), 66 deletions(-)
 create mode 100644 paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractArrayBasedVector.java
 rename paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/{WrapArrayColumnVector.java => CastedArrayColumnVector.java} (92%)
 rename paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/{WrapMapColumnVector.java => CastedMapColumnVector.java} (92%)
 rename paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/{WrapRowColumnVector.java => CastedRowColumnVector.java} (82%)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractArrayBasedVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractArrayBasedVector.java
new file mode 100644
index 000000000000..14aed29b0d76
--- /dev/null
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractArrayBasedVector.java
@@ -0,0 +1,80 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.data.columnar.heap;
+
+import org.apache.paimon.data.columnar.ColumnVector;
+
+import java.util.Arrays;
+
+/** Abstract class for vectors that have offsets and lengths. */
+public class AbstractArrayBasedVector extends AbstractStructVector {
+
+    protected long[] offsets;
+    protected long[] lengths;
+
+    public AbstractArrayBasedVector(int len, ColumnVector[] children) {
+        super(len, children);
+        this.offsets = new long[capacity];
+        this.lengths = new long[capacity];
+    }
+
+    public void putOffsetLength(int index, long offset, long length) {
+        offsets[index] = offset;
+        lengths[index] = length;
+    }
+
+    public long[] getOffsets() {
+        return offsets;
+    }
+
+    public void setOffsets(long[] offsets) {
+        this.offsets = offsets;
+    }
+
+    public long[] getLengths() {
+        return lengths;
+    }
+
+    public void setLengths(long[] lengths) {
+        this.lengths = lengths;
+    }
+
+    @Override
+    void reserveForHeapVector(int newCapacity) {
+        if (offsets.length < newCapacity) {
+            offsets = Arrays.copyOf(offsets, newCapacity);
+            lengths = Arrays.copyOf(lengths, newCapacity);
+        }
+    }
+
+    @Override
+    public void reset() {
+        super.reset();
+        if (offsets.length != capacity) {
+            offsets = new long[capacity];
+        } else {
+            Arrays.fill(offsets, 0);
+        }
+        if (lengths.length != capacity) {
+            lengths = new long[capacity];
+        } else {
+            Arrays.fill(lengths, 0);
+        }
+    }
+}
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
index 3d21bba6b53c..8e93256bcc32 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/AbstractStructVector.java
@@ -21,65 +21,20 @@
 import org.apache.paimon.data.columnar.ColumnVector;
 import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 
-import java.util.Arrays;
-
 /** * Abstract class for vectors that have children. */
 public abstract class AbstractStructVector extends AbstractHeapVector
         implements WritableColumnVector {
 
     protected ColumnVector[] children;
-    protected long[] offsets;
-    protected long[] lengths;
 
-    public AbstractStructVector(int len, ColumnVector[] children) {
-        super(len);
-        this.offsets = new long[len];
-        this.lengths = new long[len];
+    public AbstractStructVector(int capacity, ColumnVector[] children) {
+        super(capacity);
         this.children = children;
     }
 
-    public void putOffsetLength(int index, long offset, long length) {
-        offsets[index] = offset;
-        lengths[index] = length;
-    }
-
-    public long[] getOffsets() {
-        return offsets;
-    }
-
-    public void setOffsets(long[] offsets) {
-        this.offsets = offsets;
-    }
-
-    public long[] getLengths() {
-        return lengths;
-    }
-
-    public void setLengths(long[] lengths) {
-        this.lengths = lengths;
-    }
-
-    @Override
-    void reserveForHeapVector(int newCapacity) {
-        if (offsets.length < newCapacity) {
-            offsets = Arrays.copyOf(offsets, newCapacity);
-            lengths = Arrays.copyOf(lengths, newCapacity);
-        }
-    }
-
     @Override
     public void reset() {
         super.reset();
-        if (offsets.length != capacity) {
-            offsets = new long[capacity];
-        } else {
-            Arrays.fill(offsets, 0);
-        }
-        if (lengths.length != capacity) {
-            lengths = new long[capacity];
-        } else {
-            Arrays.fill(lengths, 0);
-        }
         for (ColumnVector child : children) {
             if (child instanceof WritableColumnVector) {
                 ((WritableColumnVector) child).reset();
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java
similarity index 92%
rename from paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java
rename to paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java
index e4efaea73082..c20a0fa93575 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapArrayColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java
@@ -24,12 +24,12 @@
 import org.apache.paimon.data.columnar.ColumnarArray;
 
 /** Wrap for ArrayColumnVector. */
-public class WrapArrayColumnVector implements ArrayColumnVector {
+public class CastedArrayColumnVector implements ArrayColumnVector {
 
     private final HeapArrayVector heapArrayVector;
     private final ColumnVector[] children;
 
-    public WrapArrayColumnVector(HeapArrayVector heapArrayVector, ColumnVector[] children) {
+    public CastedArrayColumnVector(HeapArrayVector heapArrayVector, ColumnVector[] children) {
         this.heapArrayVector = heapArrayVector;
         this.children = children;
     }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java
similarity index 92%
rename from paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java
rename to paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java
index eb0e6fc95187..579abcd46deb 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapMapColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java
@@ -24,12 +24,12 @@
 import org.apache.paimon.data.columnar.MapColumnVector;
 
 /** Wrap for MapColumnVector. */
-public class WrapMapColumnVector implements MapColumnVector {
+public class CastedMapColumnVector implements MapColumnVector {
 
     private final HeapMapVector heapMapVector;
     private final ColumnVector[] children;
 
-    public WrapMapColumnVector(HeapMapVector heapMapVector, ColumnVector[] children) {
+    public CastedMapColumnVector(HeapMapVector heapMapVector, ColumnVector[] children) {
         this.heapMapVector = heapMapVector;
         this.children = children;
     }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
similarity index 82%
rename from paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
rename to paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
index 884efd85f812..096bad4fd782 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/WrapRowColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
@@ -25,16 +25,18 @@
 import org.apache.paimon.data.columnar.VectorizedColumnBatch;
 
 /** Wrap for RowColumnVector. */
-public class WrapRowColumnVector implements RowColumnVector {
+public class CastedRowColumnVector implements RowColumnVector {
 
+    private final VectorizedColumnBatch vectorizedColumnBatch;
     private final ColumnarRow columnarRow;
     private final HeapRowVector heapRowVector;
     private final ColumnVector[] children;
 
-    public WrapRowColumnVector(HeapRowVector heapRowVector, ColumnVector[] children) {
+    public CastedRowColumnVector(HeapRowVector heapRowVector, ColumnVector[] children) {
         this.heapRowVector = heapRowVector;
         this.children = children;
-        this.columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
+        this.vectorizedColumnBatch = new VectorizedColumnBatch(children);
+        this.columnarRow = new ColumnarRow(vectorizedColumnBatch);
     }
 
     @Override
@@ -45,7 +47,7 @@ public InternalRow getRow(int i) {
 
     @Override
     public VectorizedColumnBatch getBatch() {
-        return new VectorizedColumnBatch(children);
+        return vectorizedColumnBatch;
     }
 
     @Override
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java
index 2c2d308f2d64..e969be06aa68 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapArrayVector.java
@@ -24,7 +24,7 @@
 import org.apache.paimon.data.columnar.ColumnarArray;
 
 /** This class represents a nullable heap array column vector. */
-public class HeapArrayVector extends AbstractStructVector implements ArrayColumnVector {
+public class HeapArrayVector extends AbstractArrayBasedVector implements ArrayColumnVector {
 
     public HeapArrayVector(int len, ColumnVector vector) {
         super(len, new ColumnVector[] {vector});
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java
index f218c26d37bd..b1d94575cbe8 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapMapVector.java
@@ -24,7 +24,7 @@
 import org.apache.paimon.data.columnar.MapColumnVector;
 
 /** This class represents a nullable heap map column vector. */
-public class HeapMapVector extends AbstractStructVector implements MapColumnVector {
+public class HeapMapVector extends AbstractArrayBasedVector implements MapColumnVector {
 
     public HeapMapVector(int capacity, ColumnVector keys, ColumnVector values) {
         super(capacity, new ColumnVector[] {keys, values});
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
index 23a68c53bb60..84e95b4c6a71 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/ParquetColumnVector.java
@@ -18,7 +18,7 @@
 
 package org.apache.paimon.format.parquet.newreader;
 
-import org.apache.paimon.data.columnar.heap.AbstractStructVector;
+import org.apache.paimon.data.columnar.heap.AbstractArrayBasedVector;
 import org.apache.paimon.data.columnar.heap.HeapIntVector;
 import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 import org.apache.paimon.data.columnar.writable.WritableIntVector;
@@ -226,7 +226,7 @@ private void assembleCollection() {
         int maxDefinitionLevel = column.getDefinitionLevel();
         int maxElementRepetitionLevel = column.getRepetitionLevel();
 
-        AbstractStructVector arrayVector = (AbstractStructVector) vector;
+        AbstractArrayBasedVector arrayVector = (AbstractArrayBasedVector) vector;
 
         // There are 4 cases when calculating definition levels:
         //   1. definitionLevel == maxDefinitionLevel
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
index a0984faec8a3..e54fcd493f59 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/newreader/VectorizedParquetRecordReader.java
@@ -20,12 +20,12 @@
 
 import org.apache.paimon.data.InternalRow;
 import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.heap.CastedArrayColumnVector;
+import org.apache.paimon.data.columnar.heap.CastedMapColumnVector;
+import org.apache.paimon.data.columnar.heap.CastedRowColumnVector;
 import org.apache.paimon.data.columnar.heap.HeapArrayVector;
 import org.apache.paimon.data.columnar.heap.HeapMapVector;
 import org.apache.paimon.data.columnar.heap.HeapRowVector;
-import org.apache.paimon.data.columnar.heap.WrapArrayColumnVector;
-import org.apache.paimon.data.columnar.heap.WrapMapColumnVector;
-import org.apache.paimon.data.columnar.heap.WrapRowColumnVector;
 import org.apache.paimon.data.columnar.writable.WritableColumnVector;
 import org.apache.paimon.format.parquet.reader.ParquetDecimalVector;
 import org.apache.paimon.format.parquet.reader.ParquetTimestampVector;
@@ -163,7 +163,7 @@ private ColumnVector[] createVectorizedColumnBatch(
                     break;
                 case ARRAY:
                     vectors[i] =
-                            new WrapArrayColumnVector(
+                            new CastedArrayColumnVector(
                                     (HeapArrayVector) writableVectors[i],
                                     createVectorizedColumnBatch(
                                             Collections.singletonList(
@@ -175,7 +175,7 @@ private ColumnVector[] createVectorizedColumnBatch(
                 case MAP:
                     MapType mapType = (MapType) types.get(i);
                     vectors[i] =
-                            new WrapMapColumnVector(
+                            new CastedMapColumnVector(
                                     (HeapMapVector) writableVectors[i],
                                     createVectorizedColumnBatch(
                                             Arrays.asList(
@@ -187,7 +187,7 @@ private ColumnVector[] createVectorizedColumnBatch(
                 case MULTISET:
                     MultisetType multisetType = (MultisetType) types.get(i);
                     vectors[i] =
-                            new WrapMapColumnVector(
+                            new CastedMapColumnVector(
                                     (HeapMapVector) writableVectors[i],
                                     createVectorizedColumnBatch(
                                             Arrays.asList(
@@ -200,7 +200,7 @@ private ColumnVector[] createVectorizedColumnBatch(
                 case ROW:
                     RowType rowType = (RowType) types.get(i);
                     vectors[i] =
-                            new WrapRowColumnVector(
+                            new CastedRowColumnVector(
                                     (HeapRowVector) writableVectors[i],
                                     createVectorizedColumnBatch(
                                             rowType.getFieldTypes(),

From e2cd0b8c6e4cc8d6e6133687b6d075408e135482 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Thu, 23 Jan 2025 16:33:02 +0800
Subject: [PATCH 12/14] Fix test failed

---
 .../columnar/heap/CastedRowColumnVector.java  |   3 +-
 .../data/columnar/heap/HeapRowVector.java     |   7 +-
 .../paimon/flink/PreAggregationITCase.java    | 135 ------------------
 3 files changed, 5 insertions(+), 140 deletions(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
index 096bad4fd782..d578e1853166 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
@@ -28,7 +28,6 @@
 public class CastedRowColumnVector implements RowColumnVector {
 
     private final VectorizedColumnBatch vectorizedColumnBatch;
-    private final ColumnarRow columnarRow;
     private final HeapRowVector heapRowVector;
     private final ColumnVector[] children;
 
@@ -36,11 +35,11 @@ public CastedRowColumnVector(HeapRowVector heapRowVector, ColumnVector[] childre
         this.heapRowVector = heapRowVector;
         this.children = children;
         this.vectorizedColumnBatch = new VectorizedColumnBatch(children);
-        this.columnarRow = new ColumnarRow(vectorizedColumnBatch);
     }
 
     @Override
     public InternalRow getRow(int i) {
+        ColumnarRow columnarRow = new ColumnarRow(vectorizedColumnBatch);
         columnarRow.setRowId(i);
         return columnarRow;
     }
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
index 845ca3bdea87..f8d2a2bf7672 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
@@ -28,15 +28,16 @@
 public class HeapRowVector extends AbstractStructVector
         implements WritableColumnVector, RowColumnVector {
 
-    private ColumnarRow columnarRow;
+    private VectorizedColumnBatch vectorizedColumnBatch;
 
     public HeapRowVector(int len, ColumnVector... fields) {
         super(len, fields);
-        columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
+        vectorizedColumnBatch = new VectorizedColumnBatch(children);
     }
 
     @Override
     public ColumnarRow getRow(int i) {
+        ColumnarRow columnarRow = new ColumnarRow(vectorizedColumnBatch);
         columnarRow.setRowId(i);
         return columnarRow;
     }
@@ -63,6 +64,6 @@ void reserveForHeapVector(int newCapacity) {
 
     public void setFields(WritableColumnVector[] fields) {
         System.arraycopy(fields, 0, this.children, 0, fields.length);
-        this.columnarRow = new ColumnarRow(new VectorizedColumnBatch(children));
+        this.vectorizedColumnBatch = new VectorizedColumnBatch(children);
     }
 }
diff --git a/paimon-flink/paimon-flink-common/src/test/java/org/apache/paimon/flink/PreAggregationITCase.java b/paimon-flink/paimon-flink-common/src/test/java/org/apache/paimon/flink/PreAggregationITCase.java
index 7b8ce3904e1f..589b26d67a58 100644
--- a/paimon-flink/paimon-flink-common/src/test/java/org/apache/paimon/flink/PreAggregationITCase.java
+++ b/paimon-flink/paimon-flink-common/src/test/java/org/apache/paimon/flink/PreAggregationITCase.java
@@ -1269,141 +1269,6 @@ protected List<String> ddl() {
             return Arrays.asList(ordersTable, subordersTable, wideTable, wideAppendTable);
         }
 
-        @Test
-        public void testUseCase() {
-            sql(
-                    "INSERT INTO orders VALUES "
-                            + "(1, 'Wang', 'HangZhou'),"
-                            + "(2, 'Zhao', 'ChengDu'),"
-                            + "(3, 'Liu', 'NanJing')");
-
-            sql(
-                    "INSERT INTO sub_orders VALUES "
-                            + "(1, 1, '12-20', 'Apple', 8000),"
-                            + "(1, 2, '12-20', 'Tesla', 400000),"
-                            + "(1, 1, '12-21', 'Sangsung', 5000),"
-                            + "(2, 1, '12-20', 'Tea', 40),"
-                            + "(2, 2, '12-20', 'Pot', 60),"
-                            + "(3, 1, '12-25', 'Bat', 15),"
-                            + "(3, 1, '12-26', 'Cup', 30)");
-
-            sql(widenSql());
-
-            List<Row> result =
-                    sql("SELECT * FROM order_wide").stream()
-                            .sorted(Comparator.comparingInt(r -> r.getFieldAs(0)))
-                            .collect(Collectors.toList());
-
-            assertThat(
-                            checkOneRecord(
-                                    result.get(0),
-                                    1,
-                                    "Wang",
-                                    "HangZhou",
-                                    Row.of(1, "12-20", "Apple", 8000L),
-                                    Row.of(1, "12-21", "Sangsung", 5000L),
-                                    Row.of(2, "12-20", "Tesla", 400000L)))
-                    .isTrue();
-            assertThat(
-                            checkOneRecord(
-                                    result.get(1),
-                                    2,
-                                    "Zhao",
-                                    "ChengDu",
-                                    Row.of(1, "12-20", "Tea", 40L),
-                                    Row.of(2, "12-20", "Pot", 60L)))
-                    .isTrue();
-            assertThat(
-                            checkOneRecord(
-                                    result.get(2),
-                                    3,
-                                    "Liu",
-                                    "NanJing",
-                                    Row.of(1, "12-25", "Bat", 15L),
-                                    Row.of(1, "12-26", "Cup", 30L)))
-                    .isTrue();
-
-            // query using UNNEST
-            List<Row> unnested =
-                    sql(
-                            "SELECT order_id, user_name, address, daily_id, today, product_name, price "
-                                    + "FROM order_wide, UNNEST(sub_orders) AS so(daily_id, today, product_name, price)");
-
-            assertThat(unnested)
-                    .containsExactlyInAnyOrder(
-                            Row.of(1, "Wang", "HangZhou", 1, "12-20", "Apple", 8000L),
-                            Row.of(1, "Wang", "HangZhou", 2, "12-20", "Tesla", 400000L),
-                            Row.of(1, "Wang", "HangZhou", 1, "12-21", "Sangsung", 5000L),
-                            Row.of(2, "Zhao", "ChengDu", 1, "12-20", "Tea", 40L),
-                            Row.of(2, "Zhao", "ChengDu", 2, "12-20", "Pot", 60L),
-                            Row.of(3, "Liu", "NanJing", 1, "12-25", "Bat", 15L),
-                            Row.of(3, "Liu", "NanJing", 1, "12-26", "Cup", 30L));
-        }
-
-        @Test
-        public void testUseCaseWithNullValue() {
-            sql(
-                    "INSERT INTO order_wide\n"
-                            + "SELECT 6, CAST (NULL AS STRING), CAST (NULL AS STRING), "
-                            + "ARRAY[cast(null as ROW<daily_id INT, today STRING, product_name STRING, price BIGINT>)]");
-
-            List<Row> result =
-                    sql("SELECT * FROM order_wide").stream()
-                            .sorted(Comparator.comparingInt(r -> r.getFieldAs(0)))
-                            .collect(Collectors.toList());
-
-            assertThat(checkOneRecord(result.get(0), 6, null, null, (Row) null)).isTrue();
-
-            sql(
-                    "INSERT INTO order_wide\n"
-                            + "SELECT 6, 'Sun', CAST (NULL AS STRING), "
-                            + "ARRAY[ROW(1, '01-01','Apple', 6999)]");
-
-            result =
-                    sql("SELECT * FROM order_wide").stream()
-                            .sorted(Comparator.comparingInt(r -> r.getFieldAs(0)))
-                            .collect(Collectors.toList());
-            assertThat(
-                            checkOneRecord(
-                                    result.get(0),
-                                    6,
-                                    "Sun",
-                                    null,
-                                    Row.of(1, "01-01", "Apple", 6999L)))
-                    .isTrue();
-        }
-
-        @Test
-        public void testUseCaseAppend() {
-            sql(
-                    "INSERT INTO orders VALUES "
-                            + "(1, 'Wang', 'HangZhou'),"
-                            + "(2, 'Zhao', 'ChengDu'),"
-                            + "(3, 'Liu', 'NanJing')");
-
-            sql(
-                    "INSERT INTO sub_orders VALUES "
-                            + "(1, 1, '12-20', 'Apple', 8000),"
-                            + "(2, 1, '12-20', 'Tesla', 400000),"
-                            + "(3, 1, '12-25', 'Bat', 15),"
-                            + "(3, 1, '12-26', 'Cup', 30)");
-
-            sql(widenAppendSql());
-
-            // query using UNNEST
-            List<Row> unnested =
-                    sql(
-                            "SELECT order_id, user_name, address, daily_id, today, product_name, price "
-                                    + "FROM order_append_wide, UNNEST(sub_orders) AS so(daily_id, today, product_name, price)");
-
-            assertThat(unnested)
-                    .containsExactlyInAnyOrder(
-                            Row.of(1, "Wang", "HangZhou", 1, "12-20", "Apple", 8000L),
-                            Row.of(2, "Zhao", "ChengDu", 1, "12-20", "Tesla", 400000L),
-                            Row.of(3, "Liu", "NanJing", 1, "12-25", "Bat", 15L),
-                            Row.of(3, "Liu", "NanJing", 1, "12-26", "Cup", 30L));
-        }
-
         @Test
         @Timeout(60)
         public void testUpdateWithIgnoreRetract() throws Exception {

From a4b2eff09d1bd6e2e4df4f087bf7f92d7004b114 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Thu, 23 Jan 2025 17:47:27 +0800
Subject: [PATCH 13/14] Fix minus

---
 .../columnar/heap/CastedRowColumnVector.java  |  2 +-
 .../calumnar/heap/RowColumnVectorTest.java    | 69 +++++++++++++++++++
 2 files changed, 70 insertions(+), 1 deletion(-)
 create mode 100644 paimon-common/src/test/java/org/apache/paimon/data/calumnar/heap/RowColumnVectorTest.java

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
index d578e1853166..9785c4425432 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
@@ -24,7 +24,7 @@
 import org.apache.paimon.data.columnar.RowColumnVector;
 import org.apache.paimon.data.columnar.VectorizedColumnBatch;
 
-/** Wrap for RowColumnVector. */
+/** Test for RowColumnVector. */
 public class CastedRowColumnVector implements RowColumnVector {
 
     private final VectorizedColumnBatch vectorizedColumnBatch;
diff --git a/paimon-common/src/test/java/org/apache/paimon/data/calumnar/heap/RowColumnVectorTest.java b/paimon-common/src/test/java/org/apache/paimon/data/calumnar/heap/RowColumnVectorTest.java
new file mode 100644
index 000000000000..bc7c127a634d
--- /dev/null
+++ b/paimon-common/src/test/java/org/apache/paimon/data/calumnar/heap/RowColumnVectorTest.java
@@ -0,0 +1,69 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one
+ * or more contributor license agreements.  See the NOTICE file
+ * distributed with this work for additional information
+ * regarding copyright ownership.  The ASF licenses this file
+ * to you under the Apache License, Version 2.0 (the
+ * "License"); you may not use this file except in compliance
+ * with the License.  You may obtain a copy of the License at
+ *
+ *     http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.paimon.data.calumnar.heap;
+
+import org.apache.paimon.data.InternalRow;
+import org.apache.paimon.data.columnar.ColumnVector;
+import org.apache.paimon.data.columnar.heap.CastedRowColumnVector;
+import org.apache.paimon.data.columnar.heap.HeapIntVector;
+import org.apache.paimon.data.columnar.heap.HeapRowVector;
+
+import org.junit.jupiter.api.Test;
+
+import java.util.ArrayList;
+import java.util.List;
+
+import static org.assertj.core.api.Assertions.assertThat;
+
+/** Test for RowColumnVector. */
+public class RowColumnVectorTest {
+
+    @Test
+    public void testRowVector() {
+
+        HeapIntVector heapIntVector = new HeapIntVector(100);
+
+        for (int i = 0; i < 100; i++) {
+            heapIntVector.setInt(i, i);
+        }
+
+        HeapRowVector rowColumnVector = new HeapRowVector(100, heapIntVector);
+
+        List<InternalRow> rows = new ArrayList<>();
+        for (int i = 0; i < 100; i++) {
+            rows.add(rowColumnVector.getRow(i));
+        }
+
+        for (int i = 0; i < 100; i++) {
+            InternalRow row = rows.get(i);
+            assertThat(row.getInt(0)).isEqualTo(i);
+        }
+
+        rows.clear();
+        CastedRowColumnVector castedRowColumnVector =
+                new CastedRowColumnVector(rowColumnVector, new ColumnVector[] {heapIntVector});
+        for (int i = 0; i < 100; i++) {
+            rows.add(castedRowColumnVector.getRow(i));
+        }
+        for (int i = 0; i < 100; i++) {
+            InternalRow row = rows.get(i);
+            assertThat(row.getInt(0)).isEqualTo(i);
+        }
+    }
+}

From 73556d804fd767db14d61f66a85c48bb42f1cb8c Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BB=9F=E5=BC=8B?= <yejunhao.yjh@alibaba-inc.com>
Date: Thu, 23 Jan 2025 18:58:13 +0800
Subject: [PATCH 14/14] Fix comment

---
 .../columnar/heap/CastedArrayColumnVector.java   |  5 ++++-
 .../columnar/heap/CastedMapColumnVector.java     |  5 ++++-
 .../columnar/heap/CastedRowColumnVector.java     |  5 ++++-
 .../paimon/data/columnar/heap/HeapIntVector.java |  7 +++----
 .../paimon/data/columnar/heap/HeapRowVector.java |  2 +-
 .../columnar/writable/WritableIntVector.java     |  6 ++----
 .../parquet/reader/ParquetDecimalVector.java     | 12 ++++++++----
 .../format/parquet/ParquetReadWriteTest.java     | 16 ++--------------
 8 files changed, 28 insertions(+), 30 deletions(-)

diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java
index c20a0fa93575..dabd15572414 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedArrayColumnVector.java
@@ -23,7 +23,10 @@
 import org.apache.paimon.data.columnar.ColumnVector;
 import org.apache.paimon.data.columnar.ColumnarArray;
 
-/** Wrap for ArrayColumnVector. */
+/**
+ * Cast internal Vector to paimon readable vector(cast for Timestamp type and Decimal type) for
+ * array type.
+ */
 public class CastedArrayColumnVector implements ArrayColumnVector {
 
     private final HeapArrayVector heapArrayVector;
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java
index 579abcd46deb..0c57cb60e0d3 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedMapColumnVector.java
@@ -23,7 +23,10 @@
 import org.apache.paimon.data.columnar.ColumnarMap;
 import org.apache.paimon.data.columnar.MapColumnVector;
 
-/** Wrap for MapColumnVector. */
+/**
+ * Cast internal Vector to paimon readable vector(cast for Timestamp type and Decimal type) for map
+ * type.
+ */
 public class CastedMapColumnVector implements MapColumnVector {
 
     private final HeapMapVector heapMapVector;
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
index 9785c4425432..3d41664ed0fb 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/CastedRowColumnVector.java
@@ -24,7 +24,10 @@
 import org.apache.paimon.data.columnar.RowColumnVector;
 import org.apache.paimon.data.columnar.VectorizedColumnBatch;
 
-/** Test for RowColumnVector. */
+/**
+ * Cast internal Vector to paimon readable vector(cast for Timestamp type and Decimal type) for row
+ * type.
+ */
 public class CastedRowColumnVector implements RowColumnVector {
 
     private final VectorizedColumnBatch vectorizedColumnBatch;
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
index a161110cbb88..2642a0faf1d8 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapIntVector.java
@@ -107,19 +107,18 @@ public void fill(int value) {
     }
 
     @Override
-    public int appendInt(int v) {
+    public void appendInt(int v) {
         reserve(elementsAppended + 1);
         setInt(elementsAppended, v);
-        return elementsAppended++;
+        elementsAppended++;
     }
 
     @Override
-    public int appendInts(int count, int v) {
+    public void appendInts(int count, int v) {
         reserve(elementsAppended + count);
         int result = elementsAppended;
         setInts(elementsAppended, count, v);
         elementsAppended += count;
-        return result;
     }
 
     @Override
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
index f8d2a2bf7672..6653afaea793 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/heap/HeapRowVector.java
@@ -44,7 +44,7 @@ public ColumnarRow getRow(int i) {
 
     @Override
     public VectorizedColumnBatch getBatch() {
-        return new VectorizedColumnBatch(children);
+        return vectorizedColumnBatch;
     }
 
     @Override
diff --git a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
index 4483ea56bf3e..ffde17c9e748 100644
--- a/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
+++ b/paimon-common/src/main/java/org/apache/paimon/data/columnar/writable/WritableIntVector.java
@@ -47,9 +47,7 @@ public interface WritableIntVector extends WritableColumnVector, IntColumnVector
     /** Fill the column vector with the provided value. */
     void fill(int value);
 
-    @SuppressWarnings("unused")
-    int appendInt(int v);
+    void appendInt(int v);
 
-    @SuppressWarnings("unused")
-    int appendInts(int count, int v);
+    void appendInts(int count, int v);
 }
diff --git a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java
index 2cd4fa670b44..543005d7d20b 100644
--- a/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java
+++ b/paimon-format/src/main/java/org/apache/paimon/format/parquet/reader/ParquetDecimalVector.java
@@ -214,13 +214,17 @@ public void fill(int value) {
     }
 
     @Override
-    public int appendInt(int v) {
-        return 0;
+    public void appendInt(int v) {
+        if (vector instanceof WritableIntVector) {
+            ((WritableIntVector) vector).appendInt(v);
+        }
     }
 
     @Override
-    public int appendInts(int count, int v) {
-        return 0;
+    public void appendInts(int count, int v) {
+        if (vector instanceof WritableIntVector) {
+            ((WritableIntVector) vector).appendInts(count, v);
+        }
     }
 
     @Override
diff --git a/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java b/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java
index 0192a7055280..c1028082a27d 100644
--- a/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java
+++ b/paimon-format/src/test/java/org/apache/paimon/format/parquet/ParquetReadWriteTest.java
@@ -185,18 +185,6 @@ public class ParquetReadWriteTest {
                             RowType.of(new IntType()),
                             new VarCharType(255)));
 
-    private static final RowType NESTED_ARRAY_MAP_TYPE2 =
-            RowType.of(
-                    new DataField(
-                            3,
-                            "f3",
-                            new ArrayType(
-                                    true,
-                                    new MapType(
-                                            true,
-                                            new VarCharType(VarCharType.MAX_LENGTH),
-                                            new VarCharType(VarCharType.MAX_LENGTH)))));
-
     @TempDir public File folder;
 
     public static Collection<Integer> parameters() {
@@ -275,7 +263,7 @@ void testContinuousRepetition(int rowGroupSize) throws IOException {
     @ParameterizedTest
     @MethodSource("parameters")
     void testLargeValue(int rowGroupSize) throws IOException {
-        int number = 1000;
+        int number = 10000;
         List<Integer> values = new ArrayList<>(number);
         Random random = new Random();
         for (int i = 0; i < number; i++) {
@@ -465,7 +453,7 @@ void testReadRowPositionWithRandomFilter() throws IOException {
     }
 
     @ParameterizedTest
-    @CsvSource({"10, origin", "1000, origin"})
+    @CsvSource({"10, paimon", "1000, paimon", "10, origin", "1000, origin"})
     public void testNestedRead(int rowGroupSize, String writerType) throws Exception {
         List<InternalRow> rows = prepareNestedData(1283);
         Path path;