From f8bb964da13505f188cf543a1aec808629da806d Mon Sep 17 00:00:00 2001
From: lihaopeng <lihaopeng@baidu.com>
Date: Wed, 27 Apr 2022 11:31:30 +0800
Subject: [PATCH 1/2] [feature-wip](stream-load-vec) Support stream load in
 vectorized engine (#8709)

Implement vectorized stream load.
Added fe configuration option `enable_vectorized_load` to enable vectorized stream load.

Co-authored-by: tengjp@outlook.com
Co-authored-by: mrhhsg@gmail.com
Co-authored-by: minghong.zhou@163.com
Co-authored-by: HappenLee <happenlee@hotmail.com>
Co-authored-by: zhoubintao <35688959+zbtzbtzbt@users.noreply.github.com>
---
 be/src/exec/base_scanner.h                    |  10 +
 be/src/exec/broker_scan_node.cpp              |  14 +-
 be/src/exec/broker_scan_node.h                |  13 +-
 be/src/exec/broker_scanner.cpp                |   8 +-
 be/src/exec/broker_scanner.h                  |  16 +-
 be/src/exec/exec_node.cpp                     |   8 +-
 be/src/exec/tablet_sink.cpp                   | 307 ++++----
 be/src/exec/tablet_sink.h                     | 121 ++--
 be/src/olap/compaction.cpp                    |   2 +-
 be/src/olap/delta_writer.cpp                  |  45 +-
 be/src/olap/delta_writer.h                    |  11 +-
 be/src/olap/memtable.cpp                      | 180 ++++-
 be/src/olap/memtable.h                        |  82 ++-
 be/src/olap/merger.cpp                        |  50 ++
 be/src/olap/merger.h                          |   4 +
 be/src/olap/olap_define.h                     |   3 +
 be/src/olap/reader.cpp                        |  11 +
 be/src/olap/row_block2.cpp                    |   2 -
 be/src/olap/row_cursor_cell.h                 |   2 +-
 be/src/olap/rowset/beta_rowset_writer.cpp     |  41 +-
 be/src/olap/rowset/beta_rowset_writer.h       |   2 +
 be/src/olap/rowset/rowset_writer.h            |   7 +-
 .../olap/rowset/segment_v2/column_writer.cpp  |  21 +
 be/src/olap/rowset/segment_v2/column_writer.h |   6 +
 .../olap/rowset/segment_v2/segment_writer.cpp |  94 ++-
 .../olap/rowset/segment_v2/segment_writer.h   |  21 +-
 be/src/runtime/load_channel.cpp               |  63 +-
 be/src/runtime/load_channel.h                 |  74 +-
 be/src/runtime/load_channel_mgr.cpp           |  65 +-
 be/src/runtime/load_channel_mgr.h             |  77 +-
 be/src/runtime/tablets_channel.cpp            |  80 +-
 be/src/runtime/tablets_channel.h              | 108 ++-
 be/src/service/internal_service.cpp           |  31 +
 be/src/service/internal_service.h             |   5 +
 be/src/udf/udf.cpp                            |   2 +-
 be/src/vec/CMakeLists.txt                     |   3 +
 .../aggregate_function_reader.cpp             |  41 +-
 .../aggregate_function_reader.h               |   7 +-
 .../aggregate_function_simple_factory.cpp     |   4 +-
 .../aggregate_function_window.cpp             |  96 +--
 .../aggregate_function_window.h               |  69 +-
 be/src/vec/core/block.cpp                     |  18 +
 be/src/vec/core/block.h                       |  25 +
 be/src/vec/exec/vbroker_scan_node.cpp         | 228 ++++++
 be/src/vec/exec/vbroker_scan_node.h           |  52 ++
 be/src/vec/exec/vbroker_scanner.cpp           | 293 ++++++++
 be/src/vec/exec/vbroker_scanner.h             |  39 +
 be/src/vec/exprs/vexpr_context.cpp            |   1 +
 be/src/vec/olap/block_reader.cpp              |   2 +-
 be/src/vec/olap/olap_data_convertor.cpp       | 684 ++++++++++++++++++
 be/src/vec/olap/olap_data_convertor.h         | 210 ++++++
 be/src/vec/olap/vcollect_iterator.cpp         |  47 +-
 be/src/vec/olap/vcollect_iterator.h           |   5 +
 be/src/vec/sink/vtablet_sink.cpp              | 293 +++++++-
 be/src/vec/sink/vtablet_sink.h                |  44 ++
 be/test/CMakeLists.txt                        |   3 +
 be/test/olap/delta_writer_test.cpp            | 244 +++++++
 .../olap/rowset/segment_v2/segment_test.cpp   |   6 +-
 be/test/tools/benchmark_tool.cpp              |   2 +-
 be/test/vec/exec/vbroker_scan_node_test.cpp   | 644 +++++++++++++++++
 be/test/vec/exec/vbroker_scanner_test.cpp     | 460 ++++++++++++
 be/test/vec/exec/vtablet_sink_test.cpp        | 607 ++++++++++++++++
 be/test/vec/exprs/vexpr_test.cpp              |  10 +-
 .../java/org/apache/doris/common/Config.java  |   2 +
 .../doris/planner/StreamLoadPlanner.java      |   6 +
 gensrc/proto/internal_service.proto           |  33 +
 66 files changed, 5146 insertions(+), 618 deletions(-)
 create mode 100644 be/src/vec/exec/vbroker_scan_node.cpp
 create mode 100644 be/src/vec/exec/vbroker_scan_node.h
 create mode 100644 be/src/vec/exec/vbroker_scanner.cpp
 create mode 100644 be/src/vec/exec/vbroker_scanner.h
 create mode 100644 be/src/vec/olap/olap_data_convertor.cpp
 create mode 100644 be/src/vec/olap/olap_data_convertor.h
 create mode 100644 be/test/vec/exec/vbroker_scan_node_test.cpp
 create mode 100644 be/test/vec/exec/vbroker_scanner_test.cpp
 create mode 100644 be/test/vec/exec/vtablet_sink_test.cpp

diff --git a/be/src/exec/base_scanner.h b/be/src/exec/base_scanner.h
index c01891c3818db4..338818914b340b 100644
--- a/be/src/exec/base_scanner.h
+++ b/be/src/exec/base_scanner.h
@@ -33,6 +33,11 @@ class MemTracker;
 class RuntimeState;
 class ExprContext;
 
+namespace vectorized {
+class IColumn;
+using MutableColumnPtr = IColumn::MutablePtr;
+}
+
 // The counter will be passed to each scanner.
 // Note that this struct is not thread safe.
 // So if we support concurrent scan in the future, we need to modify this struct.
@@ -56,6 +61,11 @@ class BaseScanner {
     // Get next tuple
     virtual Status get_next(Tuple* tuple, MemPool* tuple_pool, bool* eof, bool *fill_tuple) = 0;
 
+    // Get next block
+    virtual Status get_next(std::vector<vectorized::MutableColumnPtr>& columns, bool* eof) {
+        return Status::NotSupported("Not Implemented get block");
+    }
+
     // Close this scanner
     virtual void close() = 0;
     Status fill_dest_tuple(Tuple* dest_tuple, MemPool* mem_pool, bool* fill_tuple);
diff --git a/be/src/exec/broker_scan_node.cpp b/be/src/exec/broker_scan_node.cpp
index e16410e0f5983f..ce450745a7e29a 100644
--- a/be/src/exec/broker_scan_node.cpp
+++ b/be/src/exec/broker_scan_node.cpp
@@ -21,7 +21,7 @@
 #include <sstream>
 
 #include "common/object_pool.h"
-#include "exec/broker_scanner.h"
+#include "vec/exec/vbroker_scanner.h"
 #include "exec/json_scanner.h"
 #include "exec/orc_scanner.h"
 #include "exec/parquet_scanner.h"
@@ -238,9 +238,15 @@ std::unique_ptr<BaseScanner> BrokerScanNode::create_scanner(const TBrokerScanRan
                                _pre_filter_texprs, counter);
         break;
     default:
-        scan = new BrokerScanner(_runtime_state, runtime_profile(), scan_range.params,
-                                 scan_range.ranges, scan_range.broker_addresses,
-                                 _pre_filter_texprs, counter);
+        if (_vectorized) {
+            scan = new vectorized::VBrokerScanner(_runtime_state, runtime_profile(), scan_range.params,
+                                     scan_range.ranges, scan_range.broker_addresses,
+                                     _pre_filter_texprs, counter);
+        } else {
+            scan = new BrokerScanner(_runtime_state, runtime_profile(), scan_range.params,
+                                     scan_range.ranges, scan_range.broker_addresses,
+                                     _pre_filter_texprs, counter);
+        }
     }
     std::unique_ptr<BaseScanner> scanner(scan);
     return scanner;
diff --git a/be/src/exec/broker_scan_node.h b/be/src/exec/broker_scan_node.h
index c4494731d87b18..68adbf007c4433 100644
--- a/be/src/exec/broker_scan_node.h
+++ b/be/src/exec/broker_scan_node.h
@@ -65,7 +65,6 @@ class BrokerScanNode : public ScanNode {
     // Write debug string of this into out.
     virtual void debug_string(int indentation_level, std::stringstream* out) const override;
 
-private:
     // Update process status to one failed status,
     // NOTE: Must hold the mutex of this scan node
     bool update_status(const Status& new_status) {
@@ -76,8 +75,12 @@ class BrokerScanNode : public ScanNode {
         return false;
     }
 
+    std::unique_ptr<BaseScanner> create_scanner(const TBrokerScanRange& scan_range,
+                                                ScannerCounter* counter);
+
+private:
     // Create scanners to do scan job
-    Status start_scanners();
+    virtual Status start_scanners();
 
     // One scanner worker, This scanner will handle 'length' ranges start from start_idx
     void scanner_worker(int start_idx, int length);
@@ -86,10 +89,8 @@ class BrokerScanNode : public ScanNode {
     Status scanner_scan(const TBrokerScanRange& scan_range,
                         const std::vector<ExprContext*>& conjunct_ctxs, ScannerCounter* counter);
 
-    std::unique_ptr<BaseScanner> create_scanner(const TBrokerScanRange& scan_range,
-                                                ScannerCounter* counter);
-
-private:
+protected:
+    bool _vectorized = false;
     TupleId _tuple_id;
     RuntimeState* _runtime_state;
     TupleDescriptor* _tuple_desc;
diff --git a/be/src/exec/broker_scanner.cpp b/be/src/exec/broker_scanner.cpp
index 646bcbc1f45b2a..f91a685c44f799 100644
--- a/be/src/exec/broker_scanner.cpp
+++ b/be/src/exec/broker_scanner.cpp
@@ -30,8 +30,6 @@
 #include "exec/plain_binary_line_reader.h"
 #include "exec/plain_text_line_reader.h"
 #include "exec/s3_reader.h"
-#include "exec/text_converter.h"
-#include "exec/text_converter.hpp"
 #include "exprs/expr.h"
 #include "runtime/descriptors.h"
 #include "runtime/exec_env.h"
@@ -82,10 +80,6 @@ BrokerScanner::~BrokerScanner() {
 
 Status BrokerScanner::open() {
     RETURN_IF_ERROR(BaseScanner::open()); // base default function
-    _text_converter.reset(new (std::nothrow) TextConverter('\\'));
-    if (_text_converter == nullptr) {
-        return Status::InternalError("No memory error.");
-    }
     return Status::OK();
 }
 
@@ -272,7 +266,7 @@ Status BrokerScanner::open_line_reader() {
             return Status::InternalError(ss.str());
         }
         size += 1;
-        // not  first range will always skip one line
+        // not first range will always skip one line
         _skip_lines = 1;
     }
 
diff --git a/be/src/exec/broker_scanner.h b/be/src/exec/broker_scanner.h
index 23d1a81c02c5f2..e56fce6bc63316 100644
--- a/be/src/exec/broker_scanner.h
+++ b/be/src/exec/broker_scanner.h
@@ -56,7 +56,7 @@ class BrokerScanner : public BaseScanner {
                   const TBrokerScanRangeParams& params, const std::vector<TBrokerRangeDesc>& ranges,
                   const std::vector<TNetworkAddress>& broker_addresses,
                   const std::vector<TExpr>& pre_filter_texprs, ScannerCounter* counter);
-    ~BrokerScanner();
+    virtual ~BrokerScanner();
 
     // Open this scanner, will initialize information need to
     Status open() override;
@@ -67,12 +67,16 @@ class BrokerScanner : public BaseScanner {
     // Close this scanner
     void close() override;
 
+protected:
+    // Read next buffer from reader
+    Status open_next_reader();
+
+    Status _line_to_src_tuple(const Slice& line);
+
 private:
     Status open_file_reader();
     Status create_decompressor(TFileFormatType::type type);
     Status open_line_reader();
-    // Read next buffer from reader
-    Status open_next_reader();
 
     // Split one text line to values
     void split_line(const Slice& line);
@@ -88,14 +92,10 @@ class BrokerScanner : public BaseScanner {
     //  output is tuple
     Status _convert_one_row(const Slice& line, Tuple* tuple, MemPool* tuple_pool, bool* fill_tuple);
 
-    Status _line_to_src_tuple(const Slice& line);
-
-private:
+protected:
     const std::vector<TBrokerRangeDesc>& _ranges;
     const std::vector<TNetworkAddress>& _broker_addresses;
 
-    std::unique_ptr<TextConverter> _text_converter;
-
     std::string _value_separator;
     std::string _line_delimiter;
     TFileFormatType::type _file_format_type;
diff --git a/be/src/exec/exec_node.cpp b/be/src/exec/exec_node.cpp
index 2ff50229dce7cb..1603324fcf1c28 100644
--- a/be/src/exec/exec_node.cpp
+++ b/be/src/exec/exec_node.cpp
@@ -82,6 +82,7 @@
 #include "vec/exec/vsort_node.h"
 #include "vec/exec/vtable_function_node.h"
 #include "vec/exec/vunion_node.h"
+#include "vec/exec/vbroker_scan_node.h"
 #include "vec/exprs/vexpr.h"
 
 namespace doris {
@@ -392,6 +393,7 @@ Status ExecNode::create_node(RuntimeState* state, ObjectPool* pool, const TPlanN
         case TPlanNodeType::SELECT_NODE:
         case TPlanNodeType::REPEAT_NODE:
         case TPlanNodeType::TABLE_FUNCTION_NODE:
+        case TPlanNodeType::BROKER_SCAN_NODE:
             break;
         default: {
             const auto& i = _TPlanNodeType_VALUES_TO_NAMES.find(tnode.node_type);
@@ -555,7 +557,11 @@ Status ExecNode::create_node(RuntimeState* state, ObjectPool* pool, const TPlanN
         return Status::OK();
 
     case TPlanNodeType::BROKER_SCAN_NODE:
-        *node = pool->add(new BrokerScanNode(pool, tnode, descs));
+        if (state->enable_vectorized_exec()) {
+            *node = pool->add(new vectorized::VBrokerScanNode(pool, tnode, descs));
+        } else {
+            *node = pool->add(new BrokerScanNode(pool, tnode, descs));
+        }
         return Status::OK();
 
     case TPlanNodeType::REPEAT_NODE:
diff --git a/be/src/exec/tablet_sink.cpp b/be/src/exec/tablet_sink.cpp
index 9928b7e26fda2d..b195591de0ef3f 100644
--- a/be/src/exec/tablet_sink.cpp
+++ b/be/src/exec/tablet_sink.cpp
@@ -41,6 +41,9 @@
 #include "util/time.h"
 #include "util/uid_util.h"
 
+#include "vec/core/block.h"
+#include "vec/sink/vtablet_sink.h"
+
 namespace doris {
 namespace stream_load {
 
@@ -65,7 +68,9 @@ NodeChannel::~NodeChannel() noexcept {
         delete _add_batch_closure;
         _add_batch_closure = nullptr;
     }
-    _cur_add_batch_request.release_id();
+    if (!_is_vectorized) {
+        _cur_add_batch_request.release_id();
+    }
 }
 
 // if "_cancelled" is set to true,
@@ -86,7 +91,6 @@ Status NodeChannel::init(RuntimeState* state) {
 
     _row_desc.reset(new RowDescriptor(_tuple_desc, false));
     _batch_size = state->batch_size();
-    _cur_batch.reset(new RowBatch(*_row_desc, _batch_size));
 
     _stub = state->exec_env()->brpc_internal_client_cache()->get_client(_node_info.host,
                                                                         _node_info.brpc_port);
@@ -97,12 +101,18 @@ Status NodeChannel::init(RuntimeState* state) {
         return Status::InternalError("get rpc stub failed");
     }
 
-    // Initialize _cur_add_batch_request
-    _cur_add_batch_request.set_allocated_id(&_parent->_load_id);
-    _cur_add_batch_request.set_index_id(_index_channel->_index_id);
-    _cur_add_batch_request.set_sender_id(_parent->_sender_id);
-    _cur_add_batch_request.set_backend_id(_node_id);
-    _cur_add_batch_request.set_eos(false);
+    if (!_is_vectorized) {
+        _cur_batch.reset(new RowBatch(*_row_desc, _batch_size));
+
+        // Initialize _cur_add_batch_request
+        _cur_add_batch_request.set_allocated_id(&_parent->_load_id);
+        _cur_add_batch_request.set_index_id(_index_channel->_index_id);
+        _cur_add_batch_request.set_sender_id(_parent->_sender_id);
+        _cur_add_batch_request.set_backend_id(_node_id);
+        _cur_add_batch_request.set_eos(false);
+
+        _name = fmt::format("NodeChannel[{}-{}]", _index_channel->_index_id, _node_id);
+    }
 
     _rpc_timeout_ms = state->query_options().query_timeout * 1000;
     _timeout_watch.start();
@@ -110,7 +120,6 @@ Status NodeChannel::init(RuntimeState* state) {
 
     _load_info = "load_id=" + print_id(_parent->_load_id) +
                  ", txn_id=" + std::to_string(_parent->_txn_id);
-    _name = fmt::format("NodeChannel[{}-{}]", _index_channel->_index_id, _node_id);
     return Status::OK();
 }
 
@@ -132,6 +141,7 @@ void NodeChannel::open() {
     request.set_load_channel_timeout_s(_parent->_load_channel_timeout_s);
     request.set_is_high_priority(_parent->_is_high_priority);
     request.set_sender_ip(BackendOptions::get_localhost());
+    request.set_is_vectorized(_is_vectorized);
 
     _open_closure = new RefCountClosure<PTabletWriterOpenResult>();
     _open_closure->ref();
@@ -186,67 +196,69 @@ Status NodeChannel::open_wait() {
         return status;
     }
 
-    // add batch closure
-    _add_batch_closure = ReusableClosure<PTabletWriterAddBatchResult>::create();
-    _add_batch_closure->addFailedHandler([this](bool is_last_rpc) {
-        std::lock_guard<std::mutex> l(this->_closed_lock);
-        if (this->_is_closed) {
-            // if the node channel is closed, no need to call `mark_as_failed`,
-            // and notice that _index_channel may already be destroyed.
-            return;
-        }
-        // If rpc failed, mark all tablets on this node channel as failed
-        _index_channel->mark_as_failed(this->node_id(), this->host(),
-                                       _add_batch_closure->cntl.ErrorText(), -1);
-        Status st = _index_channel->check_intolerable_failure();
-        if (!st.ok()) {
-            _cancel_with_msg(fmt::format("{}, err: {}", channel_info(), st.get_error_msg()));
-        } else if (is_last_rpc) {
-            // if this is last rpc, will must set _add_batches_finished. otherwise, node channel's close_wait
-            // will be blocked.
-            _add_batches_finished = true;
-        }
-    });
-
-    _add_batch_closure->addSuccessHandler([this](const PTabletWriterAddBatchResult& result,
-                                                 bool is_last_rpc) {
-        std::lock_guard<std::mutex> l(this->_closed_lock);
-        if (this->_is_closed) {
-            // if the node channel is closed, no need to call the following logic,
-            // and notice that _index_channel may already be destroyed.
-            return;
-        }
-        Status status(result.status());
-        if (status.ok()) {
-            // if has error tablet, handle them first
-            for (auto& error : result.tablet_errors()) {
-                _index_channel->mark_as_failed(this->node_id(), this->host(), error.msg(),
-                                               error.tablet_id());
+    if (!_is_vectorized) {
+        // add batch closure
+        _add_batch_closure = ReusableClosure<PTabletWriterAddBatchResult>::create();
+        _add_batch_closure->addFailedHandler([this](bool is_last_rpc) {
+            std::lock_guard<std::mutex> l(this->_closed_lock);
+            if (this->_is_closed) {
+                // if the node channel is closed, no need to call `mark_as_failed`,
+                // and notice that _index_channel may already be destroyed.
+                return;
             }
-
+            // If rpc failed, mark all tablets on this node channel as failed
+            _index_channel->mark_as_failed(this->node_id(), this->host(),
+                                           _add_batch_closure->cntl.ErrorText(), -1);
             Status st = _index_channel->check_intolerable_failure();
             if (!st.ok()) {
-                _cancel_with_msg(st.get_error_msg());
+                _cancel_with_msg(fmt::format("{}, err: {}", channel_info(), st.get_error_msg()));
             } else if (is_last_rpc) {
-                for (auto& tablet : result.tablet_vec()) {
-                    TTabletCommitInfo commit_info;
-                    commit_info.tabletId = tablet.tablet_id();
-                    commit_info.backendId = _node_id;
-                    _tablet_commit_infos.emplace_back(std::move(commit_info));
-                }
+                // if this is last rpc, will must set _add_batches_finished. otherwise, node channel's close_wait
+                // will be blocked.
                 _add_batches_finished = true;
             }
-        } else {
-            _cancel_with_msg(fmt::format("{}, add batch req success but status isn't ok, err: {}",
-                                         channel_info(), status.get_error_msg()));
-        }
+        });
 
-        if (result.has_execution_time_us()) {
-            _add_batch_counter.add_batch_execution_time_us += result.execution_time_us();
-            _add_batch_counter.add_batch_wait_execution_time_us += result.wait_execution_time_us();
-            _add_batch_counter.add_batch_num++;
-        }
-    });
+        _add_batch_closure->addSuccessHandler([this](const PTabletWriterAddBatchResult& result,
+                                                     bool is_last_rpc) {
+            std::lock_guard<std::mutex> l(this->_closed_lock);
+            if (this->_is_closed) {
+                // if the node channel is closed, no need to call the following logic,
+                // and notice that _index_channel may already be destroyed.
+                return;
+            }
+            Status status(result.status());
+            if (status.ok()) {
+                // if has error tablet, handle them first
+                for (auto& error : result.tablet_errors()) {
+                    _index_channel->mark_as_failed(this->node_id(), this->host(), error.msg(),
+                                                   error.tablet_id());
+                }
+
+                Status st = _index_channel->check_intolerable_failure();
+                if (!st.ok()) {
+                    _cancel_with_msg(st.get_error_msg());
+                } else if (is_last_rpc) {
+                    for (auto& tablet : result.tablet_vec()) {
+                        TTabletCommitInfo commit_info;
+                        commit_info.tabletId = tablet.tablet_id();
+                        commit_info.backendId = _node_id;
+                        _tablet_commit_infos.emplace_back(std::move(commit_info));
+                    }
+                    _add_batches_finished = true;
+                }
+            } else {
+                _cancel_with_msg(fmt::format("{}, add batch req success but status isn't ok, err: {}",
+                                             channel_info(), status.get_error_msg()));
+            }
+
+            if (result.has_execution_time_us()) {
+                _add_batch_counter.add_batch_execution_time_us += result.execution_time_us();
+                _add_batch_counter.add_batch_wait_execution_time_us += result.wait_execution_time_us();
+                _add_batch_counter.add_batch_num++;
+            }
+        });
+    }
     return status;
 }
 
@@ -300,59 +312,6 @@ Status NodeChannel::add_row(Tuple* input_tuple, int64_t tablet_id) {
     return Status::OK();
 }
 
-// Used for vectorized engine.
-// TODO(cmy): deprecated, need refactor
-Status NodeChannel::add_row(BlockRow& block_row, int64_t tablet_id) {
-    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_node_channel_tracker);
-    // If add_row() when _eos_is_produced==true, there must be sth wrong, we can only mark this channel as failed.
-    auto st = none_of({_cancelled, _eos_is_produced});
-    if (!st.ok()) {
-        if (_cancelled) {
-            std::lock_guard<SpinLock> l(_cancel_msg_lock);
-            return Status::InternalError("add row failed. " + _cancel_msg);
-        } else {
-            return st.clone_and_prepend("already stopped, can't add row. cancelled/eos: ");
-        }
-    }
-
-    // We use OlapTableSink mem_tracker which has the same ancestor of _plan node,
-    // so in the ideal case, mem limit is a matter for _plan node.
-    // But there is still some unfinished things, we do mem limit here temporarily.
-    // _cancelled may be set by rpc callback, and it's possible that _cancelled might be set in any of the steps below.
-    // It's fine to do a fake add_row() and return OK, because we will check _cancelled in next add_row() or mark_close().
-    while (!_cancelled && _pending_batches_num > 0 &&
-           (_pending_batches_bytes > _max_pending_batches_bytes ||
-            _parent->_mem_tracker->any_limit_exceeded())) {
-        SCOPED_ATOMIC_TIMER(&_mem_exceeded_block_ns);
-        std::this_thread::sleep_for(std::chrono::milliseconds(10));
-    }
-
-    auto row_no = _cur_batch->add_row();
-    if (row_no == RowBatch::INVALID_ROW_INDEX) {
-        {
-            SCOPED_ATOMIC_TIMER(&_queue_push_lock_ns);
-            std::lock_guard<std::mutex> l(_pending_batches_lock);
-            _pending_batches_bytes += _cur_batch->tuple_data_pool()->total_reserved_bytes();
-            //To simplify the add_row logic, postpone adding batch into req until the time of sending req
-            _pending_batches.emplace(std::move(_cur_batch), _cur_add_batch_request);
-            _pending_batches_num++;
-        }
-
-        _cur_batch.reset(new RowBatch(*_row_desc, _batch_size));
-        _cur_add_batch_request.clear_tablet_ids();
-
-        row_no = _cur_batch->add_row();
-    }
-    DCHECK_NE(row_no, RowBatch::INVALID_ROW_INDEX);
-
-    _cur_batch->get_row(row_no)->set_tuple(
-            0, block_row.first->deep_copy_tuple(*_tuple_desc, _cur_batch->tuple_data_pool(),
-                                                block_row.second, 0, true));
-    _cur_batch->commit_last_row();
-    _cur_add_batch_request.add_tablet_ids(tablet_id);
-    return Status::OK();
-}
-
 void NodeChannel::mark_close() {
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_node_channel_tracker);
     auto st = none_of({_cancelled, _eos_is_produced});
@@ -377,6 +336,11 @@ void NodeChannel::mark_close() {
     return;
 }
 
+void NodeChannel::_close_check() {
+    std::lock_guard<std::mutex> lg(_pending_batches_lock);
+    CHECK(_pending_batches.empty()) << name();
+    CHECK(_cur_batch == nullptr) << name();
+}
 Status NodeChannel::close_wait(RuntimeState* state) {
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_node_channel_tracker);
     // set _is_closed to true finally
@@ -403,11 +367,7 @@ Status NodeChannel::close_wait(RuntimeState* state) {
     _close_time_ms = UnixMillis() - _close_time_ms;
 
     if (_add_batches_finished) {
-        {
-            std::lock_guard<std::mutex> lg(_pending_batches_lock);
-            CHECK(_pending_batches.empty()) << name();
-            CHECK(_cur_batch == nullptr) << name();
-        }
+        _close_check();
         state->tablet_commit_infos().insert(state->tablet_commit_infos().end(),
                                             std::make_move_iterator(_tablet_commit_infos.begin()),
                                             std::make_move_iterator(_tablet_commit_infos.end()));
@@ -588,8 +548,6 @@ void NodeChannel::clear_all_batches() {
     _cur_batch.reset();
 }
 
-IndexChannel::~IndexChannel() {}
-
 Status IndexChannel::init(RuntimeState* state, const std::vector<TTabletWithPartition>& tablets) {
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_index_channel_tracker);
     for (auto& tablet : tablets) {
@@ -606,7 +564,11 @@ Status IndexChannel::init(RuntimeState* state, const std::vector<TTabletWithPart
                 // NodeChannel is not added to the _parent->_pool.
                 // Because the deconstruction of NodeChannel may take a long time to wait rpc finish.
                 // but the ObjectPool will hold a spin lock to delete objects.
-                channel = std::make_shared<NodeChannel>(_parent, this, node_id);
+                if (!_is_vectorized) {
+                    channel = std::make_shared<NodeChannel>(_parent, this, node_id);
+                } else {
+                    channel = std::make_shared<VNodeChannel>(_parent, this, node_id);
+                }
                 _node_channels.emplace(node_id, channel);
             } else {
                 channel = it->second;
@@ -623,35 +585,6 @@ Status IndexChannel::init(RuntimeState* state, const std::vector<TTabletWithPart
     return Status::OK();
 }
 
-void IndexChannel::add_row(Tuple* tuple, int64_t tablet_id) {
-    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_index_channel_tracker);
-    auto it = _channels_by_tablet.find(tablet_id);
-    DCHECK(it != _channels_by_tablet.end()) << "unknown tablet, tablet_id=" << tablet_id;
-    for (auto channel : it->second) {
-        // if this node channel is already failed, this add_row will be skipped
-        auto st = channel->add_row(tuple, tablet_id);
-        if (!st.ok()) {
-            mark_as_failed(channel->node_id(), channel->host(), st.get_error_msg(), tablet_id);
-            // continue add row to other node, the error will be checked for every batch outside
-        }
-    }
-}
-
-// Used for vectorized engine.
-// TODO(cmy): deprecated, need refactor
-void IndexChannel::add_row(BlockRow& block_row, int64_t tablet_id) {
-    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_index_channel_tracker);
-    auto it = _channels_by_tablet.find(tablet_id);
-    DCHECK(it != _channels_by_tablet.end()) << "unknown tablet, tablet_id=" << tablet_id;
-    for (auto channel : it->second) {
-        // if this node channel is already failed, this add_row will be skipped
-        auto st = channel->add_row(block_row, tablet_id);
-        if (!st.ok()) {
-            mark_as_failed(channel->node_id(), channel->host(), st.get_error_msg(), tablet_id);
-        }
-    }
-}
-
 void IndexChannel::mark_as_failed(int64_t node_id, const std::string& host, const std::string& err,
                                   int64_t tablet_id) {
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_index_channel_tracker);
@@ -705,10 +638,15 @@ OlapTableSink::OlapTableSink(ObjectPool* pool, const RowDescriptor& row_desc,
           _input_row_desc(row_desc),
           _filter_bitmap(1024),
           _stop_background_threads_latch(1) {
-    if (!texprs.empty()) {
-        *status = Expr::create_expr_trees(_pool, texprs, &_output_expr_ctxs);
+    if (!_is_vectorized) {
+        if (!texprs.empty()) {
+            *status = Expr::create_expr_trees(_pool, texprs, &_output_expr_ctxs);
+        }
+        _name = "OlapTableSink";
+    }
+    else {
+        *status = Status::OK();
     }
-    _name = "OlapTableSink";
     _transfer_data_by_brpc_attachment = config::transfer_data_by_brpc_attachment;
 }
 
@@ -774,8 +712,10 @@ Status OlapTableSink::prepare(RuntimeState* state) {
     SCOPED_TIMER(_profile->total_time_counter());
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
 
-    // Prepare the exprs to run.
-    RETURN_IF_ERROR(Expr::prepare(_output_expr_ctxs, state, _input_row_desc, _expr_mem_tracker));
+    if (!_is_vectorized) {
+        // Prepare the exprs to run.
+        RETURN_IF_ERROR(Expr::prepare(_output_expr_ctxs, state, _input_row_desc, _expr_mem_tracker));
+    }
 
     // get table's tuple descriptor
     _output_tuple_desc = state->desc_tbl().get_tuple_descriptor(_tuple_desc_id);
@@ -783,27 +723,31 @@ Status OlapTableSink::prepare(RuntimeState* state) {
         LOG(WARNING) << "unknown destination tuple descriptor, id=" << _tuple_desc_id;
         return Status::InternalError("unknown destination tuple descriptor");
     }
-    if (!_output_expr_ctxs.empty()) {
-        if (_output_expr_ctxs.size() != _output_tuple_desc->slots().size()) {
-            LOG(WARNING) << "number of exprs is not same with slots, num_exprs="
-                         << _output_expr_ctxs.size()
-                         << ", num_slots=" << _output_tuple_desc->slots().size();
-            return Status::InternalError("number of exprs is not same with slots");
-        }
-        for (int i = 0; i < _output_expr_ctxs.size(); ++i) {
-            if (!is_type_compatible(_output_expr_ctxs[i]->root()->type().type,
-                                    _output_tuple_desc->slots()[i]->type().type)) {
-                LOG(WARNING) << "type of exprs is not match slot's, expr_type="
-                             << _output_expr_ctxs[i]->root()->type().type
-                             << ", slot_type=" << _output_tuple_desc->slots()[i]->type().type
-                             << ", slot_name=" << _output_tuple_desc->slots()[i]->col_name();
-                return Status::InternalError("expr's type is not same with slot's");
+
+    _output_row_desc = _pool->add(new RowDescriptor(_output_tuple_desc, false));
+
+    if (!_is_vectorized) {
+        if (!_output_expr_ctxs.empty()) {
+            if (_output_expr_ctxs.size() != _output_tuple_desc->slots().size()) {
+                LOG(WARNING) << "number of exprs is not same with slots, num_exprs="
+                             << _output_expr_ctxs.size()
+                             << ", num_slots=" << _output_tuple_desc->slots().size();
+                return Status::InternalError("number of exprs is not same with slots");
+            }
+            for (int i = 0; i < _output_expr_ctxs.size(); ++i) {
+                if (!is_type_compatible(_output_expr_ctxs[i]->root()->type().type,
+                                        _output_tuple_desc->slots()[i]->type().type)) {
+                    LOG(WARNING) << "type of exprs is not match slot's, expr_type="
+                                 << _output_expr_ctxs[i]->root()->type().type
+                                 << ", slot_type=" << _output_tuple_desc->slots()[i]->type().type
+                                 << ", slot_name=" << _output_tuple_desc->slots()[i]->col_name();
+                    return Status::InternalError("expr's type is not same with slot's");
+                }
             }
         }
-    }
 
-    _output_row_desc = _pool->add(new RowDescriptor(_output_tuple_desc, false));
-    _output_batch.reset(new RowBatch(*_output_row_desc, state->batch_size()));
+        _output_batch.reset(new RowBatch(*_output_row_desc, state->batch_size()));
+    }
 
     _max_decimalv2_val.resize(_output_tuple_desc->slots().size());
     _min_decimalv2_val.resize(_output_tuple_desc->slots().size());
@@ -865,9 +809,8 @@ Status OlapTableSink::prepare(RuntimeState* state) {
                 tablets.emplace_back(std::move(tablet_with_partition));
             }
         }
-        auto channel = std::make_shared<IndexChannel>(this, index->index_id);
-        RETURN_IF_ERROR(channel->init(state, tablets));
-        _channels.emplace_back(channel);
+        _channels.emplace_back(new IndexChannel(this, index->index_id, _is_vectorized));
+        RETURN_IF_ERROR(_channels.back()->init(state, tablets));
     }
 
     return Status::OK();
@@ -877,8 +820,10 @@ Status OlapTableSink::open(RuntimeState* state) {
     SCOPED_TIMER(_profile->total_time_counter());
     SCOPED_TIMER(_open_timer);
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
-    // Prepare the exprs to run.
-    RETURN_IF_ERROR(Expr::open(_output_expr_ctxs, state));
+    if (!_is_vectorized) {
+        // Prepare the exprs to run.
+        RETURN_IF_ERROR(Expr::open(_output_expr_ctxs, state));
+    }
 
     for (auto index_channel : _channels) {
         index_channel->for_each_node_channel(
diff --git a/be/src/exec/tablet_sink.h b/be/src/exec/tablet_sink.h
index 1a902e834bff09..84f069dce7becd 100644
--- a/be/src/exec/tablet_sink.h
+++ b/be/src/exec/tablet_sink.h
@@ -54,6 +54,10 @@ class TupleDescriptor;
 class ExprContext;
 class TExpr;
 
+namespace vectorized {
+class Block;
+class MutableBlock;
+}
 namespace stream_load {
 
 class OlapTableSink;
@@ -87,18 +91,18 @@ struct AddBatchCounter {
 // So using create() to get the closure pointer is recommended. We can delete the closure ptr before the capture vars destruction.
 // Delete this point is safe, don't worry about RPC callback will run after ReusableClosure deleted.
 template <typename T>
-class ReusableClosure : public google::protobuf::Closure {
+class ReusableClosure final: public google::protobuf::Closure {
 public:
     ReusableClosure() : cid(INVALID_BTHREAD_ID) {}
-    ~ReusableClosure() {
+    ~ReusableClosure() override {
         // shouldn't delete when Run() is calling or going to be called, wait for current Run() done.
         join();
     }
 
     static ReusableClosure<T>* create() { return new ReusableClosure<T>(); }
 
-    void addFailedHandler(std::function<void(bool)> fn) { failed_handler = fn; }
-    void addSuccessHandler(std::function<void(const T&, bool)> fn) { success_handler = fn; }
+    void addFailedHandler(const std::function<void(bool)>& fn) { failed_handler = fn; }
+    void addSuccessHandler(const std::function<void(const T&, bool)>& fn) { success_handler = fn; }
 
     void join() {
         // We rely on in_flight to assure one rpc is running,
@@ -166,25 +170,27 @@ class IndexChannel;
 class NodeChannel {
 public:
     NodeChannel(OlapTableSink* parent, IndexChannel* index_channel, int64_t node_id);
-    ~NodeChannel() noexcept;
+    virtual ~NodeChannel() noexcept;
 
     // called before open, used to add tablet located in this backend
     void add_tablet(const TTabletWithPartition& tablet) { _all_tablets.emplace_back(tablet); }
 
-    Status init(RuntimeState* state);
+    virtual Status init(RuntimeState* state);
 
     // we use open/open_wait to parallel
     void open();
-    Status open_wait();
+    virtual Status open_wait();
 
     Status add_row(Tuple* tuple, int64_t tablet_id);
-
-    Status add_row(BlockRow& block_row, int64_t tablet_id);
+    virtual Status add_row(const BlockRow& block_row, int64_t tablet_id) {
+        LOG(FATAL) << "add block row to NodeChannel not supported";
+        return Status::OK();
+    }
 
     // two ways to stop channel:
     // 1. mark_close()->close_wait() PS. close_wait() will block waiting for the last AddBatch rpc response.
     // 2. just cancel()
-    void mark_close();
+    virtual void mark_close();
     Status close_wait(RuntimeState* state);
 
     void cancel(const std::string& cancel_msg);
@@ -194,8 +200,8 @@ class NodeChannel {
     // 1: running, haven't reach eos.
     // only allow 1 rpc in flight
     // plz make sure, this func should be called after open_wait().
-    int try_send_and_fetch_status(RuntimeState* state,
-                                  std::unique_ptr<ThreadPoolToken>& thread_pool_token);
+    virtual int try_send_and_fetch_status(RuntimeState* state,
+                                          std::unique_ptr<ThreadPoolToken>& thread_pool_token);
 
     void try_send_batch(RuntimeState* state);
 
@@ -223,15 +229,21 @@ class NodeChannel {
 
     void clear_all_batches();
 
+    virtual void clear_all_blocks() {
+        LOG(FATAL) << "NodeChannel::clear_all_blocks not supported";
+    }
+
     std::string channel_info() const {
         return fmt::format("{}, {}, node={}:{}", _name, _load_info, _node_info.host,
                            _node_info.brpc_port);
     }
 
-private:
+protected:
     void _cancel_with_msg(const std::string& msg);
+    virtual void _close_check();
 
-private:
+protected:
+    bool _is_vectorized = false;
     OlapTableSink* _parent = nullptr;
     IndexChannel* _index_channel = nullptr;
     int64_t _node_id = -1;
@@ -248,6 +260,9 @@ class NodeChannel {
     int64_t _next_packet_seq = 0;
     MonotonicStopWatch _timeout_watch;
 
+    // the timestamp when this node channel be marked closed and finished closed
+    uint64_t _close_time_ms = 0;
+
     // user cancel or get some errors
     std::atomic<bool> _cancelled {false};
     SpinLock _cancel_msg_lock;
@@ -257,26 +272,21 @@ class NodeChannel {
     std::atomic<bool> _send_finished {false};
 
     // add batches finished means the last rpc has be response, used to check whether this channel can be closed
-    std::atomic<bool> _add_batches_finished {false};
+    std::atomic<bool> _add_batches_finished {false}; // reuse for vectorized
 
     bool _eos_is_produced {false}; // only for restricting producer behaviors
 
     std::unique_ptr<RowDescriptor> _row_desc;
     int _batch_size = 0;
-    std::unique_ptr<RowBatch> _cur_batch;
-    PTabletWriterAddBatchRequest _cur_add_batch_request;
 
-    std::mutex _pending_batches_lock;
-    using AddBatchReq = std::pair<std::unique_ptr<RowBatch>, PTabletWriterAddBatchRequest>;
-    std::queue<AddBatchReq> _pending_batches;
-    std::atomic<int> _pending_batches_num {0};
     // limit _pending_batches size
     std::atomic<size_t> _pending_batches_bytes {0};
     size_t _max_pending_batches_bytes {10 * 1024 * 1024};
+    std::mutex _pending_batches_lock; // reuse for vectorized
+    std::atomic<int> _pending_batches_num {0}; // reuse for vectorized
 
     std::shared_ptr<PBackendService_Stub> _stub = nullptr;
     RefCountClosure<PTabletWriterOpenResult>* _open_closure = nullptr;
-    ReusableClosure<PTabletWriterAddBatchResult>* _add_batch_closure = nullptr;
 
     std::vector<TTabletWithPartition> _all_tablets;
     std::vector<TTabletCommitInfo> _tablet_commit_infos;
@@ -287,18 +297,6 @@ class NodeChannel {
     std::atomic<int64_t> _queue_push_lock_ns {0};
     std::atomic<int64_t> _actual_consume_ns {0};
 
-    // buffer for saving serialized row batch data.
-    // In the non-attachment approach, we need to use two PRowBatch structures alternately
-    // so that when one PRowBatch is sent, the other PRowBatch can be used for the serialization of the next RowBatch.
-    // This is not necessary with the attachment approach, because the memory structures
-    // are already copied into attachment memory before sending, and will wait for
-    // the previous RPC to be fully completed before the next copy.
-    std::string _tuple_data_buffer;
-    std::string* _tuple_data_buffer_ptr = nullptr;
-
-    // the timestamp when this node channel be marked closed and finished closed
-    uint64_t _close_time_ms = 0;
-
     // lock to protect _is_closed.
     // The methods in the IndexChannel are called back in the RpcClosure in the NodeChannel.
     // However, this rpc callback may occur after the whole task is finished (e.g. due to network latency),
@@ -309,20 +307,36 @@ class NodeChannel {
     // The IndexChannel is definitely accessible until the NodeChannel is closed.
     std::mutex _closed_lock;
     bool _is_closed = false;
+
+private:
+    // buffer for saving serialized row batch data.
+    // In the non-attachment approach, we need to use two PRowBatch structures alternately
+    // so that when one PRowBatch is sent, the other PRowBatch can be used for the serialization of the next RowBatch.
+    // This is not necessary with the attachment approach, because the memory structures
+    // are already copied into attachment memory before sending, and will wait for
+    // the previous RPC to be fully completed before the next copy.
+    std::string _tuple_data_buffer;
+    std::string* _tuple_data_buffer_ptr = nullptr;
+
+    std::unique_ptr<RowBatch> _cur_batch;
+    PTabletWriterAddBatchRequest _cur_add_batch_request;
+    using AddBatchReq = std::pair<std::unique_ptr<RowBatch>, PTabletWriterAddBatchRequest>;
+    std::queue<AddBatchReq> _pending_batches;
+    ReusableClosure<PTabletWriterAddBatchResult>* _add_batch_closure = nullptr;
 };
 
 class IndexChannel {
 public:
-    IndexChannel(OlapTableSink* parent, int64_t index_id) : _parent(parent), _index_id(index_id) {
+    IndexChannel(OlapTableSink* parent, int64_t index_id, bool is_vec) :
+        _parent(parent), _index_id(index_id), _is_vectorized(is_vec) {
         _index_channel_tracker = MemTracker::create_tracker(-1, "IndexChannel");
     }
-    ~IndexChannel();
+    ~IndexChannel() = default;
 
     Status init(RuntimeState* state, const std::vector<TTabletWithPartition>& tablets);
 
-    void add_row(Tuple* tuple, int64_t tablet_id);
-
-    void add_row(BlockRow& block_row, int64_t tablet_id);
+    template <typename Row>
+    void add_row(const Row& tuple, int64_t tablet_id);
 
     void for_each_node_channel(
             const std::function<void(const std::shared_ptr<NodeChannel>&)>& func) {
@@ -343,9 +357,11 @@ class IndexChannel {
 
 private:
     friend class NodeChannel;
+    friend class VNodeChannel;
 
     OlapTableSink* _parent;
     int64_t _index_id;
+    bool _is_vectorized = false;
 
     // from backend channel to tablet_id
     // ATTN: must be placed before `_node_channels` and `_channels_by_tablet`.
@@ -370,6 +386,21 @@ class IndexChannel {
     std::shared_ptr<MemTracker> _index_channel_tracker;
 };
 
+template <typename Row>
+void IndexChannel::add_row(const Row& tuple, int64_t tablet_id) {
+    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_index_channel_tracker);
+    auto it = _channels_by_tablet.find(tablet_id);
+    DCHECK(it != _channels_by_tablet.end()) << "unknown tablet, tablet_id=" << tablet_id;
+    for (const auto& channel : it->second) {
+        // if this node channel is already failed, this add_row will be skipped
+        auto st = channel->add_row(tuple, tablet_id);
+        if (!st.ok()) {
+            mark_as_failed(channel->node_id(), channel->host(), st.get_error_msg(), tablet_id);
+            // continue add row to other node, the error will be checked for every batch outside
+        }
+    }
+}
+
 // Write data to Olap Table.
 // When OlapTableSink::open() called, there will be a consumer thread running in the background.
 // When you call OlapTableSink::send(), you will be the producer who products pending batches.
@@ -414,8 +445,11 @@ class OlapTableSink : public DataSink {
 
 protected:
     friend class NodeChannel;
+    friend class VNodeChannel;
     friend class IndexChannel;
 
+    bool _is_vectorized = false;
+
     std::shared_ptr<MemTracker> _mem_tracker;
 
     ObjectPool* _pool;
@@ -430,8 +464,6 @@ class OlapTableSink : public DataSink {
     // this is tuple descriptor of destination OLAP table
     TupleDescriptor* _output_tuple_desc = nullptr;
     RowDescriptor* _output_row_desc = nullptr;
-    std::vector<ExprContext*> _output_expr_ctxs;
-    std::unique_ptr<RowBatch> _output_batch;
 
     bool _need_validate_data = false;
 
@@ -444,7 +476,6 @@ class OlapTableSink : public DataSink {
 
     // TODO(zc): think about cache this data
     std::shared_ptr<OlapTableSchemaParam> _schema;
-    OlapTablePartitionParam* _partition = nullptr;
     OlapTableLocationParam* _location = nullptr;
     DorisNodesInfo* _nodes_info = nullptr;
 
@@ -470,7 +501,6 @@ class OlapTableSink : public DataSink {
     int64_t _convert_batch_ns = 0;
     int64_t _validate_data_ns = 0;
     int64_t _send_data_ns = 0;
-    int64_t _serialize_batch_ns = 0;
     int64_t _number_input_rows = 0;
     int64_t _number_output_rows = 0;
     int64_t _number_filtered_rows = 0;
@@ -513,6 +543,11 @@ class OlapTableSink : public DataSink {
     // only compute tablet index in the corresponding partition once for the whole time in olap table sink
     enum FindTabletMode { FIND_TABLET_EVERY_ROW, FIND_TABLET_EVERY_BATCH, FIND_TABLET_EVERY_SINK };
     FindTabletMode findTabletMode = FindTabletMode::FIND_TABLET_EVERY_ROW;
+
+private:
+    OlapTablePartitionParam* _partition = nullptr;
+    std::vector<ExprContext*> _output_expr_ctxs;
+    std::unique_ptr<RowBatch> _output_batch;
 };
 
 } // namespace stream_load
diff --git a/be/src/olap/compaction.cpp b/be/src/olap/compaction.cpp
index 4f90a0e3dbb96f..852ec5cae74baa 100644
--- a/be/src/olap/compaction.cpp
+++ b/be/src/olap/compaction.cpp
@@ -86,7 +86,7 @@ Status Compaction::do_compaction_impl(int64_t permits) {
     // 2. write merged rows to output rowset
     // The test results show that merger is low-memory-footprint, there is no need to tracker its mem pool
     Merger::Statistics stats;
-    auto res = Merger::merge_rowsets(_tablet, compaction_type(), _input_rs_readers,
+    auto res = Merger::vmerge_rowsets(_tablet, compaction_type(), _input_rs_readers,
                                      _output_rs_writer.get(), &stats);
     if (!res.ok()) {
         LOG(WARNING) << "fail to do " << compaction_name() << ". res=" << res
diff --git a/be/src/olap/delta_writer.cpp b/be/src/olap/delta_writer.cpp
index 14b442c7388319..70eb6a7b8e7b15 100644
--- a/be/src/olap/delta_writer.cpp
+++ b/be/src/olap/delta_writer.cpp
@@ -29,19 +29,20 @@
 
 namespace doris {
 
-Status DeltaWriter::open(WriteRequest* req, DeltaWriter** writer) {
-    *writer = new DeltaWriter(req, StorageEngine::instance());
+Status DeltaWriter::open(WriteRequest* req, DeltaWriter** writer, bool is_vec) {
+    *writer = new DeltaWriter(req, StorageEngine::instance(), is_vec);
     return Status::OK();
 }
 
-DeltaWriter::DeltaWriter(WriteRequest* req, StorageEngine* storage_engine)
+DeltaWriter::DeltaWriter(WriteRequest* req, StorageEngine* storage_engine, bool is_vec)
         : _req(*req),
           _tablet(nullptr),
           _cur_rowset(nullptr),
           _rowset_writer(nullptr),
           _tablet_schema(nullptr),
           _delta_written_success(false),
-          _storage_engine(storage_engine) {}
+          _storage_engine(storage_engine),
+          _is_vec(is_vec) {}
 
 DeltaWriter::~DeltaWriter() {
     if (_is_init && !_delta_written_success) {
@@ -195,6 +196,40 @@ Status DeltaWriter::write(const RowBatch* row_batch, const std::vector<int>& row
     return Status::OK();
 }
 
+Status DeltaWriter::write(const vectorized::Block* block, const std::vector<int>& row_idxs) {
+    if (UNLIKELY(row_idxs.empty())) {
+        return Status::OK();
+    }
+    std::lock_guard<std::mutex> l(_lock);
+    if (!_is_init && !_is_cancelled) {
+        RETURN_NOT_OK(init());
+    }
+
+    if (_is_cancelled) {
+        return Status::OLAPInternalError(OLAP_ERR_ALREADY_CANCELLED);
+    }
+
+    int start = 0, end = 0;
+    const size_t num_rows = row_idxs.size();
+    for (; start < num_rows;) {
+        auto count = end + 1 - start;
+        if (end == num_rows - 1 || (row_idxs[end + 1] - row_idxs[start]) != count) {
+            _mem_table->insert(block, row_idxs[start], count);
+            start += count;
+            end = start;
+        } else {
+            end++;
+        }
+    }
+
+    if (_mem_table->memory_usage() >= config::write_buffer_size) {
+        RETURN_NOT_OK(_flush_memtable_async());
+        _reset_mem_table();
+    }
+
+    return Status::OK();
+}
+
 Status DeltaWriter::_flush_memtable_async() {
     if (++_segment_counter > config::max_segment_num_per_rowset) {
         return Status::OLAPInternalError(OLAP_ERR_TOO_MANY_SEGMENTS);
@@ -252,7 +287,7 @@ Status DeltaWriter::wait_flush() {
 void DeltaWriter::_reset_mem_table() {
     _mem_table.reset(new MemTable(_tablet->tablet_id(), _schema.get(), _tablet_schema, _req.slots,
                                   _req.tuple_desc, _tablet->keys_type(), _rowset_writer.get(),
-                                  _mem_tracker));
+                                  _mem_tracker, _is_vec));
 }
 
 Status DeltaWriter::close() {
diff --git a/be/src/olap/delta_writer.h b/be/src/olap/delta_writer.h
index 62bad10fc19ebd..b937e4f9e31d0b 100644
--- a/be/src/olap/delta_writer.h
+++ b/be/src/olap/delta_writer.h
@@ -53,7 +53,7 @@ struct WriteRequest {
 // This class is NOT thread-safe, external synchronization is required.
 class DeltaWriter {
 public:
-    static Status open(WriteRequest* req, DeltaWriter** writer);
+    static Status open(WriteRequest* req, DeltaWriter** writer, bool is_vec = false);
 
     ~DeltaWriter();
 
@@ -61,6 +61,8 @@ class DeltaWriter {
 
     Status write(Tuple* tuple);
     Status write(const RowBatch* row_batch, const std::vector<int>& row_idxs);
+    Status write(const vectorized::Block* block, const std::vector<int>& row_idxs);
+
     // flush the last memtable to flush queue, must call it before close_wait()
     Status close();
     // wait for all memtables to be flushed.
@@ -88,7 +90,7 @@ class DeltaWriter {
     int64_t tablet_id() { return _tablet->tablet_id(); }
 
 private:
-    DeltaWriter(WriteRequest* req, StorageEngine* storage_engine);
+    DeltaWriter(WriteRequest* req, StorageEngine* storage_engine, bool is_vec);
 
     // push a full memtable to flush executor
     Status _flush_memtable_async();
@@ -97,13 +99,13 @@ class DeltaWriter {
 
     void _reset_mem_table();
 
-private:
     bool _is_init = false;
     bool _is_cancelled = false;
     WriteRequest _req;
     TabletSharedPtr _tablet;
     RowsetSharedPtr _cur_rowset;
     std::unique_ptr<RowsetWriter> _rowset_writer;
+    // TODO: Recheck the lifttime of _mem_table, Look only should use unique_ptr
     std::shared_ptr<MemTable> _mem_table;
     std::unique_ptr<Schema> _schema;
     const TabletSchema* _tablet_schema;
@@ -117,6 +119,9 @@ class DeltaWriter {
     int64_t _segment_counter = 0;
 
     std::mutex _lock;
+
+    // use in vectorized load
+    bool _is_vec;
 };
 
 } // namespace doris
diff --git a/be/src/olap/memtable.cpp b/be/src/olap/memtable.cpp
index 9ff9cc3b48d581..993f0582ace59d 100644
--- a/be/src/olap/memtable.cpp
+++ b/be/src/olap/memtable.cpp
@@ -19,20 +19,22 @@
 
 #include "common/logging.h"
 #include "olap/row.h"
-#include "olap/row_cursor.h"
 #include "olap/rowset/column_data_writer.h"
 #include "olap/rowset/rowset_writer.h"
 #include "olap/schema.h"
 #include "runtime/tuple.h"
-#include "util/debug_util.h"
 #include "util/doris_metrics.h"
+#include "vec/core/field.h"
+#include "vec/aggregate_functions/aggregate_function_simple_factory.h"
+#include "vec/aggregate_functions/aggregate_function_reader.h"
 
 namespace doris {
 
 MemTable::MemTable(int64_t tablet_id, Schema* schema, const TabletSchema* tablet_schema,
                    const std::vector<SlotDescriptor*>* slot_descs, TupleDescriptor* tuple_desc,
                    KeysType keys_type, RowsetWriter* rowset_writer,
-                   const std::shared_ptr<MemTracker>& parent_tracker)
+                   const std::shared_ptr<MemTracker>& parent_tracker,
+                   bool support_vec)
         : _tablet_id(tablet_id),
           _schema(schema),
           _tablet_schema(tablet_schema),
@@ -42,19 +44,53 @@ MemTable::MemTable(int64_t tablet_id, Schema* schema, const TabletSchema* tablet
           _buffer_mem_pool(new MemPool(_mem_tracker.get())),
           _table_mem_pool(new MemPool(_mem_tracker.get())),
           _schema_size(_schema->schema_size()),
-          _rowset_writer(rowset_writer) {
-    if (tablet_schema->sort_type() == SortType::ZORDER) {
-        _row_comparator =
-                std::make_shared<TupleRowZOrderComparator>(_schema, tablet_schema->sort_col_num());
-    } else {
-        _row_comparator = std::make_shared<RowCursorComparator>(_schema);
+          _rowset_writer(rowset_writer),
+          _is_first_insertion(true), 
+          _agg_functions(schema->num_columns()),
+          _mem_usage(0){
+    if (support_vec) {
+        _skip_list = nullptr;
+        _vec_row_comparator = std::make_shared<RowInBlockComparator>(_schema);
+        // TODO: Support ZOrderComparator in the future
+        _vec_skip_list = new VecTable(_vec_row_comparator.get(), _table_mem_pool.get(),
+                                _keys_type == KeysType::DUP_KEYS);
+    }else{
+        _vec_skip_list = nullptr;
+        if (tablet_schema->sort_type() == SortType::ZORDER) {
+            _row_comparator =
+                    std::make_shared<TupleRowZOrderComparator>(_schema, tablet_schema->sort_col_num());
+        } else {
+            _row_comparator = std::make_shared<RowCursorComparator>(_schema);
+        }
+        _skip_list = new Table(_row_comparator.get(), _table_mem_pool.get(),
+                            _keys_type == KeysType::DUP_KEYS);
+    }
+}
+
+void MemTable::_init_agg_functions(const vectorized::Block* block) {
+    for (uint32_t cid = _schema->num_key_columns(); cid < _schema->num_columns(); ++cid) {
+        FieldAggregationMethod agg_method = _tablet_schema->column(cid).aggregation();
+        std::string agg_name =
+                TabletColumn::get_string_by_aggregation_type(agg_method) + vectorized::AGG_LOAD_SUFFIX;
+        std::transform(agg_name.begin(), agg_name.end(), agg_name.begin(), [](unsigned char c) { return std::tolower(c); });
+
+        // create aggregate function
+        vectorized::DataTypes argument_types{block->get_data_type(cid)};
+        vectorized::AggregateFunctionPtr function = vectorized::AggregateFunctionSimpleFactory::instance().get(
+                agg_name, argument_types, {}, argument_types.back()->is_nullable());
+
+        DCHECK(function != nullptr);
+        _agg_functions[cid] = function;
     }
-    _skip_list = new Table(_row_comparator.get(), _table_mem_pool.get(),
-                           _keys_type == KeysType::DUP_KEYS);
 }
 
 MemTable::~MemTable() {
     delete _skip_list;
+    delete _vec_skip_list;
+
+    std::for_each(_row_in_blocks.begin(), _row_in_blocks.end(),
+            std::default_delete<RowInBlock>());
+    _mem_tracker->release(_mem_usage);
 }
 
 MemTable::RowCursorComparator::RowCursorComparator(const Schema* schema) : _schema(schema) {}
@@ -65,6 +101,62 @@ int MemTable::RowCursorComparator::operator()(const char* left, const char* righ
     return compare_row(lhs_row, rhs_row);
 }
 
+int MemTable::RowInBlockComparator::operator()(const RowInBlock* left, const RowInBlock* right) const{
+    return _pblock->compare_at(left->_row_pos, right->_row_pos, 
+                            _schema->num_key_columns(), 
+                            *_pblock, -1); 
+}
+
+void MemTable::insert(const vectorized::Block* block, size_t row_pos, size_t num_rows) {
+    if (_is_first_insertion) {
+        _is_first_insertion = false;
+        auto cloneBlock = block->clone_without_columns();
+        _input_mutable_block = vectorized::MutableBlock::build_mutable_block(&cloneBlock);
+        _vec_row_comparator->set_block(&_input_mutable_block);
+        _output_mutable_block = vectorized::MutableBlock::build_mutable_block(&cloneBlock);
+        if (_keys_type != KeysType::DUP_KEYS){
+            _init_agg_functions(block);
+        }
+    }
+    size_t cursor_in_mutableblock = _input_mutable_block.rows();
+    size_t oldsize = _input_mutable_block.allocated_bytes();
+    _input_mutable_block.add_rows(block, row_pos, num_rows);
+    size_t newsize = _input_mutable_block.allocated_bytes();
+    _mem_usage += newsize - oldsize;
+    _mem_tracker->consume(newsize - oldsize);
+
+    for(int i = 0; i < num_rows; i++){       
+        _row_in_blocks.emplace_back(new RowInBlock{cursor_in_mutableblock + i});
+        _insert_one_row_from_block(_row_in_blocks.back());
+    }   
+}
+
+void MemTable::_insert_one_row_from_block(RowInBlock* row_in_block) {
+    _rows++;
+    bool overwritten = false;
+    if (_keys_type == KeysType::DUP_KEYS) {
+        // TODO: dup keys only need sort opertaion. Rethink skiplist is the beat way to sort columns?
+        _vec_skip_list->Insert(row_in_block, &overwritten);
+        DCHECK(!overwritten) << "Duplicate key model meet overwrite in SkipList";
+        return;
+    }
+
+    bool is_exist = _vec_skip_list->Find(row_in_block, &_vec_hint);
+    if (is_exist){
+        _aggregate_two_row_in_block(row_in_block, _vec_hint.curr->key);
+    } else {
+        row_in_block->init_agg_places(_agg_functions, _schema->num_key_columns());
+        for (auto cid = _schema->num_key_columns(); cid < _schema->num_columns(); cid++){
+            auto col_ptr = _input_mutable_block.mutable_columns()[cid].get();
+            auto place = row_in_block->_agg_places[cid];
+            _agg_functions[cid]->add(place, const_cast<const doris::vectorized::IColumn**>(&col_ptr),
+                                     row_in_block->_row_pos, nullptr);
+        }
+        
+        _vec_skip_list->InsertWithHint(row_in_block, is_exist, &_vec_hint);
+    }
+}
+
 void MemTable::insert(const Tuple* tuple) {
     _rows++;
     bool overwritten = false;
@@ -124,12 +216,65 @@ void MemTable::_aggregate_two_row(const ContiguousRow& src_row, TableKey row_in_
     }
 }
 
+void MemTable::_aggregate_two_row_in_block(RowInBlock* new_row, RowInBlock* row_in_skiplist){
+    if (_tablet_schema->has_sequence_col()) {
+        auto sequence_idx = _tablet_schema->sequence_col_idx();
+        auto res = _input_mutable_block.compare_at(row_in_skiplist->_row_pos, new_row->_row_pos, sequence_idx, _input_mutable_block, -1);
+        // dst sequence column larger than src, don't need to update
+        if (res > 0){
+            return;
+        }
+    }
+    // dst is non-sequence row, or dst sequence is smaller
+    for (uint32_t cid = _schema->num_key_columns(); cid < _schema->num_columns(); ++cid) {
+        auto place = row_in_skiplist->_agg_places[cid];
+        auto col_ptr = _input_mutable_block.mutable_columns()[cid].get();
+        _agg_functions[cid]->add(place, const_cast<const doris::vectorized::IColumn**>(&col_ptr),
+                new_row->_row_pos, nullptr);
+    }   
+    
+}
+vectorized::Block MemTable::_collect_vskiplist_results() {
+    VecTable::Iterator it(_vec_skip_list);
+    vectorized::Block in_block = _input_mutable_block.to_block();
+    // TODO: should try to insert data by column, not by row. to opt the the code
+    if (_keys_type == KeysType::DUP_KEYS){
+        for (it.SeekToFirst(); it.Valid(); it.Next()) {
+            _output_mutable_block.add_row(&in_block, it.key()->_row_pos);
+        }
+    } else {
+        for (it.SeekToFirst(); it.Valid(); it.Next()) {
+            auto& block_data = in_block.get_columns_with_type_and_name();
+            // move key columns
+            for (size_t i = 0; i < _schema->num_key_columns(); ++i) {
+                _output_mutable_block.get_column_by_position(i)->insert_from(*block_data[i].column.get(), it.key()->_row_pos);
+            }
+            // get value columns from agg_places
+            for (size_t i = _schema->num_key_columns(); i < _schema->num_columns(); ++i) {
+                auto function = _agg_functions[i];
+                function->insert_result_into(it.key()->_agg_places[i] , *(_output_mutable_block.get_column_by_position(i)));
+                function->destroy(it.key()->_agg_places[i]);
+            }
+        }
+    }
+    return _output_mutable_block.to_block();
+}
+
 Status MemTable::flush() {
     VLOG_CRITICAL << "begin to flush memtable for tablet: " << _tablet_id
                   << ", memsize: " << memory_usage() << ", rows: " << _rows;
     int64_t duration_ns = 0;
-    {
-        SCOPED_RAW_TIMER(&duration_ns);
+    RETURN_NOT_OK(_do_flush(duration_ns));
+    DorisMetrics::instance()->memtable_flush_total->increment(1);
+    DorisMetrics::instance()->memtable_flush_duration_us->increment(duration_ns / 1000);
+    VLOG_CRITICAL << "after flush memtable for tablet: " << _tablet_id
+                  << ", flushsize: " << _flush_size;
+    return Status::OK();
+}
+
+Status MemTable::_do_flush(int64_t& duration_ns) {
+    SCOPED_RAW_TIMER(&duration_ns);
+    if (_skip_list) {
         Status st = _rowset_writer->flush_single_memtable(this, &_flush_size);
         if (st == Status::OLAPInternalError(OLAP_ERR_FUNC_NOT_IMPLEMENTED)) {
             // For alpha rowset, we do not implement "flush_single_memtable".
@@ -145,11 +290,12 @@ Status MemTable::flush() {
         } else {
             RETURN_NOT_OK(st);
         }
+    } else {
+        vectorized::Block block = _collect_vskiplist_results();
+        RETURN_NOT_OK(_rowset_writer->add_block(&block));
+        _flush_size = block.allocated_bytes();
+        RETURN_NOT_OK(_rowset_writer->flush());
     }
-    DorisMetrics::instance()->memtable_flush_total->increment(1);
-    DorisMetrics::instance()->memtable_flush_duration_us->increment(duration_ns / 1000);
-    VLOG_CRITICAL << "after flush memtable for tablet: " << _tablet_id
-                  << ", flushsize: " << _flush_size;
     return Status::OK();
 }
 
diff --git a/be/src/olap/memtable.h b/be/src/olap/memtable.h
index 3fad1ac0734b7b..b034368f63873b 100644
--- a/be/src/olap/memtable.h
+++ b/be/src/olap/memtable.h
@@ -24,6 +24,9 @@
 #include "olap/skiplist.h"
 #include "runtime/mem_tracker.h"
 #include "util/tuple_row_zorder_compare.h"
+#include "vec/core/block.h"
+#include "vec/common/string_ref.h"
+#include "vec/aggregate_functions/aggregate_function.h"
 
 namespace doris {
 
@@ -40,13 +43,18 @@ class MemTable {
     MemTable(int64_t tablet_id, Schema* schema, const TabletSchema* tablet_schema,
              const std::vector<SlotDescriptor*>* slot_descs, TupleDescriptor* tuple_desc,
              KeysType keys_type, RowsetWriter* rowset_writer,
-             const std::shared_ptr<MemTracker>& parent_tracker);
+             const std::shared_ptr<MemTracker>& parent_tracker,
+             bool support_vec = false);
     ~MemTable();
 
     int64_t tablet_id() const { return _tablet_id; }
     size_t memory_usage() const { return _mem_tracker->consumption(); }
-    std::shared_ptr<MemTracker> mem_tracker() { return _mem_tracker; }
+    std::shared_ptr<MemTracker>& mem_tracker() { return _mem_tracker; }
+    
     void insert(const Tuple* tuple);
+    // insert tuple from (row_pos) to (row_pos+num_rows)
+    void insert(const vectorized::Block* block, size_t row_pos, size_t num_rows);
+    
     /// Flush
     Status flush();
     Status close();
@@ -54,18 +62,62 @@ class MemTable {
     int64_t flush_size() const { return _flush_size; }
 
 private:
+    Status _do_flush(int64_t& duration_ns);
+
     class RowCursorComparator : public RowComparator {
     public:
         RowCursorComparator(const Schema* schema);
-        virtual int operator()(const char* left, const char* right) const;
+        int operator()(const char* left, const char* right) const;
+
+    private:
+        const Schema* _schema;
+    };
+
+    // row pos in _input_mutable_block
+    struct RowInBlock {
+        size_t _row_pos;
+        std::vector<vectorized::AggregateDataPtr> _agg_places;
+        explicit RowInBlock(size_t i) : _row_pos(i) {}
+
+        void init_agg_places(std::vector<vectorized::AggregateFunctionPtr>& agg_functions,
+                            int key_column_count) {
+            _agg_places.resize(agg_functions.size());
+            for(int cid = 0; cid < agg_functions.size(); cid++) {
+                if (cid < key_column_count) {
+                    _agg_places[cid] = nullptr;
+                } else {
+                    auto function = agg_functions[cid];
+                    size_t place_size = function->size_of_data();
+                    _agg_places[cid] = new char[place_size];
+                    function->create(_agg_places[cid]);
+                }
+            }
+        }
+
+        ~RowInBlock() {
+            for (auto agg_place : _agg_places) {
+                delete [] agg_place;
+            }
+        }
+    };
 
+    class RowInBlockComparator {
+    public:
+        RowInBlockComparator(const Schema* schema) : _schema(schema) {};
+        // call set_block before operator().
+        // only first time insert block to create _input_mutable_block,
+        // so can not Comparator of construct to set pblock
+        void set_block(vectorized::MutableBlock* pblock) {_pblock = pblock;}
+        int operator()(const RowInBlock* left, const RowInBlock* right) const;
     private:
         const Schema* _schema;
+        vectorized::MutableBlock* _pblock;// 对应Memtable::_input_mutable_block
     };
 
 private:
     typedef SkipList<char*, RowComparator> Table;
     typedef Table::key_type TableKey;
+    typedef SkipList<RowInBlock*, RowInBlockComparator> VecTable;
 
 public:
     /// The iterator of memtable, so that the data in this memtable
@@ -73,7 +125,7 @@ class MemTable {
     class Iterator {
     public:
         Iterator(MemTable* mem_table);
-        ~Iterator() {}
+        ~Iterator() = default;
 
         void seek_to_first();
         bool valid();
@@ -85,9 +137,13 @@ class MemTable {
         Table::Iterator _it;
     };
 
+    
 private:
     void _tuple_to_row(const Tuple* tuple, ContiguousRow* row, MemPool* mem_pool);
     void _aggregate_two_row(const ContiguousRow& new_row, TableKey row_in_skiplist);
+    // for vectorized
+    void _insert_one_row_from_block(RowInBlock* row_in_block);
+    void _aggregate_two_row_in_block(RowInBlock* new_row, RowInBlock* row_in_skiplist);
 
     int64_t _tablet_id;
     Schema* _schema;
@@ -96,7 +152,11 @@ class MemTable {
     const std::vector<SlotDescriptor*>* _slot_descs;
     KeysType _keys_type;
 
+    // TODO: change to unique_ptr of comparator
     std::shared_ptr<RowComparator> _row_comparator;
+    
+    std::shared_ptr<RowInBlockComparator> _vec_row_comparator;
+
     std::shared_ptr<MemTracker> _mem_tracker;
     // This is a buffer, to hold the memory referenced by the rows that have not
     // been inserted into the SkipList
@@ -115,6 +175,9 @@ class MemTable {
     Table* _skip_list;
     Table::Hint _hint;
 
+    VecTable* _vec_skip_list;
+    VecTable::Hint _vec_hint;
+
     RowsetWriter* _rowset_writer;
 
     // the data size flushed on disk of this memtable
@@ -124,8 +187,19 @@ class MemTable {
     // in unique or aggragate key model.
     int64_t _rows = 0;
 
+    //for vectorized 
+    vectorized::MutableBlock _input_mutable_block;
+    vectorized::MutableBlock _output_mutable_block;
+    vectorized::Block _collect_vskiplist_results();
+    bool _is_first_insertion;
+
+    void _init_agg_functions(const vectorized::Block* block);
+    std::vector<vectorized::AggregateFunctionPtr> _agg_functions;
+    std::vector<RowInBlock*> _row_in_blocks;
+    size_t _mem_usage;
 }; // class MemTable
 
+
 inline std::ostream& operator<<(std::ostream& os, const MemTable& table) {
     os << "MemTable(addr=" << &table << ", tablet=" << table.tablet_id()
        << ", mem=" << table.memory_usage();
diff --git a/be/src/olap/merger.cpp b/be/src/olap/merger.cpp
index e28a3b4a4ed317..b7d50babb6eccc 100644
--- a/be/src/olap/merger.cpp
+++ b/be/src/olap/merger.cpp
@@ -22,6 +22,7 @@
 
 #include "olap/olap_define.h"
 #include "olap/tuple_reader.h"
+#include "vec/olap/block_reader.h"
 #include "olap/row_cursor.h"
 #include "olap/tablet.h"
 #include "util/trace.h"
@@ -87,4 +88,53 @@ Status Merger::merge_rowsets(TabletSharedPtr tablet, ReaderType reader_type,
     return Status::OK();
 }
 
+Status Merger::vmerge_rowsets(TabletSharedPtr tablet, ReaderType reader_type,
+                                  const std::vector<RowsetReaderSharedPtr>& src_rowset_readers,
+                                  RowsetWriter* dst_rowset_writer, Statistics* stats_output) {
+    TRACE_COUNTER_SCOPE_LATENCY_US("merge_rowsets_latency_us");
+
+    vectorized::BlockReader reader;
+    TabletReader::ReaderParams reader_params;
+    reader_params.tablet = tablet;
+    reader_params.reader_type = reader_type;
+    reader_params.rs_readers = src_rowset_readers;
+    reader_params.version = dst_rowset_writer->version();
+
+    const auto& schema = tablet->tablet_schema();
+    reader_params.return_columns.resize(schema.num_columns());
+    std::iota(reader_params.return_columns.begin(), reader_params.return_columns.end(), 0);
+    reader_params.origin_return_columns = &reader_params.return_columns;
+    RETURN_NOT_OK(reader.init(reader_params));
+    
+    vectorized::Block block = schema.create_block(reader_params.return_columns);
+    size_t output_rows = 0;
+    while (true) {
+        bool eof = false;
+        // Read one block from block reader
+        RETURN_NOT_OK_LOG(
+                reader.next_block_with_aggregation(&block, nullptr, nullptr, &eof),
+                "failed to read next block when merging rowsets of tablet " + tablet->full_name());
+        if (eof) {
+            break;
+        }
+        RETURN_NOT_OK_LOG(
+                dst_rowset_writer->add_block(&block),
+                "failed to write block when merging rowsets of tablet " + tablet->full_name());
+        output_rows += block.rows();
+        block.clear_column_data();
+    }
+
+    if (stats_output != nullptr) {
+        stats_output->output_rows = output_rows;
+        stats_output->merged_rows = reader.merged_rows();
+        stats_output->filtered_rows = reader.filtered_rows();
+    }
+
+    RETURN_NOT_OK_LOG(
+            dst_rowset_writer->flush(),
+            "failed to flush rowset when merging rowsets of tablet " + tablet->full_name());
+
+    return Status::OK();
+}
+
 } // namespace doris
diff --git a/be/src/olap/merger.h b/be/src/olap/merger.h
index efd46271e1f7b4..e8ae558505e133 100644
--- a/be/src/olap/merger.h
+++ b/be/src/olap/merger.h
@@ -38,6 +38,10 @@ class Merger {
     static Status merge_rowsets(TabletSharedPtr tablet, ReaderType reader_type,
                                     const std::vector<RowsetReaderSharedPtr>& src_rowset_readers,
                                     RowsetWriter* dst_rowset_writer, Statistics* stats_output);
+
+    static Status vmerge_rowsets(TabletSharedPtr tablet, ReaderType reader_type,
+                                     const std::vector<RowsetReaderSharedPtr>& src_rowset_readers,
+                                     RowsetWriter* dst_rowset_writer, Statistics* stats_output);
 };
 
 } // namespace doris
diff --git a/be/src/olap/olap_define.h b/be/src/olap/olap_define.h
index d24695607b5120..3e1559ad16b2d7 100644
--- a/be/src/olap/olap_define.h
+++ b/be/src/olap/olap_define.h
@@ -56,6 +56,9 @@ static const uint16_t OLAP_VARCHAR_MAX_LENGTH = 65535;
 // the max length supported for string type 2GB
 static const uint32_t OLAP_STRING_MAX_LENGTH = 2147483647;
 
+// the max length supported for vec string type 1MB
+static constexpr size_t MAX_SIZE_OF_VEC_STRING = 1024 * 1024;
+
 // the max length supported for array
 static const uint16_t OLAP_ARRAY_MAX_LENGTH = 65535;
 
diff --git a/be/src/olap/reader.cpp b/be/src/olap/reader.cpp
index 05a1104c777855..90b47bce637bfe 100644
--- a/be/src/olap/reader.cpp
+++ b/be/src/olap/reader.cpp
@@ -310,6 +310,17 @@ Status TabletReader::_init_return_columns(const ReaderParams& read_params) {
             }
         }
         VLOG_NOTICE << "return column is empty, using full column as default.";
+    } else if ((read_params.reader_type == READER_CUMULATIVE_COMPACTION ||
+                read_params.reader_type == READER_BASE_COMPACTION) &&
+               !read_params.return_columns.empty()) {
+        _return_columns = read_params.return_columns;
+        for (auto id : read_params.return_columns) {
+            if (_tablet->tablet_schema().column(id).is_key()) {
+                _key_cids.push_back(id);
+            } else {
+                _value_cids.push_back(id);
+            }
+        }
     } else if (read_params.reader_type == READER_CHECKSUM) {
         _return_columns = read_params.return_columns;
         for (auto id : read_params.return_columns) {
diff --git a/be/src/olap/row_block2.cpp b/be/src/olap/row_block2.cpp
index 83bb249566eb2b..d7bf6783e883c1 100644
--- a/be/src/olap/row_block2.cpp
+++ b/be/src/olap/row_block2.cpp
@@ -355,8 +355,6 @@ Status RowBlockV2::_copy_data_to_column(int cid,
 Status RowBlockV2::_append_data_to_column(const ColumnVectorBatch* batch, size_t start,
                                           uint32_t len,
                                           doris::vectorized::MutableColumnPtr& origin_column) {
-    constexpr auto MAX_SIZE_OF_VEC_STRING = 1024l * 1024;
-
     auto* column = origin_column.get();
     uint32_t selected_size = len;
     bool nullable_mark_array[selected_size];
diff --git a/be/src/olap/row_cursor_cell.h b/be/src/olap/row_cursor_cell.h
index ffe78b030d5acd..10ef938fce1857 100644
--- a/be/src/olap/row_cursor_cell.h
+++ b/be/src/olap/row_cursor_cell.h
@@ -33,4 +33,4 @@ struct RowCursorCell {
     void* _ptr;
 };
 
-} // namespace doris
+} // namespace doris
\ No newline at end of file
diff --git a/be/src/olap/rowset/beta_rowset_writer.cpp b/be/src/olap/rowset/beta_rowset_writer.cpp
index 43b7c610041a2a..16ee1be6dcfe23 100644
--- a/be/src/olap/rowset/beta_rowset_writer.cpp
+++ b/be/src/olap/rowset/beta_rowset_writer.cpp
@@ -38,10 +38,6 @@
 
 namespace doris {
 
-// TODO(lingbin): Should be a conf that can be dynamically adjusted, or a member in the context
-const uint32_t MAX_SEGMENT_SIZE = static_cast<uint32_t>(OLAP_MAX_COLUMN_SEGMENT_FILE_SIZE *
-                                                        OLAP_COLUMN_FILE_SEGMENT_SIZE_SCALE);
-
 BetaRowsetWriter::BetaRowsetWriter()
         : _rowset_meta(nullptr),
           _num_segment(0),
@@ -99,6 +95,41 @@ Status BetaRowsetWriter::init(const RowsetWriterContext& rowset_writer_context)
     return Status::OK();
 }
 
+Status BetaRowsetWriter::add_block(const vectorized::Block* block) {
+    if (block->rows() == 0) {
+        return Status::OK();
+    }
+    if (UNLIKELY(_segment_writer == nullptr)) {
+        RETURN_NOT_OK(_create_segment_writer(&_segment_writer));
+    }
+    size_t block_size_in_bytes = block->bytes();
+    size_t block_row_num = block->rows();
+    size_t row_avg_size_in_bytes = std::max((size_t)1, block_size_in_bytes / block_row_num);
+    size_t row_offset = 0;
+
+    do {
+        auto max_row_add = _segment_writer->max_row_to_add(row_avg_size_in_bytes);
+        if (UNLIKELY(max_row_add < 1)) {
+            // no space for another signle row, need flush now
+            RETURN_NOT_OK(_flush_segment_writer(&_segment_writer));
+            RETURN_NOT_OK(_create_segment_writer(&_segment_writer));
+            max_row_add = _segment_writer->max_row_to_add(row_avg_size_in_bytes);
+            DCHECK(max_row_add > 0);
+        }
+
+        size_t input_row_num = std::min(block_row_num - row_offset, size_t(max_row_add));
+        auto s = _segment_writer->append_block(block, row_offset, input_row_num);
+        if (UNLIKELY(!s.ok())) {
+            LOG(WARNING) << "failed to append block: " << s.to_string();
+            return Status::OLAPInternalError(OLAP_ERR_WRITER_DATA_WRITE_ERROR);
+        }
+        row_offset += input_row_num;
+    } while (row_offset < block_row_num);
+
+    _num_rows_written += block_row_num;
+    return Status::OK();
+}
+
 template <typename RowType>
 Status BetaRowsetWriter::_add_row(const RowType& row) {
     if (PREDICT_FALSE(_segment_writer == nullptr)) {
@@ -270,7 +301,7 @@ Status BetaRowsetWriter::_create_segment_writer(std::unique_ptr<segment_v2::Segm
     DCHECK(wblock != nullptr);
     segment_v2::SegmentWriterOptions writer_options;
     writer->reset(new segment_v2::SegmentWriter(wblock.get(), _num_segment, _context.tablet_schema,
-                                                _context.data_dir, writer_options));
+                                                _context.data_dir, _context.max_rows_per_segment, writer_options));
     {
         std::lock_guard<SpinLock> l(_lock);
         _wblocks.push_back(std::move(wblock));
diff --git a/be/src/olap/rowset/beta_rowset_writer.h b/be/src/olap/rowset/beta_rowset_writer.h
index 8f9b54b51e890a..0bce1af5ccd90a 100644
--- a/be/src/olap/rowset/beta_rowset_writer.h
+++ b/be/src/olap/rowset/beta_rowset_writer.h
@@ -43,6 +43,8 @@ class BetaRowsetWriter : public RowsetWriter {
     // For Memtable::flush()
     Status add_row(const ContiguousRow& row) override { return _add_row(row); }
 
+    Status add_block(const vectorized::Block* block) override;
+    
     // add rowset by create hard link
     Status add_rowset(RowsetSharedPtr rowset) override;
 
diff --git a/be/src/olap/rowset/rowset_writer.h b/be/src/olap/rowset/rowset_writer.h
index 6fb290e3dc7a0b..d23a4777140e06 100644
--- a/be/src/olap/rowset/rowset_writer.h
+++ b/be/src/olap/rowset/rowset_writer.h
@@ -24,6 +24,7 @@
 #include "olap/column_mapping.h"
 #include "olap/rowset/rowset.h"
 #include "olap/rowset/rowset_writer_context.h"
+#include "vec/core/block.h"
 
 namespace doris {
 
@@ -43,6 +44,10 @@ class RowsetWriter {
     virtual Status add_row(const RowCursor& row) = 0;
     virtual Status add_row(const ContiguousRow& row) = 0;
 
+    virtual Status add_block(const vectorized::Block* block) {
+        return Status::OLAPInternalError(OLAP_ERR_FUNC_NOT_IMPLEMENTED);
+    }
+
     // Precondition: the input `rowset` should have the same type of the rowset we're building
     virtual Status add_rowset(RowsetSharedPtr rowset) = 0;
 
@@ -59,7 +64,7 @@ class RowsetWriter {
     virtual Status flush_single_memtable(MemTable* memtable, int64_t* flush_size) {
         return Status::OLAPInternalError(OLAP_ERR_FUNC_NOT_IMPLEMENTED);
     }
-
+    
     // finish building and return pointer to the built rowset (guaranteed to be inited).
     // return nullptr when failed
     virtual RowsetSharedPtr build() = 0;
diff --git a/be/src/olap/rowset/segment_v2/column_writer.cpp b/be/src/olap/rowset/segment_v2/column_writer.cpp
index 234c182b029185..87770acdb12ba3 100644
--- a/be/src/olap/rowset/segment_v2/column_writer.cpp
+++ b/be/src/olap/rowset/segment_v2/column_writer.cpp
@@ -191,6 +191,27 @@ Status ColumnWriter::append_nullable(const uint8_t* is_null_bits, const void* da
     return Status::OK();
 }
 
+Status ColumnWriter::append(const uint8_t* nullmap, const void* data, size_t num_rows) {
+    assert(data && num_rows > 0);
+    if (nullmap) {
+        size_t bitmap_size = BitmapSize(num_rows);
+        if (_null_bitmap.size() < bitmap_size) {
+            _null_bitmap.resize(bitmap_size);
+        }
+        uint8_t* bitmap_data = _null_bitmap.data();
+        memset(bitmap_data, 0, bitmap_size);
+        for (size_t i = 0; i < num_rows; ++i) {
+            if (nullmap[i]) {
+                BitmapSet(bitmap_data, i);
+            }
+        }
+        return append_nullable(bitmap_data, data, num_rows);
+    } else {
+        const uint8_t* ptr = (const uint8_t*)data;
+        return append_data(&ptr, num_rows);
+    }
+}
+
 ///////////////////////////////////////////////////////////////////////////////////
 
 ScalarColumnWriter::ScalarColumnWriter(const ColumnWriterOptions& opts,
diff --git a/be/src/olap/rowset/segment_v2/column_writer.h b/be/src/olap/rowset/segment_v2/column_writer.h
index c5daddc6ceb59a..8b7cb60b32525e 100644
--- a/be/src/olap/rowset/segment_v2/column_writer.h
+++ b/be/src/olap/rowset/segment_v2/column_writer.h
@@ -101,6 +101,8 @@ class ColumnWriter {
         return append_nullable(&nullmap, data, 1);
     }
 
+    Status append(const uint8_t* nullmap, const void* data, size_t num_rows);
+
     Status append_nullable(const uint8_t* nullmap, const void* data, size_t num_rows);
 
     virtual Status append_nulls(size_t num_rows) = 0;
@@ -141,6 +143,10 @@ class ColumnWriter {
 private:
     std::unique_ptr<Field> _field;
     bool _is_nullable;
+    std::vector<uint8_t> _null_bitmap;
+
+protected:
+    std::shared_ptr<MemTracker> _mem_tracker;
 };
 
 class FlushPageCallback {
diff --git a/be/src/olap/rowset/segment_v2/segment_writer.cpp b/be/src/olap/rowset/segment_v2/segment_writer.cpp
index a0c3ebb80fbb80..5eebb30a886970 100644
--- a/be/src/olap/rowset/segment_v2/segment_writer.cpp
+++ b/be/src/olap/rowset/segment_v2/segment_writer.cpp
@@ -38,16 +38,24 @@ const char* k_segment_magic = "D0R1";
 const uint32_t k_segment_magic_length = 4;
 
 SegmentWriter::SegmentWriter(fs::WritableBlock* wblock, uint32_t segment_id,
-                             const TabletSchema* tablet_schema,
-                             DataDir* data_dir, const SegmentWriterOptions& opts)
+                             const TabletSchema* tablet_schema, DataDir* data_dir,
+                             uint32_t max_row_per_segment, const SegmentWriterOptions& opts)
         : _segment_id(segment_id),
           _tablet_schema(tablet_schema),
           _data_dir(data_dir),
+          _max_row_per_segment(max_row_per_segment),
           _opts(opts),
           _wblock(wblock),
           _mem_tracker(
-                  MemTracker::create_virtual_tracker(-1, "SegmentWriter:Segment-" + std::to_string(segment_id))) {
+                  MemTracker::create_virtual_tracker(-1, "SegmentWriter:Segment-" + std::to_string(segment_id))),
+          _olap_data_convertor(tablet_schema) {
     CHECK_NOTNULL(_wblock);
+    size_t num_short_key_column = _tablet_schema->num_short_key_columns();
+    for (size_t cid = 0; cid < num_short_key_column; ++cid) {
+        const auto& column = _tablet_schema->column(cid);
+        _short_key_coders.push_back(get_key_coder(column.type()));
+        _short_key_index_size.push_back(column.index_length());
+    }
 }
 
 SegmentWriter::~SegmentWriter() {
@@ -102,6 +110,86 @@ Status SegmentWriter::init(uint32_t write_mbytes_per_sec __attribute__((unused))
     return Status::OK();
 }
 
+Status SegmentWriter::append_block(const vectorized::Block* block, size_t row_pos,
+                                   size_t num_rows) {
+    assert(block && num_rows > 0 && row_pos + num_rows <= block->rows() &&
+           block->columns() == _column_writers.size());
+    _olap_data_convertor.set_source_content(block, row_pos, num_rows);
+
+    // find all row pos for short key indexes
+    std::vector<size_t> short_key_pos;
+    if (UNLIKELY(_short_key_row_pos == 0)) {
+        short_key_pos.push_back(0);
+    }
+    while (_short_key_row_pos + _opts.num_rows_per_block < _row_count + num_rows) {
+        _short_key_row_pos += _opts.num_rows_per_block;
+        short_key_pos.push_back(_short_key_row_pos - _row_count);
+    }
+
+    // convert column data from engine format to storage layer format
+    std::vector<vectorized::IOlapColumnDataAccessorSPtr> short_key_columns;
+    size_t num_key_columns = _tablet_schema->num_short_key_columns();
+    for (size_t cid = 0; cid < _column_writers.size(); ++cid) {
+        auto converted_result = _olap_data_convertor.convert_column_data(cid);
+        if (converted_result.first != Status::OK()) {
+            return converted_result.first;
+        }
+        if (cid < num_key_columns) {
+            short_key_columns.push_back(converted_result.second);
+        }
+        _column_writers[cid]->append(converted_result.second->get_nullmap(),
+                                     converted_result.second->get_data(), num_rows);
+    }
+
+    // create short key indexes
+    std::vector<const void*> key_column_fields;
+    for (const auto pos : short_key_pos) {
+        for (const auto& column : short_key_columns) {
+            key_column_fields.push_back(column->get_data_at(pos));
+        }
+        std::string encoded_key = encode_short_keys(key_column_fields);
+        RETURN_IF_ERROR(_index_builder->add_item(encoded_key));
+        key_column_fields.clear();
+    }
+    
+    _row_count += num_rows;
+    _olap_data_convertor.clear_source_content();
+    return Status::OK();
+}
+
+int64_t SegmentWriter::max_row_to_add(size_t row_avg_size_in_bytes) {
+    int64_t size_rows = ((int64_t)MAX_SEGMENT_SIZE - (int64_t)estimate_segment_size()) / row_avg_size_in_bytes;
+    int64_t count_rows = (int64_t)_max_row_per_segment - _row_count;
+
+    return std::min(size_rows, count_rows);
+}
+
+
+std::string SegmentWriter::encode_short_keys(
+        const std::vector<const void*> key_column_fields, bool null_first) {
+    size_t num_key_columns = _tablet_schema->num_short_key_columns();
+    assert(key_column_fields.size() == num_key_columns &&
+           _short_key_coders.size() == num_key_columns &&
+           _short_key_index_size.size() == num_key_columns);
+
+    std::string encoded_keys;
+    for (size_t cid = 0; cid < num_key_columns; ++cid) {
+        auto field = key_column_fields[cid];
+        if (UNLIKELY(!field)) {
+            if (null_first) {
+                encoded_keys.push_back(KEY_NULL_FIRST_MARKER);
+            } else {
+                encoded_keys.push_back(KEY_NULL_LAST_MARKER);
+            }
+            continue;
+        }
+        encoded_keys.push_back(KEY_NORMAL_MARKER);
+        _short_key_coders[cid]->encode_ascending(field, _short_key_index_size[cid],
+                                                 &encoded_keys);
+    }
+    return encoded_keys;
+}
+
 template <typename RowType>
 Status SegmentWriter::append_row(const RowType& row) {
     for (size_t cid = 0; cid < _column_writers.size(); ++cid) {
diff --git a/be/src/olap/rowset/segment_v2/segment_writer.h b/be/src/olap/rowset/segment_v2/segment_writer.h
index baa91198d05b0f..cc047e19c96f26 100644
--- a/be/src/olap/rowset/segment_v2/segment_writer.h
+++ b/be/src/olap/rowset/segment_v2/segment_writer.h
@@ -25,9 +25,14 @@
 #include "common/status.h" // Status
 #include "gen_cpp/segment_v2.pb.h"
 #include "gutil/macros.h"
+#include "vec/core/block.h"
+#include "vec/olap/olap_data_convertor.h"
 
 namespace doris {
 
+// TODO(lingbin): Should be a conf that can be dynamically adjusted, or a member in the context
+const uint32_t MAX_SEGMENT_SIZE = static_cast<uint32_t>(OLAP_MAX_COLUMN_SEGMENT_FILE_SIZE *
+                                                        OLAP_COLUMN_FILE_SEGMENT_SIZE_SCALE);
 class DataDir;
 class MemTracker;
 class RowBlock;
@@ -35,6 +40,7 @@ class RowCursor;
 class TabletSchema;
 class TabletColumn;
 class ShortKeyIndexBuilder;
+class KeyCoder;
 
 namespace fs {
 class WritableBlock;
@@ -55,7 +61,7 @@ class SegmentWriter {
 public:
     explicit SegmentWriter(fs::WritableBlock* block, uint32_t segment_id,
                            const TabletSchema* tablet_schema,
-                           DataDir* data_dir,
+                           DataDir* data_dir, uint32_t max_row_per_segment,
                            const SegmentWriterOptions& opts);
     ~SegmentWriter();
 
@@ -64,6 +70,10 @@ class SegmentWriter {
     template <typename RowType>
     Status append_row(const RowType& row);
 
+    Status append_block(const vectorized::Block* block, size_t row_pos, size_t num_rows);
+
+    int64_t max_row_to_add(size_t row_avg_size_in_bytes);
+
     uint64_t estimate_segment_size();
 
     uint32_t num_rows_written() { return _row_count; }
@@ -83,10 +93,14 @@ class SegmentWriter {
     Status _write_footer();
     Status _write_raw_data(const std::vector<Slice>& slices);
 
+    std::string encode_short_keys(const std::vector<const void*> key_column_fields,
+                                  bool null_first = true);
+
 private:
     uint32_t _segment_id;
     const TabletSchema* _tablet_schema;
     DataDir* _data_dir;
+    uint32_t _max_row_per_segment;
     SegmentWriterOptions _opts;
 
     // Not owned. owned by RowsetWriter
@@ -97,6 +111,11 @@ class SegmentWriter {
     std::vector<std::unique_ptr<ColumnWriter>> _column_writers;
     std::shared_ptr<MemTracker> _mem_tracker;
     uint32_t _row_count = 0;
+
+    vectorized::OlapBlockDataConvertor _olap_data_convertor;
+    std::vector< const KeyCoder* > _short_key_coders;
+    std::vector< uint16_t > _short_key_index_size;
+    size_t _short_key_row_pos = 0;
 };
 
 } // namespace segment_v2
diff --git a/be/src/runtime/load_channel.cpp b/be/src/runtime/load_channel.cpp
index 766e00919d0520..eb8756c81aa5af 100644
--- a/be/src/runtime/load_channel.cpp
+++ b/be/src/runtime/load_channel.cpp
@@ -25,9 +25,9 @@
 namespace doris {
 
 LoadChannel::LoadChannel(const UniqueId& load_id, int64_t mem_limit, int64_t timeout_s,
-                         bool is_high_priority, const std::string& sender_ip)
+                         bool is_high_priority, const std::string& sender_ip, bool is_vec)
         : _load_id(load_id), _timeout_s(timeout_s), _is_high_priority(is_high_priority),
-          _sender_ip(sender_ip) {
+          _sender_ip(sender_ip), _is_vec(is_vec) {
     _mem_tracker = MemTracker::create_tracker(
             mem_limit, "LoadChannel:" + _load_id.to_string(), nullptr, MemTrackerLevel::TASK);
     // _last_updated_time should be set before being inserted to
@@ -39,7 +39,7 @@ LoadChannel::LoadChannel(const UniqueId& load_id, int64_t mem_limit, int64_t tim
 LoadChannel::~LoadChannel() {
     LOG(INFO) << "load channel removed. mem peak usage=" << _mem_tracker->peak_consumption()
               << ", info=" << _mem_tracker->debug_string() << ", load_id=" << _load_id
-              << ", is high priority=" << _is_high_priority << ", sender_ip=" << _sender_ip;
+              << ", is high priority=" << _is_high_priority << ", sender_ip=" << _sender_ip << ", is_vec=" << _is_vec;
 }
 
 Status LoadChannel::open(const PTabletWriterOpenRequest& params) {
@@ -54,7 +54,7 @@ Status LoadChannel::open(const PTabletWriterOpenRequest& params) {
         } else {
             // create a new tablets channel
             TabletsChannelKey key(params.id(), index_id);
-            channel.reset(new TabletsChannel(key, _is_high_priority));
+            channel.reset(new TabletsChannel(key, _is_high_priority, _is_vec));
             _tablets_channels.insert({index_id, channel});
         }
     }
@@ -66,50 +66,23 @@ Status LoadChannel::open(const PTabletWriterOpenRequest& params) {
     return Status::OK();
 }
 
-Status LoadChannel::add_batch(const PTabletWriterAddBatchRequest& request,
-                              PTabletWriterAddBatchResult* response) {
-    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
-    int64_t index_id = request.index_id();
-    // 1. get tablets channel
-    std::shared_ptr<TabletsChannel> channel;
-    {
-        std::lock_guard<std::mutex> l(_lock);
-        auto it = _tablets_channels.find(index_id);
-        if (it == _tablets_channels.end()) {
-            if (_finished_channel_ids.find(index_id) != _finished_channel_ids.end()) {
-                // this channel is already finished, just return OK
-                return Status::OK();
-            }
-            std::stringstream ss;
-            ss << "load channel " << _load_id << " add batch with unknown index id: " << index_id;
-            return Status::InternalError(ss.str());
+Status LoadChannel::_get_tablets_channel(std::shared_ptr<TabletsChannel>& channel, bool& is_finished, const int64_t index_id) {
+    std::lock_guard<std::mutex> l(_lock);
+    auto it = _tablets_channels.find(index_id);
+    if (it == _tablets_channels.end()) {
+        if (_finished_channel_ids.find(index_id) != _finished_channel_ids.end()) {
+            // this channel is already finished, just return OK
+            is_finished = true;
+            return Status::OK();
         }
-        channel = it->second;
+        std::stringstream ss;
+        ss << "load channel " << _load_id << " add batch with unknown index id: " << index_id;
+        return Status::InternalError(ss.str());
     }
 
-    // 2. check if mem consumption exceed limit
-    handle_mem_exceed_limit(false);
-
-    // 3. add batch to tablets channel
-    if (request.has_row_batch()) {
-        RETURN_IF_ERROR(channel->add_batch(request, response));
-    }
-
-    // 4. handle eos
-    Status st;
-    if (request.has_eos() && request.eos()) {
-        bool finished = false;
-        RETURN_IF_ERROR(channel->close(request.sender_id(), request.backend_id(), 
-                                       &finished, request.partition_ids(),
-                                       response->mutable_tablet_vec()));
-        if (finished) {
-            std::lock_guard<std::mutex> l(_lock);
-            _tablets_channels.erase(index_id);
-            _finished_channel_ids.emplace(index_id);
-        }
-    }
-    _last_updated_time.store(time(nullptr));
-    return st;
+    is_finished = false;
+    channel = it->second;
+    return Status::OK();
 }
 
 void LoadChannel::handle_mem_exceed_limit(bool force) {
diff --git a/be/src/runtime/load_channel.h b/be/src/runtime/load_channel.h
index ba0ad3033498c8..37ee8453c912e4 100644
--- a/be/src/runtime/load_channel.h
+++ b/be/src/runtime/load_channel.h
@@ -27,27 +27,29 @@
 #include "gen_cpp/Types_types.h"
 #include "gen_cpp/internal_service.pb.h"
 #include "runtime/mem_tracker.h"
+#include "runtime/tablets_channel.h"
+#include "runtime/thread_context.h"
 #include "util/uid_util.h"
 
 namespace doris {
 
 class Cache;
-class TabletsChannel;
 
 // A LoadChannel manages tablets channels for all indexes
 // corresponding to a certain load job
 class LoadChannel {
 public:
     LoadChannel(const UniqueId& load_id, int64_t mem_limit, int64_t timeout_s,
-                bool is_high_priority, const std::string& sender_ip);
+                bool is_high_priority, const std::string& sender_ip, bool is_vec);
     ~LoadChannel();
 
     // open a new load channel if not exist
     Status open(const PTabletWriterOpenRequest& request);
 
     // this batch must belong to a index in one transaction
-    Status add_batch(const PTabletWriterAddBatchRequest& request,
-                     PTabletWriterAddBatchResult* response);
+    template <typename TabletWriterAddRequest, typename TabletWriterAddResult>
+    Status add_batch(const TabletWriterAddRequest& request,
+                     TabletWriterAddResult* response);
 
     // return true if this load channel has been opened and all tablets channels are closed then.
     bool is_finished();
@@ -70,6 +72,29 @@ class LoadChannel {
 
     bool is_high_priority() const { return _is_high_priority; }
 
+protected:
+    Status _get_tablets_channel(std::shared_ptr<TabletsChannel>& channel,
+                                bool& is_finished,
+                                const int64_t index_id);
+    
+    template<typename Request, typename Response>
+    Status _handle_eos(std::shared_ptr<TabletsChannel>& channel,
+                       const Request& request,
+                       Response* response) {
+        bool finished = false;
+        auto index_id = request.index_id();
+        RETURN_IF_ERROR(channel->close(request.sender_id(), request.backend_id(), 
+                                        &finished, request.partition_ids(),
+                                        response->mutable_tablet_vec()));
+        if (finished) {
+            std::lock_guard<std::mutex> l(_lock);
+            _tablets_channels.erase(index_id);
+            _finished_channel_ids.emplace(index_id);
+        }
+        return Status::OK();
+    }
+
+
 private:
     // when mem consumption exceeds limit, should call this method to find the channel
     // that consumes the largest memory(, and then we can reduce its memory usage).
@@ -99,8 +124,49 @@ class LoadChannel {
 
     // the ip where tablet sink locate
     std::string _sender_ip = "";
+
+    // true if this load is vectorized
+    bool _is_vec = false;
 };
 
+template <typename TabletWriterAddRequest, typename TabletWriterAddResult>
+Status LoadChannel::add_batch(const TabletWriterAddRequest& request,
+                              TabletWriterAddResult* response) {
+    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
+    int64_t index_id = request.index_id();
+    // 1. get tablets channel
+    std::shared_ptr<TabletsChannel> channel;
+    bool is_finished;
+    Status st = _get_tablets_channel(channel, is_finished, index_id);
+    if (!st.ok() || is_finished) {
+        return st;
+    }
+
+    // 2. check if mem consumption exceed limit
+    handle_mem_exceed_limit(false);
+
+    // 3. add batch to tablets channel
+    if constexpr (std::is_same_v<TabletWriterAddRequest, PTabletWriterAddBatchRequest>) {
+        if (request.has_row_batch()) {
+            RETURN_IF_ERROR(channel->add_batch(request, response));
+        }
+    } else {
+        if (request.has_block()) {
+            RETURN_IF_ERROR(channel->add_batch(request, response));
+        }
+    }
+
+    // 4. handle eos
+    if (request.has_eos() && request.eos()) {
+        st = _handle_eos(channel, request, response);
+        if (!st.ok()) {
+            return st;
+        }
+    }
+    _last_updated_time.store(time(nullptr));
+    return st;
+}
+
 inline std::ostream& operator<<(std::ostream& os, const LoadChannel& load_channel) {
     os << "LoadChannel(id=" << load_channel.load_id() << ", mem=" << load_channel.mem_consumption()
         << ", last_update_time=" << static_cast<uint64_t>(load_channel.last_updated_time())
diff --git a/be/src/runtime/load_channel_mgr.cpp b/be/src/runtime/load_channel_mgr.cpp
index 9de0736301b7db..35f7c3b82fc76b 100644
--- a/be/src/runtime/load_channel_mgr.cpp
+++ b/be/src/runtime/load_channel_mgr.cpp
@@ -18,7 +18,6 @@
 #include "runtime/load_channel_mgr.h"
 
 #include "gutil/strings/substitute.h"
-#include "olap/lru_cache.h"
 #include "runtime/load_channel.h"
 #include "runtime/mem_tracker.h"
 #include "runtime/thread_context.h"
@@ -95,6 +94,11 @@ Status LoadChannelMgr::init(int64_t process_mem_limit) {
     return Status::OK();
 }
 
+LoadChannel* LoadChannelMgr::_create_load_channel(const UniqueId& load_id, int64_t mem_limit, int64_t timeout_s,
+                                     bool is_high_priority, const std::string& sender_ip, bool is_vec) {
+    return new LoadChannel(load_id, mem_limit, timeout_s, is_high_priority, sender_ip, is_vec);
+}
+
 Status LoadChannelMgr::open(const PTabletWriterOpenRequest& params) {
     SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
     UniqueId load_id(params.id());
@@ -115,8 +119,8 @@ Status LoadChannelMgr::open(const PTabletWriterOpenRequest& params) {
             int64_t job_timeout_s = calc_job_timeout_s(timeout_in_req_s);
 
             bool is_high_priority = (params.has_is_high_priority() && params.is_high_priority());
-            channel.reset(new LoadChannel(load_id, job_max_memory, job_timeout_s, is_high_priority,
-                                          params.sender_ip()));
+            channel.reset(_create_load_channel(load_id, job_max_memory, job_timeout_s, is_high_priority,
+                                          params.sender_ip(), params.is_vectorized()));
             _load_channels.insert({load_id, channel});
         }
     }
@@ -127,55 +131,16 @@ Status LoadChannelMgr::open(const PTabletWriterOpenRequest& params) {
 
 static void dummy_deleter(const CacheKey& key, void* value) {}
 
-Status LoadChannelMgr::add_batch(const PTabletWriterAddBatchRequest& request,
-                                 PTabletWriterAddBatchResult* response) {
-    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
-    UniqueId load_id(request.id());
-    // 1. get load channel
-    std::shared_ptr<LoadChannel> channel;
+void LoadChannelMgr::_finish_load_channel(const UniqueId load_id) {
+    VLOG_NOTICE << "removing load channel " << load_id << " because it's finished";
     {
         std::lock_guard<std::mutex> l(_lock);
-        auto it = _load_channels.find(load_id);
-        if (it == _load_channels.end()) {
-            auto handle = _last_success_channel->lookup(load_id.to_string());
-            // success only when eos be true
-            if (handle != nullptr) {
-                _last_success_channel->release(handle);
-                if (request.has_eos() && request.eos()) {
-                    return Status::OK();
-                }
-            }
-            return Status::InternalError(strings::Substitute(
-                    "fail to add batch in load channel. unknown load_id=$0", load_id.to_string()));
-        }
-        channel = it->second;
+        _load_channels.erase(load_id);
+        auto handle =
+                _last_success_channel->insert(load_id.to_string(), nullptr, 1, dummy_deleter);
+        _last_success_channel->release(handle);
     }
-
-    if (!channel->is_high_priority()) {
-        // 2. check if mem consumption exceed limit
-        // If this is a high priority load task, do not handle this.
-        // because this may block for a while, which may lead to rpc timeout.
-        _handle_mem_exceed_limit();
-    }
-
-    // 3. add batch to load channel
-    // batch may not exist in request(eg: eos request without batch),
-    // this case will be handled in load channel's add batch method.
-    RETURN_IF_ERROR(channel->add_batch(request, response));
-
-    // 4. handle finish
-    if (channel->is_finished()) {
-        VLOG_NOTICE << "removing load channel " << load_id << " because it's finished";
-        {
-            std::lock_guard<std::mutex> l(_lock);
-            _load_channels.erase(load_id);
-            auto handle =
-                    _last_success_channel->insert(load_id.to_string(), nullptr, 1, dummy_deleter);
-            _last_success_channel->release(handle);
-        }
-        VLOG_CRITICAL << "removed load channel " << load_id;
-    }
-    return Status::OK();
+    VLOG_CRITICAL << "removed load channel " << load_id;
 }
 
 void LoadChannelMgr::_handle_mem_exceed_limit() {
@@ -223,7 +188,7 @@ Status LoadChannelMgr::cancel(const PTabletWriterCancelRequest& params) {
         }
     }
 
-    if (cancelled_channel.get() != nullptr) {
+    if (cancelled_channel != nullptr) {
         cancelled_channel->cancel();
         LOG(INFO) << "load channel has been cancelled: " << load_id;
     }
diff --git a/be/src/runtime/load_channel_mgr.h b/be/src/runtime/load_channel_mgr.h
index 1da0ec75a5fc05..292f3776e8d28a 100644
--- a/be/src/runtime/load_channel_mgr.h
+++ b/be/src/runtime/load_channel_mgr.h
@@ -28,15 +28,17 @@
 #include "gen_cpp/Types_types.h"
 #include "gen_cpp/internal_service.pb.h"
 #include "gutil/ref_counted.h"
+#include "runtime/load_channel.h"
 #include "runtime/tablets_channel.h"
+#include "runtime/thread_context.h"
 #include "util/countdown_latch.h"
 #include "util/thread.h"
 #include "util/uid_util.h"
+#include "olap/lru_cache.h"
 
 namespace doris {
 
 class Cache;
-class LoadChannel;
 
 // LoadChannelMgr -> LoadChannel -> TabletsChannel -> DeltaWriter
 // All dispatched load data for this backend is routed from this class
@@ -50,20 +52,29 @@ class LoadChannelMgr {
     // open a new load channel if not exist
     Status open(const PTabletWriterOpenRequest& request);
 
-    Status add_batch(const PTabletWriterAddBatchRequest& request,
-                     PTabletWriterAddBatchResult* response);
+    template <typename TabletWriterAddRequest, typename TabletWriterAddResult>
+    Status add_batch(const TabletWriterAddRequest& request,
+                     TabletWriterAddResult* response);
 
     // cancel all tablet stream for 'load_id' load
     Status cancel(const PTabletWriterCancelRequest& request);
 
 private:
+    static LoadChannel* _create_load_channel(const UniqueId& load_id, int64_t mem_limit, int64_t timeout_s,
+                                              bool is_high_priority, const std::string& sender_ip, bool is_vec);
+
+    template<typename Request>
+    Status _get_load_channel(std::shared_ptr<LoadChannel>& channel, bool& is_eof,
+                             const UniqueId& load_id, const Request& request);
+
+    void _finish_load_channel(UniqueId load_id);
     // check if the total load mem consumption exceeds limit.
     // If yes, it will pick a load channel to try to reduce memory consumption.
     void _handle_mem_exceed_limit();
 
     Status _start_bg_worker();
 
-private:
+protected:
     // lock protect the load channel map
     std::mutex _lock;
     // load id -> load channel
@@ -79,4 +90,62 @@ class LoadChannelMgr {
     Status _start_load_channels_clean();
 };
 
+template<typename Request>
+Status LoadChannelMgr::_get_load_channel(std::shared_ptr<LoadChannel>& channel,
+                         bool& is_eof,
+                         const UniqueId& load_id,
+                         const Request& request) {
+    is_eof = false;
+    std::lock_guard<std::mutex> l(_lock);
+    auto it = _load_channels.find(load_id);
+    if (it == _load_channels.end()) {
+        auto handle = _last_success_channel->lookup(load_id.to_string());
+        // success only when eos be true
+        if (handle != nullptr) {
+            _last_success_channel->release(handle);
+            if (request.has_eos() && request.eos()) {
+                is_eof = true;
+                return Status::OK();
+            }
+        }
+        return Status::InternalError(strings::Substitute(
+                "fail to add batch in load channel. unknown load_id=$0", load_id.to_string()));
+    }
+    channel = it->second;
+    return Status::OK();
+}
+
+template <typename TabletWriterAddRequest, typename TabletWriterAddResult>
+Status LoadChannelMgr::add_batch(const TabletWriterAddRequest& request,
+                                 TabletWriterAddResult* response) {
+    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
+    UniqueId load_id(request.id());
+    // 1. get load channel
+    std::shared_ptr<LoadChannel> channel;
+    bool is_eof;
+    auto status = _get_load_channel(channel, is_eof, load_id, request);
+    if (!status.ok() || is_eof) {
+        return status;
+    }
+
+    if (!channel->is_high_priority()) {
+        // 2. check if mem consumption exceed limit
+        // If this is a high priority load task, do not handle this.
+        // because this may block for a while, which may lead to rpc timeout.
+        _handle_mem_exceed_limit();
+    }
+
+    // 3. add batch to load channel
+    // batch may not exist in request(eg: eos request without batch),
+    // this case will be handled in load channel's add batch method.
+    RETURN_IF_ERROR(channel->add_batch(request, response));
+
+    // 4. handle finish
+    if (channel->is_finished()) {
+        _finish_load_channel(load_id);
+    }
+    return Status::OK();
+}
+
+
 } // namespace doris
diff --git a/be/src/runtime/tablets_channel.cpp b/be/src/runtime/tablets_channel.cpp
index 6ae7721cf9ae28..e8ad30d83f16d1 100644
--- a/be/src/runtime/tablets_channel.cpp
+++ b/be/src/runtime/tablets_channel.cpp
@@ -18,8 +18,6 @@
 #include "runtime/tablets_channel.h"
 
 #include "exec/tablet_info.h"
-#include "gutil/strings/substitute.h"
-#include "olap/delta_writer.h"
 #include "olap/memtable.h"
 #include "runtime/row_batch.h"
 #include "runtime/tuple_row.h"
@@ -32,8 +30,8 @@ DEFINE_GAUGE_METRIC_PROTOTYPE_2ARG(tablet_writer_count, MetricUnit::NOUNIT);
 
 std::atomic<uint64_t> TabletsChannel::_s_tablet_writer_count;
 
-TabletsChannel::TabletsChannel(const TabletsChannelKey& key, bool is_high_priority)
-        : _key(key), _state(kInitialized), _closed_senders(64), _is_high_priority(is_high_priority) {
+TabletsChannel::TabletsChannel(const TabletsChannelKey& key, bool is_high_priority, bool is_vec)
+        : _key(key), _state(kInitialized), _closed_senders(64), _is_high_priority(is_high_priority), _is_vec(is_vec) {
     _mem_tracker = MemTracker::create_tracker(-1, "TabletsChannel:" + std::to_string(key.index_id));
     static std::once_flag once_flag;
     std::call_once(once_flag, [] {
@@ -76,78 +74,6 @@ Status TabletsChannel::open(const PTabletWriterOpenRequest& request) {
     return Status::OK();
 }
 
-Status TabletsChannel::add_batch(const PTabletWriterAddBatchRequest& request,
-        PTabletWriterAddBatchResult* response) {
-    DCHECK(request.tablet_ids_size() == request.row_batch().num_rows());
-    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
-    int64_t cur_seq;
-    {
-        std::lock_guard<std::mutex> l(_lock);
-        if (_state != kOpened) {
-            return _state == kFinished
-                ? _close_status
-                : Status::InternalError(strings::Substitute("TabletsChannel $0 state: $1",
-                            _key.to_string(), _state));
-        }
-        cur_seq = _next_seqs[request.sender_id()];
-        // check packet
-        if (request.packet_seq() < cur_seq) {
-            LOG(INFO) << "packet has already recept before, expect_seq=" << cur_seq
-                << ", recept_seq=" << request.packet_seq();
-            return Status::OK();
-        } else if (request.packet_seq() > cur_seq) {
-            LOG(WARNING) << "lost data packet, expect_seq=" << cur_seq
-                << ", recept_seq=" << request.packet_seq();
-            return Status::InternalError("lost data packet");
-        }
-    }
-
-    RowBatch row_batch(*_row_desc, request.row_batch());
-    std::unordered_map<int64_t /* tablet_id */, std::vector<int> /* row index */> tablet_to_rowidxs;
-    for (int i = 0; i < request.tablet_ids_size(); ++i) {
-        int64_t tablet_id = request.tablet_ids(i);
-        if (_broken_tablets.find(tablet_id) != _broken_tablets.end()) {
-            // skip broken tablets
-            continue;
-        }
-        auto it = tablet_to_rowidxs.find(tablet_id);
-        if (it == tablet_to_rowidxs.end()) {
-            tablet_to_rowidxs.emplace(tablet_id, std::initializer_list<int>{ i });
-        } else {
-            it->second.emplace_back(i);
-        }
-    }
-
-    google::protobuf::RepeatedPtrField<PTabletError>* tablet_errors = response->mutable_tablet_errors(); 
-    for (const auto& tablet_to_rowidxs_it : tablet_to_rowidxs) {
-        auto tablet_writer_it = _tablet_writers.find(tablet_to_rowidxs_it.first);
-        if (tablet_writer_it == _tablet_writers.end()) {
-            return Status::InternalError(
-                    strings::Substitute("unknown tablet to append data, tablet=$0", tablet_to_rowidxs_it.first));
-        }
-
-        Status st = tablet_writer_it->second->write(&row_batch, tablet_to_rowidxs_it.second);
-        if (!st.ok()) {
-            auto err_msg = strings::Substitute(
-                    "tablet writer write failed, tablet_id=$0, txn_id=$1, err=$2",
-                    tablet_to_rowidxs_it.first, _txn_id, st.to_string());
-            LOG(WARNING) << err_msg;
-            PTabletError* error = tablet_errors->Add();
-            error->set_tablet_id(tablet_to_rowidxs_it.first);
-            error->set_msg(err_msg);
-            _broken_tablets.insert(tablet_to_rowidxs_it.first);
-            // continue write to other tablet.
-            // the error will return back to sender.
-        }
-    }
-
-    {
-        std::lock_guard<std::mutex> l(_lock);
-        _next_seqs[request.sender_id()] = cur_seq + 1;
-    }
-    return Status::OK();
-}
-
 Status TabletsChannel::close(int sender_id, int64_t backend_id, bool* finished,
                              const google::protobuf::RepeatedField<int64_t>& partition_ids,
                              google::protobuf::RepeatedPtrField<PTabletInfo>* tablet_vec) {
@@ -288,7 +214,7 @@ Status TabletsChannel::_open_all_writers(const PTabletWriterOpenRequest& request
         wrequest.is_high_priority = _is_high_priority;
 
         DeltaWriter* writer = nullptr;
-        auto st = DeltaWriter::open(&wrequest, &writer);
+        auto st = DeltaWriter::open(&wrequest, &writer, _is_vec);
         if (!st.ok()) {
             std::stringstream ss;
             ss << "open delta writer failed, tablet_id=" << tablet.tablet_id()
diff --git a/be/src/runtime/tablets_channel.h b/be/src/runtime/tablets_channel.h
index 226b2b76db05f5..1d0fe3c5fa14aa 100644
--- a/be/src/runtime/tablets_channel.h
+++ b/be/src/runtime/tablets_channel.h
@@ -15,6 +15,8 @@
 // specific language governing permissions and limitations
 // under the License.
 
+#pragma once
+
 #include <cstdint>
 #include <unordered_map>
 #include <utility>
@@ -25,9 +27,14 @@
 #include "gen_cpp/internal_service.pb.h"
 #include "runtime/descriptors.h"
 #include "runtime/mem_tracker.h"
+#include "runtime/thread_context.h"
 #include "util/bitmap.h"
 #include "util/priority_thread_pool.hpp"
 #include "util/uid_util.h"
+#include "gutil/strings/substitute.h"
+
+#include "vec/core/block.h"
+#include "olap/delta_writer.h"
 
 namespace doris {
 
@@ -54,14 +61,15 @@ class OlapTableSchemaParam;
 // Write channel for a particular (load, index).
 class TabletsChannel {
 public:
-    TabletsChannel(const TabletsChannelKey& key, bool is_high_priority);
+    TabletsChannel(const TabletsChannelKey& key, bool is_high_priority, bool is_vec);
 
     ~TabletsChannel();
 
     Status open(const PTabletWriterOpenRequest& request);
 
     // no-op when this channel has been closed or cancelled
-    Status add_batch(const PTabletWriterAddBatchRequest& request, PTabletWriterAddBatchResult* response);
+    template <typename TabletWriterAddRequest, typename TabletWriterAddResult>
+    Status add_batch(const TabletWriterAddRequest& request, TabletWriterAddResult* response);
 
     // Mark sender with 'sender_id' as closed.
     // If all senders are closed, close this channel, set '*finished' to true, update 'tablet_vec'
@@ -83,10 +91,12 @@ class TabletsChannel {
     int64_t mem_consumption() const { return _mem_tracker->consumption(); }
 
 private:
+    template<typename Request>
+    Status _get_current_seq(int64_t& cur_seq, const Request& request);
+
     // open all writer
     Status _open_all_writers(const PTabletWriterOpenRequest& request);
 
-private:
     // id of this load channel
     TabletsChannelKey _key;
 
@@ -104,6 +114,7 @@ class TabletsChannel {
     int64_t _txn_id = -1;
     int64_t _index_id = -1;
     OlapTableSchemaParam* _schema = nullptr;
+
     TupleDescriptor* _tuple_desc = nullptr;
     // row_desc used to construct
     RowDescriptor* _row_desc = nullptr;
@@ -130,6 +141,97 @@ class TabletsChannel {
     static std::atomic<uint64_t> _s_tablet_writer_count;
 
     bool _is_high_priority = false;
+
+    bool _is_vec = false;
 };
 
+template<typename Request>
+Status TabletsChannel::_get_current_seq(int64_t& cur_seq, const Request& request) {
+    std::lock_guard<std::mutex> l(_lock);
+    if (_state != kOpened) {
+        return _state == kFinished
+            ? _close_status
+            : Status::InternalError(strings::Substitute("TabletsChannel $0 state: $1",
+                        _key.to_string(), _state));
+    }
+    cur_seq = _next_seqs[request.sender_id()];
+    // check packet
+    if (request.packet_seq() > cur_seq) {
+        LOG(WARNING) << "lost data packet, expect_seq=" << cur_seq
+            << ", recept_seq=" << request.packet_seq();
+        return Status::InternalError("lost data packet");
+    }
+    return Status::OK();
+}
+
+template <typename TabletWriterAddRequest, typename TabletWriterAddResult>
+Status TabletsChannel::add_batch(const TabletWriterAddRequest& request,
+                                 TabletWriterAddResult* response) {
+    SCOPED_SWITCH_THREAD_LOCAL_MEM_TRACKER(_mem_tracker);
+    int64_t cur_seq = 0;
+
+    auto status = _get_current_seq(cur_seq, request);
+    if (UNLIKELY(!status.ok())) {
+        return status;
+    }
+
+    if (request.packet_seq() < cur_seq) {
+        LOG(INFO) << "packet has already recept before, expect_seq=" << cur_seq
+                  << ", recept_seq=" << request.packet_seq();
+        return Status::OK();
+    }
+
+    std::unordered_map<int64_t /* tablet_id */, std::vector<int> /* row index */> tablet_to_rowidxs;
+    for (int i = 0; i < request.tablet_ids_size(); ++i) {
+        int64_t tablet_id = request.tablet_ids(i);
+        if (_broken_tablets.find(tablet_id) != _broken_tablets.end()) {
+            // skip broken tablets
+            continue;
+        }
+        auto it = tablet_to_rowidxs.find(tablet_id);
+        if (it == tablet_to_rowidxs.end()) {
+            tablet_to_rowidxs.emplace(tablet_id, std::initializer_list<int>{ i });
+        } else {
+            it->second.emplace_back(i);
+        }
+    }
+
+    auto get_send_data = [&] () {
+        if constexpr (std::is_same_v<TabletWriterAddRequest, PTabletWriterAddBatchRequest>) {
+            return RowBatch(*_row_desc, request.row_batch());
+        } else {
+            return vectorized::Block(request.block());
+        }
+    };
+
+    auto send_data = get_send_data();
+    google::protobuf::RepeatedPtrField<PTabletError>* tablet_errors = response->mutable_tablet_errors();
+    for (const auto& tablet_to_rowidxs_it : tablet_to_rowidxs) {
+        auto tablet_writer_it = _tablet_writers.find(tablet_to_rowidxs_it.first);
+        if (tablet_writer_it == _tablet_writers.end()) {
+            return Status::InternalError(
+                    strings::Substitute("unknown tablet to append data, tablet=$0", tablet_to_rowidxs_it.first));
+        }
+
+        Status st = tablet_writer_it->second->write(&send_data, tablet_to_rowidxs_it.second);
+        if (!st.ok()) {
+            auto err_msg = strings::Substitute(
+                    "tablet writer write failed, tablet_id=$0, txn_id=$1, err=$2",
+                    tablet_to_rowidxs_it.first, _txn_id, st.code());
+            LOG(WARNING) << err_msg;
+            PTabletError* error = tablet_errors->Add();
+            error->set_tablet_id(tablet_to_rowidxs_it.first);
+            error->set_msg(err_msg);
+            _broken_tablets.insert(tablet_to_rowidxs_it.first);
+            // continue write to other tablet.
+            // the error will return back to sender.
+        }
+    }
+
+    {
+        std::lock_guard<std::mutex> l(_lock);
+        _next_seqs[request.sender_id()] = cur_seq + 1;
+    }
+    return Status::OK();
+}
 } // namespace doris
diff --git a/be/src/service/internal_service.cpp b/be/src/service/internal_service.cpp
index 5080b1c21825b2..9fa45b9a66ebee 100644
--- a/be/src/service/internal_service.cpp
+++ b/be/src/service/internal_service.cpp
@@ -123,6 +123,37 @@ void PInternalServiceImpl<T>::exec_plan_fragment(google::protobuf::RpcController
     st.to_protobuf(response->mutable_status());
 }
 
+template <typename T>
+void PInternalServiceImpl<T>::tablet_writer_add_block(google::protobuf::RpcController* cntl_base,
+                                                      const PTabletWriterAddBlockRequest* request,
+                                                      PTabletWriterAddBlockResult* response,
+                                                      google::protobuf::Closure* done) {
+    VLOG_RPC << "tablet writer add block, id=" << request->id()
+             << ", index_id=" << request->index_id() << ", sender_id=" << request->sender_id()
+             << ", current_queued_size=" << _tablet_worker_pool.get_queue_size();
+    int64_t submit_task_time_ns = MonotonicNanos();
+    _tablet_worker_pool.offer([cntl_base, request, response, done, submit_task_time_ns, this]() {
+        int64_t wait_execution_time_ns = MonotonicNanos() - submit_task_time_ns;
+        brpc::ClosureGuard closure_guard(done);
+        int64_t execution_time_ns = 0;
+        {
+            SCOPED_RAW_TIMER(&execution_time_ns);
+            brpc::Controller* cntl = static_cast<brpc::Controller*>(cntl_base);
+            attachment_transfer_request_block<PTabletWriterAddBlockRequest>(request, cntl);
+            auto st = _exec_env->load_channel_mgr()->add_batch(*request, response);
+            if (!st.ok()) {
+                LOG(WARNING) << "tablet writer add block failed, message=" << st.get_error_msg()
+                             << ", id=" << request->id() << ", index_id=" << request->index_id()
+                             << ", sender_id=" << request->sender_id()
+                             << ", backend id=" << request->backend_id();
+            }
+            st.to_protobuf(response->mutable_status());
+        }
+        response->set_execution_time_us(execution_time_ns / NANOS_PER_MICRO);
+        response->set_wait_execution_time_us(wait_execution_time_ns / NANOS_PER_MICRO);
+    });
+}
+
 template <typename T>
 void PInternalServiceImpl<T>::tablet_writer_add_batch(google::protobuf::RpcController* cntl_base,
                                                       const PTabletWriterAddBatchRequest* request,
diff --git a/be/src/service/internal_service.h b/be/src/service/internal_service.h
index c4073bf86ed282..ce4913701d0bff 100644
--- a/be/src/service/internal_service.h
+++ b/be/src/service/internal_service.h
@@ -64,6 +64,11 @@ class PInternalServiceImpl : public T {
                                  PTabletWriterAddBatchResult* response,
                                  google::protobuf::Closure* done) override;
 
+    void tablet_writer_add_block(google::protobuf::RpcController* controller,
+                                 const PTabletWriterAddBlockRequest* request,
+                                 PTabletWriterAddBlockResult* response,
+                                 google::protobuf::Closure* done) override;
+
     void tablet_writer_cancel(google::protobuf::RpcController* controller,
                               const PTabletWriterCancelRequest* request,
                               PTabletWriterCancelResult* response,
diff --git a/be/src/udf/udf.cpp b/be/src/udf/udf.cpp
index b343155cffba00..f7491d4c5ecc28 100644
--- a/be/src/udf/udf.cpp
+++ b/be/src/udf/udf.cpp
@@ -178,7 +178,7 @@ doris_udf::FunctionContext* FunctionContextImpl::create_context(
         const doris_udf::FunctionContext::TypeDesc& return_type,
         const std::vector<doris_udf::FunctionContext::TypeDesc>& arg_types, int varargs_buffer_size,
         bool debug) {
-    doris_udf::FunctionContext* ctx = new doris_udf::FunctionContext();
+    auto* ctx = new doris_udf::FunctionContext();
     ctx->_impl->_state = state;
     ctx->_impl->_pool = new FreePool(pool);
     ctx->_impl->_intermediate_type = intermediate_type;
diff --git a/be/src/vec/CMakeLists.txt b/be/src/vec/CMakeLists.txt
index 63f07d14082ffb..7555e9d0ca9222 100644
--- a/be/src/vec/CMakeLists.txt
+++ b/be/src/vec/CMakeLists.txt
@@ -99,6 +99,8 @@ set(VEC_FILES
   exec/vassert_num_rows_node.cpp
   exec/vrepeat_node.cpp
   exec/vtable_function_node.cpp
+  exec/vbroker_scan_node.cpp
+  exec/vbroker_scanner.cpp
   exec/join/vhash_join_node.cpp
   exprs/vectorized_agg_fn.cpp
   exprs/vectorized_fn_call.cpp
@@ -177,6 +179,7 @@ set(VEC_FILES
   olap/vgeneric_iterators.cpp
   olap/vcollect_iterator.cpp
   olap/block_reader.cpp
+  olap/olap_data_convertor.cpp
   sink/mysql_result_writer.cpp
   sink/result_sink.cpp
   sink/vdata_stream_sender.cpp
diff --git a/be/src/vec/aggregate_functions/aggregate_function_reader.cpp b/be/src/vec/aggregate_functions/aggregate_function_reader.cpp
index ce78397794fb4e..f90515fd5e09dc 100644
--- a/be/src/vec/aggregate_functions/aggregate_function_reader.cpp
+++ b/be/src/vec/aggregate_functions/aggregate_function_reader.cpp
@@ -20,29 +20,38 @@
 namespace doris::vectorized {
 
 // auto spread at nullable condition, null value do not participate aggregate
-void register_aggregate_function_reader(AggregateFunctionSimpleFactory& factory) {
+void register_aggregate_function_reader_load(AggregateFunctionSimpleFactory& factory) {
     // add a suffix to the function name here to distinguish special functions of agg reader
-    auto register_function_reader = [&](const std::string& name,
-                                        const AggregateFunctionCreator& creator) {
-        factory.register_function(name + agg_reader_suffix, creator, false);
+    auto register_function = [&](const std::string& name,
+                                 const AggregateFunctionCreator& creator) {
+        factory.register_function(name + AGG_READER_SUFFIX, creator, false);
+        factory.register_function(name + AGG_LOAD_SUFFIX, creator, false);
     };
 
-    register_function_reader("sum", create_aggregate_function_sum_reader);
-    register_function_reader("max", create_aggregate_function_max);
-    register_function_reader("min", create_aggregate_function_min);
-    register_function_reader("replace_if_not_null", create_aggregate_function_replace_if_not_null);
-    register_function_reader("bitmap_union", create_aggregate_function_bitmap_union);
-    register_function_reader("hll_union", create_aggregate_function_HLL_union<false>);
+    register_function("sum", create_aggregate_function_sum_reader);
+    register_function("max", create_aggregate_function_max);
+    register_function("min", create_aggregate_function_min);
+    register_function("bitmap_union", create_aggregate_function_bitmap_union);
+    register_function("hll_union", create_aggregate_function_HLL_union<false>);
 }
 
-void register_aggregate_function_reader_no_spread(AggregateFunctionSimpleFactory& factory) {
-    auto register_function_reader = [&](const std::string& name,
-                                        const AggregateFunctionCreator& creator, bool nullable) {
-        factory.register_function(name + agg_reader_suffix, creator, nullable);
+// only replace funtion in load/reader do different agg operation.
+// because Doris can ensure that the data is globally ordered in reader, but cannot in load
+// 1. reader, get the first value of input data.
+// 2. load, get the last value of input data.
+void register_aggregate_function_replace_reader_load(AggregateFunctionSimpleFactory& factory) {
+    auto register_function = [&](const std::string& name, const std::string& suffix,
+                                 const AggregateFunctionCreator& creator, bool nullable) {
+        factory.register_function(name + suffix, creator, nullable);
     };
 
-    register_function_reader("replace", create_aggregate_function_replace, false);
-    register_function_reader("replace", create_aggregate_function_replace_nullable, true);
+    register_function("replace", AGG_READER_SUFFIX, create_aggregate_function_first<false, true>, false);
+    register_function("replace", AGG_READER_SUFFIX, create_aggregate_function_first<true, true>, true);
+    register_function("replace", AGG_LOAD_SUFFIX, create_aggregate_function_last<false, true>, false);
+    register_function("replace", AGG_LOAD_SUFFIX, create_aggregate_function_last<true, true>, true);
+
+    register_function("replace_if_not_null", AGG_READER_SUFFIX, create_aggregate_function_first<false, true>, false);
+    register_function("replace_if_not_null", AGG_LOAD_SUFFIX, create_aggregate_function_last<false, true>, false);
 }
 
 } // namespace doris::vectorized
diff --git a/be/src/vec/aggregate_functions/aggregate_function_reader.h b/be/src/vec/aggregate_functions/aggregate_function_reader.h
index f44be5ee574168..86fea6f079b855 100644
--- a/be/src/vec/aggregate_functions/aggregate_function_reader.h
+++ b/be/src/vec/aggregate_functions/aggregate_function_reader.h
@@ -26,10 +26,11 @@
 
 namespace doris::vectorized {
 
-static const std::string agg_reader_suffix = "_reader";
+static auto constexpr AGG_READER_SUFFIX = "_reader";
+static auto constexpr AGG_LOAD_SUFFIX = "_load";
 
-void register_aggregate_function_reader(AggregateFunctionSimpleFactory& factory);
+void register_aggregate_function_reader_load(AggregateFunctionSimpleFactory& factory);
 
-void register_aggregate_function_reader_no_spread(AggregateFunctionSimpleFactory& factory);
+void register_aggregate_function_replace_reader_load(AggregateFunctionSimpleFactory& factory);
 
 } // namespace doris::vectorized
diff --git a/be/src/vec/aggregate_functions/aggregate_function_simple_factory.cpp b/be/src/vec/aggregate_functions/aggregate_function_simple_factory.cpp
index 6315fd6600c3fc..4931958276605b 100644
--- a/be/src/vec/aggregate_functions/aggregate_function_simple_factory.cpp
+++ b/be/src/vec/aggregate_functions/aggregate_function_simple_factory.cpp
@@ -58,7 +58,7 @@ AggregateFunctionSimpleFactory& AggregateFunctionSimpleFactory::instance() {
         register_aggregate_function_uniq(instance);
         register_aggregate_function_bitmap(instance);
         register_aggregate_function_combinator_distinct(instance);
-        register_aggregate_function_reader(instance); // register aggregate function for agg reader
+        register_aggregate_function_reader_load(instance); // register aggregate function for agg reader
         register_aggregate_function_window_rank(instance);
         register_aggregate_function_stddev_variance_pop(instance);
         register_aggregate_function_topn(instance);
@@ -72,7 +72,7 @@ AggregateFunctionSimpleFactory& AggregateFunctionSimpleFactory::instance() {
         register_aggregate_function_combinator_null(instance);
 
         register_aggregate_function_stddev_variance_samp(instance);
-        register_aggregate_function_reader_no_spread(instance);
+        register_aggregate_function_replace_reader_load(instance);
         register_aggregate_function_window_lead_lag(instance);
         register_aggregate_function_HLL_union_agg(instance);
         register_aggregate_function_percentile_approx(instance);
diff --git a/be/src/vec/aggregate_functions/aggregate_function_window.cpp b/be/src/vec/aggregate_functions/aggregate_function_window.cpp
index b96f241e513c47..53a4c4931c4f18 100644
--- a/be/src/vec/aggregate_functions/aggregate_function_window.cpp
+++ b/be/src/vec/aggregate_functions/aggregate_function_window.cpp
@@ -23,7 +23,7 @@
 #include "common/logging.h"
 #include "vec/aggregate_functions/aggregate_function_simple_factory.h"
 #include "vec/aggregate_functions/factory_helpers.h"
-#include "vec/aggregate_functions/helpers.h"
+
 namespace doris::vectorized {
 
 AggregateFunctionPtr create_aggregate_function_dense_rank(const std::string& name,
@@ -53,44 +53,6 @@ AggregateFunctionPtr create_aggregate_function_row_number(const std::string& nam
     return std::make_shared<WindowFunctionRowNumber>(argument_types);
 }
 
-template <template <typename> class AggregateFunctionTemplate, template <typename> class Data,
-          bool is_nullable, bool is_copy = false>
-static IAggregateFunction* create_function_single_value(const String& name,
-                                                        const DataTypes& argument_types,
-                                                        const Array& parameters) {
-    using StoreType = std::conditional_t<is_copy, CopiedValue, Value>;
-
-    assert_arity_at_most<3>(name, argument_types);
-
-    auto type = argument_types[0].get();
-    if (type->is_nullable()) {
-        type = assert_cast<const DataTypeNullable*>(type)->get_nested_type().get();
-    }
-    WhichDataType which(*type);
-
-#define DISPATCH(TYPE)                        \
-    if (which.idx == TypeIndex::TYPE)         \
-        return new AggregateFunctionTemplate< \
-                Data<LeadAndLagData<TYPE, is_nullable, false, StoreType>>>(argument_types);
-    FOR_NUMERIC_TYPES(DISPATCH)
-#undef DISPATCH
-
-    if (which.is_decimal()) {
-        return new AggregateFunctionTemplate<
-                Data<LeadAndLagData<Int128, is_nullable, false, StoreType>>>(argument_types);
-    }
-    if (which.is_date_or_datetime()) {
-        return new AggregateFunctionTemplate<
-                Data<LeadAndLagData<Int64, is_nullable, false, StoreType>>>(argument_types);
-    }
-    if (which.is_string_or_fixed_string()) {
-        return new AggregateFunctionTemplate<
-                Data<LeadAndLagData<StringRef, is_nullable, true, StoreType>>>(argument_types);
-    }
-    DCHECK(false) << "with unknowed type, failed in  create_aggregate_function_leadlag";
-    return nullptr;
-}
-
 template <bool is_nullable>
 AggregateFunctionPtr create_aggregate_function_lag(const std::string& name,
                                                    const DataTypes& argument_types,
@@ -111,53 +73,6 @@ AggregateFunctionPtr create_aggregate_function_lead(const std::string& name,
                     name, argument_types, parameters));
 }
 
-template <bool is_nullable>
-AggregateFunctionPtr create_aggregate_function_first(const std::string& name,
-                                                     const DataTypes& argument_types,
-                                                     const Array& parameters,
-                                                     const bool result_is_nullable) {
-    return AggregateFunctionPtr(
-            create_function_single_value<WindowFunctionData, WindowFunctionFirstData, is_nullable>(
-                    name, argument_types, parameters));
-}
-
-template <bool is_nullable>
-AggregateFunctionPtr create_aggregate_function_last(const std::string& name,
-                                                    const DataTypes& argument_types,
-                                                    const Array& parameters,
-                                                    const bool result_is_nullable) {
-    return AggregateFunctionPtr(
-            create_function_single_value<WindowFunctionData, WindowFunctionLastData, is_nullable>(
-                    name, argument_types, parameters));
-}
-
-AggregateFunctionPtr create_aggregate_function_replace_if_not_null(const std::string& name,
-                                                                   const DataTypes& argument_types,
-                                                                   const Array& parameters,
-                                                                   const bool result_is_nullable) {
-    return AggregateFunctionPtr(
-            create_function_single_value<WindowFunctionData, WindowFunctionFirstData, false, true>(
-                    name, argument_types, parameters));
-}
-
-AggregateFunctionPtr create_aggregate_function_replace(const std::string& name,
-                                                       const DataTypes& argument_types,
-                                                       const Array& parameters,
-                                                       const bool result_is_nullable) {
-    return AggregateFunctionPtr(
-            create_function_single_value<WindowFunctionData, WindowFunctionFirstData, false, true>(
-                    name, argument_types, parameters));
-}
-
-AggregateFunctionPtr create_aggregate_function_replace_nullable(const std::string& name,
-                                                                const DataTypes& argument_types,
-                                                                const Array& parameters,
-                                                                const bool result_is_nullable) {
-    return AggregateFunctionPtr(
-            create_function_single_value<WindowFunctionData, WindowFunctionFirstData, true, true>(
-                    name, argument_types, parameters));
-}
-
 void register_aggregate_function_window_rank(AggregateFunctionSimpleFactory& factory) {
     factory.register_function("dense_rank", create_aggregate_function_dense_rank);
     factory.register_function("rank", create_aggregate_function_rank);
@@ -169,9 +84,10 @@ void register_aggregate_function_window_lead_lag(AggregateFunctionSimpleFactory&
     factory.register_function("lead", create_aggregate_function_lead<true>, true);
     factory.register_function("lag", create_aggregate_function_lag<false>);
     factory.register_function("lag", create_aggregate_function_lag<true>, true);
-    factory.register_function("first_value", create_aggregate_function_first<false>);
-    factory.register_function("first_value", create_aggregate_function_first<true>, true);
-    factory.register_function("last_value", create_aggregate_function_last<false>);
-    factory.register_function("last_value", create_aggregate_function_last<true>, true);
+    factory.register_function("first_value", create_aggregate_function_first<false, false>);
+    factory.register_function("first_value", create_aggregate_function_first<true, false>, true);
+    factory.register_function("last_value", create_aggregate_function_last<false, false>);
+    factory.register_function("last_value", create_aggregate_function_last<true, false>, true);
 }
+
 } // namespace doris::vectorized
\ No newline at end of file
diff --git a/be/src/vec/aggregate_functions/aggregate_function_window.h b/be/src/vec/aggregate_functions/aggregate_function_window.h
index 133efe7ea0e2ef..c438cd358293ce 100644
--- a/be/src/vec/aggregate_functions/aggregate_function_window.h
+++ b/be/src/vec/aggregate_functions/aggregate_function_window.h
@@ -21,11 +21,13 @@
 #pragma once
 
 #include "vec/aggregate_functions/aggregate_function.h"
+#include "vec/aggregate_functions/helpers.h"
 #include "vec/columns/column_vector.h"
 #include "vec/data_types/data_type_decimal.h"
 #include "vec/data_types/data_type_number.h"
 #include "vec/data_types/data_type_string.h"
 #include "vec/io/io_helper.h"
+#include "factory_helpers.h"
 
 namespace doris::vectorized {
 
@@ -405,19 +407,62 @@ class WindowFunctionData final
     DataTypePtr _argument_type;
 };
 
-AggregateFunctionPtr create_aggregate_function_replace_if_not_null(const std::string& name,
-                                                                   const DataTypes& argument_types,
-                                                                   const Array& parameters,
-                                                                   const bool result_is_nullable);
+template <template <typename> class AggregateFunctionTemplate, template <typename> class Data,
+          bool is_nullable, bool is_copy = false>
+static IAggregateFunction* create_function_single_value(const String& name,
+                                                        const DataTypes& argument_types,
+                                                        const Array& parameters) {
+    using StoreType = std::conditional_t<is_copy, CopiedValue, Value>;
 
-AggregateFunctionPtr create_aggregate_function_replace(const std::string& name,
-                                                       const DataTypes& argument_types,
-                                                       const Array& parameters,
-                                                       const bool result_is_nullable);
+    assert_arity_at_most<3>(name, argument_types);
 
-AggregateFunctionPtr create_aggregate_function_replace_nullable(const std::string& name,
-                                                                const DataTypes& argument_types,
-                                                                const Array& parameters,
-                                                                const bool result_is_nullable);
+    auto type = argument_types[0].get();
+    if (type->is_nullable()) {
+        type = assert_cast<const DataTypeNullable*>(type)->get_nested_type().get();
+    }
+    WhichDataType which(*type);
+
+#define DISPATCH(TYPE)                        \
+    if (which.idx == TypeIndex::TYPE)         \
+        return new AggregateFunctionTemplate< \
+                Data<LeadAndLagData<TYPE, is_nullable, false, StoreType>>>(argument_types);
+    FOR_NUMERIC_TYPES(DISPATCH)
+#undef DISPATCH
+
+    if (which.is_decimal()) {
+        return new AggregateFunctionTemplate<
+                Data<LeadAndLagData<Int128, is_nullable, false, StoreType>>>(argument_types);
+    }
+    if (which.is_date_or_datetime()) {
+        return new AggregateFunctionTemplate<
+                Data<LeadAndLagData<Int64, is_nullable, false, StoreType>>>(argument_types);
+    }
+    if (which.is_string_or_fixed_string()) {
+        return new AggregateFunctionTemplate<
+                Data<LeadAndLagData<StringRef, is_nullable, true, StoreType>>>(argument_types);
+    }
+    DCHECK(false) << "with unknowed type, failed in  create_aggregate_function_leadlag";
+    return nullptr;
+}
+
+template <bool is_nullable, bool is_copy>
+AggregateFunctionPtr create_aggregate_function_first(const std::string& name,
+                                                     const DataTypes& argument_types,
+                                                     const Array& parameters,
+                                                     bool result_is_nullable) {
+    return AggregateFunctionPtr(
+            create_function_single_value<WindowFunctionData, WindowFunctionFirstData, is_nullable, is_copy>(
+                    name, argument_types, parameters));
+}
+
+template <bool is_nullable, bool is_copy>
+AggregateFunctionPtr create_aggregate_function_last(const std::string& name,
+                                                    const DataTypes& argument_types,
+                                                    const Array& parameters,
+                                                    bool result_is_nullable) {
+    return AggregateFunctionPtr(
+            create_function_single_value<WindowFunctionData, WindowFunctionLastData, is_nullable, is_copy>(
+                    name, argument_types, parameters));
+}
 
 } // namespace doris::vectorized
diff --git a/be/src/vec/core/block.cpp b/be/src/vec/core/block.cpp
index 36be1d61c35ac6..90d3984ee0fe4f 100644
--- a/be/src/vec/core/block.cpp
+++ b/be/src/vec/core/block.cpp
@@ -862,6 +862,15 @@ void MutableBlock::add_rows(const Block* block, const int* row_begin, const int*
     }
 }
 
+void MutableBlock::add_rows(const Block* block, size_t row_begin, size_t length) {
+    auto& block_data = block->get_columns_with_type_and_name();
+    for (size_t i = 0; i < _columns.size(); ++i) {
+        auto& dst = _columns[i];
+        auto& src = *block_data[i].column.get();
+        dst->insert_range_from(src, row_begin, length);
+    }
+}
+
 Block MutableBlock::to_block(int start_column) {
     return to_block(start_column, _columns.size());
 }
@@ -954,4 +963,13 @@ void Block::shrink_char_type_column_suffix_zero(const std::vector<size_t>& char_
         }
     }
 }
+size_t MutableBlock::allocated_bytes() const {
+    size_t res = 0;
+    for (const auto& col : _columns) {
+        res += col->allocated_bytes();
+    }
+
+    return res;
+}
+
 } // namespace doris::vectorized
diff --git a/be/src/vec/core/block.h b/be/src/vec/core/block.h
index ff8927c6823c33..ed5860dd5a1cd4 100644
--- a/be/src/vec/core/block.h
+++ b/be/src/vec/core/block.h
@@ -357,6 +357,29 @@ class MutableBlock {
 
     DataTypes& data_types() { return _data_types; }
 
+    MutableColumnPtr& get_column_by_position(size_t position) { return _columns[position]; }
+    const MutableColumnPtr& get_column_by_position(size_t position) const { return _columns[position]; }
+
+    DataTypePtr& get_datatype_by_position(size_t position) { return _data_types[position]; }
+    const DataTypePtr& get_datatype_by_position(size_t position) const { return _data_types[position]; }
+
+    int compare_at(size_t n, size_t m, size_t num_columns, const MutableBlock& rhs,
+                   int nan_direction_hint) const {
+        DCHECK_GE(columns(), num_columns);
+        DCHECK_GE(rhs.columns(), num_columns);
+
+        DCHECK_LE(n, rows());
+        DCHECK_LE(m, rhs.rows());
+        for (size_t i = 0; i < num_columns; ++i) {
+            DCHECK(get_datatype_by_position(i)->equals(*rhs.get_datatype_by_position(i)));
+            auto res = get_column_by_position(i)->compare_at(n, m, *(rhs.get_column_by_position(i)),
+                                                             nan_direction_hint);
+            if (res) {
+                return res;
+            }
+        }
+        return 0;
+    }
     template <typename T>
     void merge(T&& block) {
         if (_columns.size() == 0 && _data_types.size() == 0) {
@@ -400,6 +423,7 @@ class MutableBlock {
 
     void add_row(const Block* block, int row);
     void add_rows(const Block* block, const int* row_begin, const int* row_end);
+    void add_rows(const Block* block, size_t row_begin, size_t length);
 
     std::string dump_data(size_t row_limit = 100) const;
 
@@ -407,6 +431,7 @@ class MutableBlock {
         _columns.clear();
         _data_types.clear();
     }
+    size_t allocated_bytes() const;
 };
 
 } // namespace vectorized
diff --git a/be/src/vec/exec/vbroker_scan_node.cpp b/be/src/vec/exec/vbroker_scan_node.cpp
new file mode 100644
index 00000000000000..e183cdd06c6e52
--- /dev/null
+++ b/be/src/vec/exec/vbroker_scan_node.cpp
@@ -0,0 +1,228 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+#include "vec/exec/vbroker_scan_node.h"
+
+#include "gen_cpp/PlanNodes_types.h"
+#include "runtime/runtime_state.h"
+#include "runtime/string_value.h"
+#include "runtime/tuple.h"
+#include "runtime/tuple_row.h"
+#include "runtime/mem_tracker.h"
+#include "util/runtime_profile.h"
+#include "util/types.h"
+#include "vec/exprs/vexpr_context.h"
+
+namespace doris::vectorized {
+
+VBrokerScanNode::VBrokerScanNode(ObjectPool* pool, const TPlanNode& tnode,
+                                 const DescriptorTbl& descs)
+        : BrokerScanNode(pool, tnode, descs) {
+    _vectorized = true;
+}
+
+Status VBrokerScanNode::start_scanners() {
+    {
+        std::unique_lock<std::mutex> l(_batch_queue_lock);
+        _num_running_scanners = 1;
+    }
+    _scanner_threads.emplace_back(&VBrokerScanNode::scanner_worker, this, 0, _scan_ranges.size());
+    return Status::OK();
+}
+
+Status VBrokerScanNode::get_next(RuntimeState* state, vectorized::Block* block, bool* eos) {
+    SCOPED_TIMER(_runtime_profile->total_time_counter());
+    // check if CANCELLED.
+    if (state->is_cancelled()) {
+        std::unique_lock<std::mutex> l(_batch_queue_lock);
+        if (update_status(Status::Cancelled("Cancelled"))) {
+            // Notify all scanners
+            _queue_writer_cond.notify_all();
+        }
+    }
+
+    if (_scan_finished.load()) {
+        *eos = true;
+        return Status::OK();
+    }
+
+    std::shared_ptr<vectorized::Block> scanner_block;
+    {
+        std::unique_lock<std::mutex> l(_batch_queue_lock);
+        while (_process_status.ok() && !_runtime_state->is_cancelled() &&
+               _num_running_scanners > 0 && _block_queue.empty()) {
+            SCOPED_TIMER(_wait_scanner_timer);
+            _queue_reader_cond.wait_for(l, std::chrono::seconds(1));
+        }
+        if (!_process_status.ok()) {
+            // Some scanner process failed.
+            return _process_status;
+        }
+        if (_runtime_state->is_cancelled()) {
+            if (update_status(Status::Cancelled("Cancelled"))) {
+                _queue_writer_cond.notify_all();
+            }
+            return _process_status;
+        }
+        if (!_block_queue.empty()) {
+            scanner_block = _block_queue.front();
+            _block_queue.pop_front();
+        }
+    }
+
+    // All scanner has been finished, and all cached batch has been read
+    if (scanner_block == nullptr) {
+        _scan_finished.store(true);
+        *eos = true;
+        return Status::OK();
+    }
+
+    // notify one scanner
+    _queue_writer_cond.notify_one();
+
+    reached_limit(scanner_block.get(), eos);
+    *block = *scanner_block;
+
+    if (*eos) {
+        _scan_finished.store(true);
+        _queue_writer_cond.notify_all();
+        LOG(INFO) << "VBrokerScanNode ReachedLimit.";
+    } else {
+        *eos = false;
+    }
+
+    return Status::OK();
+}
+
+Status VBrokerScanNode::close(RuntimeState* state) {
+    auto status = BrokerScanNode::close(state);
+    _block_queue.clear();
+    return status;
+}
+
+Status VBrokerScanNode::scanner_scan(const TBrokerScanRange& scan_range,
+                                     ScannerCounter* counter) {
+    //create scanner object and open
+    std::unique_ptr<BaseScanner> scanner = create_scanner(scan_range, counter);
+    RETURN_IF_ERROR(scanner->open());
+    bool scanner_eof = false;
+
+    const int batch_size = _runtime_state->batch_size();
+    size_t slot_num = _tuple_desc->slots().size();
+
+    while (!scanner_eof) {
+        std::shared_ptr<vectorized::Block> block(new vectorized::Block());
+        std::vector<vectorized::MutableColumnPtr> columns(slot_num);
+        for (int i = 0; i < slot_num; i++) {
+            columns[i] = _tuple_desc->slots()[i]->get_empty_mutable_column();
+        }
+
+        while (columns[0]->size() < batch_size && !scanner_eof) {
+            RETURN_IF_CANCELLED(_runtime_state);
+            // If we have finished all works
+            if (_scan_finished.load()) {
+                return Status::OK();
+            }
+
+            RETURN_IF_ERROR(scanner->get_next(columns, &scanner_eof));
+            if (scanner_eof) {
+                break;
+            }
+        }
+
+        if (!columns[0]->empty()) {
+            auto n_columns = 0;
+            for (const auto slot_desc : _tuple_desc->slots()) {
+                block->insert(ColumnWithTypeAndName(std::move(columns[n_columns++]),
+                                                    slot_desc->get_data_type_ptr(),
+                                                    slot_desc->col_name()));
+            }
+
+            auto old_rows = block->rows();
+
+            RETURN_IF_ERROR(VExprContext::filter_block(_vconjunct_ctx_ptr, block.get(),
+                                                       _tuple_desc->slots().size()));
+
+            counter->num_rows_unselected += old_rows - block->rows();
+
+            std::unique_lock<std::mutex> l(_batch_queue_lock);
+            while (_process_status.ok() && !_scan_finished.load() &&
+                   !_runtime_state->is_cancelled() &&
+                   // stop pushing more batch if
+                   // 1. too many batches in queue, or
+                   // 2. at least one batch in queue and memory exceed limit.
+                   (_block_queue.size() >= _max_buffered_batches ||
+                    (mem_tracker()->any_limit_exceeded() && !_block_queue.empty()))) {
+                _queue_writer_cond.wait_for(l, std::chrono::seconds(1));
+            }
+            // Process already set failed, so we just return OK
+            if (!_process_status.ok()) {
+                return Status::OK();
+            }
+            // Scan already finished, just return
+            if (_scan_finished.load()) {
+                return Status::OK();
+            }
+            // Runtime state is canceled, just return cancel
+            if (_runtime_state->is_cancelled()) {
+                return Status::Cancelled("Cancelled");
+            }
+            // Queue size Must be smaller than _max_buffered_batches
+            _block_queue.push_back(block);
+
+            // Notify reader to
+            _queue_reader_cond.notify_one();
+        }
+    }
+
+    return Status::OK();
+}
+
+void VBrokerScanNode::scanner_worker(int start_idx, int length) {
+    Status status = Status::OK();
+    ScannerCounter counter;
+    for (int i = 0; i < length && status.ok(); ++i) {
+        const TBrokerScanRange& scan_range =
+                _scan_ranges[start_idx + i].scan_range.broker_scan_range;
+        status = scanner_scan(scan_range, &counter);
+        if (!status.ok()) {
+            LOG(WARNING) << "Scanner[" << start_idx + i
+                         << "] process failed. status=" << status.get_error_msg();
+        }
+    }
+
+    // Update stats
+    _runtime_state->update_num_rows_load_filtered(counter.num_rows_filtered);
+    _runtime_state->update_num_rows_load_unselected(counter.num_rows_unselected);
+
+    // scanner is going to finish
+    {
+        std::lock_guard<std::mutex> l(_batch_queue_lock);
+        if (!status.ok()) {
+            update_status(status);
+        }
+        // This scanner will finish
+        _num_running_scanners--;
+    }
+    _queue_reader_cond.notify_all();
+    // If one scanner failed, others don't need scan any more
+    if (!status.ok()) {
+        _queue_writer_cond.notify_all();
+    }
+}
+
+}
\ No newline at end of file
diff --git a/be/src/vec/exec/vbroker_scan_node.h b/be/src/vec/exec/vbroker_scan_node.h
new file mode 100644
index 00000000000000..1a1b8eb4e07b1d
--- /dev/null
+++ b/be/src/vec/exec/vbroker_scan_node.h
@@ -0,0 +1,52 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+#pragma once
+
+#include <memory>
+
+#include "exec/broker_scan_node.h"
+#include "exec/scan_node.h"
+#include "runtime/descriptors.h"
+namespace doris {
+
+class RuntimeState;
+class Status;
+
+namespace vectorized {
+class VBrokerScanNode final : public BrokerScanNode {
+public:
+    VBrokerScanNode(ObjectPool* pool, const TPlanNode& tnode, const DescriptorTbl& descs);
+    ~VBrokerScanNode() override = default;
+
+    Status get_next(RuntimeState* state, vectorized::Block* block, bool* eos) override;
+
+    // Close the scanner, and report errors.
+    Status close(RuntimeState* state) override;
+
+private:
+    Status start_scanners() override;
+
+    void scanner_worker(int start_idx, int length);
+    // Scan one range
+    Status scanner_scan(const TBrokerScanRange& scan_range,
+                        ScannerCounter* counter);
+
+    std::deque<std::shared_ptr<vectorized::Block>> _block_queue;
+};
+} // namespace vectorized
+} // namespace doris
\ No newline at end of file
diff --git a/be/src/vec/exec/vbroker_scanner.cpp b/be/src/vec/exec/vbroker_scanner.cpp
new file mode 100644
index 00000000000000..3a7988185863d4
--- /dev/null
+++ b/be/src/vec/exec/vbroker_scanner.cpp
@@ -0,0 +1,293 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+#include "vec/exec/vbroker_scanner.h"
+
+#include <fmt/format.h>
+#include <iostream>
+#include <sstream>
+
+#include "exec/exec_node.h"
+#include "exprs/expr_context.h"
+#include "exec/plain_text_line_reader.h"
+
+namespace doris::vectorized {
+VBrokerScanner::VBrokerScanner(RuntimeState* state, RuntimeProfile* profile,
+                             const TBrokerScanRangeParams& params,
+                             const std::vector<TBrokerRangeDesc>& ranges,
+                             const std::vector<TNetworkAddress>& broker_addresses,
+                             const std::vector<TExpr>& pre_filter_texprs,
+                             ScannerCounter* counter)
+        : BrokerScanner(state, profile, params, ranges, broker_addresses, pre_filter_texprs, counter) {
+
+}
+
+Status VBrokerScanner::get_next(std::vector<MutableColumnPtr>& columns, bool* eof) {
+    SCOPED_TIMER(_read_timer);
+
+    const int batch_size = _state->batch_size();
+
+    // Get one line
+    while (columns[0]->size() < batch_size && !_scanner_eof) {
+        if (_cur_line_reader == nullptr || _cur_line_reader_eof) {
+            RETURN_IF_ERROR(open_next_reader());
+            // If there isn't any more reader, break this
+            if (_scanner_eof) {
+                continue;
+            }
+        }
+        const uint8_t* ptr = nullptr;
+        size_t size = 0;
+        RETURN_IF_ERROR(_cur_line_reader->read_line(&ptr, &size, &_cur_line_reader_eof));
+        if (_skip_lines > 0) {
+            _skip_lines--;
+            continue;
+        }
+        if (size == 0) {
+            // Read empty row, just continue
+            continue;
+        }
+        {
+            COUNTER_UPDATE(_rows_read_counter, 1);
+            SCOPED_TIMER(_materialize_timer);
+            RETURN_IF_ERROR(_convert_one_row(Slice(ptr, size), columns));
+            if (_success) {
+                free_expr_local_allocations();
+            }
+        }
+    }
+    if (_scanner_eof) {
+        *eof = true;
+    } else {
+        *eof = false;
+    }
+    return Status::OK();
+}
+
+Status VBrokerScanner::_convert_one_row(const Slice& line, std::vector<MutableColumnPtr>& columns) {
+    RETURN_IF_ERROR(_line_to_src_tuple(line));
+    if (!_success) {
+        // If not success, which means we met an invalid row, return.
+        return Status::OK();
+    }
+
+    return _fill_dest_columns(columns);
+}
+
+Status VBrokerScanner::_fill_dest_columns(std::vector<MutableColumnPtr>& columns) {
+    // filter src tuple by preceding filter first
+    if (!ExecNode::eval_conjuncts(&_pre_filter_ctxs[0], _pre_filter_ctxs.size(), _src_tuple_row)) {
+        _counter->num_rows_unselected++;
+        _success = false;
+        return Status::OK();
+    }
+    // convert and fill dest tuple
+    int ctx_idx = 0;
+    for (auto slot_desc : _dest_tuple_desc->slots()) {
+        if (!slot_desc->is_materialized()) {
+            continue;
+        }
+
+        int dest_index = ctx_idx++;
+        auto* column_ptr = columns[dest_index].get();
+
+        ExprContext* ctx = _dest_expr_ctx[dest_index];
+        void* value = ctx->get_value(_src_tuple_row);
+        if (value == nullptr) {
+            // Only when the expr return value is null, we will check the error message.
+            std::string expr_error = ctx->get_error_msg();
+            if (!expr_error.empty()) {
+                RETURN_IF_ERROR(_state->append_error_msg_to_file(
+                        [&]() -> std::string {
+                            return _src_tuple_row->to_string(*(_row_desc.get()));
+                        },
+                        [&]() -> std::string { return expr_error; }, &_scanner_eof));
+                _counter->num_rows_filtered++;
+                // The ctx is reused, so must clear the error state and message.
+                ctx->clear_error_msg();
+                _success = false;
+                return Status::OK();
+            }
+            // If _strict_mode is false, _src_slot_descs_order_by_dest size could be zero
+            if (_strict_mode && (_src_slot_descs_order_by_dest[dest_index] != nullptr) &&
+                !_src_tuple->is_null(
+                        _src_slot_descs_order_by_dest[dest_index]->null_indicator_offset())) {
+                RETURN_IF_ERROR(_state->append_error_msg_to_file(
+                        [&]() -> std::string {
+                            return _src_tuple_row->to_string(*(_row_desc.get()));
+                        },
+                        [&]() -> std::string {
+                            // Type of the slot is must be Varchar in _src_tuple.
+                            StringValue* raw_value = _src_tuple->get_string_slot(
+                                    _src_slot_descs_order_by_dest[dest_index]->tuple_offset());
+                            std::string raw_string;
+                            if (raw_value != nullptr) { //is not null then get raw value
+                                raw_string = raw_value->to_string();
+                            }
+                            fmt::memory_buffer error_msg;
+                            fmt::format_to(error_msg,
+                                           "column({}) value is incorrect while strict mode is {}, "
+                                           "src value is {}",
+                                           slot_desc->col_name(), _strict_mode, raw_string);
+                            return error_msg.data();
+                        },
+                        &_scanner_eof));
+                _counter->num_rows_filtered++;
+                _success = false;
+                return Status::OK();
+            }
+            if (!slot_desc->is_nullable()) {
+                RETURN_IF_ERROR(_state->append_error_msg_to_file(
+                        [&]() -> std::string {
+                            return _src_tuple_row->to_string(*(_row_desc.get()));
+                        },
+                        [&]() -> std::string {
+                            fmt::memory_buffer error_msg;
+                            fmt::format_to(
+                                    error_msg,
+                                    "column({}) values is null while columns is not nullable",
+                                    slot_desc->col_name());
+                            return error_msg.data();
+                        },
+                        &_scanner_eof));
+                _counter->num_rows_filtered++;
+                _success = false;
+                return Status::OK();
+            }
+            auto* nullable_column =
+                    reinterpret_cast<vectorized::ColumnNullable*>(column_ptr);
+            nullable_column->insert_data(nullptr, 0);
+            continue;
+        }
+        if (slot_desc->is_nullable()) {
+            auto* nullable_column =
+                    reinterpret_cast<vectorized::ColumnNullable*>(column_ptr);
+            nullable_column->get_null_map_data().push_back(0);
+            column_ptr = &nullable_column->get_nested_column();
+        }
+        char* value_ptr = (char*)value;
+        switch (slot_desc->type().type) {
+        case TYPE_BOOLEAN: {
+            assert_cast<ColumnVector<UInt8>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_TINYINT: {
+            assert_cast<ColumnVector<Int8>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_SMALLINT: {
+            assert_cast<ColumnVector<Int16>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_INT: {
+            assert_cast<ColumnVector<Int32>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_BIGINT: {
+            assert_cast<ColumnVector<Int64>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_LARGEINT: {
+            assert_cast<ColumnVector<Int128>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_FLOAT: {
+            assert_cast<ColumnVector<Float32>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_DOUBLE: {
+            assert_cast<ColumnVector<Float64>*>(column_ptr)->insert_data(value_ptr, 0);
+            break;
+        }
+        case TYPE_CHAR: {
+            Slice* slice = reinterpret_cast<Slice*>(value_ptr);
+            assert_cast<ColumnString*>(column_ptr)
+                    ->insert_data(slice->data, strnlen(slice->data, slice->size));
+            break;
+        }
+        case TYPE_VARCHAR:
+        case TYPE_STRING: {
+            Slice* slice = reinterpret_cast<Slice*>(value_ptr);
+            assert_cast<ColumnString*>(column_ptr)->insert_data(slice->data, slice->size);
+            break;
+        }
+        case TYPE_OBJECT: {
+            Slice* slice = reinterpret_cast<Slice*>(value_ptr);
+            // insert_default()
+            auto* target_column = assert_cast<ColumnBitmap*>(column_ptr);
+
+            target_column->insert_default();
+            BitmapValue* pvalue = nullptr;
+            int pos = target_column->size() - 1;
+            pvalue = &target_column->get_element(pos);
+
+            if (slice->size != 0) {
+                BitmapValue value;
+                value.deserialize(slice->data);
+                *pvalue = std::move(value);
+            } else {
+                *pvalue = std::move(*reinterpret_cast<BitmapValue*>(slice->data));
+            }
+            break;
+        }
+        case TYPE_HLL: {
+            Slice* slice = reinterpret_cast<Slice*>(value_ptr);
+            auto* target_column = assert_cast<ColumnHLL*>(column_ptr);
+
+            target_column->insert_default();
+            HyperLogLog* pvalue = nullptr;
+            int pos = target_column->size() - 1;
+            pvalue = &target_column->get_element(pos);
+            if (slice->size != 0) {
+                HyperLogLog value;
+                value.deserialize(*slice);
+                *pvalue = std::move(value);
+            } else {
+                *pvalue = std::move(*reinterpret_cast<HyperLogLog*>(slice->data));
+            }
+            break;
+        }
+        case TYPE_DECIMALV2: {
+            assert_cast<ColumnDecimal<Decimal128>*>(column_ptr)
+                    ->insert_data(reinterpret_cast<char*>(value_ptr), 0);
+            break;
+        }
+        case TYPE_DATETIME: {
+            DateTimeValue value = *reinterpret_cast<DateTimeValue*>(value_ptr);
+            VecDateTimeValue date;
+            date.convert_dt_to_vec_dt(&value);
+            assert_cast<ColumnVector<Int64>*>(column_ptr)
+                    ->insert_data(reinterpret_cast<char*>(&date), 0);
+            break;
+        }
+        case TYPE_DATE: {
+            DateTimeValue value = *reinterpret_cast<DateTimeValue*>(value_ptr);
+            VecDateTimeValue date;
+            date.convert_dt_to_vec_dt(&value);
+            assert_cast<ColumnVector<Int64>*>(column_ptr)
+                    ->insert_data(reinterpret_cast<char*>(&date), 0);
+            break;
+        }
+        default: {
+            break;
+        }
+        }
+    }
+    _success = true;
+    return Status::OK();
+}
+} // namespace doris::vectorized
diff --git a/be/src/vec/exec/vbroker_scanner.h b/be/src/vec/exec/vbroker_scanner.h
new file mode 100644
index 00000000000000..89d077168f4cb4
--- /dev/null
+++ b/be/src/vec/exec/vbroker_scanner.h
@@ -0,0 +1,39 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+#pragma once
+
+#include <exec/broker_scanner.h>
+
+
+namespace doris::vectorized {
+class VBrokerScanner final : public BrokerScanner {
+public:
+    VBrokerScanner(RuntimeState* state, RuntimeProfile* profile,
+                  const TBrokerScanRangeParams& params, const std::vector<TBrokerRangeDesc>& ranges,
+                  const std::vector<TNetworkAddress>& broker_addresses,
+                  const std::vector<TExpr>& pre_filter_texprs, ScannerCounter* counter);
+    ~VBrokerScanner() override = default;
+
+    Status get_next(std::vector<MutableColumnPtr>& columns, bool* eof) override;
+
+private:
+    Status _convert_one_row(const Slice& line, std::vector<MutableColumnPtr>& columns);
+    Status _fill_dest_columns(std::vector<MutableColumnPtr>& columns);
+
+};
+} // namespace doris::vectorized
\ No newline at end of file
diff --git a/be/src/vec/exprs/vexpr_context.cpp b/be/src/vec/exprs/vexpr_context.cpp
index 06d3d2f2bef543..6615e0ff8c56ae 100644
--- a/be/src/vec/exprs/vexpr_context.cpp
+++ b/be/src/vec/exprs/vexpr_context.cpp
@@ -68,6 +68,7 @@ void VExprContext::close(doris::RuntimeState* state) {
 
     for (int i = 0; i < _fn_contexts.size(); ++i) {
         _fn_contexts[i]->impl()->close();
+        delete _fn_contexts[i];
     }
     // _pool can be NULL if Prepare() was never called
     if (_pool != NULL) {
diff --git a/be/src/vec/olap/block_reader.cpp b/be/src/vec/olap/block_reader.cpp
index 8ad582129e1f2c..73d71a84575449 100644
--- a/be/src/vec/olap/block_reader.cpp
+++ b/be/src/vec/olap/block_reader.cpp
@@ -91,7 +91,7 @@ void BlockReader::_init_agg_state(const ReaderParams& read_params) {
                         .column(read_params.origin_return_columns->at(_return_columns_loc[idx]))
                         .aggregation();
         std::string agg_name =
-                TabletColumn::get_string_by_aggregation_type(agg_method) + agg_reader_suffix;
+                TabletColumn::get_string_by_aggregation_type(agg_method) + AGG_READER_SUFFIX;
         std::transform(agg_name.begin(), agg_name.end(), agg_name.begin(),
                        [](unsigned char c) { return std::tolower(c); });
 
diff --git a/be/src/vec/olap/olap_data_convertor.cpp b/be/src/vec/olap/olap_data_convertor.cpp
new file mode 100644
index 00000000000000..60505252c1bda2
--- /dev/null
+++ b/be/src/vec/olap/olap_data_convertor.cpp
@@ -0,0 +1,684 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+#include "vec/olap/olap_data_convertor.h"
+
+#include "vec/columns/column_complex.h"
+#include "vec/columns/column_vector.h"
+
+namespace doris::vectorized {
+
+// class OlapBlockDataConvertor
+OlapBlockDataConvertor::OlapBlockDataConvertor(const TabletSchema* tablet_schema) {
+    assert(tablet_schema);
+    const auto& columns = tablet_schema->columns();
+    for (const auto& col : columns) {
+        switch (col.type()) {
+        case FieldType::OLAP_FIELD_TYPE_OBJECT: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorBitMap>());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_HLL: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorHLL>());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_CHAR: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorChar>(col.length()));
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_MAP:
+        case FieldType::OLAP_FIELD_TYPE_VARCHAR: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorVarChar>(false));
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_STRING: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorVarChar>(true));
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_DATE: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorDate>());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_DATETIME: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorDateTime>());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_DECIMAL: {
+            _convertors.emplace_back(std::make_shared<OlapColumnDataConvertorDecimal>());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_BOOL: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::UInt8> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_TINYINT: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Int8> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_SMALLINT: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Int16> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_INT: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Int32> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_BIGINT: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Int64> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_LARGEINT: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Int128> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_FLOAT: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Float32> >());
+            break;
+        }
+        case FieldType::OLAP_FIELD_TYPE_DOUBLE: {
+            _convertors.emplace_back(
+                    std::make_shared<OlapColumnDataConvertorSimple<vectorized::Float64> >());
+            break;
+        }
+        default: {
+            DCHECK(false) << "Invalid type in RowBlockV2:" << col.type();
+        }
+        }
+    }
+}
+
+void OlapBlockDataConvertor::set_source_content(const vectorized::Block* block, size_t row_pos,
+                                                size_t num_rows) {
+    assert(block && num_rows > 0 && row_pos + num_rows <= block->rows() &&
+           block->columns() == _convertors.size());
+    size_t cid = 0;
+    for (const auto& typed_column : *block) {
+        _convertors[cid]->set_source_column(typed_column, row_pos, num_rows);
+        ++cid;
+    }
+}
+
+void OlapBlockDataConvertor::clear_source_content() {
+    for (auto& convertor : _convertors) {
+        convertor->clear_source_column();
+    }
+}
+
+std::pair<Status, IOlapColumnDataAccessorSPtr> OlapBlockDataConvertor::convert_column_data(
+        size_t cid) {
+    assert(cid < _convertors.size());
+    auto status = _convertors[cid]->convert_to_olap();
+    return {status, _convertors[cid]};
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorBase
+void OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    assert(num_rows > 0 && row_pos + num_rows <= typed_column.column->size());
+    _typed_column = typed_column;
+    _row_pos = row_pos;
+    _num_rows = num_rows;
+    if (_typed_column.column->is_nullable()) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        _nullmap = nullable_column->get_null_map_data().data();
+    }
+}
+
+void OlapBlockDataConvertor::OlapColumnDataConvertorBase::clear_source_column() {
+    // just to reduce the source column's ref count to 1
+    _typed_column.column = nullptr;
+}
+
+const UInt8* OlapBlockDataConvertor::OlapColumnDataConvertorBase::get_nullmap() const {
+    assert(_typed_column.column);
+    return _nullmap;
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorObject
+void OlapBlockDataConvertor::OlapColumnDataConvertorObject::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(typed_column, row_pos,
+                                                                           num_rows);
+    _raw_data.clear();
+    _slice.resize(num_rows);
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorObject::get_data() const {
+    return _slice.data();
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorObject::get_data_at(
+        size_t offset) const {
+    assert(offset < _num_rows && _num_rows == _slice.size());
+    UInt8 null_flag = 0;
+    if (_nullmap) {
+        null_flag = _nullmap[offset];
+    }
+    return null_flag ? nullptr : _slice.data() + offset;
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorBitMap::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnBitmap* column_bitmap = nullptr;
+    if (_nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_bitmap = assert_cast<const vectorized::ColumnBitmap*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_bitmap = assert_cast<const vectorized::ColumnBitmap*>(_typed_column.column.get());
+    }
+
+    assert(column_bitmap);
+    BitmapValue* bitmap_value_cur =
+            const_cast<BitmapValue*>(column_bitmap->get_data().data() + _row_pos);
+    BitmapValue* bitmap_value_end = bitmap_value_cur + _num_rows;
+    size_t slice_size;
+    size_t old_size;
+    char* raw_data;
+    Slice* slice = _slice.data();
+    if (_nullmap) {
+        const UInt8* nullmap_cur = _nullmap + _row_pos;
+        while (bitmap_value_cur != bitmap_value_end) {
+            if (!*nullmap_cur) {
+                slice_size = bitmap_value_cur->getSizeInBytes();
+                old_size = _raw_data.size();
+                _raw_data.resize(old_size + slice_size);
+
+                raw_data = _raw_data.data() + old_size;
+                bitmap_value_cur->write(raw_data);
+
+                slice->data = raw_data;
+                slice->size = slice_size;
+            } else {
+                // TODO: this may not be neccessary, check and remove later
+                slice->data = nullptr;
+                slice->size = 0;
+            }
+            ++slice;
+            ++nullmap_cur;
+            ++bitmap_value_cur;
+        }
+        assert(nullmap_cur == _nullmap + _row_pos + _num_rows && slice == _slice.get_end_ptr());
+    } else {
+        while (bitmap_value_cur != bitmap_value_end) {
+            slice_size = bitmap_value_cur->getSizeInBytes();
+            old_size = _raw_data.size();
+            _raw_data.resize(old_size + slice_size);
+
+            raw_data = _raw_data.data() + old_size;
+            bitmap_value_cur->write(raw_data);
+
+            slice->data = raw_data;
+            slice->size = slice_size;
+
+            ++slice;
+            ++bitmap_value_cur;
+        }
+        assert(slice == _slice.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorHLL::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnHLL* column_hll = nullptr;
+    const UInt8* nullmap = get_nullmap();
+    if (nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_hll = assert_cast<const vectorized::ColumnHLL*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_hll = assert_cast<const vectorized::ColumnHLL*>(_typed_column.column.get());
+    }
+
+    assert(column_hll);
+    HyperLogLog* hll_value_cur =
+            const_cast<HyperLogLog*>(column_hll->get_data().data() + _row_pos);
+    HyperLogLog* hll_value_end = hll_value_cur + _num_rows;
+    size_t slice_size;
+    size_t old_size;
+    char* raw_data;
+    Slice* slice = _slice.data();
+    if (nullmap) {
+        const UInt8* nullmap_cur = nullmap + _row_pos;
+        while (hll_value_cur != hll_value_end) {
+            if (!*nullmap_cur) {
+                slice_size = hll_value_cur->max_serialized_size();
+                old_size = _raw_data.size();
+                _raw_data.resize(old_size + slice_size);
+
+                raw_data = _raw_data.data() + old_size;
+                slice_size = hll_value_cur->serialize((uint8_t*)raw_data);
+                _raw_data.resize(old_size + slice_size);
+
+                slice->data = raw_data;
+                slice->size = slice_size;
+            } else {
+                // TODO: this may not be neccessary, check and remove later
+                slice->data = nullptr;
+                slice->size = 0;
+            }
+            ++slice;
+            ++nullmap_cur;
+            ++hll_value_cur;
+        }
+        assert(nullmap_cur == nullmap + _row_pos + _num_rows && slice == _slice.get_end_ptr());
+    } else {
+        while (hll_value_cur != hll_value_end) {
+            slice_size = hll_value_cur->max_serialized_size();
+            old_size = _raw_data.size();
+            _raw_data.resize(old_size + slice_size);
+
+            raw_data = _raw_data.data() + old_size;
+            slice_size = hll_value_cur->serialize((uint8_t*)raw_data);
+            _raw_data.resize(old_size + slice_size);
+
+            slice->data = raw_data;
+            slice->size = slice_size;
+
+            ++slice;
+            ++hll_value_cur;
+        }
+        assert(slice == _slice.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorChar
+OlapBlockDataConvertor::OlapColumnDataConvertorChar::OlapColumnDataConvertorChar(size_t length)
+        : _length(length) {
+    assert(length > 0);
+}
+
+void OlapBlockDataConvertor::OlapColumnDataConvertorChar::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(typed_column, row_pos,
+                                                                           num_rows);
+    _raw_data.resize(_length * num_rows);
+    memset(_raw_data.data(), 0, _length * num_rows);
+    _slice.resize(num_rows);
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorChar::get_data() const {
+    return _slice.data();
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorChar::get_data_at(
+        size_t offset) const {
+    assert(offset < _num_rows && _num_rows == _slice.size());
+    UInt8 null_flag = 0;
+    if (_nullmap) {
+        null_flag = _nullmap[offset];
+    }
+    return null_flag ? nullptr : _slice.data() + offset;
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorChar::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnString* column_string = nullptr;
+    if (_nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_string = assert_cast<const vectorized::ColumnString*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_string = assert_cast<const vectorized::ColumnString*>(_typed_column.column.get());
+    }
+
+    assert(column_string);
+
+    const ColumnString::Char* char_data = column_string->get_chars().data();
+    const ColumnString::Offset* offset_cur = column_string->get_offsets().data() + _row_pos;
+    const ColumnString::Offset* offset_end = offset_cur + _num_rows;
+    char* raw_data = _raw_data.data();
+    Slice* slice = _slice.data();
+    size_t string_length;
+    size_t string_offset = *(offset_cur - 1);
+    size_t slice_size = _length;
+    if (_nullmap) {
+        const UInt8* nullmap_cur = _nullmap + _row_pos;
+        while (offset_cur != offset_end) {
+            if (!*nullmap_cur) {
+                string_length = *offset_cur - string_offset - 1;
+                assert(string_length <= slice_size);
+                memcpy(raw_data, char_data + string_offset, string_length);
+
+                slice->data = raw_data;
+                slice->size = slice_size;
+            } else {
+                // TODO: this may not be neccessary, check and remove later
+                slice->data = nullptr;
+                slice->size = 0;
+            }
+
+            string_offset = *offset_cur;
+            ++nullmap_cur;
+            ++slice;
+            ++offset_cur;
+            raw_data += slice_size;
+        }
+        assert(nullmap_cur == _nullmap + _row_pos + _num_rows && slice == _slice.get_end_ptr());
+    } else {
+        while (offset_cur != offset_end) {
+            string_length = *offset_cur - string_offset - 1;
+            assert(string_length <= slice_size);
+            memcpy(raw_data, char_data + string_offset, string_length);
+
+            slice->data = raw_data;
+            slice->size = slice_size;
+
+            string_offset = *offset_cur;
+            ++slice;
+            ++offset_cur;
+            raw_data += slice_size;
+        }
+        assert(slice == _slice.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorVarChar
+OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::OlapColumnDataConvertorVarChar(
+        bool check_length)
+        : _check_length(check_length) {}
+
+void OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(typed_column, row_pos,
+                                                                           num_rows);
+    _slice.resize(num_rows);
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::get_data() const {
+    return _slice.data();
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::get_data_at(
+        size_t offset) const {
+    assert(offset < _num_rows && _num_rows == _slice.size());
+    UInt8 null_flag = 0;
+    if (_nullmap) {
+        null_flag = _nullmap[offset];
+    }
+    return null_flag ? nullptr : _slice.data() + offset;
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnString* column_string = nullptr;
+    if (_nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_string = assert_cast<const vectorized::ColumnString*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_string = assert_cast<const vectorized::ColumnString*>(_typed_column.column.get());
+    }
+
+    assert(column_string);
+
+    const char* char_data = (const char*)(column_string->get_chars().data());
+    const ColumnString::Offset* offset_cur = column_string->get_offsets().data() + _row_pos;
+    const ColumnString::Offset* offset_end = offset_cur + _num_rows;
+
+    Slice* slice = _slice.data();
+    size_t string_offset = *(offset_cur - 1);
+    if (_nullmap) {
+        const UInt8* nullmap_cur = _nullmap + _row_pos;
+        while (offset_cur != offset_end) {
+            if (!*nullmap_cur) {
+                slice->data = const_cast<char*>(char_data + string_offset);
+                slice->size = *offset_cur - string_offset - 1;
+                if (UNLIKELY(slice->size > MAX_SIZE_OF_VEC_STRING && _check_length)) {
+                    return Status::NotSupported(
+                            "Not support string len over than 1MB in vec engine.");
+                }
+            } else {
+                // TODO: this may not be neccessary, check and remove later
+                slice->data = nullptr;
+                slice->size = 0;
+            }
+            string_offset = *offset_cur;
+            ++nullmap_cur;
+            ++slice;
+            ++offset_cur;
+        }
+        assert(nullmap_cur == _nullmap + _row_pos + _num_rows && slice == _slice.get_end_ptr());
+    } else {
+        while (offset_cur != offset_end) {
+            slice->data = const_cast<char*>(char_data + string_offset);
+            slice->size = *offset_cur - string_offset - 1;
+            if (UNLIKELY(slice->size > MAX_SIZE_OF_VEC_STRING && _check_length)) {
+                return Status::NotSupported("Not support string len over than 1MB in vec engine.");
+            }
+            string_offset = *offset_cur;
+            ++slice;
+            ++offset_cur;
+        }
+        assert(slice == _slice.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorDate
+void OlapBlockDataConvertor::OlapColumnDataConvertorDate::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(typed_column, row_pos,
+                                                                           num_rows);
+    _values.resize(num_rows);
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorDate::get_data() const {
+    return _values.data();
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorDate::get_data_at(
+        size_t offset) const {
+    assert(offset < _num_rows && _num_rows == _values.size());
+    UInt8 null_flag = 0;
+    if (_nullmap) {
+        null_flag = _nullmap[offset];
+    }
+    return null_flag ? nullptr : _values.data() + offset;
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorDate::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnVector<vectorized::Int64>* column_datetime = nullptr;
+    if (_nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_datetime = assert_cast<const vectorized::ColumnVector<vectorized::Int64>*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_datetime = assert_cast<const vectorized::ColumnVector<vectorized::Int64>*>(
+                _typed_column.column.get());
+    }
+
+    assert(column_datetime);
+
+    const VecDateTimeValue* datetime_cur =
+            (const VecDateTimeValue*)(column_datetime->get_data().data()) + _row_pos;
+    const VecDateTimeValue* datetime_end = datetime_cur + _num_rows;
+    uint24_t* value = _values.data();
+    if (_nullmap) {
+        const UInt8* nullmap_cur = _nullmap + _row_pos;
+        while (datetime_cur != datetime_end) {
+            if (!*nullmap_cur) {
+                *value = datetime_cur->to_olap_date();
+            } else {
+                // do nothing
+            }
+            ++value;
+            ++datetime_cur;
+            ++nullmap_cur;
+        }
+        assert(nullmap_cur == _nullmap + _row_pos + _num_rows && value == _values.get_end_ptr());
+    } else {
+        while (datetime_cur != datetime_end) {
+            *value = datetime_cur->to_olap_date();
+            ++value;
+            ++datetime_cur;
+        }
+        assert(value == _values.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorDateTime
+void OlapBlockDataConvertor::OlapColumnDataConvertorDateTime::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(typed_column, row_pos,
+                                                                           num_rows);
+    _values.resize(num_rows);
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorDateTime::get_data() const {
+    return _values.data();
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorDateTime::get_data_at(
+        size_t offset) const {
+    assert(offset < _num_rows && _num_rows == _values.size());
+    UInt8 null_flag = 0;
+    if (_nullmap) {
+        null_flag = _nullmap[offset];
+    }
+    return null_flag ? nullptr : _values.data() + offset;
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorDateTime::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnVector<vectorized::Int64>* column_datetime = nullptr;
+    if (_nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_datetime = assert_cast<const vectorized::ColumnVector<vectorized::Int64>*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_datetime = assert_cast<const vectorized::ColumnVector<vectorized::Int64>*>(
+                _typed_column.column.get());
+    }
+
+    assert(column_datetime);
+
+    const VecDateTimeValue* datetime_cur =
+            (const VecDateTimeValue*)(column_datetime->get_data().data()) + _row_pos;
+    const VecDateTimeValue* datetime_end = datetime_cur + _num_rows;
+    uint64_t* value = _values.data();
+    if (_nullmap) {
+        const UInt8* nullmap_cur = _nullmap + _row_pos;
+        while (datetime_cur != datetime_end) {
+            if (!*nullmap_cur) {
+                *value = datetime_cur->to_olap_datetime();
+            } else {
+                // do nothing
+            }
+            ++value;
+            ++datetime_cur;
+            ++nullmap_cur;
+        }
+        assert(nullmap_cur == _nullmap + _row_pos + _num_rows && value == _values.get_end_ptr());
+    } else {
+        while (datetime_cur != datetime_end) {
+            *value = datetime_cur->to_olap_datetime();
+            ++value;
+            ++datetime_cur;
+        }
+        assert(value == _values.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+// class OlapBlockDataConvertor::OlapColumnDataConvertorDecimal
+void OlapBlockDataConvertor::OlapColumnDataConvertorDecimal::set_source_column(
+        const ColumnWithTypeAndName& typed_column, size_t row_pos, size_t num_rows) {
+    OlapBlockDataConvertor::OlapColumnDataConvertorBase::set_source_column(typed_column, row_pos,
+                                                                           num_rows);
+    _values.resize(num_rows);
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorDecimal::get_data() const {
+    return _values.data();
+}
+
+const void* OlapBlockDataConvertor::OlapColumnDataConvertorDecimal::get_data_at(
+        size_t offset) const {
+    assert(offset < _num_rows && _num_rows == _values.size());
+    UInt8 null_flag = 0;
+    if (_nullmap) {
+        null_flag = _nullmap[offset];
+    }
+    return null_flag ? nullptr : _values.data() + offset;
+}
+
+Status OlapBlockDataConvertor::OlapColumnDataConvertorDecimal::convert_to_olap() {
+    assert(_typed_column.column);
+    const vectorized::ColumnDecimal<vectorized::Decimal128>* column_decimal = nullptr;
+    if (_nullmap) {
+        auto nullable_column =
+                assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+        column_decimal = assert_cast<const vectorized::ColumnDecimal<vectorized::Decimal128>*>(
+                nullable_column->get_nested_column_ptr().get());
+    } else {
+        column_decimal = assert_cast<const vectorized::ColumnDecimal<vectorized::Decimal128>*>(
+                _typed_column.column.get());
+    }
+
+    assert(column_decimal);
+
+    const DecimalV2Value* decimal_cur =
+            (const DecimalV2Value*)(column_decimal->get_data().data()) + _row_pos;
+    const DecimalV2Value* decimal_end = decimal_cur + _num_rows;
+    decimal12_t* value = _values.data();
+    if (_nullmap) {
+        const UInt8* nullmap_cur = _nullmap + _row_pos;
+        while (decimal_cur != decimal_end) {
+            if (!*nullmap_cur) {
+                value->integer = decimal_cur->int_value();
+                value->fraction = decimal_cur->frac_value();
+            } else {
+                // do nothing
+            }
+            ++value;
+            ++decimal_cur;
+            ++nullmap_cur;
+        }
+        assert(nullmap_cur == _nullmap + _row_pos + _num_rows && value == _values.get_end_ptr());
+    } else {
+        while (decimal_cur != decimal_end) {
+            value->integer = decimal_cur->int_value();
+            value->fraction = decimal_cur->frac_value();
+            ++value;
+            ++decimal_cur;
+        }
+        assert(value == _values.get_end_ptr());
+    }
+    return Status::OK();
+}
+
+} // namespace doris::vectorized
\ No newline at end of file
diff --git a/be/src/vec/olap/olap_data_convertor.h b/be/src/vec/olap/olap_data_convertor.h
new file mode 100644
index 00000000000000..5ade3dd0d1ab6b
--- /dev/null
+++ b/be/src/vec/olap/olap_data_convertor.h
@@ -0,0 +1,210 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+
+#pragma once
+#include "olap/tablet_schema.h"
+#include "vec/core/block.h"
+
+namespace doris::vectorized {
+
+class IOlapColumnDataAccessor {
+public:
+    virtual const UInt8* get_nullmap() const = 0;
+    virtual const void* get_data() const = 0;
+    virtual const void* get_data_at(size_t offset) const = 0;
+    virtual ~IOlapColumnDataAccessor() {}
+};
+using IOlapColumnDataAccessorSPtr = std::shared_ptr<IOlapColumnDataAccessor>;
+
+class OlapBlockDataConvertor {
+public:
+    OlapBlockDataConvertor(const TabletSchema* tablet_schema);
+    void set_source_content(const vectorized::Block* block, size_t row_pos, size_t num_rows);
+    void clear_source_content();
+    std::pair<Status, IOlapColumnDataAccessorSPtr> convert_column_data(size_t cid);
+
+private:
+    // accessors for different data types;
+    class OlapColumnDataConvertorBase : public IOlapColumnDataAccessor {
+    public:
+        OlapColumnDataConvertorBase() = default;
+        virtual ~OlapColumnDataConvertorBase() = default;
+        OlapColumnDataConvertorBase(const OlapColumnDataConvertorBase&) = delete;
+        OlapColumnDataConvertorBase& operator=(const OlapColumnDataConvertorBase&) = delete;
+        OlapColumnDataConvertorBase(OlapColumnDataConvertorBase&&) = delete;
+        OlapColumnDataConvertorBase& operator=(OlapColumnDataConvertorBase&&) = delete;
+
+        virtual void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                                       size_t num_rows);
+        void clear_source_column();
+        const UInt8* get_nullmap() const override;
+        virtual Status convert_to_olap() = 0;
+
+    protected:
+        ColumnWithTypeAndName _typed_column;
+        size_t _row_pos = 0;
+        size_t _num_rows = 0;
+        const UInt8* _nullmap = nullptr;
+    };
+    using OlapColumnDataConvertorBaseSPtr = std::shared_ptr<OlapColumnDataConvertorBase>;
+
+    class OlapColumnDataConvertorObject : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorObject() = default;
+        ~OlapColumnDataConvertorObject() override = default;
+
+        void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                               size_t num_rows) override;
+        const void* get_data() const override;
+        const void* get_data_at(size_t offset) const override;
+    protected:
+        PaddedPODArray<Slice> _slice;
+        PaddedPODArray<char> _raw_data;
+    };
+
+    class OlapColumnDataConvertorHLL final : public OlapColumnDataConvertorObject{
+    public:
+        Status convert_to_olap() override;
+    };
+
+    class OlapColumnDataConvertorBitMap final : public OlapColumnDataConvertorObject{
+    public:
+        Status convert_to_olap() override;
+    };
+
+    class OlapColumnDataConvertorChar : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorChar(size_t length);
+        ~OlapColumnDataConvertorChar() override = default;
+
+        void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                               size_t num_rows) override;
+        const void* get_data() const override;
+        const void* get_data_at(size_t offset) const override;
+        Status convert_to_olap() override;
+
+    private:
+        size_t _length;
+        PaddedPODArray<Slice> _slice;
+        PaddedPODArray<char> _raw_data;
+    };
+
+    class OlapColumnDataConvertorVarChar : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorVarChar(bool check_length);
+        ~OlapColumnDataConvertorVarChar() override = default;
+
+        void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                               size_t num_rows) override;
+        const void* get_data() const override;
+        const void* get_data_at(size_t offset) const override;
+        Status convert_to_olap() override;
+
+    private:
+        bool _check_length;
+        PaddedPODArray<Slice> _slice;
+    };
+
+    class OlapColumnDataConvertorDate : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorDate() = default;
+        ~OlapColumnDataConvertorDate() override = default;
+
+        void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                               size_t num_rows) override;
+        const void* get_data() const override;
+        const void* get_data_at(size_t offset) const override;
+        Status convert_to_olap() override;
+
+    private:
+        PaddedPODArray<uint24_t> _values;
+    };
+
+    class OlapColumnDataConvertorDateTime : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorDateTime() = default;
+        ~OlapColumnDataConvertorDateTime() override = default;
+
+        void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                               size_t num_rows) override;
+        const void* get_data() const override;
+        const void* get_data_at(size_t offset) const override;
+        Status convert_to_olap() override;
+
+    private:
+        PaddedPODArray<uint64_t> _values;
+    };
+
+    class OlapColumnDataConvertorDecimal : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorDecimal() = default;
+        ~OlapColumnDataConvertorDecimal() override = default;
+
+        void set_source_column(const ColumnWithTypeAndName& typed_column, size_t row_pos,
+                               size_t num_rows) override;
+        const void* get_data() const override;
+        const void* get_data_at(size_t offset) const override;
+        Status convert_to_olap() override;
+
+    private:
+        PaddedPODArray<decimal12_t> _values;
+    };
+
+    // class OlapColumnDataConvertorSimple for simple types, which don't need to do any convert, like int, float, double, etc...
+    template <typename T>
+    class OlapColumnDataConvertorSimple : public OlapColumnDataConvertorBase {
+    public:
+        OlapColumnDataConvertorSimple() = default;
+        ~OlapColumnDataConvertorSimple() override = default;
+
+        const void* get_data() const override { return _values; }
+
+        const void* get_data_at(size_t offset) const override {
+            assert(offset < _num_rows);
+            UInt8 null_flag = 0;
+            if (_nullmap) {
+                null_flag = _nullmap[offset];
+            }
+            return null_flag ? nullptr : _values + offset;
+        }
+
+        Status convert_to_olap() override {
+            const vectorized::ColumnVector<T>* column_data = nullptr;
+            if (_nullmap) {
+                auto nullable_column =
+                        assert_cast<const vectorized::ColumnNullable*>(_typed_column.column.get());
+                column_data = assert_cast<const vectorized::ColumnVector<T>*>(
+                        nullable_column->get_nested_column_ptr().get());
+            } else {
+                column_data = assert_cast<const vectorized::ColumnVector<T>*>(
+                        _typed_column.column.get());
+            }
+
+            assert(column_data);
+            _values = (const T*)(column_data->get_data().data()) + _row_pos;
+            return Status::OK();
+        }
+
+    private:
+        const T* _values = nullptr;
+    };
+
+private:
+    std::vector<OlapColumnDataConvertorBaseSPtr> _convertors;
+};
+
+} // namespace doris::vectorized
diff --git a/be/src/vec/olap/vcollect_iterator.cpp b/be/src/vec/olap/vcollect_iterator.cpp
index 2f0177892fa455..2124f7a8006092 100644
--- a/be/src/vec/olap/vcollect_iterator.cpp
+++ b/be/src/vec/olap/vcollect_iterator.cpp
@@ -211,8 +211,15 @@ Status VCollectIterator::Level0Iterator::next(IteratorRowRef* ref) {
     return Status::OK();
 }
 
+
 Status VCollectIterator::Level0Iterator::next(Block* block) {
-    return _rs_reader->next_block(block);
+    if (UNLIKELY(_ref.block->rows() > 0 && _ref.row_pos == 0)) {
+        block->swap(*_ref.block);
+        _ref.row_pos = -1;
+        return Status::OK();
+    } else {
+        return _rs_reader->next_block(block);
+    }
 }
 
 VCollectIterator::Level1Iterator::Level1Iterator(
@@ -224,6 +231,7 @@ VCollectIterator::Level1Iterator::Level1Iterator(
           _merge(merge),
           _skip_same(skip_same) {
     _ref.row_pos = -1; // represent eof
+    _batch_size = reader->_batch_size;
 }
 
 VCollectIterator::Level1Iterator::~Level1Iterator() {
@@ -261,7 +269,11 @@ Status VCollectIterator::Level1Iterator::next(Block* block) {
     if (UNLIKELY(_cur_child == nullptr)) {
         return Status::OLAPInternalError(OLAP_ERR_DATA_EOF);
     }
-    return _normal_next(block);
+    if (_merge) {
+        return _merge_next(block);
+    } else {
+        return _normal_next(block);
+    }
 }
 
 int64_t VCollectIterator::Level1Iterator::version() const {
@@ -362,6 +374,37 @@ Status VCollectIterator::Level1Iterator::_normal_next(IteratorRowRef* ref) {
     }
 }
 
+Status VCollectIterator::Level1Iterator::_merge_next(Block* block) {
+    int target_block_row = 0;
+    auto target_columns = block->mutate_columns();
+    size_t column_count = block->columns();
+    IteratorRowRef cur_row = _ref;
+    do {
+        const auto& src_block = cur_row.block;
+        assert(src_block->columns() == column_count);
+        for (size_t i = 0; i < column_count; ++i) {
+            target_columns[i]->insert_from(*(src_block->get_by_position(i).column),
+                                           cur_row.row_pos);
+        }
+        ++target_block_row;
+        auto res = _merge_next(&cur_row);
+        if (UNLIKELY(res == Status::OLAPInternalError(OLAP_ERR_DATA_EOF))) {
+            if (target_block_row > 0) {
+                return Status::OK();
+            } else {
+                return res;
+            }
+        }
+
+        if (UNLIKELY(!res.ok())) {
+            LOG(WARNING) << "next failed: " << res;
+            return res;
+        }
+    } while (target_block_row < _batch_size);
+
+    return Status::OK();
+}
+
 Status VCollectIterator::Level1Iterator::_normal_next(Block* block) {
     auto res = _cur_child->next(block);
     if (LIKELY(res.ok())) {
diff --git a/be/src/vec/olap/vcollect_iterator.h b/be/src/vec/olap/vcollect_iterator.h
index 13ebc4be643718..6abeb3dfe9ddb9 100644
--- a/be/src/vec/olap/vcollect_iterator.h
+++ b/be/src/vec/olap/vcollect_iterator.h
@@ -163,6 +163,8 @@ class VCollectIterator {
 
         Status _normal_next(Block* block);
 
+        Status _merge_next(Block* block);
+
         // Each LevelIterator corresponds to a rowset reader,
         // it will be cleared after '_heap' has been initialized when '_merge == true'.
         std::list<LevelIterator*> _children;
@@ -181,6 +183,9 @@ class VCollectIterator {
         bool _skip_same;
         // used when `_merge == true`
         std::unique_ptr<MergeHeap> _heap;
+
+        // batch size, get from TabletReader
+        int _batch_size; 
     };
 
     std::unique_ptr<LevelIterator> _inner_iter;
diff --git a/be/src/vec/sink/vtablet_sink.cpp b/be/src/vec/sink/vtablet_sink.cpp
index 0804cde38fd686..f4d553f9e899b1 100644
--- a/be/src/vec/sink/vtablet_sink.cpp
+++ b/be/src/vec/sink/vtablet_sink.cpp
@@ -22,20 +22,309 @@
 #include "vec/core/block.h"
 #include "vec/exprs/vexpr.h"
 #include "vec/exprs/vexpr_context.h"
+#include "util/debug/sanitizer_scopes.h"
+#include "util/time.h"
+#include "util/proto_util.h"
 
 namespace doris {
 namespace stream_load {
 
+VNodeChannel::VNodeChannel(OlapTableSink* parent, IndexChannel* index_channel, int64_t node_id)
+    : NodeChannel(parent, index_channel, node_id) {
+    _is_vectorized = true;
+}
+
+VNodeChannel::~VNodeChannel() {
+    _cur_add_block_request.release_id();
+}
+
+void VNodeChannel::clear_all_blocks() {
+    std::lock_guard<std::mutex> lg(_pending_batches_lock);
+    std::queue<AddBlockReq> empty;
+    std::swap(_pending_blocks, empty);
+    _cur_mutable_block.reset();
+}
+
+// if "_cancelled" is set to true,
+// no need to set _cancel_msg because the error will be
+// returned directly via "TabletSink::prepare()" method.
+Status VNodeChannel::init(RuntimeState* state) {
+    RETURN_IF_ERROR(NodeChannel::init(state));
+
+    _cur_mutable_block.reset(new vectorized::MutableBlock({_tuple_desc}));
+
+    // Initialize _cur_add_block_request
+    _cur_add_block_request.set_allocated_id(&_parent->_load_id);
+    _cur_add_block_request.set_index_id(_index_channel->_index_id);
+    _cur_add_block_request.set_sender_id(_parent->_sender_id);
+    _cur_add_block_request.set_backend_id(_node_id);
+    _cur_add_block_request.set_eos(false);
+
+    _name = fmt::format("VNodeChannel[{}-{}]", _index_channel->_index_id, _node_id);
+
+    return Status::OK();
+}
+
+Status VNodeChannel::open_wait() {
+    Status status = NodeChannel::open_wait();
+    if (!status.ok()) {
+        return status;
+    }
+
+    // add block closure
+    _add_block_closure = ReusableClosure<PTabletWriterAddBlockResult>::create();
+    _add_block_closure->addFailedHandler([this](bool is_last_rpc) {
+        std::lock_guard<std::mutex> l(this->_closed_lock);
+        if (this->_is_closed) {
+            // if the node channel is closed, no need to call `mark_as_failed`,
+            // and notice that _index_channel may already be destroyed.
+            return;
+        }
+        // If rpc failed, mark all tablets on this node channel as failed
+        _index_channel->mark_as_failed(this->node_id(), this->host(),
+                                       _add_block_closure->cntl.ErrorText(), -1);
+        Status st = _index_channel->check_intolerable_failure();
+        if (!st.ok()) {
+            _cancel_with_msg(fmt::format("{}, err: {}", channel_info(), st.get_error_msg()));
+        } else if (is_last_rpc) {
+            // if this is last rpc, will must set _add_batches_finished. otherwise, node channel's close_wait
+            // will be blocked.
+            _add_batches_finished = true;
+        }
+    });
+
+    _add_block_closure->addSuccessHandler([this](const PTabletWriterAddBlockResult& result,
+                                                 bool is_last_rpc) {
+        std::lock_guard<std::mutex> l(this->_closed_lock);
+        if (this->_is_closed) {
+            // if the node channel is closed, no need to call the following logic,
+            // and notice that _index_channel may already be destroyed.
+            return;
+        }
+        Status status(result.status());
+        if (status.ok()) {
+            // if has error tablet, handle them first
+            for (auto& error : result.tablet_errors()) {
+                _index_channel->mark_as_failed(this->node_id(), this->host(), error.msg(), error.tablet_id());
+            }
+
+            Status st = _index_channel->check_intolerable_failure();
+            if (!st.ok()) {
+                _cancel_with_msg(st.get_error_msg());
+            } else if (is_last_rpc) {
+                for (auto& tablet : result.tablet_vec()) {
+                    TTabletCommitInfo commit_info;
+                    commit_info.tabletId = tablet.tablet_id();
+                    commit_info.backendId = _node_id;
+                    _tablet_commit_infos.emplace_back(std::move(commit_info));
+                }
+                _add_batches_finished = true;
+            }
+        } else {
+            _cancel_with_msg(fmt::format("{}, add batch req success but status isn't ok, err: {}",
+                                         channel_info(), status.get_error_msg()));
+        }
+
+        if (result.has_execution_time_us()) {
+            _add_batch_counter.add_batch_execution_time_us += result.execution_time_us();
+            _add_batch_counter.add_batch_wait_execution_time_us += result.wait_execution_time_us();
+            _add_batch_counter.add_batch_num++;
+        }
+    });
+    return status;
+}
+
+Status VNodeChannel::add_row(const BlockRow& block_row, int64_t tablet_id) {
+    // If add_row() when _eos_is_produced==true, there must be sth wrong, we can only mark this channel as failed.
+    auto st = none_of({_cancelled, _eos_is_produced});
+    if (!st.ok()) {
+        if (_cancelled) {
+            std::lock_guard<SpinLock> l(_cancel_msg_lock);
+            return Status::InternalError("add row failed. " + _cancel_msg);
+        } else {
+            return st.clone_and_prepend("already stopped, can't add row. cancelled/eos: ");
+        }
+    }
+
+    // We use OlapTableSink mem_tracker which has the same ancestor of _plan node,
+    // so in the ideal case, mem limit is a matter for _plan node.
+    // But there is still some unfinished things, we do mem limit here temporarily.
+    // _cancelled may be set by rpc callback, and it's possible that _cancelled might be set in any of the steps below.
+    // It's fine to do a fake add_row() and return OK, because we will check _cancelled in next add_row() or mark_close().
+    while (!_cancelled && _parent->_mem_tracker->any_limit_exceeded() &&
+           _pending_batches_num > 0) {
+        SCOPED_ATOMIC_TIMER(&_mem_exceeded_block_ns);
+        std::this_thread::sleep_for(std::chrono::milliseconds(10));
+    }
+
+    _cur_mutable_block->add_row(block_row.first, block_row.second);
+    _cur_add_block_request.add_tablet_ids(tablet_id);
+
+    if (_cur_mutable_block->rows() == _batch_size) {
+        {
+            SCOPED_ATOMIC_TIMER(&_queue_push_lock_ns);
+            std::lock_guard<std::mutex> l(_pending_batches_lock);
+            //To simplify the add_row logic, postpone adding block into req until the time of sending req
+            _pending_blocks.emplace(std::move(_cur_mutable_block), _cur_add_block_request);
+            _pending_batches_num++;
+        }
+
+        _cur_mutable_block.reset(new vectorized::MutableBlock({_tuple_desc}));
+        _cur_add_block_request.clear_tablet_ids();
+    }
+
+    return Status::OK();
+}
+
+int VNodeChannel::try_send_and_fetch_status(RuntimeState* state,
+                                            std::unique_ptr<ThreadPoolToken>& thread_pool_token) {
+    auto st = none_of({_cancelled, _send_finished});
+    if (!st.ok()) {
+        return 0;
+    }
+
+    if (!_add_block_closure->try_set_in_flight()) {
+        return _send_finished ? 0 : 1;
+    }
+
+    // We are sure that try_send_batch is not running
+    if (_pending_batches_num > 0) {
+        auto s = thread_pool_token->submit_func(
+                std::bind(&VNodeChannel::try_send_block, this, state));
+        if (!s.ok()) {
+            _cancel_with_msg("submit send_batch task to send_batch_thread_pool failed");
+            // clear in flight
+            _add_block_closure->clear_in_flight();
+        }
+        // in_flight is cleared in closure::Run
+    } else {
+        // clear in flight
+        _add_block_closure->clear_in_flight();
+    }
+    return _send_finished ? 0 : 1;
+}
+
+void VNodeChannel::try_send_block(RuntimeState* state) {
+    SCOPED_ATTACH_TASK_THREAD(state, _node_channel_tracker);
+    SCOPED_ATOMIC_TIMER(&_actual_consume_ns);
+    AddBlockReq send_block;
+    {
+        debug::ScopedTSANIgnoreReadsAndWrites ignore_tsan;
+        std::lock_guard<std::mutex> l(_pending_batches_lock);
+        DCHECK(!_pending_blocks.empty());
+        send_block = std::move(_pending_blocks.front());
+        _pending_blocks.pop();
+        _pending_batches_num--;
+        _pending_batches_bytes -= send_block.first->allocated_bytes();
+    }
+
+    auto mutable_block = std::move(send_block.first);
+    auto request = std::move(send_block.second); // doesn't need to be saved in heap
+
+    // tablet_ids has already set when add row
+    request.set_packet_seq(_next_packet_seq);
+    auto block = mutable_block->to_block();
+    if (block.rows() > 0) {
+        SCOPED_ATOMIC_TIMER(&_serialize_batch_ns);
+        size_t uncompressed_bytes = 0, compressed_bytes = 0;
+        Status st = block.serialize(request.mutable_block(), &uncompressed_bytes,
+                                    &compressed_bytes, &_column_values_buffer);
+        if (!st.ok()) {
+            cancel(fmt::format("{}, err: {}", channel_info(), st.get_error_msg()));
+            _add_block_closure->clear_in_flight();
+            return;
+        }
+        if (compressed_bytes >= double(config::brpc_max_body_size) * 0.95f) {
+            LOG(WARNING) << "send block too large, this rpc may failed. send size: "
+                         << compressed_bytes << ", threshold: " << config::brpc_max_body_size
+                         << ", " << channel_info();
+        }
+    }
+
+    int remain_ms = _rpc_timeout_ms - _timeout_watch.elapsed_time() / NANOS_PER_MILLIS;
+    if (UNLIKELY(remain_ms < config::min_load_rpc_timeout_ms)) {
+        if (remain_ms <= 0 && !request.eos()) {
+            cancel(fmt::format("{}, err: timeout", channel_info()));
+            _add_block_closure->clear_in_flight();
+            return;
+        } else {
+            remain_ms = config::min_load_rpc_timeout_ms;
+        }
+    }
+
+    _add_block_closure->reset();
+    _add_block_closure->cntl.set_timeout_ms(remain_ms);
+    if (config::tablet_writer_ignore_eovercrowded) {
+        _add_block_closure->cntl.ignore_eovercrowded();
+    }
+
+    if (request.eos()) {
+        for (auto pid : _parent->_partition_ids) {
+            request.add_partition_ids(pid);
+        }
+
+        // eos request must be the last request
+        _add_block_closure->end_mark();
+        _send_finished = true;
+        CHECK(_pending_batches_num == 0) << _pending_batches_num;
+    }
+
+    if (request.has_block()) {
+        request_block_transfer_attachment<PTabletWriterAddBlockRequest,
+                                          ReusableClosure<PTabletWriterAddBlockResult>>(
+                &request, _column_values_buffer, _add_block_closure);
+    }
+    _stub->tablet_writer_add_block(&_add_block_closure->cntl, &request, &_add_block_closure->result,
+                                   _add_block_closure);
+
+    _next_packet_seq++;
+}
+
+void VNodeChannel::_close_check() {
+    std::lock_guard<std::mutex> lg(_pending_batches_lock);
+    CHECK(_pending_blocks.empty()) << name();
+    CHECK(_cur_mutable_block == nullptr) << name();
+}
+
+void VNodeChannel::mark_close() {
+    auto st = none_of({_cancelled, _eos_is_produced});
+    if (!st.ok()) {
+        return;
+    }
+
+    _cur_add_block_request.set_eos(true);
+    {
+        debug::ScopedTSANIgnoreReadsAndWrites ignore_tsan;
+        std::lock_guard<std::mutex> l(_pending_batches_lock);
+        _pending_blocks.emplace(std::move(_cur_mutable_block), _cur_add_block_request);
+        _pending_batches_num++;
+        DCHECK(_pending_blocks.back().second.eos());
+        _close_time_ms = UnixMillis();
+        LOG(INFO) << channel_info()
+                  << " mark closed, left pending batch size: " << _pending_blocks.size();
+    }
+
+    _eos_is_produced = true;
+}
+
 VOlapTableSink::VOlapTableSink(ObjectPool* pool, const RowDescriptor& row_desc,
                                const std::vector<TExpr>& texprs, Status* status)
         : OlapTableSink(pool, row_desc, texprs, status) {
+    _is_vectorized = true;
     // From the thrift expressions create the real exprs.
     vectorized::VExpr::create_expr_trees(pool, texprs, &_output_vexpr_ctxs);
-    // Do not use the origin data scala expr, clear scala expr contexts
-    _output_expr_ctxs.clear();
     _name = "VOlapTableSink";
 }
 
+VOlapTableSink::~VOlapTableSink() {
+    // We clear NodeChannels' batches here, cuz NodeChannels' batches destruction will use
+    // OlapTableSink::_mem_tracker and its parents.
+    // But their destructions are after OlapTableSink's.
+    for (const auto& index_channel : _channels) {
+        index_channel->for_each_node_channel([](const std::shared_ptr<NodeChannel>& ch) { ch->clear_all_blocks(); });
+    }
+}
+
 Status VOlapTableSink::init(const TDataSink& sink) {
     RETURN_IF_ERROR(OlapTableSink::init(sink));
     _vpartition = _pool->add(new VOlapTablePartitionParam(_schema, sink.olap_table_sink.partition));
diff --git a/be/src/vec/sink/vtablet_sink.h b/be/src/vec/sink/vtablet_sink.h
index 5514ff190945eb..844a7a7df2216e 100644
--- a/be/src/vec/sink/vtablet_sink.h
+++ b/be/src/vec/sink/vtablet_sink.h
@@ -28,6 +28,48 @@ class VExprContext;
 
 namespace stream_load {
 
+class VNodeChannel : public NodeChannel {
+public:
+    VNodeChannel(OlapTableSink* parent, IndexChannel* index_channel, int64_t node_id);
+
+    ~VNodeChannel() override;
+
+    Status init(RuntimeState* state) override;
+
+    Status open_wait() override;
+
+    Status add_row(const BlockRow& block_row, int64_t tablet_id) override;
+
+    int try_send_and_fetch_status(RuntimeState* state,
+                                  std::unique_ptr<ThreadPoolToken>& thread_pool_token) override;
+
+    void try_send_block(RuntimeState* state);
+
+    void clear_all_blocks() override;
+
+    // two ways to stop channel:
+    // 1. mark_close()->close_wait() PS. close_wait() will block waiting for the last AddBatch rpc response.
+    // 2. just cancel()
+    void mark_close() override;
+
+protected:
+    void _close_check() override;
+
+private:
+    std::unique_ptr<vectorized::MutableBlock> _cur_mutable_block;
+    PTabletWriterAddBlockRequest _cur_add_block_request;
+
+    using AddBlockReq = std::pair<std::unique_ptr<vectorized::MutableBlock>, PTabletWriterAddBlockRequest>;
+    std::queue<AddBlockReq> _pending_blocks;
+    ReusableClosure<PTabletWriterAddBlockResult>* _add_block_closure = nullptr;
+
+    // This buffer is used to store the serialized block data
+    // The data in the buffer is copied to the attachment of the brpc when it is sent,
+    // to avoid an extra pb serialization in the brpc.
+    std::string _column_values_buffer;
+};
+
+
 class OlapTableSink;
 
 // Write block data to Olap Table.
@@ -40,6 +82,8 @@ class VOlapTableSink : public OlapTableSink {
     VOlapTableSink(ObjectPool* pool, const RowDescriptor& row_desc,
                    const std::vector<TExpr>& texprs, Status* status);
 
+    ~VOlapTableSink() override;
+
     Status init(const TDataSink& sink) override;
     // TODO: unify the code of prepare/open/close with result sink
     Status prepare(RuntimeState* state) override;
diff --git a/be/test/CMakeLists.txt b/be/test/CMakeLists.txt
index c443bcaa95699c..5abf9cceb22386 100644
--- a/be/test/CMakeLists.txt
+++ b/be/test/CMakeLists.txt
@@ -336,6 +336,9 @@ set(VEC_TEST_FILES
     vec/core/column_complex_test.cpp
     vec/core/column_nullable_test.cpp
     vec/exec/vgeneric_iterators_test.cpp
+    vec/exec/vbroker_scan_node_test.cpp
+    vec/exec/vbroker_scanner_test.cpp
+    vec/exec/vtablet_sink_test.cpp
     vec/exprs/vexpr_test.cpp
     vec/function/function_array_element_test.cpp
     vec/function/function_array_index_test.cpp
diff --git a/be/test/olap/delta_writer_test.cpp b/be/test/olap/delta_writer_test.cpp
index 1c94897b7ea22d..008273420b85dd 100644
--- a/be/test/olap/delta_writer_test.cpp
+++ b/be/test/olap/delta_writer_test.cpp
@@ -85,6 +85,7 @@ static void create_tablet_request(int64_t tablet_id, int32_t schema_hash,
     request->tablet_schema.short_key_column_count = 6;
     request->tablet_schema.keys_type = TKeysType::AGG_KEYS;
     request->tablet_schema.storage_type = TStorageType::COLUMN;
+    request->__set_storage_format(TStorageFormat::V2);
 
     TColumn k1;
     k1.column_name = "k1";
@@ -234,6 +235,7 @@ static void create_tablet_request_with_sequence_col(int64_t tablet_id, int32_t s
     request->tablet_schema.keys_type = TKeysType::UNIQUE_KEYS;
     request->tablet_schema.storage_type = TStorageType::COLUMN;
     request->tablet_schema.__set_sequence_col_idx(2);
+    request->__set_storage_format(TStorageFormat::V2);
 
     TColumn k1;
     k1.column_name = "k1";
@@ -369,6 +371,15 @@ TEST_F(TestDeltaWriter, open) {
     EXPECT_EQ(Status::OK(), res);
     SAFE_DELETE(delta_writer);
 
+    // test vec delta writer
+    DeltaWriter::open(&write_req, &delta_writer, true);
+    EXPECT_NE(delta_writer, nullptr);
+    res = delta_writer->close();
+    EXPECT_EQ(Status::OK(), res);
+    res = delta_writer->close_wait(nullptr, false);
+    EXPECT_EQ(Status::OK(), res);
+    SAFE_DELETE(delta_writer);
+
     TDropTabletReq drop_request;
     auto tablet_id = 10003;
     auto schema_hash = 270068375;
@@ -495,6 +506,147 @@ TEST_F(TestDeltaWriter, write) {
     delete delta_writer;
 }
 
+TEST_F(TestDeltaWriter, vec_write) {
+       TCreateTabletReq request;
+    create_tablet_request(10004, 270068376, &request);
+    Status res = k_engine->create_tablet(request);
+    ASSERT_TRUE(res.ok());
+
+    TDescriptorTable tdesc_tbl = create_descriptor_tablet();
+    ObjectPool obj_pool;
+    DescriptorTbl* desc_tbl = nullptr;
+    DescriptorTbl::create(&obj_pool, tdesc_tbl, &desc_tbl);
+    TupleDescriptor* tuple_desc = desc_tbl->get_tuple_descriptor(0);
+//     const std::vector<SlotDescriptor*>& slots = tuple_desc->slots();
+
+    PUniqueId load_id;
+    load_id.set_hi(0);
+    load_id.set_lo(0);
+    WriteRequest write_req = {10004, 270068376,  WriteType::LOAD,       20002, 30002, load_id,
+                              tuple_desc, &(tuple_desc->slots())};
+    DeltaWriter* delta_writer = nullptr;
+    DeltaWriter::open(&write_req, &delta_writer, true);
+    ASSERT_NE(delta_writer, nullptr);
+
+    auto tracker = std::make_shared<MemTracker>();
+    MemPool pool(tracker.get());
+
+    vectorized::Block block;
+    for (const auto& slot_desc : tuple_desc->slots()) {
+        block.insert(vectorized::ColumnWithTypeAndName(slot_desc->get_empty_mutable_column(),
+                                                       slot_desc->get_data_type_ptr(),
+                                                       slot_desc->col_name()));
+    }
+
+    auto columns = block.mutate_columns();
+    {
+        int8_t k1 = -127;
+        columns[0]->insert_data((const char*)&k1, sizeof(k1));
+
+        int16_t k2 = -32767;
+        columns[1]->insert_data((const char*)&k2, sizeof(k2));
+
+        int32_t k3 = -2147483647;
+        columns[2]->insert_data((const char*)&k3, sizeof(k3));
+
+        int64_t k4 = -9223372036854775807L;
+        columns[3]->insert_data((const char*)&k4, sizeof(k4));
+
+        int128_t k5 = -90000;
+        columns[4]->insert_data((const char*)&k5, sizeof(k5));
+
+        DateTimeValue k6;
+        k6.from_date_str("2048-11-10", 10);
+        auto k6_int = k6.to_int64();
+        columns[5]->insert_data((const char*)&k6_int, sizeof(k6_int));
+
+        DateTimeValue k7;
+        k7.from_date_str("2636-08-16 19:39:43", 19);
+        auto k7_int = k7.to_int64();
+        columns[6]->insert_data((const char*)&k7_int, sizeof(k7_int));
+
+        columns[7]->insert_data("abcd", 4);
+        columns[8]->insert_data("abcde", 5);
+
+        DecimalV2Value decimal_value;
+        decimal_value.assign_from_double(1.1);
+        columns[9]->insert_data((const char*)&decimal_value, sizeof(decimal_value));
+
+        int8_t v1 = -127;
+        columns[10]->insert_data((const char*)&v1, sizeof(v1));
+
+        int16_t v2 = -32767;
+        columns[11]->insert_data((const char*)&v2, sizeof(v2));
+
+        int32_t v3 = -2147483647;
+        columns[12]->insert_data((const char*)&v3, sizeof(v3));
+
+        int64_t v4 = -9223372036854775807L;
+        columns[13]->insert_data((const char*)&v4, sizeof(v4));
+
+        int128_t v5 = -90000;
+        columns[14]->insert_data((const char*)&v5, sizeof(v5));
+
+        DateTimeValue v6;
+        v6.from_date_str("2048-11-10", 10);
+        auto v6_int = v6.to_int64();
+        columns[15]->insert_data((const char*)&v6_int, sizeof(v6_int));
+
+        DateTimeValue v7;
+        v7.from_date_str("2636-08-16 19:39:43", 19);
+        auto v7_int = v7.to_int64();
+        columns[16]->insert_data((const char*)&v7_int, sizeof(v7_int));
+
+        columns[17]->insert_data("abcd", 4);
+        columns[18]->insert_data("abcde", 5);
+
+        decimal_value.assign_from_double(1.1);
+        columns[19]->insert_data((const char*)&decimal_value, sizeof(decimal_value));
+
+        res = delta_writer->write(&block, {0});
+        ASSERT_TRUE(res.ok());
+    }
+
+    res = delta_writer->close();
+    ASSERT_TRUE(res.ok());
+    res = delta_writer->close_wait(nullptr, false);
+    ASSERT_TRUE(res.ok());
+
+    // publish version success
+    TabletSharedPtr tablet =
+            k_engine->tablet_manager()->get_tablet(write_req.tablet_id, write_req.schema_hash);
+    std::cout << "before publish, tablet row nums:" << tablet->num_rows() << std::endl;
+    OlapMeta* meta = tablet->data_dir()->get_meta();
+    Version version;
+    version.first = tablet->rowset_with_max_version()->end_version() + 1;
+    version.second = tablet->rowset_with_max_version()->end_version() + 1;
+    std::cout << "start to add rowset version:" << version.first << "-" << version.second
+              << std::endl;
+    std::map<TabletInfo, RowsetSharedPtr> tablet_related_rs;
+    StorageEngine::instance()->txn_manager()->get_txn_related_tablets(
+            write_req.txn_id, write_req.partition_id, &tablet_related_rs);
+    for (auto& tablet_rs : tablet_related_rs) {
+        std::cout << "start to publish txn" << std::endl;
+        RowsetSharedPtr rowset = tablet_rs.second;
+        res = k_engine->txn_manager()->publish_txn(meta, write_req.partition_id, write_req.txn_id,
+                                                   write_req.tablet_id, write_req.schema_hash,
+                                                   tablet_rs.first.tablet_uid, version);
+        ASSERT_TRUE(res.ok());
+        std::cout << "start to add inc rowset:" << rowset->rowset_id()
+                  << ", num rows:" << rowset->num_rows() << ", version:" << rowset->version().first
+                  << "-" << rowset->version().second << std::endl;
+        res = tablet->add_inc_rowset(rowset);
+        ASSERT_TRUE(res.ok());
+    }
+    ASSERT_EQ(2, tablet->num_rows());
+
+    auto tablet_id = 10003;
+    auto schema_hash = 270068375;
+    res = k_engine->tablet_manager()->drop_tablet(tablet_id, schema_hash);
+    ASSERT_TRUE(res.ok());
+    delete delta_writer;
+}
+
 TEST_F(TestDeltaWriter, sequence_col) {
     TCreateTabletReq request;
     create_tablet_request_with_sequence_col(10005, 270068377, &request);
@@ -566,4 +718,96 @@ TEST_F(TestDeltaWriter, sequence_col) {
     delete delta_writer;
 }
 
+TEST_F(TestDeltaWriter, vec_sequence_col) {
+    TCreateTabletReq request;
+    sleep(20);
+    create_tablet_request_with_sequence_col(10005, 270068377, &request);
+    Status res = k_engine->create_tablet(request);
+    ASSERT_TRUE(res.ok());
+
+    TDescriptorTable tdesc_tbl = create_descriptor_tablet_with_sequence_col();
+    ObjectPool obj_pool;
+    DescriptorTbl* desc_tbl = nullptr;
+    DescriptorTbl::create(&obj_pool, tdesc_tbl, &desc_tbl);
+    TupleDescriptor* tuple_desc = desc_tbl->get_tuple_descriptor(0);
+
+    PUniqueId load_id;
+    load_id.set_hi(0);
+    load_id.set_lo(0);
+    WriteRequest write_req = {10005, 270068377,  WriteType::LOAD,       20003, 30003, load_id,
+                              tuple_desc, &(tuple_desc->slots())};
+    DeltaWriter* delta_writer = nullptr;
+    DeltaWriter::open(&write_req, &delta_writer, true);
+    ASSERT_NE(delta_writer, nullptr);
+
+    MemTracker tracker;
+    MemPool pool(&tracker);
+
+    vectorized::Block block;
+    for (const auto& slot_desc : tuple_desc->slots()) {
+        block.insert(vectorized::ColumnWithTypeAndName(slot_desc->get_empty_mutable_column(),
+                                                       slot_desc->get_data_type_ptr(),
+                                                       slot_desc->col_name()));
+    }
+
+    auto columns = block.mutate_columns();
+    {
+        int8_t c1 = 123;
+        columns[0]->insert_data((const char*)&c1, sizeof(c1));
+
+        int16_t c2 = 456;
+        columns[1]->insert_data((const char*)&c2, sizeof(c2));
+
+        int32_t c3 = 1;
+        columns[2]->insert_data((const char*)&c3, sizeof(c2));
+
+        DateTimeValue c4;
+        c4.from_date_str("2020-07-16 19:39:43", 19);
+        int64_t c4_int = c4.to_int64();
+        columns[3]->insert_data((const char*)&c4_int, sizeof(c4));
+
+        res = delta_writer->write(&block, {0});
+        ASSERT_TRUE(res.ok());
+    }
+
+    res = delta_writer->close();
+    ASSERT_TRUE(res.ok());
+    res = delta_writer->close_wait(nullptr, false);
+    ASSERT_TRUE(res.ok());
+
+    // publish version success
+    TabletSharedPtr tablet =
+            k_engine->tablet_manager()->get_tablet(write_req.tablet_id, write_req.schema_hash);
+    std::cout << "before publish, tablet row nums:" << tablet->num_rows() << std::endl;
+    OlapMeta* meta = tablet->data_dir()->get_meta();
+    Version version;
+    version.first = tablet->rowset_with_max_version()->end_version() + 1;
+    version.second = tablet->rowset_with_max_version()->end_version() + 1;
+    std::cout << "start to add rowset version:" << version.first << "-" << version.second
+              << std::endl;
+    std::map<TabletInfo, RowsetSharedPtr> tablet_related_rs;
+    StorageEngine::instance()->txn_manager()->get_txn_related_tablets(
+            write_req.txn_id, write_req.partition_id, &tablet_related_rs);
+    for (auto& tablet_rs : tablet_related_rs) {
+        std::cout << "start to publish txn" << std::endl;
+        RowsetSharedPtr rowset = tablet_rs.second;
+        res = k_engine->txn_manager()->publish_txn(meta, write_req.partition_id, write_req.txn_id,
+                                                   write_req.tablet_id, write_req.schema_hash,
+                                                   tablet_rs.first.tablet_uid, version);
+        ASSERT_TRUE(res.ok());
+        std::cout << "start to add inc rowset:" << rowset->rowset_id()
+                  << ", num rows:" << rowset->num_rows() << ", version:" << rowset->version().first
+                  << "-" << rowset->version().second << std::endl;
+        res = tablet->add_inc_rowset(rowset);
+        ASSERT_TRUE(res.ok());
+    }
+    ASSERT_EQ(1, tablet->num_rows());
+
+    auto tablet_id = 10005;
+    auto schema_hash = 270068377;
+    res = k_engine->tablet_manager()->drop_tablet(tablet_id, schema_hash);
+    ASSERT_TRUE(res.ok());
+    delete delta_writer;
+}
+
 } // namespace doris
diff --git a/be/test/olap/rowset/segment_v2/segment_test.cpp b/be/test/olap/rowset/segment_v2/segment_test.cpp
index d7b03e11953d38..e651efa890a6a6 100644
--- a/be/test/olap/rowset/segment_v2/segment_test.cpp
+++ b/be/test/olap/rowset/segment_v2/segment_test.cpp
@@ -117,7 +117,7 @@ class SegmentReaderWriterTest : public ::testing::Test {
         EXPECT_TRUE(st.ok());
         DataDir data_dir(kSegmentDir);
         data_dir.init();
-        SegmentWriter writer(wblock.get(), 0, &build_schema, &data_dir, opts);
+        SegmentWriter writer(wblock.get(), 0, &build_schema, &data_dir, INT32_MAX, opts);
         st = writer.init(10);
         EXPECT_TRUE(st.ok());
 
@@ -624,7 +624,7 @@ TEST_F(SegmentReaderWriterTest, estimate_segment_size) {
     EXPECT_TRUE(st.ok()) << st.to_string();
     DataDir data_dir(dname);
     data_dir.init();
-    SegmentWriter writer(wblock.get(), 0, tablet_schema.get(), &data_dir, opts);
+    SegmentWriter writer(wblock.get(), 0, tablet_schema.get(), &data_dir, INT32_MAX, opts);
     st = writer.init(10);
     EXPECT_TRUE(st.ok()) << st.to_string();
 
@@ -797,7 +797,7 @@ TEST_F(SegmentReaderWriterTest, TestStringDict) {
     EXPECT_TRUE(st.ok());
     DataDir data_dir(dname);
     data_dir.init();
-    SegmentWriter writer(wblock.get(), 0, tablet_schema.get(), &data_dir, opts);
+    SegmentWriter writer(wblock.get(), 0, tablet_schema.get(), &data_dir, INT32_MAX, opts);
     st = writer.init(10);
     EXPECT_TRUE(st.ok());
 
diff --git a/be/test/tools/benchmark_tool.cpp b/be/test/tools/benchmark_tool.cpp
index 833ad026e0d16c..12d214cb8f07b3 100644
--- a/be/test/tools/benchmark_tool.cpp
+++ b/be/test/tools/benchmark_tool.cpp
@@ -348,7 +348,7 @@ class SegmentBenchmark : public BaseBenchmark {
         SegmentWriterOptions opts;
         DataDir data_dir(kSegmentDir);
         data_dir.init();
-        SegmentWriter writer(wblock.get(), 0, &_tablet_schema, &data_dir, opts);
+        SegmentWriter writer(wblock.get(), 0, &_tablet_schema, &data_dir, INT32_MAX, opts);
         writer.init(1024);
 
         RowCursor row;
diff --git a/be/test/vec/exec/vbroker_scan_node_test.cpp b/be/test/vec/exec/vbroker_scan_node_test.cpp
new file mode 100644
index 00000000000000..d9d8c3e4b9044f
--- /dev/null
+++ b/be/test/vec/exec/vbroker_scan_node_test.cpp
@@ -0,0 +1,644 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+#include "vec/exec/vbroker_scan_node.h"
+
+#include <gtest/gtest.h>
+
+#include <map>
+#include <string>
+#include <vector>
+
+#include "common/object_pool.h"
+#include "exprs/binary_predicate.h"
+#include "runtime/primitive_type.h"
+#include "exprs/slot_ref.h"
+#include "exprs/literal.h"
+#include "runtime/mem_tracker.h"
+#include "exec/local_file_reader.h"
+#include "exprs/cast_functions.h"
+#include "gen_cpp/Descriptors_types.h"
+#include "gen_cpp/PlanNodes_types.h"
+#include "runtime/descriptors.h"
+#include "runtime/runtime_state.h"
+#include "runtime/user_function_cache.h"
+
+namespace doris {
+
+Expr* create_literal(ObjectPool* pool, PrimitiveType type, const void* data);
+
+namespace vectorized {
+class VBrokerScanNodeTest : public testing::Test {
+public:
+    VBrokerScanNodeTest() : _runtime_state(TQueryGlobals()) {
+        init();
+        _runtime_state._instance_mem_tracker.reset(new MemTracker());
+    }
+    void init();
+    static void SetUpTestCase() {
+        UserFunctionCache::instance()->init(
+                "./be/test/runtime/test_data/user_function_cache/normal");
+        CastFunctions::init();
+    }
+
+protected:
+    virtual void SetUp() {}
+    virtual void TearDown() {}
+
+private:
+    void init_desc_table();
+    RuntimeState _runtime_state;
+    ObjectPool _obj_pool;
+    std::map<std::string, SlotDescriptor*> _slots_map;
+    TBrokerScanRangeParams _params;
+    DescriptorTbl* _desc_tbl;
+    TPlanNode _tnode;
+};
+
+void VBrokerScanNodeTest::init_desc_table() {
+    TDescriptorTable t_desc_table;
+
+    // table descriptors
+    TTableDescriptor t_table_desc;
+
+    t_table_desc.id = 0;
+    t_table_desc.tableType = TTableType::OLAP_TABLE;
+    t_table_desc.numCols = 0;
+    t_table_desc.numClusteringCols = 0;
+    t_desc_table.tableDescriptors.push_back(t_table_desc);
+    t_desc_table.__isset.tableDescriptors = true;
+
+    int next_slot_id = 1;
+    // TSlotDescriptor
+    // int offset = 1;
+    // int i = 0;
+    // k1
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 0;
+        slot_desc.byteOffset = 0;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k1";
+        slot_desc.slotIdx = 1;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k2
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 4;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k2";
+        slot_desc.slotIdx = 2;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k3
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 8;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k3";
+        slot_desc.slotIdx = 3;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k4(partitioned column)
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 12;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k4";
+        slot_desc.slotIdx = 4;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+
+    t_desc_table.__isset.slotDescriptors = true;
+    {
+        // TTupleDescriptor dest
+        TTupleDescriptor t_tuple_desc;
+        t_tuple_desc.id = 0;
+        t_tuple_desc.byteSize = 16;
+        t_tuple_desc.numNullBytes = 0;
+        t_tuple_desc.tableId = 0;
+        t_tuple_desc.__isset.tableId = true;
+        t_desc_table.tupleDescriptors.push_back(t_tuple_desc);
+    }
+
+    // source tuple descriptor
+    // TSlotDescriptor
+    // int offset = 1;
+    // int i = 0;
+    // k1
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 0;
+        slot_desc.byteOffset = 0;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k1";
+        slot_desc.slotIdx = 1;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k2
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 16;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k2";
+        slot_desc.slotIdx = 2;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k3
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 32;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k3";
+        slot_desc.slotIdx = 3;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k4(partitioned column)
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 48;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k4";
+        slot_desc.slotIdx = 4;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+
+    {
+        // TTupleDescriptor source
+        TTupleDescriptor t_tuple_desc;
+        t_tuple_desc.id = 1;
+        t_tuple_desc.byteSize = 64;
+        t_tuple_desc.numNullBytes = 0;
+        t_tuple_desc.tableId = 0;
+        t_tuple_desc.__isset.tableId = true;
+        t_desc_table.tupleDescriptors.push_back(t_tuple_desc);
+    }
+
+    DescriptorTbl::create(&_obj_pool, t_desc_table, &_desc_tbl);
+
+    _runtime_state.set_desc_tbl(_desc_tbl);
+}
+
+void VBrokerScanNodeTest::init() {
+    _params.column_separator = ',';
+    _params.line_delimiter = '\n';
+
+    TTypeDesc int_type;
+    {
+        TTypeNode node;
+        node.__set_type(TTypeNodeType::SCALAR);
+        TScalarType scalar_type;
+        scalar_type.__set_type(TPrimitiveType::INT);
+        node.__set_scalar_type(scalar_type);
+        int_type.types.push_back(node);
+    }
+    TTypeDesc varchar_type;
+    {
+        TTypeNode node;
+        node.__set_type(TTypeNodeType::SCALAR);
+        TScalarType scalar_type;
+        scalar_type.__set_type(TPrimitiveType::VARCHAR);
+        scalar_type.__set_len(5000);
+        node.__set_scalar_type(scalar_type);
+        varchar_type.types.push_back(node);
+    }
+
+    for (int i = 0; i < 4; ++i) {
+        TExprNode cast_expr;
+        cast_expr.node_type = TExprNodeType::CAST_EXPR;
+        cast_expr.type = int_type;
+        cast_expr.__set_opcode(TExprOpcode::CAST);
+        cast_expr.__set_num_children(1);
+        cast_expr.__set_output_scale(-1);
+        cast_expr.__isset.fn = true;
+        cast_expr.fn.name.function_name = "casttoint";
+        cast_expr.fn.binary_type = TFunctionBinaryType::BUILTIN;
+        cast_expr.fn.arg_types.push_back(varchar_type);
+        cast_expr.fn.ret_type = int_type;
+        cast_expr.fn.has_var_args = false;
+        cast_expr.fn.__set_signature("casttoint(VARCHAR(*))");
+        cast_expr.fn.__isset.scalar_fn = true;
+        cast_expr.fn.scalar_fn.symbol = "doris::CastFunctions::cast_to_int_val";
+
+        TExprNode slot_ref;
+        slot_ref.node_type = TExprNodeType::SLOT_REF;
+        slot_ref.type = varchar_type;
+        slot_ref.num_children = 0;
+        slot_ref.__isset.slot_ref = true;
+        slot_ref.slot_ref.slot_id = 5 + i;
+        slot_ref.slot_ref.tuple_id = 1;
+
+        TExpr expr;
+        expr.nodes.push_back(cast_expr);
+        expr.nodes.push_back(slot_ref);
+
+        _params.expr_of_dest_slot.emplace(i + 1, expr);
+        _params.src_slot_ids.push_back(5 + i);
+    }
+    // _params.__isset.expr_of_dest_slot = true;
+    _params.__set_dest_tuple_id(0);
+    _params.__set_src_tuple_id(1);
+
+    init_desc_table();
+
+    // Node Id
+    _tnode.node_id = 0;
+    _tnode.node_type = TPlanNodeType::BROKER_SCAN_NODE;
+    _tnode.num_children = 0;
+    _tnode.limit = -1;
+    _tnode.row_tuples.push_back(0);
+    _tnode.nullable_tuples.push_back(false);
+    _tnode.broker_scan_node.tuple_id = 0;
+    _tnode.__isset.broker_scan_node = true;
+}
+
+TEST_F(VBrokerScanNodeTest, normal) {
+    VBrokerScanNode scan_node(&_obj_pool, _tnode, *_desc_tbl);
+    scan_node.init(_tnode);
+    auto status = scan_node.prepare(&_runtime_state);
+    ASSERT_TRUE(status.ok());
+
+    // set scan range
+    std::vector<TScanRangeParams> scan_ranges;
+
+    {
+        TScanRangeParams scan_range_params;
+
+        TBrokerScanRange broker_scan_range;
+        broker_scan_range.params = _params;
+
+        TBrokerRangeDesc range;
+        range.path = "./be/test/exec/test_data/broker_scanner/normal.csv";
+        range.start_offset = 0;
+        range.size = -1;
+        range.file_type = TFileType::FILE_LOCAL;
+        range.format_type = TFileFormatType::FORMAT_CSV_PLAIN;
+        range.splittable = true;
+        std::vector<std::string> columns_from_path{"1"};
+        range.__set_columns_from_path(columns_from_path);
+        range.__set_num_of_columns_from_file(3);
+        broker_scan_range.ranges.push_back(range);
+
+        scan_range_params.scan_range.__set_broker_scan_range(broker_scan_range);
+
+        scan_ranges.push_back(scan_range_params);
+    }
+    {
+        TScanRangeParams scan_range_params;
+
+        TBrokerScanRange broker_scan_range;
+        broker_scan_range.params = _params;
+
+        TBrokerRangeDesc range;
+        range.path = "./be/test/exec/test_data/broker_scanner/normal.csv";
+        range.start_offset = 1;
+        range.size = 7;
+        range.file_type = TFileType::FILE_LOCAL;
+        range.format_type = TFileFormatType::FORMAT_CSV_PLAIN;
+        range.splittable = true;
+        std::vector<std::string> columns_from_path{"2"};
+        range.__set_columns_from_path(columns_from_path);
+        range.__set_num_of_columns_from_file(3);
+        broker_scan_range.ranges.push_back(range);
+
+        scan_range_params.scan_range.__set_broker_scan_range(broker_scan_range);
+
+        scan_ranges.push_back(scan_range_params);
+    }
+
+    scan_node.set_scan_ranges(scan_ranges);
+
+    status = scan_node.open(&_runtime_state);
+    ASSERT_TRUE(status.ok());
+
+    doris::vectorized::Block block;
+    bool eos = false;
+    status = scan_node.get_next(&_runtime_state, &block, &eos);
+    ASSERT_EQ(3, block.rows());
+    ASSERT_EQ(4, block.columns());
+    ASSERT_FALSE(eos);
+
+    auto columns = block.get_columns();
+    ASSERT_EQ(columns[0]->get_int(0), 1);
+    ASSERT_EQ(columns[0]->get_int(1), 4);
+    ASSERT_EQ(columns[0]->get_int(2), 8);
+
+    ASSERT_EQ(columns[1]->get_int(0), 2);
+    ASSERT_EQ(columns[1]->get_int(1), 5);
+    ASSERT_EQ(columns[1]->get_int(2), 9);
+
+    ASSERT_EQ(columns[2]->get_int(0), 3);
+    ASSERT_EQ(columns[2]->get_int(1), 6);
+    ASSERT_EQ(columns[2]->get_int(2), 10);
+
+    ASSERT_EQ(columns[3]->get_int(0), 1);
+    ASSERT_EQ(columns[3]->get_int(1), 1);
+    ASSERT_EQ(columns[3]->get_int(2), 1);
+
+    block.clear();
+    status = scan_node.get_next(&_runtime_state, &block, &eos);
+    ASSERT_EQ(1, block.rows());
+    ASSERT_FALSE(eos);
+
+    columns = block.get_columns();
+    ASSERT_EQ(columns[0]->get_int(0), 4);
+    ASSERT_EQ(columns[1]->get_int(0), 5);
+    ASSERT_EQ(columns[2]->get_int(0), 6);
+    ASSERT_EQ(columns[3]->get_int(0), 2);
+
+    block.clear();
+    status = scan_node.get_next(&_runtime_state, &block, &eos);
+    ASSERT_EQ(0, block.rows());
+    ASSERT_TRUE(eos);
+
+    scan_node.close(&_runtime_state);
+    {
+        std::stringstream ss;
+        scan_node.runtime_profile()->pretty_print(&ss);
+        LOG(INFO) << ss.str();
+    }
+}
+
+TEST_F(VBrokerScanNodeTest, where_binary_pre) {
+    TPlanNode _tnode_ = _tnode;
+
+    TTypeDesc int_type;
+    {
+        TTypeNode node;
+        node.__set_type(TTypeNodeType::SCALAR);
+        TScalarType scalar_type;
+        scalar_type.__set_type(TPrimitiveType::INT);
+        node.__set_scalar_type(scalar_type);
+        int_type.types.push_back(node);
+    }
+    TExpr expr;
+    {
+        TExprNode expr_node;
+        expr_node.__set_node_type(TExprNodeType::BINARY_PRED);
+        expr_node.type = gen_type_desc(TPrimitiveType::BOOLEAN);
+        expr_node.__set_num_children(2);
+        expr_node.__isset.opcode = true;
+        expr_node.__set_opcode(TExprOpcode::LT);
+        expr_node.__isset.vector_opcode = true;
+        expr_node.__set_vector_opcode(TExprOpcode::LT);
+        expr_node.__isset.fn = true;
+        expr_node.fn.name.function_name = "lt";
+        expr_node.fn.binary_type = TFunctionBinaryType::BUILTIN;
+        expr_node.fn.ret_type = int_type;
+        expr_node.fn.has_var_args = false;
+        expr.nodes.push_back(expr_node);
+
+    }
+    {
+        TExprNode expr_node;
+        expr_node.__set_node_type(TExprNodeType::SLOT_REF);
+        expr_node.type = int_type;
+        expr_node.__set_num_children(0);
+        expr_node.__isset.slot_ref = true;
+        TSlotRef slot_ref;
+        slot_ref.__set_slot_id(1);
+        slot_ref.__set_tuple_id(0);
+        expr_node.__set_slot_ref(slot_ref);
+        expr_node.__isset.output_column = true;
+        expr_node.__set_output_column(0);
+        expr.nodes.push_back(expr_node);
+    }
+    {
+        TExprNode expr_node;
+        expr_node.__set_node_type(TExprNodeType::INT_LITERAL);
+        expr_node.type = int_type;
+        expr_node.__set_num_children(0);
+        expr_node.__isset.int_literal = true;
+        TIntLiteral int_literal;
+        int_literal.__set_value(8);
+        expr_node.__set_int_literal(int_literal);
+        expr.nodes.push_back(expr_node);
+    }
+    _tnode_.__set_vconjunct(expr);
+
+    VBrokerScanNode scan_node(&_obj_pool, _tnode_, *_desc_tbl);
+    auto status = scan_node.init(_tnode_);
+    ASSERT_TRUE(status.ok());
+    status = scan_node.prepare(&_runtime_state);
+    ASSERT_TRUE(status.ok());
+
+    // set scan range
+    std::vector<TScanRangeParams> scan_ranges;
+
+    {
+        TScanRangeParams scan_range_params;
+
+        TBrokerScanRange broker_scan_range;
+        broker_scan_range.params = _params;
+
+        TBrokerRangeDesc range;
+        range.path = "./be/test/exec/test_data/broker_scanner/normal.csv";
+        range.start_offset = 0;
+        range.size = -1;
+        range.file_type = TFileType::FILE_LOCAL;
+        range.format_type = TFileFormatType::FORMAT_CSV_PLAIN;
+        range.splittable = true;
+        std::vector<std::string> columns_from_path{"1"};
+        range.__set_columns_from_path(columns_from_path);
+        range.__set_num_of_columns_from_file(3);
+        broker_scan_range.ranges.push_back(range);
+
+        scan_range_params.scan_range.__set_broker_scan_range(broker_scan_range);
+
+        scan_ranges.push_back(scan_range_params);
+    }
+
+    scan_node.set_scan_ranges(scan_ranges);
+
+    status = scan_node.open(&_runtime_state);
+    ASSERT_TRUE(status.ok());
+
+    doris::vectorized::Block block;
+    bool eos = false;
+    status = scan_node.get_next(&_runtime_state, &block, &eos);
+    ASSERT_EQ(2, block.rows());
+    ASSERT_EQ(4, block.columns());
+
+    auto columns = block.get_columns();
+    ASSERT_EQ(columns[0]->get_int(0), 1);
+    ASSERT_EQ(columns[0]->get_int(1), 4);
+
+    ASSERT_EQ(columns[1]->get_int(0), 2);
+    ASSERT_EQ(columns[1]->get_int(1), 5);
+
+    ASSERT_EQ(columns[2]->get_int(0), 3);
+    ASSERT_EQ(columns[2]->get_int(1), 6);
+
+    ASSERT_EQ(columns[3]->get_int(0), 1);
+    ASSERT_EQ(columns[3]->get_int(1), 1);
+
+    ASSERT_FALSE(eos);
+
+    block.clear();
+    status = scan_node.get_next(&_runtime_state, &block, &eos);
+    ASSERT_EQ(0, block.rows());
+    ASSERT_TRUE(eos);
+
+    scan_node.close(&_runtime_state);
+    {
+        std::stringstream ss;
+        scan_node.runtime_profile()->pretty_print(&ss);
+        LOG(INFO) << ss.str();
+    }
+}
+
+
+} // namespace vectorized
+} // namespace doris
diff --git a/be/test/vec/exec/vbroker_scanner_test.cpp b/be/test/vec/exec/vbroker_scanner_test.cpp
new file mode 100644
index 00000000000000..b0d65c7e30fe2f
--- /dev/null
+++ b/be/test/vec/exec/vbroker_scanner_test.cpp
@@ -0,0 +1,460 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+#include "vec/exec/vbroker_scanner.h"
+
+#include <gtest/gtest.h>
+
+#include <map>
+#include <string>
+#include <vector>
+
+#include "common/object_pool.h"
+#include "runtime/mem_tracker.h"
+#include "exec/local_file_reader.h"
+#include "exprs/cast_functions.h"
+#include "gen_cpp/Descriptors_types.h"
+#include "gen_cpp/PlanNodes_types.h"
+#include "runtime/descriptors.h"
+#include "runtime/runtime_state.h"
+#include "runtime/user_function_cache.h"
+
+namespace doris {
+
+namespace vectorized {
+class VBrokerScannerTest : public testing::Test {
+public:
+    VBrokerScannerTest() : _runtime_state(TQueryGlobals()) {
+        init();
+        _profile = _runtime_state.runtime_profile();
+        _runtime_state._instance_mem_tracker.reset(new MemTracker());
+    }
+    void init();
+
+    static void SetUpTestCase() {
+        UserFunctionCache::instance()->init(
+                "./be/test/runtime/test_data/user_function_cache/normal");
+        CastFunctions::init();
+    }
+
+protected:
+    virtual void SetUp() {}
+    virtual void TearDown() {}
+
+private:
+    void init_desc_table();
+    void init_params();
+
+    TupleId _dst_tuple_id = 0;
+    TupleId _src_tuple_id = 1;
+    RuntimeState _runtime_state;
+    RuntimeProfile* _profile;
+    ObjectPool _obj_pool;
+    TBrokerScanRangeParams _params;
+    DescriptorTbl* _desc_tbl;
+    std::vector<TNetworkAddress> _addresses;
+    ScannerCounter _counter;
+    std::vector<TExpr> _pre_filter; 
+};
+
+void VBrokerScannerTest::init_desc_table() {
+    TDescriptorTable t_desc_table;
+
+    // table descriptors
+    TTableDescriptor t_table_desc;
+
+    t_table_desc.id = 0;
+    t_table_desc.tableType = TTableType::OLAP_TABLE;
+    t_table_desc.numCols = 0;
+    t_table_desc.numClusteringCols = 0;
+    t_desc_table.tableDescriptors.push_back(t_table_desc);
+    t_desc_table.__isset.tableDescriptors = true;
+
+    int next_slot_id = 1;
+    // TSlotDescriptor
+    // int offset = 1;
+    // int i = 0;
+    // k1
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 0;
+        slot_desc.byteOffset = 0;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k1";
+        slot_desc.slotIdx = 1;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k2
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 4;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k2";
+        slot_desc.slotIdx = 2;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k3
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 0;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::INT);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 2;
+        slot_desc.byteOffset = 8;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k3";
+        slot_desc.slotIdx = 3;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+
+    t_desc_table.__isset.slotDescriptors = true;
+    {
+        // TTupleDescriptor dest
+        TTupleDescriptor t_tuple_desc;
+        t_tuple_desc.id = 0;
+        t_tuple_desc.byteSize = 12;
+        t_tuple_desc.numNullBytes = 0;
+        t_tuple_desc.tableId = 0;
+        t_tuple_desc.__isset.tableId = true;
+        t_desc_table.tupleDescriptors.push_back(t_tuple_desc);
+    }
+
+    // source tuple descriptor
+    // TSlotDescriptor
+    // int offset = 1;
+    // int i = 0;
+    // k1
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 0;
+        slot_desc.byteOffset = 0;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k1";
+        slot_desc.slotIdx = 1;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k2
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 1;
+        slot_desc.byteOffset = 16;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k2";
+        slot_desc.slotIdx = 2;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+    // k3
+    {
+        TSlotDescriptor slot_desc;
+
+        slot_desc.id = next_slot_id++;
+        slot_desc.parent = 1;
+        TTypeDesc type;
+        {
+            TTypeNode node;
+            node.__set_type(TTypeNodeType::SCALAR);
+            TScalarType scalar_type;
+            scalar_type.__set_type(TPrimitiveType::VARCHAR);
+            scalar_type.__set_len(65535);
+            node.__set_scalar_type(scalar_type);
+            type.types.push_back(node);
+        }
+        slot_desc.slotType = type;
+        slot_desc.columnPos = 2;
+        slot_desc.byteOffset = 32;
+        slot_desc.nullIndicatorByte = 0;
+        slot_desc.nullIndicatorBit = -1;
+        slot_desc.colName = "k3";
+        slot_desc.slotIdx = 3;
+        slot_desc.isMaterialized = true;
+
+        t_desc_table.slotDescriptors.push_back(slot_desc);
+    }
+
+    {
+        // TTupleDescriptor source
+        TTupleDescriptor t_tuple_desc;
+        t_tuple_desc.id = 1;
+        t_tuple_desc.byteSize = 48;
+        t_tuple_desc.numNullBytes = 0;
+        t_tuple_desc.tableId = 0;
+        t_tuple_desc.__isset.tableId = true;
+        t_desc_table.tupleDescriptors.push_back(t_tuple_desc);
+    }
+
+    DescriptorTbl::create(&_obj_pool, t_desc_table, &_desc_tbl);
+
+    _runtime_state.set_desc_tbl(_desc_tbl);
+}
+
+void VBrokerScannerTest::init_params() {
+    _params.column_separator = ',';
+    _params.line_delimiter = '\n';
+
+    TTypeDesc int_type;
+    {
+        TTypeNode node;
+        node.__set_type(TTypeNodeType::SCALAR);
+        TScalarType scalar_type;
+        scalar_type.__set_type(TPrimitiveType::INT);
+        node.__set_scalar_type(scalar_type);
+        int_type.types.push_back(node);
+    }
+    TTypeDesc varchar_type;
+    {
+        TTypeNode node;
+        node.__set_type(TTypeNodeType::SCALAR);
+        TScalarType scalar_type;
+        scalar_type.__set_type(TPrimitiveType::VARCHAR);
+        scalar_type.__set_len(5000);
+        node.__set_scalar_type(scalar_type);
+        varchar_type.types.push_back(node);
+    }
+
+    for (int i = 0; i < 3; ++i) {
+        TExprNode cast_expr;
+        cast_expr.node_type = TExprNodeType::CAST_EXPR;
+        cast_expr.type = int_type;
+        cast_expr.__set_opcode(TExprOpcode::CAST);
+        cast_expr.__set_num_children(1);
+        cast_expr.__set_output_scale(-1);
+        cast_expr.__isset.fn = true;
+        cast_expr.fn.name.function_name = "casttoint";
+        cast_expr.fn.binary_type = TFunctionBinaryType::BUILTIN;
+        cast_expr.fn.arg_types.push_back(varchar_type);
+        cast_expr.fn.ret_type = int_type;
+        cast_expr.fn.has_var_args = false;
+        cast_expr.fn.__set_signature("casttoint(VARCHAR(*))");
+        cast_expr.fn.__isset.scalar_fn = true;
+        cast_expr.fn.scalar_fn.symbol = "doris::CastFunctions::cast_to_int_val";
+
+        TExprNode slot_ref;
+        slot_ref.node_type = TExprNodeType::SLOT_REF;
+        slot_ref.type = varchar_type;
+        slot_ref.num_children = 0;
+        slot_ref.__isset.slot_ref = true;
+        slot_ref.slot_ref.slot_id = 4 + i;
+        slot_ref.slot_ref.tuple_id = 1;
+
+        TExpr expr;
+        expr.nodes.push_back(cast_expr);
+        expr.nodes.push_back(slot_ref);
+
+        _params.expr_of_dest_slot.emplace(i + 1, expr);
+        _params.src_slot_ids.push_back(4 + i);
+    }
+    // _params.__isset.expr_of_dest_slot = true;
+    _params.__set_dest_tuple_id(_dst_tuple_id);
+    _params.__set_src_tuple_id(_src_tuple_id);
+}
+
+void VBrokerScannerTest::init() {
+    init_desc_table();
+    init_params();
+}
+
+TEST_F(VBrokerScannerTest, normal) {
+    std::vector<TBrokerRangeDesc> ranges;
+    TBrokerRangeDesc range;
+    range.path = "./be/test/exec/test_data/broker_scanner/normal.csv";
+    range.start_offset = 0;
+    range.size = -1;
+    range.splittable = true;
+    range.file_type = TFileType::FILE_LOCAL;
+    range.format_type = TFileFormatType::FORMAT_CSV_PLAIN;
+    ranges.push_back(range);
+
+    VBrokerScanner scanner(&_runtime_state, _profile, _params, ranges, _addresses, _pre_filter, &_counter);
+    auto st = scanner.open();
+    ASSERT_TRUE(st.ok());
+
+    int slot_count = 3;
+    auto tuple_desc = _desc_tbl->get_tuple_descriptor(_dst_tuple_id);
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+    bool eof = false;
+    st = scanner.get_next(columns, &eof);
+    ASSERT_TRUE(st.ok());
+    ASSERT_TRUE(eof);
+
+    ASSERT_EQ(columns[0]->get_int(0), 1);
+    ASSERT_EQ(columns[0]->get_int(1), 4);
+    ASSERT_EQ(columns[0]->get_int(2), 8);
+
+    ASSERT_EQ(columns[1]->get_int(0), 2);
+    ASSERT_EQ(columns[1]->get_int(1), 5);
+    ASSERT_EQ(columns[1]->get_int(2), 9);
+
+    ASSERT_EQ(columns[2]->get_int(0), 3);
+    ASSERT_EQ(columns[2]->get_int(1), 6);
+    ASSERT_EQ(columns[2]->get_int(2), 10);
+}
+
+TEST_F(VBrokerScannerTest, normal2) {
+    std::vector<TBrokerRangeDesc> ranges;
+
+    TBrokerRangeDesc range;
+    range.path = "./be/test/exec/test_data/broker_scanner/normal2_1.csv";
+    range.start_offset = 0;
+    range.size = 7;
+    range.splittable = true;
+    range.file_type = TFileType::FILE_LOCAL;
+    range.format_type = TFileFormatType::FORMAT_CSV_PLAIN;
+    ranges.push_back(range);
+
+    range.path = "./be/test/exec/test_data/broker_scanner/normal2_2.csv";
+    range.start_offset = 0;
+    range.size = 4;
+    ranges.push_back(range);
+
+    VBrokerScanner scanner(&_runtime_state, _profile, _params, ranges, _addresses, _pre_filter, &_counter);
+    auto st = scanner.open();
+    ASSERT_TRUE(st.ok());
+
+    int slot_count = 3;
+    auto tuple_desc = _desc_tbl->get_tuple_descriptor(_dst_tuple_id);
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+
+    bool eof = false;
+    st = scanner.get_next(columns, &eof);
+    ASSERT_TRUE(st.ok());
+    ASSERT_TRUE(eof);
+
+    ASSERT_EQ(columns[0]->get_int(0), 1);
+    ASSERT_EQ(columns[0]->get_int(1), 3);
+
+    ASSERT_EQ(columns[1]->get_int(0), 2);
+    ASSERT_EQ(columns[1]->get_int(1), 4);
+
+    ASSERT_EQ(columns[2]->get_int(0), 3);
+    ASSERT_EQ(columns[2]->get_int(1), 5);
+}
+
+TEST_F(VBrokerScannerTest, normal5) {
+    std::vector<TBrokerRangeDesc> ranges;
+    TBrokerRangeDesc range;
+    range.path = "./be/test/exec/test_data/broker_scanner/normal.csv";
+    range.start_offset = 0;
+    range.size = 0;
+    range.splittable = true;
+    range.file_type = TFileType::FILE_LOCAL;
+    range.format_type = TFileFormatType::FORMAT_CSV_PLAIN;
+    ranges.push_back(range);
+
+    VBrokerScanner scanner(&_runtime_state, _profile, _params, ranges, _addresses, _pre_filter, &_counter);
+    auto st = scanner.open();
+    ASSERT_TRUE(st.ok());
+
+    int slot_count = 3;
+    auto tuple_desc = _desc_tbl->get_tuple_descriptor(_dst_tuple_id);
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+    bool eof = false;
+    // end of file
+    st = scanner.get_next(columns, &eof);
+    ASSERT_TRUE(st.ok());
+    ASSERT_TRUE(eof);
+    ASSERT_EQ(columns[0]->size(), 0);
+}
+} // namespace vectorized
+} // namespace doris
diff --git a/be/test/vec/exec/vtablet_sink_test.cpp b/be/test/vec/exec/vtablet_sink_test.cpp
new file mode 100644
index 00000000000000..f415008c4f8442
--- /dev/null
+++ b/be/test/vec/exec/vtablet_sink_test.cpp
@@ -0,0 +1,607 @@
+// Licensed to the Apache Software Foundation (ASF) under one
+// or more contributor license agreements.  See the NOTICE file
+// distributed with this work for additional information
+// regarding copyright ownership.  The ASF licenses this file
+// to you under the Apache License, Version 2.0 (the
+// "License"); you may not use this file except in compliance
+// with the License.  You may obtain a copy of the License at
+//
+//   http://www.apache.org/licenses/LICENSE-2.0
+//
+// Unless required by applicable law or agreed to in writing,
+// software distributed under the License is distributed on an
+// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
+// KIND, either express or implied.  See the License for the
+// specific language governing permissions and limitations
+// under the License.
+#include "vec/sink/vtablet_sink.h"
+
+#include <gtest/gtest.h>
+
+#include <map>
+#include <string>
+#include <vector>
+
+#include "common/config.h"
+#include "gen_cpp/HeartbeatService_types.h"
+#include "gen_cpp/internal_service.pb.h"
+#include "runtime/bufferpool/reservation_tracker.h"
+#include "runtime/decimalv2_value.h"
+#include "runtime/descriptor_helper.h"
+#include "runtime/exec_env.h"
+#include "runtime/result_queue_mgr.h"
+#include "runtime/runtime_state.h"
+#include "runtime/stream_load/load_stream_mgr.h"
+#include "runtime/thread_resource_mgr.h"
+#include "runtime/types.h"
+#include "service/brpc.h"
+#include "util/brpc_client_cache.h"
+#include "util/cpu_info.h"
+#include "util/debug/leakcheck_disabler.h"
+#include "util/proto_util.h"
+
+namespace doris {
+
+namespace stream_load {
+
+extern Status k_add_batch_status;
+
+class VOlapTableSinkTest : public testing::Test {
+public:
+    VOlapTableSinkTest() {}
+    virtual ~VOlapTableSinkTest() {}
+    void SetUp() override {
+        k_add_batch_status = Status::OK();
+        _env = ExecEnv::GetInstance();
+        _env->_thread_mgr = new ThreadResourceMgr();
+        _env->_master_info = new TMasterInfo();
+        _env->_load_stream_mgr = new LoadStreamMgr();
+        _env->_internal_client_cache = new BrpcClientCache<PBackendService_Stub>();
+        _env->_function_client_cache = new BrpcClientCache<PFunctionService_Stub>();
+        _env->_buffer_reservation = new ReservationTracker();
+        _env->_task_pool_mem_tracker_registry.reset(new MemTrackerTaskPool());
+        ThreadPoolBuilder("SendBatchThreadPool")
+                .set_min_threads(1)
+                .set_max_threads(5)
+                .set_max_queue_size(100)
+                .build(&_env->_send_batch_thread_pool);
+        config::tablet_writer_open_rpc_timeout_sec = 60;
+        config::max_send_batch_parallelism_per_job = 1;
+    }
+
+    void TearDown() override {
+        SAFE_DELETE(_env->_internal_client_cache);
+        SAFE_DELETE(_env->_function_client_cache);
+        SAFE_DELETE(_env->_load_stream_mgr);
+        SAFE_DELETE(_env->_master_info);
+        SAFE_DELETE(_env->_thread_mgr);
+        SAFE_DELETE(_env->_buffer_reservation);
+        if (_server) {
+            _server->Stop(100);
+            _server->Join();
+            SAFE_DELETE(_server);
+        }
+    }
+
+private:
+    ExecEnv* _env = nullptr;
+    brpc::Server* _server = nullptr;
+};
+
+TDataSink get_data_sink(TDescriptorTable* desc_tbl);
+TDataSink get_decimal_sink(TDescriptorTable* desc_tbl);
+
+
+class VTestInternalService : public PBackendService {
+public:
+    VTestInternalService() {}
+    virtual ~VTestInternalService() {}
+
+    void transmit_data(::google::protobuf::RpcController* controller,
+                       const ::doris::PTransmitDataParams* request,
+                       ::doris::PTransmitDataResult* response,
+                       ::google::protobuf::Closure* done) override {
+        brpc::ClosureGuard done_guard(done);
+    }
+
+    void tablet_writer_open(google::protobuf::RpcController* controller,
+                            const PTabletWriterOpenRequest* request,
+                            PTabletWriterOpenResult* response,
+                            google::protobuf::Closure* done) override {
+        brpc::ClosureGuard done_guard(done);
+        Status status;
+        status.to_protobuf(response->mutable_status());
+    }
+
+    void tablet_writer_add_block(google::protobuf::RpcController* controller,
+                                 const PTabletWriterAddBlockRequest* request,
+                                 PTabletWriterAddBlockResult* response,
+                                 google::protobuf::Closure* done) {
+        brpc::ClosureGuard done_guard(done);
+        {
+            std::lock_guard<std::mutex> l(_lock);
+            _row_counters += request->tablet_ids_size();
+            if (request->eos()) {
+                _eof_counters++;
+            }
+            k_add_batch_status.to_protobuf(response->mutable_status());
+
+            if (request->has_block() && _row_desc != nullptr) {
+                brpc::Controller* cntl = static_cast<brpc::Controller*>(controller);
+                attachment_transfer_request_block<PTabletWriterAddBlockRequest>(request, cntl);
+                vectorized::Block block(request->block());
+
+                for (size_t row_num = 0; row_num < block.rows(); ++row_num) {
+                    std::stringstream out;
+                    out << "(";
+                    for (size_t i = 0; i < block.columns(); ++i) {
+                        if (block.get_by_position(i).column) {
+                            out << block.get_by_position(i).to_string(row_num);
+                        }
+                        if (i != block.columns() - 1) {
+                            out << ", ";
+                        }
+                    }
+                    out << ")";
+                    _output_set->emplace(out.str());
+                }
+            }
+        }
+    }
+    void tablet_writer_cancel(google::protobuf::RpcController* controller,
+                              const PTabletWriterCancelRequest* request,
+                              PTabletWriterCancelResult* response,
+                              google::protobuf::Closure* done) override {
+        brpc::ClosureGuard done_guard(done);
+    }
+
+    std::mutex _lock;
+    int64_t _eof_counters = 0;
+    int64_t _row_counters = 0;
+    RowDescriptor* _row_desc = nullptr;
+    std::set<std::string>* _output_set = nullptr;
+};
+
+TEST_F(VOlapTableSinkTest, normal) {
+    // start brpc service first
+    _server = new brpc::Server();
+    auto service = new VTestInternalService();
+    ASSERT_EQ(_server->AddService(service, brpc::SERVER_OWNS_SERVICE), 0);
+    brpc::ServerOptions options;
+    {
+        debug::ScopedLeakCheckDisabler disable_lsan;
+        _server->Start(4356, &options);
+    }
+
+    TUniqueId fragment_id;
+    TQueryOptions query_options;
+    query_options.batch_size = 1;
+    RuntimeState state(fragment_id, query_options, TQueryGlobals(), _env);
+    state.init_mem_trackers(TUniqueId());
+
+    ObjectPool obj_pool;
+    TDescriptorTable tdesc_tbl;
+    auto t_data_sink = get_data_sink(&tdesc_tbl);
+
+    // crate desc_tabl
+    DescriptorTbl* desc_tbl = nullptr;
+    auto st = DescriptorTbl::create(&obj_pool, tdesc_tbl, &desc_tbl);
+    ASSERT_TRUE(st.ok());
+    state._desc_tbl = desc_tbl;
+
+    TupleDescriptor* tuple_desc = desc_tbl->get_tuple_descriptor(0);
+    LOG(INFO) << "tuple_desc=" << tuple_desc->debug_string();
+
+    RowDescriptor row_desc(*desc_tbl, {0}, {false});
+    service->_row_desc = &row_desc;
+    std::set<std::string> output_set;
+    service->_output_set = &output_set;
+
+    VOlapTableSink sink(&obj_pool, row_desc, {}, &st);
+    ASSERT_TRUE(st.ok());
+
+    // init
+    st = sink.init(t_data_sink);
+    ASSERT_TRUE(st.ok());
+    // prepare
+    st = sink.prepare(&state);
+    ASSERT_TRUE(st.ok());
+    // open
+    st = sink.open(&state);
+    ASSERT_TRUE(st.ok());
+
+    int slot_count = tuple_desc->slots().size();
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+
+    int col_idx = 0;
+    auto* column_ptr = columns[col_idx++].get();
+    auto column_vector_int = column_ptr;
+    int int_val = 12;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+    int_val = 13;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+    int_val = 14;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_bigint = column_ptr;
+    int64_t int64_val = 9;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+    int64_val = 25;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+    int64_val = 50;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_str = column_ptr;
+    column_vector_str->insert_data("abc", 3);
+    column_vector_str->insert_data("abcd", 4);
+    column_vector_str->insert_data("abcde1234567890", 15);
+
+    vectorized::Block block;
+    col_idx = 0;
+    for (const auto slot_desc : tuple_desc->slots()) {
+        block.insert(vectorized::ColumnWithTypeAndName(
+            std::move(columns[col_idx++]),
+            slot_desc->get_data_type_ptr(),
+            slot_desc->col_name()));
+    }
+
+    // send
+    st = sink.send(&state, &block);
+    ASSERT_TRUE(st.ok());
+    // close
+    st = sink.close(&state, Status::OK());
+    ASSERT_TRUE(st.ok() || st.to_string() == "Internal error: wait close failed. ")
+            << st.to_string();
+
+    // each node has a eof
+    ASSERT_EQ(2, service->_eof_counters);
+    ASSERT_EQ(2 * 2, service->_row_counters);
+
+    // 2node * 2
+    ASSERT_EQ(1, state.num_rows_load_filtered());
+}
+
+TEST_F(VOlapTableSinkTest, convert) {
+    // start brpc service first
+    _server = new brpc::Server();
+    auto service = new VTestInternalService();
+    ASSERT_EQ(_server->AddService(service, brpc::SERVER_OWNS_SERVICE), 0);
+    brpc::ServerOptions options;
+    {
+        debug::ScopedLeakCheckDisabler disable_lsan;
+        _server->Start(4356, &options);
+    }
+
+    TUniqueId fragment_id;
+    TQueryOptions query_options;
+    query_options.batch_size = 1024;
+    RuntimeState state(fragment_id, query_options, TQueryGlobals(), _env);
+    state.init_mem_trackers(TUniqueId());
+
+    ObjectPool obj_pool;
+    TDescriptorTable tdesc_tbl;
+    auto t_data_sink = get_data_sink(&tdesc_tbl);
+
+    // crate desc_tabl
+    DescriptorTbl* desc_tbl = nullptr;
+    auto st = DescriptorTbl::create(&obj_pool, tdesc_tbl, &desc_tbl);
+    ASSERT_TRUE(st.ok());
+    state._desc_tbl = desc_tbl;
+
+    TupleDescriptor* tuple_desc = desc_tbl->get_tuple_descriptor(0);
+
+    RowDescriptor row_desc(*desc_tbl, {0}, {false});
+
+    // expr
+    std::vector<TExpr> exprs;
+    exprs.resize(3);
+    exprs[0].nodes.resize(1);
+    exprs[0].nodes[0].node_type = TExprNodeType::SLOT_REF;
+    exprs[0].nodes[0].type = tdesc_tbl.slotDescriptors[3].slotType;
+    exprs[0].nodes[0].num_children = 0;
+    exprs[0].nodes[0].__isset.slot_ref = true;
+    exprs[0].nodes[0].slot_ref.slot_id = 0;
+    exprs[0].nodes[0].slot_ref.tuple_id = 1;
+
+    exprs[1].nodes.resize(1);
+    exprs[1].nodes[0].node_type = TExprNodeType::SLOT_REF;
+    exprs[1].nodes[0].type = tdesc_tbl.slotDescriptors[4].slotType;
+    exprs[1].nodes[0].num_children = 0;
+    exprs[1].nodes[0].__isset.slot_ref = true;
+    exprs[1].nodes[0].slot_ref.slot_id = 1;
+    exprs[1].nodes[0].slot_ref.tuple_id = 1;
+
+    exprs[2].nodes.resize(1);
+    exprs[2].nodes[0].node_type = TExprNodeType::SLOT_REF;
+    exprs[2].nodes[0].type = tdesc_tbl.slotDescriptors[5].slotType;
+    exprs[2].nodes[0].num_children = 0;
+    exprs[2].nodes[0].__isset.slot_ref = true;
+    exprs[2].nodes[0].slot_ref.slot_id = 2;
+    exprs[2].nodes[0].slot_ref.tuple_id = 1;
+
+    VOlapTableSink sink(&obj_pool, row_desc, exprs, &st);
+    ASSERT_TRUE(st.ok());
+
+    // set output tuple_id
+    t_data_sink.olap_table_sink.tuple_id = 1;
+    // init
+    st = sink.init(t_data_sink);
+    ASSERT_TRUE(st.ok());
+    // prepare
+    st = sink.prepare(&state);
+    ASSERT_TRUE(st.ok());
+    // open
+    st = sink.open(&state);
+    ASSERT_TRUE(st.ok());
+    // send
+    int slot_count = tuple_desc->slots().size();
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+
+    int col_idx = 0;
+    auto* column_ptr = columns[col_idx++].get();
+    auto column_vector_int = column_ptr;
+    int int_val = 12;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+    int_val = 13;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+    int_val = 14;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_bigint = column_ptr;
+    int64_t int64_val = 9;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+    int64_val = 25;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+    int64_val = 50;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_str = column_ptr;
+    column_vector_str->insert_data("abc", 3);
+    column_vector_str->insert_data("abcd", 4);
+    column_vector_str->insert_data("abcde", 5);
+
+    vectorized::Block block;
+    col_idx = 0;
+    for (const auto slot_desc : tuple_desc->slots()) {
+        block.insert(vectorized::ColumnWithTypeAndName(
+            std::move(columns[col_idx++]),
+            slot_desc->get_data_type_ptr(),
+            slot_desc->col_name()));
+    }
+    st = sink.send(&state, &block);
+    ASSERT_TRUE(st.ok());
+    // close
+    st = sink.close(&state, Status::OK());
+    ASSERT_TRUE(st.ok() || st.to_string() == "Internal error: wait close failed. ")
+            << st.to_string();
+
+    // each node has a eof
+    ASSERT_EQ(2, service->_eof_counters);
+    ASSERT_EQ(2 * 3, service->_row_counters);
+
+    // 2node * 2
+    ASSERT_EQ(0, state.num_rows_load_filtered());
+}
+
+TEST_F(VOlapTableSinkTest, add_block_failed) {
+    // start brpc service first
+    _server = new brpc::Server();
+    auto service = new VTestInternalService();
+    ASSERT_EQ(_server->AddService(service, brpc::SERVER_OWNS_SERVICE), 0);
+    brpc::ServerOptions options;
+    {
+        debug::ScopedLeakCheckDisabler disable_lsan;
+        _server->Start(4356, &options);
+    }
+
+    // ObjectPool create before RuntimeState, simulate actual situation better.
+    ObjectPool obj_pool;
+
+    TUniqueId fragment_id;
+    TQueryOptions query_options;
+    query_options.batch_size = 1;
+    RuntimeState state(fragment_id, query_options, TQueryGlobals(), _env);
+    state.init_mem_trackers(TUniqueId());
+
+    TDescriptorTable tdesc_tbl;
+    auto t_data_sink = get_data_sink(&tdesc_tbl);
+
+    // crate desc_tabl
+    DescriptorTbl* desc_tbl = nullptr;
+    auto st = DescriptorTbl::create(&obj_pool, tdesc_tbl, &desc_tbl);
+    ASSERT_TRUE(st.ok());
+    state._desc_tbl = desc_tbl;
+
+    RowDescriptor row_desc(*desc_tbl, {0}, {false});
+
+    // expr
+    std::vector<TExpr> exprs;
+    exprs.resize(3);
+    exprs[0].nodes.resize(1);
+    exprs[0].nodes[0].node_type = TExprNodeType::SLOT_REF;
+    exprs[0].nodes[0].type = tdesc_tbl.slotDescriptors[3].slotType;
+    exprs[0].nodes[0].num_children = 0;
+    exprs[0].nodes[0].__isset.slot_ref = true;
+    exprs[0].nodes[0].slot_ref.slot_id = 0;
+    exprs[0].nodes[0].slot_ref.tuple_id = 1;
+
+    exprs[1].nodes.resize(1);
+    exprs[1].nodes[0].node_type = TExprNodeType::SLOT_REF;
+    exprs[1].nodes[0].type = tdesc_tbl.slotDescriptors[4].slotType;
+    exprs[1].nodes[0].num_children = 0;
+    exprs[1].nodes[0].__isset.slot_ref = true;
+    exprs[1].nodes[0].slot_ref.slot_id = 1;
+    exprs[1].nodes[0].slot_ref.tuple_id = 1;
+
+    exprs[2].nodes.resize(1);
+    exprs[2].nodes[0].node_type = TExprNodeType::SLOT_REF;
+    exprs[2].nodes[0].type = tdesc_tbl.slotDescriptors[5].slotType;
+    exprs[2].nodes[0].num_children = 0;
+    exprs[2].nodes[0].__isset.slot_ref = true;
+    exprs[2].nodes[0].slot_ref.slot_id = 2;
+    exprs[2].nodes[0].slot_ref.tuple_id = 1;
+
+    VOlapTableSink sink(&obj_pool, row_desc, exprs, &st);
+    ASSERT_TRUE(st.ok());
+
+    // set output tuple_id
+    t_data_sink.olap_table_sink.tuple_id = 1;
+    // init
+    st = sink.init(t_data_sink);
+    ASSERT_TRUE(st.ok());
+    st = sink.prepare(&state);
+    ASSERT_TRUE(st.ok());
+    st = sink.open(&state);
+    ASSERT_TRUE(st.ok());
+    // send
+    TupleDescriptor* tuple_desc = desc_tbl->get_tuple_descriptor(0);
+
+    int slot_count = tuple_desc->slots().size();
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+
+    int col_idx = 0;
+    auto* column_ptr = columns[col_idx++].get();
+    auto column_vector_int = column_ptr;
+    int int_val = 12;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_bigint = column_ptr;
+    int64_t int64_val = 9;
+    column_vector_bigint->insert_data((const char*)&int64_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_str = column_ptr;
+    column_vector_str->insert_data("abc", 3);
+
+    vectorized::Block block;
+    col_idx = 0;
+    for (const auto slot_desc : tuple_desc->slots()) {
+        block.insert(vectorized::ColumnWithTypeAndName(
+            std::move(columns[col_idx++]),
+            slot_desc->get_data_type_ptr(),
+            slot_desc->col_name()));
+    }
+    // Channels will be cancelled internally, coz brpc returns k_add_batch_status.
+    k_add_batch_status = Status::InternalError("dummy failed");
+    st = sink.send(&state, &block);
+    ASSERT_TRUE(st.ok());
+
+    // Send batch multiple times, can make _cur_batch or _pending_batches(in channels) not empty.
+    // To ensure the order of releasing resource is OK.
+    sink.send(&state, &block);
+    sink.send(&state, &block);
+
+    // close
+    st = sink.close(&state, Status::OK());
+    ASSERT_FALSE(st.ok());
+}
+
+TEST_F(VOlapTableSinkTest, decimal) {
+    // start brpc service first
+    _server = new brpc::Server();
+    auto service = new VTestInternalService();
+    ASSERT_EQ(_server->AddService(service, brpc::SERVER_OWNS_SERVICE), 0);
+    brpc::ServerOptions options;
+    {
+        debug::ScopedLeakCheckDisabler disable_lsan;
+        _server->Start(4356, &options);
+    }
+
+    TUniqueId fragment_id;
+    TQueryOptions query_options;
+    query_options.batch_size = 1;
+    RuntimeState state(fragment_id, query_options, TQueryGlobals(), _env);
+    state.init_mem_trackers(TUniqueId());
+
+    ObjectPool obj_pool;
+    TDescriptorTable tdesc_tbl;
+    auto t_data_sink = get_decimal_sink(&tdesc_tbl);
+
+    // crate desc_tabl
+    DescriptorTbl* desc_tbl = nullptr;
+    auto st = DescriptorTbl::create(&obj_pool, tdesc_tbl, &desc_tbl);
+    ASSERT_TRUE(st.ok());
+    state._desc_tbl = desc_tbl;
+
+    TupleDescriptor* tuple_desc = desc_tbl->get_tuple_descriptor(0);
+    LOG(INFO) << "tuple_desc=" << tuple_desc->debug_string();
+
+    RowDescriptor row_desc(*desc_tbl, {0}, {false});
+    service->_row_desc = &row_desc;
+    std::set<std::string> output_set;
+    service->_output_set = &output_set;
+
+    VOlapTableSink sink(&obj_pool, row_desc, {}, &st);
+    ASSERT_TRUE(st.ok());
+
+    // init
+    st = sink.init(t_data_sink);
+    ASSERT_TRUE(st.ok());
+    // prepare
+    st = sink.prepare(&state);
+    ASSERT_TRUE(st.ok());
+    // open
+    st = sink.open(&state);
+    ASSERT_TRUE(st.ok());
+    // send
+    int slot_count = tuple_desc->slots().size();
+    std::vector<vectorized::MutableColumnPtr> columns(slot_count);
+    for (int i = 0; i < slot_count; i++) {
+        columns[i] = tuple_desc->slots()[i]->get_empty_mutable_column();
+    }
+
+    int col_idx = 0;
+    auto* column_ptr = columns[col_idx++].get();
+    auto column_vector_int = column_ptr;
+    int int_val = 12;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+    int_val = 13;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+    int_val = 14;
+    column_vector_int->insert_data((const char*)&int_val, 0);
+
+    column_ptr = columns[col_idx++].get();
+    auto column_vector_dec = column_ptr;
+    DecimalV2Value dec_val(std::string("12.3"));
+    column_vector_dec->insert_data((const char*)&dec_val, 0);
+    dec_val = std::string("123.123456789");
+    column_vector_dec->insert_data((const char*)&dec_val, 0);
+    dec_val = std::string("123456789123.1234");
+    column_vector_dec->insert_data((const char*)&dec_val, 0);
+
+    vectorized::Block block;
+    col_idx = 0;
+    for (const auto slot_desc : tuple_desc->slots()) {
+        block.insert(vectorized::ColumnWithTypeAndName(
+            std::move(columns[col_idx++]),
+            slot_desc->get_data_type_ptr(),
+            slot_desc->col_name()));
+    }
+    st = sink.send(&state, &block);
+    ASSERT_TRUE(st.ok());
+    // close
+    st = sink.close(&state, Status::OK());
+    ASSERT_TRUE(st.ok() || st.to_string() == "Internal error: wait close failed. ")
+            << st.to_string();
+
+    ASSERT_EQ(2, output_set.size());
+    ASSERT_TRUE(output_set.count("(12, 12.300000000)") > 0);
+    ASSERT_TRUE(output_set.count("(13, 123.120000000)") > 0);
+}
+} // namespace stream_load
+} // namespace doris
+
diff --git a/be/test/vec/exprs/vexpr_test.cpp b/be/test/vec/exprs/vexpr_test.cpp
index bf0448acdf13aa..f226cad27cd2f0 100644
--- a/be/test/vec/exprs/vexpr_test.cpp
+++ b/be/test/vec/exprs/vexpr_test.cpp
@@ -79,11 +79,7 @@ TEST(TEST_VEXPR, ABSTEST) {
     int ts = -1;
     context->execute(&block, &ts);
 
-    FunctionContext* fun_ct = context->fn_context(0);
     context->close(&runtime_stat);
-    if (fun_ct) {
-        delete fun_ct;
-    }
 }
 
 TEST(TEST_VEXPR, ABSTEST2) {
@@ -128,12 +124,8 @@ TEST(TEST_VEXPR, ABSTEST2) {
     auto block = row_batch.convert_to_vec_block();
     int ts = -1;
     context->execute(&block, &ts);
-
-    FunctionContext* fun_ct = context->fn_context(0);
     context->close(&runtime_stat);
-    if (fun_ct) {
-        delete fun_ct;
-    }
+
 }
 
 namespace doris {
diff --git a/fe/fe-core/src/main/java/org/apache/doris/common/Config.java b/fe/fe-core/src/main/java/org/apache/doris/common/Config.java
index 86c4c9ca22277a..7b5e1e9978acb8 100644
--- a/fe/fe-core/src/main/java/org/apache/doris/common/Config.java
+++ b/fe/fe-core/src/main/java/org/apache/doris/common/Config.java
@@ -1661,4 +1661,6 @@ public class Config extends ConfigBase {
     @ConfField(mutable = true, masterOnly = true)
     public static boolean enable_quantile_state_type = false;
 
+    @ConfField
+    public static boolean enable_vectorized_load = false;
 }
diff --git a/fe/fe-core/src/main/java/org/apache/doris/planner/StreamLoadPlanner.java b/fe/fe-core/src/main/java/org/apache/doris/planner/StreamLoadPlanner.java
index 602ed433bc0ceb..c87be30d273d54 100644
--- a/fe/fe-core/src/main/java/org/apache/doris/planner/StreamLoadPlanner.java
+++ b/fe/fe-core/src/main/java/org/apache/doris/planner/StreamLoadPlanner.java
@@ -33,6 +33,7 @@
 import org.apache.doris.catalog.PartitionInfo;
 import org.apache.doris.catalog.PartitionItem;
 import org.apache.doris.catalog.PartitionType;
+import org.apache.doris.common.Config;
 import org.apache.doris.common.AnalysisException;
 import org.apache.doris.common.DdlException;
 import org.apache.doris.common.ErrorCode;
@@ -140,6 +141,9 @@ public TExecPlanFragmentParams plan(TUniqueId loadId) throws UserException {
         scanNode.init(analyzer);
         descTable.computeStatAndMemLayout();
         scanNode.finalize(analyzer);
+        if (Config.enable_vectorized_load) {
+            scanNode.convertToVectoriezd();
+        }
 
         int timeout = taskInfo.getTimeout();
         if (taskInfo instanceof RoutineLoadJob) {
@@ -191,6 +195,8 @@ public TExecPlanFragmentParams plan(TUniqueId loadId) throws UserException {
         queryOptions.setMemLimit(taskInfo.getMemLimit());
         // for stream load, we use exec_mem_limit to limit the memory usage of load channel.
         queryOptions.setLoadMemLimit(taskInfo.getMemLimit());
+        queryOptions.setEnableVectorizedEngine(Config.enable_vectorized_load);
+
         params.setQueryOptions(queryOptions);
         TQueryGlobals queryGlobals = new TQueryGlobals();
         queryGlobals.setNowString(DATE_FORMAT.format(new Date()));
diff --git a/gensrc/proto/internal_service.proto b/gensrc/proto/internal_service.proto
index 0a1c03b17b75d4..76371b61a7e5b6 100644
--- a/gensrc/proto/internal_service.proto
+++ b/gensrc/proto/internal_service.proto
@@ -78,6 +78,7 @@ message PTabletWriterOpenRequest {
     optional int64 load_channel_timeout_s = 9;
     optional bool is_high_priority = 10 [default = false];
     optional string sender_ip = 11 [default = ""];
+    optional bool is_vectorized = 12 [default = false];
 };
 
 message PTabletWriterOpenResult {
@@ -107,6 +108,28 @@ message PTabletWriterAddBatchRequest {
     optional bool is_high_priority = 11 [default = false];
 };
 
+message PTabletWriterAddBlockRequest {
+    required PUniqueId id = 1;
+    required int64 index_id = 2;
+    required int32 sender_id = 3;
+
+    // If this is the last batch from this sender
+    optional bool eos = 4;
+
+    required int64 packet_seq = 5;
+    repeated int64 tablet_ids = 6;
+    // unset if and only if when eos is true
+    optional PBlock block = 7;
+    // only valid when eos is true
+    // valid partition ids that would write in this writer
+    repeated int64 partition_ids = 8;
+    // the backend which send this request
+    optional int64 backend_id = 9 [default = -1];
+    // transfer the vectorized::Block to the Controller Attachment
+    optional bool transfer_by_attachment = 10 [default = false];
+    optional bool is_high_priority = 11 [default = false];
+};
+
 message PTabletError {
     optional int64 tablet_id = 1;
     optional string msg = 2;
@@ -121,6 +144,15 @@ message PTabletWriterAddBatchResult {
     repeated PTabletError tablet_errors = 6;
 };
 
+message PTabletWriterAddBlockResult {
+    required PStatus status = 1;
+    repeated PTabletInfo tablet_vec = 2;
+    optional int64 execution_time_us = 3;
+    optional int64 wait_lock_time_us = 4;
+    optional int64 wait_execution_time_us = 5;
+    repeated PTabletError tablet_errors = 6;
+};
+
 // tablet writer cancel
 message PTabletWriterCancelRequest {
     required PUniqueId id = 1;
@@ -431,6 +463,7 @@ service PBackendService {
     rpc fetch_data(PFetchDataRequest) returns (PFetchDataResult);
     rpc tablet_writer_open(PTabletWriterOpenRequest) returns (PTabletWriterOpenResult);
     rpc tablet_writer_add_batch(PTabletWriterAddBatchRequest) returns (PTabletWriterAddBatchResult);
+    rpc tablet_writer_add_block(PTabletWriterAddBlockRequest) returns (PTabletWriterAddBlockResult);
     rpc tablet_writer_cancel(PTabletWriterCancelRequest) returns (PTabletWriterCancelResult);
     rpc get_info(PProxyRequest) returns (PProxyResult); 
     rpc update_cache(PUpdateCacheRequest) returns (PCacheResponse);

From 4827128701ed0504efa9b1d005ea1e1f3f42e6bc Mon Sep 17 00:00:00 2001
From: lihaopeng <lihaopeng@baidu.com>
Date: Thu, 28 Apr 2022 16:31:28 +0800
Subject: [PATCH 2/2] change code by code review

---
 be/src/olap/delta_writer.h              | 2 +-
 be/src/olap/olap_define.h               | 3 ---
 be/src/olap/row_block2.cpp              | 4 ++--
 be/src/vec/olap/olap_data_convertor.cpp | 9 +++++----
 gensrc/proto/internal_service.proto     | 2 +-
 5 files changed, 9 insertions(+), 11 deletions(-)

diff --git a/be/src/olap/delta_writer.h b/be/src/olap/delta_writer.h
index b937e4f9e31d0b..aa6fcb33e7f803 100644
--- a/be/src/olap/delta_writer.h
+++ b/be/src/olap/delta_writer.h
@@ -105,7 +105,7 @@ class DeltaWriter {
     TabletSharedPtr _tablet;
     RowsetSharedPtr _cur_rowset;
     std::unique_ptr<RowsetWriter> _rowset_writer;
-    // TODO: Recheck the lifttime of _mem_table, Look only should use unique_ptr
+    // TODO: Recheck the lifetime of _mem_table, Look should use unique_ptr
     std::shared_ptr<MemTable> _mem_table;
     std::unique_ptr<Schema> _schema;
     const TabletSchema* _tablet_schema;
diff --git a/be/src/olap/olap_define.h b/be/src/olap/olap_define.h
index 3e1559ad16b2d7..d24695607b5120 100644
--- a/be/src/olap/olap_define.h
+++ b/be/src/olap/olap_define.h
@@ -56,9 +56,6 @@ static const uint16_t OLAP_VARCHAR_MAX_LENGTH = 65535;
 // the max length supported for string type 2GB
 static const uint32_t OLAP_STRING_MAX_LENGTH = 2147483647;
 
-// the max length supported for vec string type 1MB
-static constexpr size_t MAX_SIZE_OF_VEC_STRING = 1024 * 1024;
-
 // the max length supported for array
 static const uint16_t OLAP_ARRAY_MAX_LENGTH = 65535;
 
diff --git a/be/src/olap/row_block2.cpp b/be/src/olap/row_block2.cpp
index d7bf6783e883c1..a29b74bca0ebba 100644
--- a/be/src/olap/row_block2.cpp
+++ b/be/src/olap/row_block2.cpp
@@ -457,11 +457,11 @@ Status RowBlockV2::_append_data_to_column(const ColumnVectorBatch* batch, size_t
             if (!nullable_mark_array[j]) {
                 uint32_t row_idx = j + start;
                 auto slice = reinterpret_cast<const Slice*>(batch->cell_ptr(row_idx));
-                if (LIKELY(slice->size <= MAX_SIZE_OF_VEC_STRING)) {
+                if (LIKELY(slice->size <= config::string_type_length_soft_limit_bytes)) {
                     column_string->insert_data(slice->data, slice->size);
                 } else {
                     return Status::NotSupported(
-                            "Not support string len over than 1MB in vec engine.");
+                            "Not support string len over than `string_type_length_soft_limit_bytes` in vec engine.");
                 }
             } else {
                 column_string->insert_default();
diff --git a/be/src/vec/olap/olap_data_convertor.cpp b/be/src/vec/olap/olap_data_convertor.cpp
index 60505252c1bda2..2cc4b9868aab3a 100644
--- a/be/src/vec/olap/olap_data_convertor.cpp
+++ b/be/src/vec/olap/olap_data_convertor.cpp
@@ -453,9 +453,9 @@ Status OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::convert_to_olap()
             if (!*nullmap_cur) {
                 slice->data = const_cast<char*>(char_data + string_offset);
                 slice->size = *offset_cur - string_offset - 1;
-                if (UNLIKELY(slice->size > MAX_SIZE_OF_VEC_STRING && _check_length)) {
+                if (UNLIKELY(slice->size > config::string_type_length_soft_limit_bytes && _check_length)) {
                     return Status::NotSupported(
-                            "Not support string len over than 1MB in vec engine.");
+                            "Not support string len over than `string_type_length_soft_limit_bytes` in vec engine.");
                 }
             } else {
                 // TODO: this may not be neccessary, check and remove later
@@ -472,8 +472,9 @@ Status OlapBlockDataConvertor::OlapColumnDataConvertorVarChar::convert_to_olap()
         while (offset_cur != offset_end) {
             slice->data = const_cast<char*>(char_data + string_offset);
             slice->size = *offset_cur - string_offset - 1;
-            if (UNLIKELY(slice->size > MAX_SIZE_OF_VEC_STRING && _check_length)) {
-                return Status::NotSupported("Not support string len over than 1MB in vec engine.");
+            if (UNLIKELY(slice->size > config::string_type_length_soft_limit_bytes && _check_length)) {
+                return Status::NotSupported("Not support string len over than `string_type_length_soft_limit_bytes`"
+                                            " in vec engine.");
             }
             string_offset = *offset_cur;
             ++slice;
diff --git a/gensrc/proto/internal_service.proto b/gensrc/proto/internal_service.proto
index 76371b61a7e5b6..ae2d1874124df6 100644
--- a/gensrc/proto/internal_service.proto
+++ b/gensrc/proto/internal_service.proto
@@ -116,7 +116,7 @@ message PTabletWriterAddBlockRequest {
     // If this is the last batch from this sender
     optional bool eos = 4;
 
-    required int64 packet_seq = 5;
+    optional int64 packet_seq = 5;
     repeated int64 tablet_ids = 6;
     // unset if and only if when eos is true
     optional PBlock block = 7;