From a28146dbd3f5dccced2038821a98f4629eddac81 Mon Sep 17 00:00:00 2001
From: Ann Zhang <ann.zhang@databricks.com>
Date: Wed, 5 Nov 2025 18:55:37 -0800
Subject: [PATCH 1/4] update

Signed-off-by: Ann Zhang <ann.zhang@databricks.com>
---
 dash-chatbot-app/model_serving_utils.py      | 2 +-
 gradio-chatbot-app/model_serving_utils.py    | 2 +-
 shiny-chatbot-app/model_serving_utils.py     | 2 +-
 streamlit-chatbot-app/model_serving_utils.py | 2 +-
 4 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/dash-chatbot-app/model_serving_utils.py b/dash-chatbot-app/model_serving_utils.py
index 96899c34..1c6d3e4b 100644
--- a/dash-chatbot-app/model_serving_utils.py
+++ b/dash-chatbot-app/model_serving_utils.py
@@ -10,7 +10,7 @@ def _get_endpoint_task_type(endpoint_name: str) -> str:
 def is_endpoint_supported(endpoint_name: str) -> bool:
     """Check if the endpoint has a supported task type."""
     task_type = _get_endpoint_task_type(endpoint_name)
-    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat"]
+    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat", "agent/v1/responses"]
     return task_type in supported_task_types
 
 def _validate_endpoint_task_type(endpoint_name: str) -> None:
diff --git a/gradio-chatbot-app/model_serving_utils.py b/gradio-chatbot-app/model_serving_utils.py
index 96899c34..1c6d3e4b 100644
--- a/gradio-chatbot-app/model_serving_utils.py
+++ b/gradio-chatbot-app/model_serving_utils.py
@@ -10,7 +10,7 @@ def _get_endpoint_task_type(endpoint_name: str) -> str:
 def is_endpoint_supported(endpoint_name: str) -> bool:
     """Check if the endpoint has a supported task type."""
     task_type = _get_endpoint_task_type(endpoint_name)
-    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat"]
+    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat", "agent/v1/responses"]
     return task_type in supported_task_types
 
 def _validate_endpoint_task_type(endpoint_name: str) -> None:
diff --git a/shiny-chatbot-app/model_serving_utils.py b/shiny-chatbot-app/model_serving_utils.py
index 405bed88..56f85a3e 100644
--- a/shiny-chatbot-app/model_serving_utils.py
+++ b/shiny-chatbot-app/model_serving_utils.py
@@ -10,7 +10,7 @@ def _get_endpoint_task_type(endpoint_name: str) -> str:
 def is_endpoint_supported(endpoint_name: str) -> bool:
     """Check if the endpoint has a supported task type."""
     task_type = _get_endpoint_task_type(endpoint_name)
-    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat"]
+    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat", "agent/v1/responses"]
     return task_type in supported_task_types
 
 def _validate_endpoint_task_type(endpoint_name: str) -> None:
diff --git a/streamlit-chatbot-app/model_serving_utils.py b/streamlit-chatbot-app/model_serving_utils.py
index e553bf92..946bb682 100644
--- a/streamlit-chatbot-app/model_serving_utils.py
+++ b/streamlit-chatbot-app/model_serving_utils.py
@@ -10,7 +10,7 @@ def _get_endpoint_task_type(endpoint_name: str) -> str:
 def is_endpoint_supported(endpoint_name: str) -> bool:
     """Check if the endpoint has a supported task type."""
     task_type = _get_endpoint_task_type(endpoint_name)
-    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat"]
+    supported_task_types = ["agent/v1/chat", "agent/v2/chat", "llm/v1/chat", "agent/v1/responses"]
     return task_type in supported_task_types
 
 def _validate_endpoint_task_type(endpoint_name: str) -> None:

From c201bcbdfd7113a0b1941d2dec8c0037607d8425 Mon Sep 17 00:00:00 2001
From: Ann Zhang <ann.zhang@databricks.com>
Date: Thu, 16 Apr 2026 17:29:48 -0700
Subject: [PATCH 2/4] Remove agent/v1/responses as a supported endpoint type

Co-authored-by: Ann Zhang
---
 .../packages/ai-sdk-providers/src/request-context.ts        | 6 ++----
 .../tests/ai-sdk-provider/request-context.test.ts           | 4 ----
 e2e-chatbot-app-next/tests/api-mocking/api-mock-handlers.ts | 4 ++--
 e2e-chatbot-app-next/tests/routes/context-injection.test.ts | 6 +++---
 4 files changed, 7 insertions(+), 13 deletions(-)

diff --git a/e2e-chatbot-app-next/packages/ai-sdk-providers/src/request-context.ts b/e2e-chatbot-app-next/packages/ai-sdk-providers/src/request-context.ts
index 4f08882a..2ec7b939 100644
--- a/e2e-chatbot-app-next/packages/ai-sdk-providers/src/request-context.ts
+++ b/e2e-chatbot-app-next/packages/ai-sdk-providers/src/request-context.ts
@@ -7,7 +7,7 @@
  *
  * Context is injected when:
  * 1. Using API_PROXY environment variable, OR
- * 2. Endpoint task type is 'agent/v2/chat' or 'agent/v1/responses'
+ * 2. Endpoint task type is 'agent/v2/chat'
  *
  * @param endpointTask - The task type of the serving endpoint (optional)
  * @returns Whether to inject context into requests
@@ -21,7 +21,5 @@ export function shouldInjectContextForEndpoint(
     return true;
   }
 
-  return (
-    endpointTask === 'agent/v2/chat' || endpointTask === 'agent/v1/responses'
-  );
+  return endpointTask === 'agent/v2/chat';
 }
diff --git a/e2e-chatbot-app-next/tests/ai-sdk-provider/request-context.test.ts b/e2e-chatbot-app-next/tests/ai-sdk-provider/request-context.test.ts
index 9f8e549f..c7531ba6 100644
--- a/e2e-chatbot-app-next/tests/ai-sdk-provider/request-context.test.ts
+++ b/e2e-chatbot-app-next/tests/ai-sdk-provider/request-context.test.ts
@@ -26,10 +26,6 @@ test.describe("Request Context Utils", () => {
       expect(shouldInjectContextForEndpoint("agent/v2/chat")).toBe(true);
     });
 
-    test("returns true for agent/v1/responses endpoint task", () => {
-      expect(shouldInjectContextForEndpoint("agent/v1/responses")).toBe(true);
-    });
-
     test("returns false for llm/v1/chat endpoint task", () => {
       expect(shouldInjectContextForEndpoint("llm/v1/chat")).toBe(false);
     });
diff --git a/e2e-chatbot-app-next/tests/api-mocking/api-mock-handlers.ts b/e2e-chatbot-app-next/tests/api-mocking/api-mock-handlers.ts
index f318dbc8..fd899747 100644
--- a/e2e-chatbot-app-next/tests/api-mocking/api-mock-handlers.ts
+++ b/e2e-chatbot-app-next/tests/api-mocking/api-mock-handlers.ts
@@ -323,13 +323,13 @@ export const handlers = [
   }),
 
   // Mock fetching endpoint details
-  // Returns agent/v1/responses to enable context injection testing
+  // Returns agent/v2/chat to enable context injection testing
   // Includes auth_policy to simulate an OBO-enabled endpoint
   http.get(/\/api\/2\.0\/serving-endpoints\/([^/]+)$/, ({ params }) => {
     const endpointName = (params as Record<string, string>)[0] ?? '';
     return HttpResponse.json({
       name: endpointName || 'test-endpoint',
-      task: 'agent/v1/responses',
+      task: 'agent/v2/chat',
       auth_policy: {
         user_auth_policy: {
           api_scopes: ['serving.serving-endpoints'],
diff --git a/e2e-chatbot-app-next/tests/routes/context-injection.test.ts b/e2e-chatbot-app-next/tests/routes/context-injection.test.ts
index 57876f3a..bc98da1f 100644
--- a/e2e-chatbot-app-next/tests/routes/context-injection.test.ts
+++ b/e2e-chatbot-app-next/tests/routes/context-injection.test.ts
@@ -7,9 +7,9 @@ import { TEST_PROMPTS } from '../prompts/routes';
  *
  * Context (conversation_id and user_id) should be injected when:
  * 1. API_PROXY environment variable is set, OR
- * 2. Endpoint task type is 'agent/v2/chat' or 'agent/v1/responses'
+ * 2. Endpoint task type is 'agent/v2/chat'
  *
- * The default mock returns 'agent/v1/responses', so context should be injected
+ * The default mock returns 'agent/v2/chat', so context should be injected
  * in all tests by default.
  */
 
@@ -31,7 +31,7 @@ test.describe
       await adaContext.request.post('/api/test/reset-captured-requests');
     });
 
-    test.describe('agent/v1/responses endpoints', () => {
+    test.describe('agent/v2/chat endpoints', () => {
       test('injects context with conversation_id and user_id', async ({
         adaContext,
       }) => {

From b0e0251a8508066476adca09dab1ba57e35af305 Mon Sep 17 00:00:00 2001
From: Ann Zhang <ann.zhang@databricks.com>
Date: Thu, 16 Apr 2026 16:59:48 -0700
Subject: [PATCH 3/4] Group consecutive tool calls into a shared render block

Co-authored-by: Ann Zhang
---
 .../client/src/components/message.tsx         | 312 +++++++++++-------
 1 file changed, 198 insertions(+), 114 deletions(-)

diff --git a/e2e-chatbot-app-next/client/src/components/message.tsx b/e2e-chatbot-app-next/client/src/components/message.tsx
index 2a296d7f..198fa8ae 100644
--- a/e2e-chatbot-app-next/client/src/components/message.tsx
+++ b/e2e-chatbot-app-next/client/src/components/message.tsx
@@ -105,6 +105,11 @@ const PurePreviewMessage = ({
     [message.parts],
   );
 
+  const renderBlocks = React.useMemo(
+    () => groupConsecutiveToolSegments(partSegments),
+    [partSegments],
+  );
+
   // Check if message only contains non-OAuth errors (no other content)
   const hasOnlyErrors = React.useMemo(() => {
     const nonErrorParts = message.parts.filter(
@@ -158,7 +163,22 @@ const PurePreviewMessage = ({
             </div>
           )}
 
-          {partSegments?.map((parts, index) => {
+          {renderBlocks.map((block) => {
+            if (block.kind === 'tool-group') {
+              return (
+                <MessageToolGroup
+                  key={`tool-group-${block.startIndex}`}
+                  tools={block.tools}
+                  isLoading={isLoading}
+                  submitApproval={submitApproval}
+                  isSubmitting={isSubmitting}
+                  pendingApprovalId={pendingApprovalId}
+                />
+              );
+            }
+
+            const parts = block.parts;
+            const index = block.index;
             const [part] = parts;
             const { type } = part;
             const key = `message-${message.id}-part-${index}`;
@@ -223,119 +243,7 @@ const PurePreviewMessage = ({
               }
             }
 
-            // Render Databricks tool calls and results
-            if (part.type === `dynamic-tool`) {
-              const { toolCallId, input, state, errorText, output, toolName } =
-                part;
-
-              // Check if this is an MCP tool call by looking for approvalRequestId in metadata
-              // This works across all states (approval-requested, approval-denied, output-available)
-              const isMcpApproval =
-                part.callProviderMetadata?.databricks?.approvalRequestId !=
-                null;
-              const mcpServerName =
-                part.callProviderMetadata?.databricks?.mcpServerName?.toString();
-
-              // Extract approval outcome for 'approval-responded' state
-              // When addToolApprovalResponse is called, AI SDK sets the `approval` property
-              // on the tool-call part and changes state to 'approval-responded'
-              const approved: boolean | undefined =
-                'approval' in part ? part.approval?.approved : undefined;
-
-              // When approved but only have approval status (not actual output), show as input-available
-              const effectiveState: ToolState = (() => {
-                if (
-                  part.providerExecuted &&
-                  !isLoading &&
-                  state === 'input-available'
-                ) {
-                  return 'output-available';
-                }
-                return state;
-              })();
-
-              // Render MCP tool calls with special styling
-              if (isMcpApproval) {
-                return (
-                  <McpTool key={toolCallId} defaultOpen={true}>
-                    <McpToolHeader
-                      serverName={mcpServerName}
-                      toolName={toolName}
-                      state={effectiveState}
-                      approved={approved}
-                    />
-                    <McpToolContent>
-                      <McpToolInput input={input} />
-                      {state === 'approval-requested' && (
-                        <McpApprovalActions
-                          onApprove={() =>
-                            submitApproval({
-                              approvalRequestId: toolCallId,
-                              approve: true,
-                            })
-                          }
-                          onDeny={() =>
-                            submitApproval({
-                              approvalRequestId: toolCallId,
-                              approve: false,
-                            })
-                          }
-                          isSubmitting={
-                            isSubmitting && pendingApprovalId === toolCallId
-                          }
-                        />
-                      )}
-                      {state === 'output-available' && output != null && (
-                        <ToolOutput
-                          output={
-                            errorText ? (
-                              <div className="rounded border p-2 text-red-500">
-                                Error: {errorText}
-                              </div>
-                            ) : (
-                              <div className="whitespace-pre-wrap font-mono text-sm">
-                                {typeof output === 'string'
-                                  ? output
-                                  : JSON.stringify(output, null, 2)}
-                              </div>
-                            )
-                          }
-                          errorText={undefined}
-                        />
-                      )}
-                    </McpToolContent>
-                  </McpTool>
-                );
-              }
-
-              // Render regular tool calls
-              return (
-                <Tool key={toolCallId} defaultOpen={true}>
-                  <ToolHeader type={toolName} state={effectiveState} />
-                  <ToolContent>
-                    <ToolInput input={input} />
-                    {state === 'output-available' && (
-                      <ToolOutput
-                        output={
-                          errorText ? (
-                            <div className="rounded border p-2 text-red-500">
-                              Error: {errorText}
-                            </div>
-                          ) : (
-                            <div className="whitespace-pre-wrap font-mono text-sm">
-                              {typeof output === 'string'
-                                ? output
-                                : JSON.stringify(output, null, 2)}
-                            </div>
-                          )
-                        }
-                        errorText={undefined}
-                      />
-                    )}
-                  </ToolContent>
-                </Tool>
-              );
-            }
+            // dynamic-tool parts are rendered by MessageToolGroup above.
 
             // Support for citations/annotations
             if (type === 'source-url') {
@@ -417,6 +325,182 @@ export const PreviewMessage = memo(
   },
 );
 
+type ChatPart = ChatMessage['parts'][number];
+type ToolPart = Extract<ChatPart, { type: 'dynamic-tool' }>;
+
+type RenderBlock =
+  | { kind: 'segment'; parts: ChatPart[]; index: number }
+  | { kind: 'tool-group'; tools: ToolPart[]; startIndex: number };
+
+const groupConsecutiveToolSegments = (
+  partSegments: ChatPart[][],
+): RenderBlock[] => {
+  const blocks: RenderBlock[] = [];
+  let i = 0;
+  while (i < partSegments.length) {
+    const segment = partSegments[i];
+    const firstPart = segment[0];
+    if (firstPart?.type === 'dynamic-tool') {
+      const startIndex = i;
+      const tools: ToolPart[] = [firstPart as ToolPart];
+      i++;
+      while (
+        i < partSegments.length &&
+        partSegments[i][0]?.type === 'dynamic-tool'
+      ) {
+        tools.push(partSegments[i][0] as ToolPart);
+        i++;
+      }
+      blocks.push({ kind: 'tool-group', tools, startIndex });
+    } else {
+      blocks.push({ kind: 'segment', parts: segment, index: i });
+      i++;
+    }
+  }
+  return blocks;
+};
+
+const MessageToolGroup = ({
+  tools,
+  isLoading,
+  submitApproval,
+  isSubmitting,
+  pendingApprovalId,
+}: {
+  tools: ToolPart[];
+  isLoading: boolean;
+  submitApproval: ReturnType<typeof useApproval>['submitApproval'];
+  isSubmitting: boolean;
+  pendingApprovalId: string | null;
+}) => {
+  const isMultiple = tools.length > 1;
+  return (
+    <div
+      className={cn('flex flex-col gap-2', {
+        'rounded-md border border-border/60 bg-muted/20 p-2': isMultiple,
+      })}
+      data-testid={isMultiple ? 'tool-group' : undefined}
+    >
+      {tools.map((tool) => (
+        <ToolPartRenderer
+          key={tool.toolCallId}
+          part={tool}
+          isLoading={isLoading}
+          submitApproval={submitApproval}
+          isSubmitting={isSubmitting}
+          pendingApprovalId={pendingApprovalId}
+        />
+      ))}
+    </div>
+  );
+};
+
+const ToolPartRenderer = ({
+  part,
+  isLoading,
+  submitApproval,
+  isSubmitting,
+  pendingApprovalId,
+}: {
+  part: ToolPart;
+  isLoading: boolean;
+  submitApproval: ReturnType<typeof useApproval>['submitApproval'];
+  isSubmitting: boolean;
+  pendingApprovalId: string | null;
+}) => {
+  const { toolCallId, input, state, errorText, output, toolName } = part;
+
+  const isMcpApproval =
+    part.callProviderMetadata?.databricks?.approvalRequestId != null;
+  const mcpServerName =
+    part.callProviderMetadata?.databricks?.mcpServerName?.toString();
+
+  const approved: boolean | undefined =
+    'approval' in part ? part.approval?.approved : undefined;
+
+  const effectiveState: ToolState = (() => {
+    if (part.providerExecuted && !isLoading && state === 'input-available') {
+      return 'output-available';
+    }
+    return state;
+  })();
+
+  if (isMcpApproval) {
+    return (
+      <McpTool defaultOpen={true}>
+        <McpToolHeader
+          serverName={mcpServerName}
+          toolName={toolName}
+          state={effectiveState}
+          approved={approved}
+        />
+        <McpToolContent>
+          <McpToolInput input={input} />
+          {state === 'approval-requested' && (
+            <McpApprovalActions
+              onApprove={() =>
+                submitApproval({ approvalRequestId: toolCallId, approve: true })
+              }
+              onDeny={() =>
+                submitApproval({
+                  approvalRequestId: toolCallId,
+                  approve: false,
+                })
+              }
+              isSubmitting={isSubmitting && pendingApprovalId === toolCallId}
+            />
+          )}
+          {state === 'output-available' && output != null && (
+            <ToolOutput
+              output={
+                errorText ? (
+                  <div className="rounded border p-2 text-red-500">
+                    Error: {errorText}
+                  </div>
+                ) : (
+                  <div className="whitespace-pre-wrap font-mono text-sm">
+                    {typeof output === 'string'
+                      ? output
+                      : JSON.stringify(output, null, 2)}
+                  </div>
+                )
+              }
+              errorText={undefined}
+            />
+          )}
+        </McpToolContent>
+      </McpTool>
+    );
+  }
+
+  return (
+    <Tool key={toolCallId} defaultOpen={true}>
+      <ToolHeader type={toolName} state={effectiveState} />
+      <ToolContent>
+        <ToolInput input={input} />
+        {state === 'output-available' && (
+          <ToolOutput
+            output={
+              errorText ? (
+                <div className="rounded border p-2 text-red-500">
+                  Error: {errorText}
+                </div>
+              ) : (
+                <div className="whitespace-pre-wrap font-mono text-sm">
+                  {typeof output === 'string'
+                    ? output
+                    : JSON.stringify(output, null, 2)}
+                </div>
+              )
+            }
+            errorText={undefined}
+          />
+        )}
+      </ToolContent>
+    </Tool>
+  );
+};
+
 export const AwaitingResponseMessage = () => {
   const role = 'assistant';
 

From 5a3bd9016f2f403518e555e6c5ff6823d9d3fe72 Mon Sep 17 00:00:00 2001
From: Ann Zhang <ann.zhang@databricks.com>
Date: Thu, 16 Apr 2026 17:00:08 -0700
Subject: [PATCH 4/4] Collapse tool groups with more than 5 tool calls

Co-authored-by: Ann Zhang
---
 .../client/src/components/message.tsx         | 52 +++++++++++++++----
 1 file changed, 42 insertions(+), 10 deletions(-)

diff --git a/e2e-chatbot-app-next/client/src/components/message.tsx b/e2e-chatbot-app-next/client/src/components/message.tsx
index 198fa8ae..c533eaba 100644
--- a/e2e-chatbot-app-next/client/src/components/message.tsx
+++ b/e2e-chatbot-app-next/client/src/components/message.tsx
@@ -1,4 +1,10 @@
 import React, { memo, useState } from 'react';
+import {
+  Collapsible,
+  CollapsibleContent,
+  CollapsibleTrigger,
+} from '@/components/ui/collapsible';
+import { ChevronDownIcon } from 'lucide-react';
 import { AnimatedAssistantIcon } from './animation-assistant-icon';
 import { Response } from './elements/response';
 import { MessageContent } from './elements/message';
@@ -360,6 +366,8 @@ const groupConsecutiveToolSegments = (
   return blocks;
 };
 
+const TOOL_GROUP_COLLAPSE_THRESHOLD = 5;
+
 const MessageToolGroup = ({
   tools,
   isLoading,
@@ -374,6 +382,25 @@ const MessageToolGroup = ({
   pendingApprovalId: string | null;
 }) => {
   const isMultiple = tools.length > 1;
+  const shouldCollapse = tools.length > TOOL_GROUP_COLLAPSE_THRESHOLD;
+  const visibleTools = shouldCollapse
+    ? tools.slice(0, TOOL_GROUP_COLLAPSE_THRESHOLD)
+    : tools;
+  const hiddenTools = shouldCollapse
+    ? tools.slice(TOOL_GROUP_COLLAPSE_THRESHOLD)
+    : [];
+
+  const renderTool = (tool: ToolPart) => (
+    <ToolPartRenderer
+      key={tool.toolCallId}
+      part={tool}
+      isLoading={isLoading}
+      submitApproval={submitApproval}
+      isSubmitting={isSubmitting}
+      pendingApprovalId={pendingApprovalId}
+    />
+  );
+
   return (
     <div
       className={cn('flex flex-col gap-2', {
@@ -381,16 +408,21 @@ const MessageToolGroup = ({
       })}
       data-testid={isMultiple ? 'tool-group' : undefined}
     >
-      {tools.map((tool) => (
-        <ToolPartRenderer
-          key={tool.toolCallId}
-          part={tool}
-          isLoading={isLoading}
-          submitApproval={submitApproval}
-          isSubmitting={isSubmitting}
-          pendingApprovalId={pendingApprovalId}
-        />
-      ))}
+      {visibleTools.map(renderTool)}
+      {shouldCollapse && (
+        <Collapsible className="group">
+          <CollapsibleContent>{hiddenTools.map(renderTool)}</CollapsibleContent>
+          <CollapsibleTrigger className="flex items-center gap-1 text-sm text-muted-foreground hover:text-foreground">
+            <ChevronDownIcon className="size-4 transition-transform group-data-[state=open]:rotate-180" />
+            <span className="group-data-[state=open]:hidden">
+              +{hiddenTools.length} more tool use(s)
+            </span>
+            <span className="hidden group-data-[state=open]:inline">
+              Show less
+            </span>
+          </CollapsibleTrigger>
+        </Collapsible>
+      )}
     </div>
   );
 };