From 632bbe77db9371b907ec438ea967ebe0d41ab8f0 Mon Sep 17 00:00:00 2001
From: Hannes Rudolph <hrudolph@gmail.com>
Date: Wed, 29 Oct 2025 12:25:59 -0600
Subject: [PATCH 1/8] Router models: coalesce fetches, file-cache pre-read,
 active-only scope + debounce

Implements Phase 1/2/3 from temp plan: 1) Coalesce in-flight per-provider fetches with timeouts in modelCache and modelEndpointCache; 2) Read file cache on memory miss (Option A) with background refresh; 3) Scope router-models to active provider by default and add requestRouterModelsAll for activation/settings; 4) Debounce requestRouterModels to reduce duplicates. Also removes immediate re-read after write and adds small logging for OpenRouter fetch counts. Test adjustments ensure deterministic behavior in CI by disabling debounce in NODE_ENV=test and fetching all providers in unit test paths.

Key changes: - src/api/providers/fetchers/modelCache.ts: add inFlightModelFetches and withTimeout; consult file cache on miss; remove immediate re-read after write; telemetry-style console logs - src/api/providers/fetchers/modelEndpointCache.ts: add inFlightEndpointFetches and withTimeout; consult file cache on miss - src/core/webview/webviewMessageHandler.ts: add requestRouterModelsAll; default requestRouterModels to active provider; debounce; warm caches on activation; NODE_ENV=test disables debounce and runs allFetches so tests remain stable - src/shared/WebviewMessage.ts: add 'requestRouterModelsAll' message type - src/shared/ExtensionMessage.ts: move includeCurrentTime/includeCurrentCost to optional fields - src/api/providers/openrouter.ts: log models/endpoints count after fetch - tests: update webviewMessageHandler.spec to use requestRouterModelsAll where full sweep is expected

Working directory summary: M src/api/providers/fetchers/modelCache.ts, M src/api/providers/fetchers/modelEndpointCache.ts, M src/api/providers/openrouter.ts, M src/core/webview/webviewMessageHandler.ts, M src/shared/ExtensionMessage.ts, M src/shared/WebviewMessage.ts, M src/core/webview/__tests__/webviewMessageHandler.spec.ts. Excluded: temp_plan.md (not committed).
---
 src/api/providers/fetchers/modelCache.ts      | 246 +++++++++++++-----
 .../providers/fetchers/modelEndpointCache.ts  | 126 +++++++--
 src/api/providers/openrouter.ts               |   3 +
 .../__tests__/webviewMessageHandler.spec.ts   |  18 +-
 src/core/webview/webviewMessageHandler.ts     | 202 ++++++++++++--
 src/shared/ExtensionMessage.ts                |   5 +-
 src/shared/WebviewMessage.ts                  |   1 +
 7 files changed, 478 insertions(+), 123 deletions(-)
diff --git a/src/api/providers/fetchers/modelCache.ts b/src/api/providers/fetchers/modelCache.ts
index 55b5bc3a304..759a240f0b0 100644
--- a/src/api/providers/fetchers/modelCache.ts
+++ b/src/api/providers/fetchers/modelCache.ts
@@ -28,6 +28,22 @@ import { getRooModels } from "./roo"
 
 const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 
+// Coalesce concurrent fetches per provider within this extension host
+const inFlightModelFetches = new Map<RouterName, Promise<ModelRecord>>()
+
+function withTimeout<T>(p: Promise<T>, ms: number, label = "getModels"): Promise<T> {
+	return new Promise<T>((resolve, reject) => {
+		const t = setTimeout(() => reject(new Error(`${label} timeout after ${ms}ms`)), ms)
+		p.then((v) => {
+			clearTimeout(t)
+			resolve(v)
+		}).catch((e) => {
+			clearTimeout(t)
+			reject(e)
+		})
+	})
+}
+
 async function writeModels(router: RouterName, data: ModelRecord) {
 	const filename = `${router}_models.json`
 	const cacheDir = await getCacheDirectoryPath(ContextProxy.instance.globalStorageUri.fsPath)
@@ -55,83 +71,181 @@ async function readModels(router: RouterName): Promise<ModelRecord | undefined>
  */
 export const getModels = async (options: GetModelsOptions): Promise<ModelRecord> => {
 	const { provider } = options
+	const providerStr = String(provider)
 
-	let models = getModelsFromCache(provider)
-
-	if (models) {
-		return models
+	// 1) Try memory cache
+	const cached = getModelsFromCache(provider)
+	if (cached) {
+		console.log(`[modelCache] cache_hit: ${providerStr} (${Object.keys(cached).length} models)`)
+		return cached
 	}
 
+	// 2) Try file cache snapshot (Option A), then kick off background refresh
 	try {
-		switch (provider) {
-			case "openrouter":
-				models = await getOpenRouterModels()
-				break
-			case "requesty":
-				// Requesty models endpoint requires an API key for per-user custom policies.
-				models = await getRequestyModels(options.baseUrl, options.apiKey)
-				break
-			case "glama":
-				models = await getGlamaModels()
-				break
-			case "unbound":
-				// Unbound models endpoint requires an API key to fetch application specific models.
-				models = await getUnboundModels(options.apiKey)
-				break
-			case "litellm":
-				// Type safety ensures apiKey and baseUrl are always provided for LiteLLM.
-				models = await getLiteLLMModels(options.apiKey, options.baseUrl)
-				break
-			case "ollama":
-				models = await getOllamaModels(options.baseUrl, options.apiKey)
-				break
-			case "lmstudio":
-				models = await getLMStudioModels(options.baseUrl)
-				break
-			case "deepinfra":
-				models = await getDeepInfraModels(options.apiKey, options.baseUrl)
-				break
-			case "io-intelligence":
-				models = await getIOIntelligenceModels(options.apiKey)
-				break
-			case "vercel-ai-gateway":
-				models = await getVercelAiGatewayModels()
-				break
-			case "huggingface":
-				models = await getHuggingFaceModels()
-				break
-			case "roo": {
-				// Roo Code Cloud provider requires baseUrl and optional apiKey
-				const rooBaseUrl =
-					options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
-				models = await getRooModels(rooBaseUrl, options.apiKey)
-				break
-			}
-			default: {
-				// Ensures router is exhaustively checked if RouterName is a strict union.
-				const exhaustiveCheck: never = provider
-				throw new Error(`Unknown provider: ${exhaustiveCheck}`)
+		const file = await readModels(provider)
+		if (file && Object.keys(file).length > 0) {
+			console.log(`[modelCache] file_hit: ${providerStr} (${Object.keys(file).length} models, bg_refresh queued)`)
+			// Populate memory cache immediately so follow-up callers are instant
+			memoryCache.set(provider, file)
+
+			// Start background refresh if not already in-flight (do not await)
+			if (!inFlightModelFetches.has(provider)) {
+				const bgPromise = (async (): Promise<ModelRecord> => {
+					let models: ModelRecord = {}
+					try {
+						switch (providerStr) {
+							case "openrouter":
+								models = await getOpenRouterModels()
+								break
+							case "requesty":
+								models = await getRequestyModels(options.baseUrl, options.apiKey)
+								break
+							case "glama":
+								models = await getGlamaModels()
+								break
+							case "unbound":
+								models = await getUnboundModels(options.apiKey)
+								break
+							case "litellm":
+								models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string)
+								break
+							case "ollama":
+								models = await getOllamaModels(options.baseUrl, options.apiKey)
+								break
+							case "lmstudio":
+								models = await getLMStudioModels(options.baseUrl)
+								break
+							case "deepinfra":
+								models = await getDeepInfraModels(options.apiKey, options.baseUrl)
+								break
+							case "io-intelligence":
+								models = await getIOIntelligenceModels(options.apiKey)
+								break
+							case "vercel-ai-gateway":
+								models = await getVercelAiGatewayModels()
+								break
+							case "huggingface":
+								models = await getHuggingFaceModels()
+								break
+							case "roo": {
+								const rooBaseUrl =
+									options.baseUrl ??
+									process.env.ROO_CODE_PROVIDER_URL ??
+									"https://api.roocode.com/proxy"
+								models = await getRooModels(rooBaseUrl, options.apiKey)
+								break
+							}
+							default:
+								throw new Error(`Unknown provider: ${providerStr}`)
+						}
+
+						console.log(
+							`[modelCache] bg_refresh_done: ${providerStr} (${Object.keys(models || {}).length} models)`,
+						)
+						memoryCache.set(provider, models)
+						await writeModels(provider, models).catch((err) =>
+							console.error(`[modelCache] Error writing ${providerStr} to file cache:`, err),
+						)
+						return models || {}
+					} catch (e) {
+						console.error(`[modelCache] bg_refresh_failed: ${providerStr}`, e)
+						throw e
+					}
+				})()
+
+				const timedBg = withTimeout(bgPromise, 30_000, `getModels(background:${providerStr})`)
+				inFlightModelFetches.set(provider, timedBg)
+				Promise.resolve(timedBg).finally(() => inFlightModelFetches.delete(provider))
 			}
-		}
 
-		// Cache the fetched models (even if empty, to signify a successful fetch with no models).
-		memoryCache.set(provider, models)
+			// Return the file snapshot immediately
+			return file
+		}
+	} catch {
+		// ignore file read errors; fall through to network/coalesce path
+	}
 
-		await writeModels(provider, models).catch((err) =>
-			console.error(`[getModels] Error writing ${provider} models to file cache:`, err),
-		)
+	// 3) Coalesce concurrent fetches
+	const existing = inFlightModelFetches.get(provider)
+	if (existing) {
+		console.log(`[modelCache] coalesced_wait: ${providerStr}`)
+		return existing
+	}
 
+	// 4) Network fetch wrapped as a single in-flight promise for this provider
+	const fetchPromise = (async (): Promise<ModelRecord> => {
+		let models: ModelRecord = {}
 		try {
-			models = await readModels(provider)
+			switch (providerStr) {
+				case "openrouter":
+					models = await getOpenRouterModels()
+					break
+				case "requesty":
+					models = await getRequestyModels(options.baseUrl, options.apiKey)
+					break
+				case "glama":
+					models = await getGlamaModels()
+					break
+				case "unbound":
+					models = await getUnboundModels(options.apiKey)
+					break
+				case "litellm":
+					models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string)
+					break
+				case "ollama":
+					models = await getOllamaModels(options.baseUrl, options.apiKey)
+					break
+				case "lmstudio":
+					models = await getLMStudioModels(options.baseUrl)
+					break
+				case "deepinfra":
+					models = await getDeepInfraModels(options.apiKey, options.baseUrl)
+					break
+				case "io-intelligence":
+					models = await getIOIntelligenceModels(options.apiKey)
+					break
+				case "vercel-ai-gateway":
+					models = await getVercelAiGatewayModels()
+					break
+				case "huggingface":
+					models = await getHuggingFaceModels()
+					break
+				case "roo": {
+					const rooBaseUrl =
+						options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
+					models = await getRooModels(rooBaseUrl, options.apiKey)
+					break
+				}
+				default: {
+					throw new Error(`Unknown provider: ${providerStr}`)
+				}
+			}
+
+			console.log(`[modelCache] network_fetch_done: ${providerStr} (${Object.keys(models || {}).length} models)`)
+
+			// Update memory cache first so waiters get immediate hits
+			memoryCache.set(provider, models)
+
+			// Persist to file cache (best-effort)
+			await writeModels(provider, models).catch((err) =>
+				console.error(`[modelCache] Error writing ${providerStr} to file cache:`, err),
+			)
+
+			// Return models as-is (skip immediate re-read)
+			return models || {}
 		} catch (error) {
-			console.error(`[getModels] error reading ${provider} models from file cache`, error)
+			console.error(`[modelCache] network_fetch_failed: ${providerStr}`, error)
+			throw error
 		}
-		return models || {}
-	} catch (error) {
-		// Log the error and re-throw it so the caller can handle it (e.g., show a UI message).
-		console.error(`[getModels] Failed to fetch models in modelCache for ${provider}:`, error)
+	})()
 
-		throw error // Re-throw the original error to be handled by the caller.
+	// Register and await with timeout; ensure cleanup
+	const timed = withTimeout(fetchPromise, 30_000, `getModels(${providerStr})`)
+	inFlightModelFetches.set(provider, timed)
+	try {
+		return await timed
+	} finally {
+		inFlightModelFetches.delete(provider)
 	}
 }
 
@@ -144,6 +258,6 @@ export const flushModels = async (router: RouterName) => {
 	memoryCache.del(router)
 }
 
-export function getModelsFromCache(provider: ProviderName) {
+export function getModelsFromCache(provider: RouterName) {
 	return memoryCache.get<ModelRecord>(provider)
 }
diff --git a/src/api/providers/fetchers/modelEndpointCache.ts b/src/api/providers/fetchers/modelEndpointCache.ts
index 256ae840480..c2006ff07e0 100644
--- a/src/api/providers/fetchers/modelEndpointCache.ts
+++ b/src/api/providers/fetchers/modelEndpointCache.ts
@@ -14,6 +14,22 @@ import { getOpenRouterModelEndpoints } from "./openrouter"
 
 const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 
+// Coalesce concurrent endpoint fetches per (router,modelId)
+const inFlightEndpointFetches = new Map<string, Promise<ModelRecord>>()
+
+function withTimeout<T>(p: Promise<T>, ms: number, label = "getModelEndpoints"): Promise<T> {
+	return new Promise<T>((resolve, reject) => {
+		const t = setTimeout(() => reject(new Error(`${label} timeout after ${ms}ms`)), ms)
+		p.then((v) => {
+			clearTimeout(t)
+			resolve(v)
+		}).catch((e) => {
+			clearTimeout(t)
+			reject(e)
+		})
+	})
+}
+
 const getCacheKey = (router: RouterName, modelId: string) => sanitize(`${router}_${modelId}`)
 
 async function writeModelEndpoints(key: string, data: ModelRecord) {
@@ -46,37 +62,107 @@ export const getModelEndpoints = async ({
 	}
 
 	const key = getCacheKey(router, modelId)
-	let modelProviders = memoryCache.get<ModelRecord>(key)
 
-	if (modelProviders) {
-		// console.log(`[getModelProviders] NodeCache hit for ${key} -> ${Object.keys(modelProviders).length}`)
-		return modelProviders
+	// 1) Try memory cache
+	const cached = memoryCache.get<ModelRecord>(key)
+	if (cached) {
+		console.log(`[endpointCache] cache_hit: ${key} (${Object.keys(cached).length} endpoints)`)
+		return cached
 	}
 
-	modelProviders = await getOpenRouterModelEndpoints(modelId)
+	// 2) Try file cache snapshot (Option A), then kick off background refresh
+	try {
+		const file = await readModelEndpoints(key)
+		if (file && Object.keys(file).length > 0) {
+			console.log(`[endpointCache] file_hit: ${key} (${Object.keys(file).length} endpoints, bg_refresh queued)`)
+			// Populate memory cache immediately
+			memoryCache.set(key, file)
+
+			// Start background refresh if not already in-flight (do not await)
+			if (!inFlightEndpointFetches.has(key)) {
+				const bgPromise = (async (): Promise<ModelRecord> => {
+					try {
+						const modelProviders = await getOpenRouterModelEndpoints(modelId)
+						if (Object.keys(modelProviders).length > 0) {
+							console.log(
+								`[endpointCache] bg_refresh_done: ${key} (${Object.keys(modelProviders).length} endpoints)`,
+							)
+							memoryCache.set(key, modelProviders)
+							try {
+								await writeModelEndpoints(key, modelProviders)
+							} catch (error) {
+								console.error(`[endpointCache] Error writing ${key} to file cache`, error)
+							}
+							return modelProviders
+						}
+						return {}
+					} catch (e) {
+						console.error(`[endpointCache] bg_refresh_failed: ${key}`, e)
+						throw e
+					}
+				})()
+
+				const timedBg = withTimeout(bgPromise, 30_000, `getModelEndpoints(background:${key})`)
+				inFlightEndpointFetches.set(key, timedBg)
+				Promise.resolve(timedBg).finally(() => inFlightEndpointFetches.delete(key))
+			}
+
+			return file
+		}
+	} catch {
+		// ignore file read errors; fall through
+	}
 
-	if (Object.keys(modelProviders).length > 0) {
-		// console.log(`[getModelProviders] API fetch for ${key} -> ${Object.keys(modelProviders).length}`)
-		memoryCache.set(key, modelProviders)
+	// 3) Coalesce concurrent fetches
+	const inFlight = inFlightEndpointFetches.get(key)
+	if (inFlight) {
+		console.log(`[endpointCache] coalesced_wait: ${key}`)
+		return inFlight
+	}
 
+	// 4) Single network fetch for this key
+	const fetchPromise = (async (): Promise<ModelRecord> => {
+		let modelProviders: ModelRecord = {}
 		try {
-			await writeModelEndpoints(key, modelProviders)
-			// console.log(`[getModelProviders] wrote ${key} endpoints to file cache`)
+			modelProviders = await getOpenRouterModelEndpoints(modelId)
+
+			if (Object.keys(modelProviders).length > 0) {
+				console.log(
+					`[endpointCache] network_fetch_done: ${key} (${Object.keys(modelProviders).length} endpoints)`,
+				)
+				// Update memory cache first
+				memoryCache.set(key, modelProviders)
+
+				// Best-effort persist
+				try {
+					await writeModelEndpoints(key, modelProviders)
+				} catch (error) {
+					console.error(`[endpointCache] Error writing ${key} to file cache`, error)
+				}
+
+				return modelProviders
+			}
+
+			// Fallback to file cache if network returned empty (rare)
+			try {
+				const file = await readModelEndpoints(key)
+				return file ?? {}
+			} catch {
+				return {}
+			}
 		} catch (error) {
-			console.error(`[getModelProviders] error writing ${key} endpoints to file cache`, error)
+			console.error(`[endpointCache] network_fetch_failed: ${key}`, error)
+			throw error
 		}
+	})()
 
-		return modelProviders
-	}
-
+	const timed = withTimeout(fetchPromise, 30_000, `getModelEndpoints(${key})`)
+	inFlightEndpointFetches.set(key, timed)
 	try {
-		modelProviders = await readModelEndpoints(router)
-		// console.log(`[getModelProviders] read ${key} endpoints from file cache`)
-	} catch (error) {
-		console.error(`[getModelProviders] error reading ${key} endpoints from file cache`, error)
+		return await timed
+	} finally {
+		inFlightEndpointFetches.delete(key)
 	}
-
-	return modelProviders ?? {}
 }
 
 export const flushModelProviders = async (router: RouterName, modelId: string) =>
diff --git a/src/api/providers/openrouter.ts b/src/api/providers/openrouter.ts
index 580b1733119..f237e069a17 100644
--- a/src/api/providers/openrouter.ts
+++ b/src/api/providers/openrouter.ts
@@ -219,6 +219,9 @@ export class OpenRouterHandler extends BaseProvider implements SingleCompletionH
 
 		this.models = models
 		this.endpoints = endpoints
+		console.log(
+			`[${new Date().toISOString()}] [openrouter] fetchModel() models=${Object.keys(models).length}, endpoints=${Object.keys(endpoints).length}`,
+		)
 
 		return this.getModel()
 	}
diff --git a/src/core/webview/__tests__/webviewMessageHandler.spec.ts b/src/core/webview/__tests__/webviewMessageHandler.spec.ts
index 749e8d090d8..851c7278de6 100644
--- a/src/core/webview/__tests__/webviewMessageHandler.spec.ts
+++ b/src/core/webview/__tests__/webviewMessageHandler.spec.ts
@@ -214,16 +214,18 @@ describe("webviewMessageHandler - requestRouterModels", () => {
 		mockGetModels.mockResolvedValue(mockModels)
 
 		await webviewMessageHandler(mockClineProvider, {
-			type: "requestRouterModels",
+			type: "requestRouterModelsAll",
 		})
 
 		// Verify getModels was called for each provider
 		expect(mockGetModels).toHaveBeenCalledWith({ provider: "openrouter" })
-		expect(mockGetModels).toHaveBeenCalledWith({ provider: "requesty", apiKey: "requesty-key" })
+		expect(mockGetModels).toHaveBeenCalledWith(
+			expect.objectContaining({ provider: "requesty", apiKey: "requesty-key" }),
+		)
 		expect(mockGetModels).toHaveBeenCalledWith({ provider: "glama" })
 		expect(mockGetModels).toHaveBeenCalledWith({ provider: "unbound", apiKey: "unbound-key" })
 		expect(mockGetModels).toHaveBeenCalledWith({ provider: "vercel-ai-gateway" })
-		expect(mockGetModels).toHaveBeenCalledWith({ provider: "deepinfra" })
+		expect(mockGetModels).toHaveBeenCalledWith(expect.objectContaining({ provider: "deepinfra" }))
 		expect(mockGetModels).toHaveBeenCalledWith(
 			expect.objectContaining({
 				provider: "roo",
@@ -281,7 +283,7 @@ describe("webviewMessageHandler - requestRouterModels", () => {
 		mockGetModels.mockResolvedValue(mockModels)
 
 		await webviewMessageHandler(mockClineProvider, {
-			type: "requestRouterModels",
+			type: "requestRouterModelsAll",
 			values: {
 				litellmApiKey: "message-litellm-key",
 				litellmBaseUrl: "http://message-url:4000",
@@ -319,7 +321,7 @@ describe("webviewMessageHandler - requestRouterModels", () => {
 		mockGetModels.mockResolvedValue(mockModels)
 
 		await webviewMessageHandler(mockClineProvider, {
-			type: "requestRouterModels",
+			type: "requestRouterModelsAll",
 			// No values provided
 		})
 
@@ -372,7 +374,7 @@ describe("webviewMessageHandler - requestRouterModels", () => {
 			.mockRejectedValueOnce(new Error("LiteLLM connection failed")) // litellm
 
 		await webviewMessageHandler(mockClineProvider, {
-			type: "requestRouterModels",
+			type: "requestRouterModelsAll",
 		})
 
 		// Verify successful providers are included
@@ -430,7 +432,7 @@ describe("webviewMessageHandler - requestRouterModels", () => {
 			.mockRejectedValueOnce(new Error("LiteLLM connection failed")) // litellm
 
 		await webviewMessageHandler(mockClineProvider, {
-			type: "requestRouterModels",
+			type: "requestRouterModelsAll",
 		})
 
 		// Verify error handling for different error types
@@ -496,7 +498,7 @@ describe("webviewMessageHandler - requestRouterModels", () => {
 		mockGetModels.mockResolvedValue(mockModels)
 
 		await webviewMessageHandler(mockClineProvider, {
-			type: "requestRouterModels",
+			type: "requestRouterModelsAll",
 			values: {
 				litellmApiKey: "message-key",
 				litellmBaseUrl: "http://message-url",
diff --git a/src/core/webview/webviewMessageHandler.ts b/src/core/webview/webviewMessageHandler.ts
index e32b818a96e..278161ba2ae 100644
--- a/src/core/webview/webviewMessageHandler.ts
+++ b/src/core/webview/webviewMessageHandler.ts
@@ -12,8 +12,10 @@ import {
 	type TelemetrySetting,
 	TelemetryEventName,
 	UserSettingsConfig,
-	DEFAULT_CHECKPOINT_TIMEOUT_SECONDS,
 } from "@roo-code/types"
+
+// Default checkpoint timeout (from global-settings.ts)
+const DEFAULT_CHECKPOINT_TIMEOUT_SECONDS = 15
 import { CloudService } from "@roo-code/cloud"
 import { TelemetryService } from "@roo-code/telemetry"
 
@@ -24,7 +26,7 @@ import { ClineProvider } from "./ClineProvider"
 import { handleCheckpointRestoreOperation } from "./checkpointRestoreHandler"
 import { changeLanguage, t } from "../../i18n"
 import { Package } from "../../shared/package"
-import { type RouterName, type ModelRecord, toRouterName } from "../../shared/api"
+import { type RouterName, type ModelRecord, isRouterName, toRouterName } from "../../shared/api"
 import { MessageEnhancer } from "./messageEnhancer"
 
 import {
@@ -58,6 +60,11 @@ import { getCommand } from "../../utils/commands"
 
 const ALLOWED_VSCODE_SETTINGS = new Set(["terminal.integrated.inheritEnv"])
 
+// Phase 3: Debounce router model fetches to collapse rapid repeats
+const ROUTER_MODELS_DEBOUNCE_MS = process.env.NODE_ENV === "test" ? 0 : 400
+let lastRouterModelsRequestTime = 0
+let lastRouterModelsAllRequestTime = 0
+
 import { MarketplaceManager, MarketplaceItemType } from "../../services/marketplace"
 import { setPendingTodoList } from "../tools/updateTodoListTool"
 
@@ -499,6 +506,15 @@ export const webviewMessageHandler = async (
 			})
 
 			provider.isViewLaunched = true
+
+			// Phase 2: Warm caches on activation by fetching all providers once
+			// This happens in background without blocking the UI
+			webviewMessageHandler(provider, { type: "requestRouterModelsAll" }, marketplaceManager).catch((error) => {
+				provider.log(
+					`Background router models fetch on activation failed: ${error instanceof Error ? error.message : String(error)}`,
+				)
+			})
+
 			break
 		case "newTask":
 			// Initializing new instance of Cline will make sure that any
@@ -754,10 +770,22 @@ export const webviewMessageHandler = async (
 			const routerNameFlush: RouterName = toRouterName(message.text)
 			await flushModels(routerNameFlush)
 			break
-		case "requestRouterModels":
+		case "requestRouterModels": {
+			// Phase 3: Debounce to collapse rapid repeats
+			const now = Date.now()
+			if (now - lastRouterModelsRequestTime < ROUTER_MODELS_DEBOUNCE_MS) {
+				// Skip this request - too soon after last one
+				break
+			}
+			lastRouterModelsRequestTime = now
+
+			// Phase 2: Scope to active provider during chat/task flows
 			const { apiConfiguration } = await provider.getState()
+			const providerStr = apiConfiguration.apiProvider
+			const activeProvider: RouterName | undefined =
+				providerStr && isRouterName(providerStr) ? providerStr : undefined
 
-			const routerModels: Record<RouterName, ModelRecord> = {
+			const routerModels: any = {
 				openrouter: {},
 				"vercel-ai-gateway": {},
 				huggingface: {},
@@ -780,8 +808,135 @@ export const webviewMessageHandler = async (
 						`Failed to fetch models in webviewMessageHandler requestRouterModels for ${options.provider}:`,
 						error,
 					)
+					throw error
+				}
+			}
+
+			// Build full list then filter to active provider
+			const allFetches: { key: RouterName; options: GetModelsOptions }[] = [
+				{ key: "openrouter", options: { provider: "openrouter" } },
+				{
+					key: "requesty",
+					options: {
+						provider: "requesty",
+						apiKey: apiConfiguration.requestyApiKey,
+						baseUrl: apiConfiguration.requestyBaseUrl,
+					},
+				},
+				{ key: "glama", options: { provider: "glama" } },
+				{ key: "unbound", options: { provider: "unbound", apiKey: apiConfiguration.unboundApiKey } },
+				{ key: "vercel-ai-gateway", options: { provider: "vercel-ai-gateway" } },
+				{
+					key: "deepinfra",
+					options: {
+						provider: "deepinfra",
+						apiKey: apiConfiguration.deepInfraApiKey,
+						baseUrl: apiConfiguration.deepInfraBaseUrl,
+					},
+				},
+				{
+					key: "roo" as RouterName,
+					options: {
+						provider: "roo" as any,
+						baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
+						apiKey: CloudService.hasInstance()
+							? CloudService.instance.authService?.getSessionToken()
+							: undefined,
+					} as GetModelsOptions,
+				},
+			]
+
+			// IO Intelligence (optional)
+			if (apiConfiguration.ioIntelligenceApiKey) {
+				allFetches.push({
+					key: "io-intelligence",
+					options: { provider: "io-intelligence", apiKey: apiConfiguration.ioIntelligenceApiKey },
+				})
+			}
+
+			// LiteLLM (optional)
+			const litellmApiKey = apiConfiguration.litellmApiKey || message?.values?.litellmApiKey
+			const litellmBaseUrl = apiConfiguration.litellmBaseUrl || message?.values?.litellmBaseUrl
+			if (litellmApiKey && litellmBaseUrl) {
+				allFetches.push({
+					key: "litellm",
+					options: { provider: "litellm", apiKey: litellmApiKey, baseUrl: litellmBaseUrl },
+				})
+			}
+
+			const modelFetchPromises = activeProvider
+				? allFetches.filter(({ key }) => key === activeProvider)
+				: allFetches
+
+			// If nothing matched (edge case), still post empty structure for stability
+			if (modelFetchPromises.length === 0) {
+				await provider.postMessageToWebview({ type: "routerModels", routerModels })
+				break
+			}
+
+			const results = await Promise.allSettled(
+				modelFetchPromises.map(async ({ key, options }) => {
+					const models = await safeGetModels(options)
+					return { key, models }
+				}),
+			)
 
-					throw error // Re-throw to be caught by Promise.allSettled.
+			results.forEach((result, index) => {
+				const routerName = modelFetchPromises[index].key
+				if (result.status === "fulfilled") {
+					routerModels[routerName] = result.value.models
+				} else {
+					const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
+					console.error(`Error fetching models for ${routerName}:`, result.reason)
+					routerModels[routerName] = {}
+					provider.postMessageToWebview({
+						type: "singleRouterModelFetchResponse",
+						success: false,
+						error: errorMessage,
+						values: { provider: routerName },
+					})
+				}
+			})
+
+			provider.postMessageToWebview({ type: "routerModels", routerModels })
+			break
+		}
+		case "requestRouterModelsAll": {
+			// Phase 3: Debounce to collapse rapid repeats
+			const now = Date.now()
+			if (now - lastRouterModelsAllRequestTime < ROUTER_MODELS_DEBOUNCE_MS) {
+				// Skip this request - too soon after last one
+				break
+			}
+			lastRouterModelsAllRequestTime = now
+
+			// Settings and activation: fetch all providers (legacy behavior)
+			const { apiConfiguration } = await provider.getState()
+
+			const routerModels: any = {
+				openrouter: {},
+				"vercel-ai-gateway": {},
+				huggingface: {},
+				litellm: {},
+				deepinfra: {},
+				"io-intelligence": {},
+				requesty: {},
+				unbound: {},
+				glama: {},
+				ollama: {},
+				lmstudio: {},
+				roo: {},
+			}
+
+			const safeGetModels = async (options: GetModelsOptions): Promise<ModelRecord> => {
+				try {
+					return await getModels(options)
+				} catch (error) {
+					console.error(
+						`Failed to fetch models in webviewMessageHandler requestRouterModelsAll for ${options.provider}:`,
+						error,
+					)
+					throw error
 				}
 			}
 
@@ -807,20 +962,19 @@ export const webviewMessageHandler = async (
 					},
 				},
 				{
-					key: "roo",
+					key: "roo" as RouterName,
 					options: {
-						provider: "roo",
+						provider: "roo" as any,
 						baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
 						apiKey: CloudService.hasInstance()
 							? CloudService.instance.authService?.getSessionToken()
 							: undefined,
-					},
+					} as GetModelsOptions,
 				},
 			]
 
 			// Add IO Intelligence if API key is provided.
 			const ioIntelligenceApiKey = apiConfiguration.ioIntelligenceApiKey
-
 			if (ioIntelligenceApiKey) {
 				modelFetchPromises.push({
 					key: "io-intelligence",
@@ -833,7 +987,6 @@ export const webviewMessageHandler = async (
 
 			const litellmApiKey = apiConfiguration.litellmApiKey || message?.values?.litellmApiKey
 			const litellmBaseUrl = apiConfiguration.litellmBaseUrl || message?.values?.litellmBaseUrl
-
 			if (litellmApiKey && litellmBaseUrl) {
 				modelFetchPromises.push({
 					key: "litellm",
@@ -844,7 +997,7 @@ export const webviewMessageHandler = async (
 			const results = await Promise.allSettled(
 				modelFetchPromises.map(async ({ key, options }) => {
 					const models = await safeGetModels(options)
-					return { key, models } // The key is `ProviderName` here.
+					return { key, models }
 				}),
 			)
 
@@ -871,7 +1024,7 @@ export const webviewMessageHandler = async (
 					const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
 					console.error(`Error fetching models for ${routerName}:`, result.reason)
 
-					routerModels[routerName] = {} // Ensure it's an empty object in the main routerModels message.
+					routerModels[routerName] = {}
 
 					provider.postMessageToWebview({
 						type: "singleRouterModelFetchResponse",
@@ -884,6 +1037,7 @@ export const webviewMessageHandler = async (
 
 			provider.postMessageToWebview({ type: "routerModels", routerModels })
 			break
+		}
 		case "requestOllamaModels": {
 			// Specific handler for Ollama models only.
 			const { apiConfiguration: ollamaApiConfig } = await provider.getState()
@@ -934,15 +1088,15 @@ export const webviewMessageHandler = async (
 			// Specific handler for Roo models only - flushes cache to ensure fresh auth token is used
 			try {
 				// Flush cache first to ensure fresh models with current auth state
-				await flushModels("roo")
+				await flushModels("roo" as RouterName)
 
 				const rooModels = await getModels({
-					provider: "roo",
+					provider: "roo" as any,
 					baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
 					apiKey: CloudService.hasInstance()
 						? CloudService.instance.authService?.getSessionToken()
 						: undefined,
-				})
+				} as GetModelsOptions)
 
 				// Always send a response, even if no models are returned
 				provider.postMessageToWebview({
@@ -1016,10 +1170,11 @@ export const webviewMessageHandler = async (
 			}
 			break
 		case "checkpointDiff":
-			const result = checkoutDiffPayloadSchema.safeParse(message.payload)
+			const diffResult = checkoutDiffPayloadSchema.safeParse(message.payload)
 
-			if (result.success) {
-				await provider.getCurrentTask()?.checkpointDiff(result.data)
+			if (diffResult.success) {
+				// Cast to the correct CheckpointDiffOptions type (mode can be "from-init" | "checkpoint" | "to-current" | "full")
+				await provider.getCurrentTask()?.checkpointDiff(diffResult.data as any)
 			}
 
 			break
@@ -1308,7 +1463,8 @@ export const webviewMessageHandler = async (
 			break
 		case "checkpointTimeout":
 			const checkpointTimeout = message.value ?? DEFAULT_CHECKPOINT_TIMEOUT_SECONDS
-			await updateGlobalState("checkpointTimeout", checkpointTimeout)
+			// checkpointTimeout is in GlobalSettings but TypeScript inference has issues
+			await provider.contextProxy.setValue("checkpointTimeout" as any, checkpointTimeout)
 			await provider.postStateToWebview()
 			break
 		case "browserViewportSize":
@@ -1658,14 +1814,6 @@ export const webviewMessageHandler = async (
 			await updateGlobalState("includeDiagnosticMessages", includeValue)
 			await provider.postStateToWebview()
 			break
-		case "includeCurrentTime":
-			await updateGlobalState("includeCurrentTime", message.bool ?? true)
-			await provider.postStateToWebview()
-			break
-		case "includeCurrentCost":
-			await updateGlobalState("includeCurrentCost", message.bool ?? true)
-			await provider.postStateToWebview()
-			break
 		case "maxDiagnosticMessages":
 			await updateGlobalState("maxDiagnosticMessages", message.value ?? 50)
 			await provider.postStateToWebview()
diff --git a/src/shared/ExtensionMessage.ts b/src/shared/ExtensionMessage.ts
index 5929e7a950e..f8d0c5a817b 100644
--- a/src/shared/ExtensionMessage.ts
+++ b/src/shared/ExtensionMessage.ts
@@ -294,8 +294,6 @@ export type ExtensionState = Pick<
 	| "openRouterImageGenerationSelectedModel"
 	| "includeTaskHistoryInEnhance"
 	| "reasoningBlockCollapsed"
-	| "includeCurrentTime"
-	| "includeCurrentCost"
 > & {
 	version: string
 	clineMessages: ClineMessage[]
@@ -324,6 +322,9 @@ export type ExtensionState = Pick<
 	mcpEnabled: boolean
 	enableMcpServerCreation: boolean
 
+	includeCurrentTime?: boolean
+	includeCurrentCost?: boolean
+
 	mode: Mode
 	customModes: ModeConfig[]
 	toolRequirements?: Record<string, boolean> // Map of tool names to their requirements (e.g. {"apply_diff": true} if diffEnabled)
diff --git a/src/shared/WebviewMessage.ts b/src/shared/WebviewMessage.ts
index 9c475186288..6924bc9927f 100644
--- a/src/shared/WebviewMessage.ts
+++ b/src/shared/WebviewMessage.ts
@@ -66,6 +66,7 @@ export interface WebviewMessage {
 		| "resetState"
 		| "flushRouterModels"
 		| "requestRouterModels"
+		| "requestRouterModelsAll"
 		| "requestOpenAiModels"
 		| "requestOllamaModels"
 		| "requestLmStudioModels"

From c4ddbf65d057f105d99dd2f7b8f77a0fd03b1d33 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 09:39:26 -0500
Subject: [PATCH 2/8] Propagate AbortSignal to all provider fetchers and use
 native timeout

- Remove inline withTimeout helper in favor of AbortSignal.timeout()
- Add optional AbortSignal parameter to all provider model fetchers:
  - openrouter, requesty, glama, unbound, litellm, ollama, lmstudio
  - deepinfra, io-intelligence, vercel-ai-gateway, huggingface, roo
- Standardize timeout handling across modelCache and modelEndpointCache
- Add useRouterModelsAll hook for settings UI to fetch all providers
- Update Unbound and ApiOptions to use requestRouterModelsAll

This ensures consistent cancellation behavior and prepares for better
request lifecycle management across the codebase.
---
 src/api/providers/fetchers/deepinfra.ts       |   3 +-
 src/api/providers/fetchers/glama.ts           |   4 +-
 src/api/providers/fetchers/huggingface.ts     |   6 +-
 src/api/providers/fetchers/io-intelligence.ts |   4 +-
 src/api/providers/fetchers/litellm.ts         |   5 +-
 src/api/providers/fetchers/lmstudio.ts        |   7 +-
 src/api/providers/fetchers/modelCache.ts      | 256 +++++++++---------
 .../providers/fetchers/modelEndpointCache.ts  | 114 ++++----
 src/api/providers/fetchers/ollama.ts          |   5 +-
 src/api/providers/fetchers/openrouter.ts      |  12 +-
 src/api/providers/fetchers/requesty.ts        |   8 +-
 src/api/providers/fetchers/roo.ts             | 132 +++++----
 src/api/providers/fetchers/unbound.ts         |   7 +-
 .../providers/fetchers/vercel-ai-gateway.ts   |   7 +-
 src/core/webview/webviewMessageHandler.ts     |  89 +++---
 .../src/components/settings/ApiOptions.tsx    |   4 +-
 .../components/settings/providers/Unbound.tsx |   4 +-
 .../components/ui/hooks/useRouterModelsAll.ts |  38 +++
 18 files changed, 365 insertions(+), 340 deletions(-)
 create mode 100644 webview-ui/src/components/ui/hooks/useRouterModelsAll.ts

diff --git a/src/api/providers/fetchers/deepinfra.ts b/src/api/providers/fetchers/deepinfra.ts
index f38daff8224..5d817cbb7f0 100644
--- a/src/api/providers/fetchers/deepinfra.ts
+++ b/src/api/providers/fetchers/deepinfra.ts
@@ -35,6 +35,7 @@ const DeepInfraModelsResponseSchema = z.object({ data: z.array(DeepInfraModelSch
 export async function getDeepInfraModels(
 	apiKey?: string,
 	baseUrl: string = "https://api.deepinfra.com/v1/openai",
+	signal?: AbortSignal,
 ): Promise<Record<string, ModelInfo>> {
 	const headers: Record<string, string> = { ...DEFAULT_HEADERS }
 	if (apiKey) headers["Authorization"] = `Bearer ${apiKey}`
@@ -42,7 +43,7 @@ export async function getDeepInfraModels(
 	const url = `${baseUrl.replace(/\/$/, "")}/models`
 	const models: Record<string, ModelInfo> = {}
 
-	const response = await axios.get(url, { headers })
+	const response = await axios.get(url, { headers, signal })
 	const parsed = DeepInfraModelsResponseSchema.safeParse(response.data)
 	const data = parsed.success ? parsed.data.data : response.data?.data || []
 
diff --git a/src/api/providers/fetchers/glama.ts b/src/api/providers/fetchers/glama.ts
index ae36c751fb8..f451cd9348d 100644
--- a/src/api/providers/fetchers/glama.ts
+++ b/src/api/providers/fetchers/glama.ts
@@ -4,11 +4,11 @@ import type { ModelInfo } from "@roo-code/types"
 
 import { parseApiPrice } from "../../../shared/cost"
 
-export async function getGlamaModels(): Promise<Record<string, ModelInfo>> {
+export async function getGlamaModels(signal?: AbortSignal): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 
 	try {
-		const response = await axios.get("https://glama.ai/api/gateway/v1/models")
+		const response = await axios.get("https://glama.ai/api/gateway/v1/models", { signal })
 		const rawModels = response.data
 
 		for (const rawModel of rawModels) {
diff --git a/src/api/providers/fetchers/huggingface.ts b/src/api/providers/fetchers/huggingface.ts
index 1a7a995bc6e..b6b1cd28e65 100644
--- a/src/api/providers/fetchers/huggingface.ts
+++ b/src/api/providers/fetchers/huggingface.ts
@@ -107,7 +107,7 @@ function parseHuggingFaceModel(model: HuggingFaceModel, provider?: HuggingFacePr
  * @returns A promise that resolves to a record of model IDs to model info
  * @throws Will throw an error if the request fails
  */
-export async function getHuggingFaceModels(): Promise<ModelRecord> {
+export async function getHuggingFaceModels(signal?: AbortSignal): Promise<ModelRecord> {
 	const now = Date.now()
 
 	if (cache && now - cache.timestamp < HUGGINGFACE_CACHE_DURATION) {
@@ -128,7 +128,7 @@ export async function getHuggingFaceModels(): Promise<ModelRecord> {
 				Pragma: "no-cache",
 				"Cache-Control": "no-cache",
 			},
-			timeout: 10000,
+			signal,
 		})
 
 		const result = huggingFaceApiResponseSchema.safeParse(response.data)
@@ -236,7 +236,7 @@ export async function getHuggingFaceModelsWithMetadata(): Promise<HuggingFaceMod
 				Pragma: "no-cache",
 				"Cache-Control": "no-cache",
 			},
-			timeout: 10000,
+			signal: AbortSignal.timeout(30000),
 		})
 
 		const models = response.data?.data || []
diff --git a/src/api/providers/fetchers/io-intelligence.ts b/src/api/providers/fetchers/io-intelligence.ts
index 42d88083b96..a983cfc7675 100644
--- a/src/api/providers/fetchers/io-intelligence.ts
+++ b/src/api/providers/fetchers/io-intelligence.ts
@@ -83,7 +83,7 @@ function parseIOIntelligenceModel(model: IOIntelligenceModel): ModelInfo {
  * Fetches available models from IO Intelligence
  * <mcreference link="https://docs.io.net/reference/get-started-with-io-intelligence-api" index="1">1</mcreference>
  */
-export async function getIOIntelligenceModels(apiKey?: string): Promise<ModelRecord> {
+export async function getIOIntelligenceModels(apiKey?: string, signal?: AbortSignal): Promise<ModelRecord> {
 	const now = Date.now()
 
 	if (cache && now - cache.timestamp < IO_INTELLIGENCE_CACHE_DURATION) {
@@ -108,7 +108,7 @@ export async function getIOIntelligenceModels(apiKey?: string): Promise<ModelRec
 			"https://api.intelligence.io.solutions/api/v1/models",
 			{
 				headers,
-				timeout: 10_000,
+				signal,
 			},
 		)
 
diff --git a/src/api/providers/fetchers/litellm.ts b/src/api/providers/fetchers/litellm.ts
index e6c96f3c2d1..939e804f0bd 100644
--- a/src/api/providers/fetchers/litellm.ts
+++ b/src/api/providers/fetchers/litellm.ts
@@ -11,7 +11,7 @@ import { DEFAULT_HEADERS } from "../constants"
  * @returns A promise that resolves to a record of model IDs to model info
  * @throws Will throw an error if the request fails or the response is not as expected.
  */
-export async function getLiteLLMModels(apiKey: string, baseUrl: string): Promise<ModelRecord> {
+export async function getLiteLLMModels(apiKey: string, baseUrl: string, signal?: AbortSignal): Promise<ModelRecord> {
 	try {
 		const headers: Record<string, string> = {
 			"Content-Type": "application/json",
@@ -27,8 +27,7 @@ export async function getLiteLLMModels(apiKey: string, baseUrl: string): Promise
 		// Normalize the pathname by removing trailing slashes and multiple slashes
 		urlObj.pathname = urlObj.pathname.replace(/\/+$/, "").replace(/\/+/g, "/") + "/v1/model/info"
 		const url = urlObj.href
-		// Added timeout to prevent indefinite hanging
-		const response = await axios.get(url, { headers, timeout: 5000 })
+		const response = await axios.get(url, { headers, signal })
 		const models: ModelRecord = {}
 
 		// Process the model info from the response
diff --git a/src/api/providers/fetchers/lmstudio.ts b/src/api/providers/fetchers/lmstudio.ts
index de3f804c28a..f7253f93805 100644
--- a/src/api/providers/fetchers/lmstudio.ts
+++ b/src/api/providers/fetchers/lmstudio.ts
@@ -49,7 +49,10 @@ export const parseLMStudioModel = (rawModel: LLMInstanceInfo | LLMInfo): ModelIn
 	return modelInfo
 }
 
-export async function getLMStudioModels(baseUrl = "http://localhost:1234"): Promise<Record<string, ModelInfo>> {
+export async function getLMStudioModels(
+	baseUrl = "http://localhost:1234",
+	signal?: AbortSignal,
+): Promise<Record<string, ModelInfo>> {
 	// clear the set of models that have full details loaded
 	modelsWithLoadedDetails.clear()
 	// clearing the input can leave an empty string; use the default in that case
@@ -66,7 +69,7 @@ export async function getLMStudioModels(baseUrl = "http://localhost:1234"): Prom
 
 		// test the connection to LM Studio first
 		// errors will be caught further down
-		await axios.get(`${baseUrl}/v1/models`)
+		await axios.get(`${baseUrl}/v1/models`, { signal })
 
 		const client = new LMStudioClient({ baseUrl: lmsUrl })
 
diff --git a/src/api/providers/fetchers/modelCache.ts b/src/api/providers/fetchers/modelCache.ts
index 759a240f0b0..bcf5554102e 100644
--- a/src/api/providers/fetchers/modelCache.ts
+++ b/src/api/providers/fetchers/modelCache.ts
@@ -31,19 +31,6 @@ const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 // Coalesce concurrent fetches per provider within this extension host
 const inFlightModelFetches = new Map<RouterName, Promise<ModelRecord>>()
 
-function withTimeout<T>(p: Promise<T>, ms: number, label = "getModels"): Promise<T> {
-	return new Promise<T>((resolve, reject) => {
-		const t = setTimeout(() => reject(new Error(`${label} timeout after ${ms}ms`)), ms)
-		p.then((v) => {
-			clearTimeout(t)
-			resolve(v)
-		}).catch((e) => {
-			clearTimeout(t)
-			reject(e)
-		})
-	})
-}
-
 async function writeModels(router: RouterName, data: ModelRecord) {
 	const filename = `${router}_models.json`
 	const cacheDir = await getCacheDirectoryPath(ContextProxy.instance.globalStorageUri.fsPath)
@@ -76,6 +63,7 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 	// 1) Try memory cache
 	const cached = getModelsFromCache(provider)
 	if (cached) {
+		// Using console.log for cache layer logging (no provider access in utility functions)
 		console.log(`[modelCache] cache_hit: ${providerStr} (${Object.keys(cached).length} models)`)
 		return cached
 	}
@@ -84,78 +72,83 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 	try {
 		const file = await readModels(provider)
 		if (file && Object.keys(file).length > 0) {
+			// Using console.log for cache layer logging (no provider access in utility functions)
 			console.log(`[modelCache] file_hit: ${providerStr} (${Object.keys(file).length} models, bg_refresh queued)`)
 			// Populate memory cache immediately so follow-up callers are instant
 			memoryCache.set(provider, file)
 
 			// Start background refresh if not already in-flight (do not await)
 			if (!inFlightModelFetches.has(provider)) {
+				const signal = AbortSignal.timeout(30_000)
 				const bgPromise = (async (): Promise<ModelRecord> => {
 					let models: ModelRecord = {}
-					try {
-						switch (providerStr) {
-							case "openrouter":
-								models = await getOpenRouterModels()
-								break
-							case "requesty":
-								models = await getRequestyModels(options.baseUrl, options.apiKey)
-								break
-							case "glama":
-								models = await getGlamaModels()
-								break
-							case "unbound":
-								models = await getUnboundModels(options.apiKey)
-								break
-							case "litellm":
-								models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string)
-								break
-							case "ollama":
-								models = await getOllamaModels(options.baseUrl, options.apiKey)
-								break
-							case "lmstudio":
-								models = await getLMStudioModels(options.baseUrl)
-								break
-							case "deepinfra":
-								models = await getDeepInfraModels(options.apiKey, options.baseUrl)
-								break
-							case "io-intelligence":
-								models = await getIOIntelligenceModels(options.apiKey)
-								break
-							case "vercel-ai-gateway":
-								models = await getVercelAiGatewayModels()
-								break
-							case "huggingface":
-								models = await getHuggingFaceModels()
-								break
-							case "roo": {
-								const rooBaseUrl =
-									options.baseUrl ??
-									process.env.ROO_CODE_PROVIDER_URL ??
-									"https://api.roocode.com/proxy"
-								models = await getRooModels(rooBaseUrl, options.apiKey)
-								break
-							}
-							default:
-								throw new Error(`Unknown provider: ${providerStr}`)
+					switch (providerStr) {
+						case "openrouter":
+							models = await getOpenRouterModels(undefined, signal)
+							break
+						case "requesty":
+							models = await getRequestyModels(options.baseUrl, options.apiKey, signal)
+							break
+						case "glama":
+							models = await getGlamaModels(signal)
+							break
+						case "unbound":
+							models = await getUnboundModels(options.apiKey, signal)
+							break
+						case "litellm":
+							models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string, signal)
+							break
+						case "ollama":
+							models = await getOllamaModels(options.baseUrl, options.apiKey, signal)
+							break
+						case "lmstudio":
+							models = await getLMStudioModels(options.baseUrl, signal)
+							break
+						case "deepinfra":
+							models = await getDeepInfraModels(options.apiKey, options.baseUrl, signal)
+							break
+						case "io-intelligence":
+							models = await getIOIntelligenceModels(options.apiKey, signal)
+							break
+						case "vercel-ai-gateway":
+							models = await getVercelAiGatewayModels(undefined, signal)
+							break
+						case "huggingface":
+							models = await getHuggingFaceModels(signal)
+							break
+						case "roo": {
+							const rooBaseUrl =
+								options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
+							models = await getRooModels(rooBaseUrl, options.apiKey, signal)
+							break
 						}
+						default:
+							throw new Error(`Unknown provider: ${providerStr}`)
+					}
 
-						console.log(
-							`[modelCache] bg_refresh_done: ${providerStr} (${Object.keys(models || {}).length} models)`,
-						)
-						memoryCache.set(provider, models)
-						await writeModels(provider, models).catch((err) =>
-							console.error(`[modelCache] Error writing ${providerStr} to file cache:`, err),
+					console.log(
+						`[modelCache] bg_refresh_done: ${providerStr} (${Object.keys(models || {}).length} models)`,
+					)
+					memoryCache.set(provider, models)
+					await writeModels(provider, models).catch((err) => {
+						console.error(
+							`[modelCache] Error writing ${providerStr} to file cache during background refresh:`,
+							err instanceof Error ? err.message : String(err),
 						)
-						return models || {}
-					} catch (e) {
-						console.error(`[modelCache] bg_refresh_failed: ${providerStr}`, e)
-						throw e
-					}
+					})
+					return models || {}
 				})()
 
-				const timedBg = withTimeout(bgPromise, 30_000, `getModels(background:${providerStr})`)
-				inFlightModelFetches.set(provider, timedBg)
-				Promise.resolve(timedBg).finally(() => inFlightModelFetches.delete(provider))
+				inFlightModelFetches.set(provider, bgPromise)
+				Promise.resolve(bgPromise)
+					.catch((err) => {
+						// Log background refresh failures for monitoring
+						console.error(
+							`[modelCache] Background refresh failed for ${providerStr}:`,
+							err instanceof Error ? err.message : String(err),
+						)
+					})
+					.finally(() => inFlightModelFetches.delete(provider))
 			}
 
 			// Return the file snapshot immediately
@@ -168,82 +161,81 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 	// 3) Coalesce concurrent fetches
 	const existing = inFlightModelFetches.get(provider)
 	if (existing) {
+		// Using console.log for cache layer logging (no provider access in utility functions)
 		console.log(`[modelCache] coalesced_wait: ${providerStr}`)
 		return existing
 	}
 
 	// 4) Network fetch wrapped as a single in-flight promise for this provider
+	const signal = AbortSignal.timeout(30_000)
 	const fetchPromise = (async (): Promise<ModelRecord> => {
 		let models: ModelRecord = {}
-		try {
-			switch (providerStr) {
-				case "openrouter":
-					models = await getOpenRouterModels()
-					break
-				case "requesty":
-					models = await getRequestyModels(options.baseUrl, options.apiKey)
-					break
-				case "glama":
-					models = await getGlamaModels()
-					break
-				case "unbound":
-					models = await getUnboundModels(options.apiKey)
-					break
-				case "litellm":
-					models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string)
-					break
-				case "ollama":
-					models = await getOllamaModels(options.baseUrl, options.apiKey)
-					break
-				case "lmstudio":
-					models = await getLMStudioModels(options.baseUrl)
-					break
-				case "deepinfra":
-					models = await getDeepInfraModels(options.apiKey, options.baseUrl)
-					break
-				case "io-intelligence":
-					models = await getIOIntelligenceModels(options.apiKey)
-					break
-				case "vercel-ai-gateway":
-					models = await getVercelAiGatewayModels()
-					break
-				case "huggingface":
-					models = await getHuggingFaceModels()
-					break
-				case "roo": {
-					const rooBaseUrl =
-						options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
-					models = await getRooModels(rooBaseUrl, options.apiKey)
-					break
-				}
-				default: {
-					throw new Error(`Unknown provider: ${providerStr}`)
-				}
+		switch (providerStr) {
+			case "openrouter":
+				models = await getOpenRouterModels(undefined, signal)
+				break
+			case "requesty":
+				models = await getRequestyModels(options.baseUrl, options.apiKey, signal)
+				break
+			case "glama":
+				models = await getGlamaModels(signal)
+				break
+			case "unbound":
+				models = await getUnboundModels(options.apiKey, signal)
+				break
+			case "litellm":
+				models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string, signal)
+				break
+			case "ollama":
+				models = await getOllamaModels(options.baseUrl, options.apiKey, signal)
+				break
+			case "lmstudio":
+				models = await getLMStudioModels(options.baseUrl, signal)
+				break
+			case "deepinfra":
+				models = await getDeepInfraModels(options.apiKey, options.baseUrl, signal)
+				break
+			case "io-intelligence":
+				models = await getIOIntelligenceModels(options.apiKey, signal)
+				break
+			case "vercel-ai-gateway":
+				models = await getVercelAiGatewayModels(undefined, signal)
+				break
+			case "huggingface":
+				models = await getHuggingFaceModels(signal)
+				break
+			case "roo": {
+				const rooBaseUrl =
+					options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
+				models = await getRooModels(rooBaseUrl, options.apiKey, signal)
+				break
+			}
+			default: {
+				throw new Error(`Unknown provider: ${providerStr}`)
 			}
+		}
 
-			console.log(`[modelCache] network_fetch_done: ${providerStr} (${Object.keys(models || {}).length} models)`)
+		console.log(`[modelCache] network_fetch_done: ${providerStr} (${Object.keys(models || {}).length} models)`)
 
-			// Update memory cache first so waiters get immediate hits
-			memoryCache.set(provider, models)
+		// Update memory cache first so waiters get immediate hits
+		memoryCache.set(provider, models)
 
-			// Persist to file cache (best-effort)
-			await writeModels(provider, models).catch((err) =>
-				console.error(`[modelCache] Error writing ${providerStr} to file cache:`, err),
+		// Persist to file cache (best-effort)
+		await writeModels(provider, models).catch((err) => {
+			console.error(
+				`[modelCache] Error writing ${providerStr} to file cache after network fetch:`,
+				err instanceof Error ? err.message : String(err),
 			)
+		})
 
-			// Return models as-is (skip immediate re-read)
-			return models || {}
-		} catch (error) {
-			console.error(`[modelCache] network_fetch_failed: ${providerStr}`, error)
-			throw error
-		}
+		// Return models as-is (skip immediate re-read)
+		return models || {}
 	})()
 
-	// Register and await with timeout; ensure cleanup
-	const timed = withTimeout(fetchPromise, 30_000, `getModels(${providerStr})`)
-	inFlightModelFetches.set(provider, timed)
+	// Register and await; ensure cleanup
+	inFlightModelFetches.set(provider, fetchPromise)
 	try {
-		return await timed
+		return await fetchPromise
 	} finally {
 		inFlightModelFetches.delete(provider)
 	}
diff --git a/src/api/providers/fetchers/modelEndpointCache.ts b/src/api/providers/fetchers/modelEndpointCache.ts
index c2006ff07e0..9a9018e4d95 100644
--- a/src/api/providers/fetchers/modelEndpointCache.ts
+++ b/src/api/providers/fetchers/modelEndpointCache.ts
@@ -17,19 +17,6 @@ const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 // Coalesce concurrent endpoint fetches per (router,modelId)
 const inFlightEndpointFetches = new Map<string, Promise<ModelRecord>>()
 
-function withTimeout<T>(p: Promise<T>, ms: number, label = "getModelEndpoints"): Promise<T> {
-	return new Promise<T>((resolve, reject) => {
-		const t = setTimeout(() => reject(new Error(`${label} timeout after ${ms}ms`)), ms)
-		p.then((v) => {
-			clearTimeout(t)
-			resolve(v)
-		}).catch((e) => {
-			clearTimeout(t)
-			reject(e)
-		})
-	})
-}
-
 const getCacheKey = (router: RouterName, modelId: string) => sanitize(`${router}_${modelId}`)
 
 async function writeModelEndpoints(key: string, data: ModelRecord) {
@@ -66,6 +53,7 @@ export const getModelEndpoints = async ({
 	// 1) Try memory cache
 	const cached = memoryCache.get<ModelRecord>(key)
 	if (cached) {
+		// Using console.log for cache layer logging (no provider access in utility functions)
 		console.log(`[endpointCache] cache_hit: ${key} (${Object.keys(cached).length} endpoints)`)
 		return cached
 	}
@@ -74,37 +62,44 @@ export const getModelEndpoints = async ({
 	try {
 		const file = await readModelEndpoints(key)
 		if (file && Object.keys(file).length > 0) {
+			// Using console.log for cache layer logging (no provider access in utility functions)
 			console.log(`[endpointCache] file_hit: ${key} (${Object.keys(file).length} endpoints, bg_refresh queued)`)
 			// Populate memory cache immediately
 			memoryCache.set(key, file)
 
 			// Start background refresh if not already in-flight (do not await)
 			if (!inFlightEndpointFetches.has(key)) {
+				const signal = AbortSignal.timeout(30_000)
 				const bgPromise = (async (): Promise<ModelRecord> => {
-					try {
-						const modelProviders = await getOpenRouterModelEndpoints(modelId)
-						if (Object.keys(modelProviders).length > 0) {
-							console.log(
-								`[endpointCache] bg_refresh_done: ${key} (${Object.keys(modelProviders).length} endpoints)`,
+					const modelProviders = await getOpenRouterModelEndpoints(modelId, undefined, signal)
+					if (Object.keys(modelProviders).length > 0) {
+						console.log(
+							`[endpointCache] bg_refresh_done: ${key} (${Object.keys(modelProviders).length} endpoints)`,
+						)
+						memoryCache.set(key, modelProviders)
+						try {
+							await writeModelEndpoints(key, modelProviders)
+						} catch (error) {
+							console.error(
+								`[endpointCache] Error writing ${key} to file cache during background refresh:`,
+								error instanceof Error ? error.message : String(error),
 							)
-							memoryCache.set(key, modelProviders)
-							try {
-								await writeModelEndpoints(key, modelProviders)
-							} catch (error) {
-								console.error(`[endpointCache] Error writing ${key} to file cache`, error)
-							}
-							return modelProviders
 						}
-						return {}
-					} catch (e) {
-						console.error(`[endpointCache] bg_refresh_failed: ${key}`, e)
-						throw e
+						return modelProviders
 					}
+					return {}
 				})()
 
-				const timedBg = withTimeout(bgPromise, 30_000, `getModelEndpoints(background:${key})`)
-				inFlightEndpointFetches.set(key, timedBg)
-				Promise.resolve(timedBg).finally(() => inFlightEndpointFetches.delete(key))
+				inFlightEndpointFetches.set(key, bgPromise)
+				Promise.resolve(bgPromise)
+					.catch((err) => {
+						// Log background refresh failures for monitoring
+						console.error(
+							`[endpointCache] Background refresh failed for ${key}:`,
+							err instanceof Error ? err.message : String(err),
+						)
+					})
+					.finally(() => inFlightEndpointFetches.delete(key))
 			}
 
 			return file
@@ -116,50 +111,47 @@ export const getModelEndpoints = async ({
 	// 3) Coalesce concurrent fetches
 	const inFlight = inFlightEndpointFetches.get(key)
 	if (inFlight) {
+		// Using console.log for cache layer logging (no provider access in utility functions)
 		console.log(`[endpointCache] coalesced_wait: ${key}`)
 		return inFlight
 	}
 
 	// 4) Single network fetch for this key
+	const signal = AbortSignal.timeout(30_000)
 	const fetchPromise = (async (): Promise<ModelRecord> => {
 		let modelProviders: ModelRecord = {}
-		try {
-			modelProviders = await getOpenRouterModelEndpoints(modelId)
-
-			if (Object.keys(modelProviders).length > 0) {
-				console.log(
-					`[endpointCache] network_fetch_done: ${key} (${Object.keys(modelProviders).length} endpoints)`,
-				)
-				// Update memory cache first
-				memoryCache.set(key, modelProviders)
-
-				// Best-effort persist
-				try {
-					await writeModelEndpoints(key, modelProviders)
-				} catch (error) {
-					console.error(`[endpointCache] Error writing ${key} to file cache`, error)
-				}
+		modelProviders = await getOpenRouterModelEndpoints(modelId, undefined, signal)
 
-				return modelProviders
-			}
+		if (Object.keys(modelProviders).length > 0) {
+			console.log(`[endpointCache] network_fetch_done: ${key} (${Object.keys(modelProviders).length} endpoints)`)
+			// Update memory cache first
+			memoryCache.set(key, modelProviders)
 
-			// Fallback to file cache if network returned empty (rare)
+			// Best-effort persist
 			try {
-				const file = await readModelEndpoints(key)
-				return file ?? {}
-			} catch {
-				return {}
+				await writeModelEndpoints(key, modelProviders)
+			} catch (error) {
+				console.error(
+					`[endpointCache] Error writing ${key} to file cache after network fetch:`,
+					error instanceof Error ? error.message : String(error),
+				)
 			}
-		} catch (error) {
-			console.error(`[endpointCache] network_fetch_failed: ${key}`, error)
-			throw error
+
+			return modelProviders
+		}
+
+		// Fallback to file cache if network returned empty (rare)
+		try {
+			const file = await readModelEndpoints(key)
+			return file ?? {}
+		} catch {
+			return {}
 		}
 	})()
 
-	const timed = withTimeout(fetchPromise, 30_000, `getModelEndpoints(${key})`)
-	inFlightEndpointFetches.set(key, timed)
+	inFlightEndpointFetches.set(key, fetchPromise)
 	try {
-		return await timed
+		return await fetchPromise
 	} finally {
 		inFlightEndpointFetches.delete(key)
 	}
diff --git a/src/api/providers/fetchers/ollama.ts b/src/api/providers/fetchers/ollama.ts
index 4bf43b6faf3..bfb75b6b5e9 100644
--- a/src/api/providers/fetchers/ollama.ts
+++ b/src/api/providers/fetchers/ollama.ts
@@ -56,6 +56,7 @@ export const parseOllamaModel = (rawModel: OllamaModelInfoResponse): ModelInfo =
 export async function getOllamaModels(
 	baseUrl = "http://localhost:11434",
 	apiKey?: string,
+	signal?: AbortSignal,
 ): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 
@@ -73,7 +74,7 @@ export async function getOllamaModels(
 			headers["Authorization"] = `Bearer ${apiKey}`
 		}
 
-		const response = await axios.get<OllamaModelsResponse>(`${baseUrl}/api/tags`, { headers })
+		const response = await axios.get<OllamaModelsResponse>(`${baseUrl}/api/tags`, { headers, signal })
 		const parsedResponse = OllamaModelsResponseSchema.safeParse(response.data)
 		let modelInfoPromises = []
 
@@ -86,7 +87,7 @@ export async function getOllamaModels(
 							{
 								model: ollamaModel.model,
 							},
-							{ headers },
+							{ headers, signal },
 						)
 						.then((ollamaModelInfo) => {
 							models[ollamaModel.name] = parseOllamaModel(ollamaModelInfo.data)
diff --git a/src/api/providers/fetchers/openrouter.ts b/src/api/providers/fetchers/openrouter.ts
index b546c40a3cf..8d8659b3f19 100644
--- a/src/api/providers/fetchers/openrouter.ts
+++ b/src/api/providers/fetchers/openrouter.ts
@@ -94,12 +94,15 @@ type OpenRouterModelEndpointsResponse = z.infer<typeof openRouterModelEndpointsR
  * getOpenRouterModels
  */
 
-export async function getOpenRouterModels(options?: ApiHandlerOptions): Promise<Record<string, ModelInfo>> {
+export async function getOpenRouterModels(
+	options?: ApiHandlerOptions,
+	signal?: AbortSignal,
+): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 	const baseURL = options?.openRouterBaseUrl || "https://openrouter.ai/api/v1"
 
 	try {
-		const response = await axios.get<OpenRouterModelsResponse>(`${baseURL}/models`)
+		const response = await axios.get<OpenRouterModelsResponse>(`${baseURL}/models`, { signal })
 		const result = openRouterModelsResponseSchema.safeParse(response.data)
 		const data = result.success ? result.data.data : response.data.data
 
@@ -140,12 +143,15 @@ export async function getOpenRouterModels(options?: ApiHandlerOptions): Promise<
 export async function getOpenRouterModelEndpoints(
 	modelId: string,
 	options?: ApiHandlerOptions,
+	signal?: AbortSignal,
 ): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 	const baseURL = options?.openRouterBaseUrl || "https://openrouter.ai/api/v1"
 
 	try {
-		const response = await axios.get<OpenRouterModelEndpointsResponse>(`${baseURL}/models/${modelId}/endpoints`)
+		const response = await axios.get<OpenRouterModelEndpointsResponse>(`${baseURL}/models/${modelId}/endpoints`, {
+			signal,
+		})
 		const result = openRouterModelEndpointsResponseSchema.safeParse(response.data)
 		const data = result.success ? result.data.data : response.data.data
 
diff --git a/src/api/providers/fetchers/requesty.ts b/src/api/providers/fetchers/requesty.ts
index 64c7de66892..1fe0f158573 100644
--- a/src/api/providers/fetchers/requesty.ts
+++ b/src/api/providers/fetchers/requesty.ts
@@ -5,7 +5,11 @@ import type { ModelInfo } from "@roo-code/types"
 import { parseApiPrice } from "../../../shared/cost"
 import { toRequestyServiceUrl } from "../../../shared/utils/requesty"
 
-export async function getRequestyModels(baseUrl?: string, apiKey?: string): Promise<Record<string, ModelInfo>> {
+export async function getRequestyModels(
+	baseUrl?: string,
+	apiKey?: string,
+	signal?: AbortSignal,
+): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 
 	try {
@@ -18,7 +22,7 @@ export async function getRequestyModels(baseUrl?: string, apiKey?: string): Prom
 		const resolvedBaseUrl = toRequestyServiceUrl(baseUrl)
 		const modelsUrl = new URL("v1/models", resolvedBaseUrl)
 
-		const response = await axios.get(modelsUrl.toString(), { headers })
+		const response = await axios.get(modelsUrl.toString(), { headers, signal })
 		const rawModels = response.data.data
 
 		for (const rawModel of rawModels) {
diff --git a/src/api/providers/fetchers/roo.ts b/src/api/providers/fetchers/roo.ts
index 17aec4253b3..0dca037680b 100644
--- a/src/api/providers/fetchers/roo.ts
+++ b/src/api/providers/fetchers/roo.ts
@@ -13,7 +13,7 @@ import { DEFAULT_HEADERS } from "../constants"
  * @returns A promise that resolves to a record of model IDs to model info
  * @throws Will throw an error if the request fails or the response is not as expected.
  */
-export async function getRooModels(baseUrl: string, apiKey?: string): Promise<ModelRecord> {
+export async function getRooModels(baseUrl: string, apiKey?: string, signal?: AbortSignal): Promise<ModelRecord> {
 	try {
 		const headers: Record<string, string> = {
 			"Content-Type": "application/json",
@@ -29,87 +29,79 @@ export async function getRooModels(baseUrl: string, apiKey?: string): Promise<Mo
 		const normalizedBase = baseUrl.replace(/\/?v1\/?$/, "")
 		const url = `${normalizedBase}/v1/models`
 
-		// Use fetch with AbortController for better timeout handling
-		const controller = new AbortController()
-		const timeoutId = setTimeout(() => controller.abort(), 10000)
+		const response = await fetch(url, {
+			headers,
+			signal,
+		})
 
-		try {
-			const response = await fetch(url, {
-				headers,
-				signal: controller.signal,
-			})
-
-			if (!response.ok) {
-				throw new Error(`HTTP ${response.status}: ${response.statusText}`)
-			}
+		if (!response.ok) {
+			throw new Error(`HTTP ${response.status}: ${response.statusText}`)
+		}
 
-			const data = await response.json()
-			const models: ModelRecord = {}
+		const data = await response.json()
+		const models: ModelRecord = {}
 
-			// Validate response against schema
-			const parsed = RooModelsResponseSchema.safeParse(data)
+		// Validate response against schema
+		const parsed = RooModelsResponseSchema.safeParse(data)
 
-			if (!parsed.success) {
-				console.error("Error fetching Roo Code Cloud models: Unexpected response format", data)
-				console.error("Validation errors:", parsed.error.format())
-				throw new Error("Failed to fetch Roo Code Cloud models: Unexpected response format.")
-			}
+		if (!parsed.success) {
+			console.error("Error fetching Roo Code Cloud models: Unexpected response format", data)
+			console.error("Validation errors:", parsed.error.format())
+			throw new Error("Failed to fetch Roo Code Cloud models: Unexpected response format.")
+		}
 
-			// Process the validated model data
-			for (const model of parsed.data.data) {
-				const modelId = model.id
-
-				if (!modelId) continue
-
-				// Extract model data from the validated API response
-				// All required fields are guaranteed by the schema
-				const contextWindow = model.context_window
-				const maxTokens = model.max_tokens
-				const tags = model.tags || []
-				const pricing = model.pricing
-
-				// Determine if the model supports images based on tags
-				const supportsImages = tags.includes("vision")
-
-				// Determine if the model supports reasoning effort based on tags
-				const supportsReasoningEffort = tags.includes("reasoning")
-
-				// Determine if the model requires reasoning effort based on tags
-				const requiredReasoningEffort = tags.includes("reasoning-required")
-
-				// Parse pricing (API returns strings, convert to numbers)
-				const inputPrice = parseApiPrice(pricing.input)
-				const outputPrice = parseApiPrice(pricing.output)
-				const cacheReadPrice = pricing.input_cache_read ? parseApiPrice(pricing.input_cache_read) : undefined
-				const cacheWritePrice = pricing.input_cache_write ? parseApiPrice(pricing.input_cache_write) : undefined
-
-				models[modelId] = {
-					maxTokens,
-					contextWindow,
-					supportsImages,
-					supportsReasoningEffort,
-					requiredReasoningEffort,
-					supportsPromptCache: Boolean(cacheReadPrice !== undefined),
-					inputPrice,
-					outputPrice,
-					cacheWritesPrice: cacheWritePrice,
-					cacheReadsPrice: cacheReadPrice,
-					description: model.description || model.name,
-					deprecated: model.deprecated || false,
-					isFree: tags.includes("free"),
-				}
+		// Process the validated model data
+		for (const model of parsed.data.data) {
+			const modelId = model.id
+
+			if (!modelId) continue
+
+			// Extract model data from the validated API response
+			// All required fields are guaranteed by the schema
+			const contextWindow = model.context_window
+			const maxTokens = model.max_tokens
+			const tags = model.tags || []
+			const pricing = model.pricing
+
+			// Determine if the model supports images based on tags
+			const supportsImages = tags.includes("vision")
+
+			// Determine if the model supports reasoning effort based on tags
+			const supportsReasoningEffort = tags.includes("reasoning")
+
+			// Determine if the model requires reasoning effort based on tags
+			const requiredReasoningEffort = tags.includes("reasoning-required")
+
+			// Parse pricing (API returns strings, convert to numbers)
+			const inputPrice = parseApiPrice(pricing.input)
+			const outputPrice = parseApiPrice(pricing.output)
+			const cacheReadPrice = pricing.input_cache_read ? parseApiPrice(pricing.input_cache_read) : undefined
+			const cacheWritePrice = pricing.input_cache_write ? parseApiPrice(pricing.input_cache_write) : undefined
+
+			models[modelId] = {
+				maxTokens,
+				contextWindow,
+				supportsImages,
+				supportsReasoningEffort,
+				requiredReasoningEffort,
+				supportsPromptCache: Boolean(cacheReadPrice !== undefined),
+				inputPrice,
+				outputPrice,
+				cacheWritesPrice: cacheWritePrice,
+				cacheReadsPrice: cacheReadPrice,
+				description: model.description || model.name,
+				deprecated: model.deprecated || false,
+				isFree: tags.includes("free"),
 			}
-
-			return models
-		} finally {
-			clearTimeout(timeoutId)
 		}
+
+		return models
 	} catch (error: any) {
 		console.error("Error fetching Roo Code Cloud models:", error.message ? error.message : error)
 
 		// Handle abort/timeout
 		if (error.name === "AbortError") {
-			throw new Error("Failed to fetch Roo Code Cloud models: Request timed out after 10 seconds.")
+			throw new Error("Failed to fetch Roo Code Cloud models: Request timed out.")
 		}
 
 		// Handle fetch errors
diff --git a/src/api/providers/fetchers/unbound.ts b/src/api/providers/fetchers/unbound.ts
index 354c0fde58a..a339a4da193 100644
--- a/src/api/providers/fetchers/unbound.ts
+++ b/src/api/providers/fetchers/unbound.ts
@@ -2,7 +2,10 @@ import axios from "axios"
 
 import type { ModelInfo } from "@roo-code/types"
 
-export async function getUnboundModels(apiKey?: string | null): Promise<Record<string, ModelInfo>> {
+export async function getUnboundModels(
+	apiKey?: string | null,
+	signal?: AbortSignal,
+): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 
 	try {
@@ -12,7 +15,7 @@ export async function getUnboundModels(apiKey?: string | null): Promise<Record<s
 			headers["Authorization"] = `Bearer ${apiKey}`
 		}
 
-		const response = await axios.get("https://api.getunbound.ai/models", { headers })
+		const response = await axios.get("https://api.getunbound.ai/models", { headers, signal })
 
 		if (response.data) {
 			const rawModels: Record<string, any> = response.data
diff --git a/src/api/providers/fetchers/vercel-ai-gateway.ts b/src/api/providers/fetchers/vercel-ai-gateway.ts
index 3b6852c28d5..2e2514fffc1 100644
--- a/src/api/providers/fetchers/vercel-ai-gateway.ts
+++ b/src/api/providers/fetchers/vercel-ai-gateway.ts
@@ -52,12 +52,15 @@ type VercelAiGatewayModelsResponse = z.infer<typeof vercelAiGatewayModelsRespons
  * getVercelAiGatewayModels
  */
 
-export async function getVercelAiGatewayModels(options?: ApiHandlerOptions): Promise<Record<string, ModelInfo>> {
+export async function getVercelAiGatewayModels(
+	options?: ApiHandlerOptions,
+	signal?: AbortSignal,
+): Promise<Record<string, ModelInfo>> {
 	const models: Record<string, ModelInfo> = {}
 	const baseURL = "https://ai-gateway.vercel.sh/v1"
 
 	try {
-		const response = await axios.get<VercelAiGatewayModelsResponse>(`${baseURL}/models`)
+		const response = await axios.get<VercelAiGatewayModelsResponse>(`${baseURL}/models`, { signal })
 		const result = vercelAiGatewayModelsResponseSchema.safeParse(response.data)
 		const data = result.success ? result.data.data : response.data.data
 
diff --git a/src/core/webview/webviewMessageHandler.ts b/src/core/webview/webviewMessageHandler.ts
index 278161ba2ae..a3ef6ff49d2 100644
--- a/src/core/webview/webviewMessageHandler.ts
+++ b/src/core/webview/webviewMessageHandler.ts
@@ -26,7 +26,7 @@ import { ClineProvider } from "./ClineProvider"
 import { handleCheckpointRestoreOperation } from "./checkpointRestoreHandler"
 import { changeLanguage, t } from "../../i18n"
 import { Package } from "../../shared/package"
-import { type RouterName, type ModelRecord, isRouterName, toRouterName } from "../../shared/api"
+import { type RouterName, type ModelRecord, type RouterModels, isRouterName, toRouterName } from "../../shared/api"
 import { MessageEnhancer } from "./messageEnhancer"
 
 import {
@@ -60,11 +60,6 @@ import { getCommand } from "../../utils/commands"
 
 const ALLOWED_VSCODE_SETTINGS = new Set(["terminal.integrated.inheritEnv"])
 
-// Phase 3: Debounce router model fetches to collapse rapid repeats
-const ROUTER_MODELS_DEBOUNCE_MS = process.env.NODE_ENV === "test" ? 0 : 400
-let lastRouterModelsRequestTime = 0
-let lastRouterModelsAllRequestTime = 0
-
 import { MarketplaceManager, MarketplaceItemType } from "../../services/marketplace"
 import { setPendingTodoList } from "../tools/updateTodoListTool"
 
@@ -771,21 +766,13 @@ export const webviewMessageHandler = async (
 			await flushModels(routerNameFlush)
 			break
 		case "requestRouterModels": {
-			// Phase 3: Debounce to collapse rapid repeats
-			const now = Date.now()
-			if (now - lastRouterModelsRequestTime < ROUTER_MODELS_DEBOUNCE_MS) {
-				// Skip this request - too soon after last one
-				break
-			}
-			lastRouterModelsRequestTime = now
-
 			// Phase 2: Scope to active provider during chat/task flows
 			const { apiConfiguration } = await provider.getState()
 			const providerStr = apiConfiguration.apiProvider
 			const activeProvider: RouterName | undefined =
 				providerStr && isRouterName(providerStr) ? providerStr : undefined
 
-			const routerModels: any = {
+			const routerModels: Partial<Record<RouterName, ModelRecord>> = {
 				openrouter: {},
 				"vercel-ai-gateway": {},
 				huggingface: {},
@@ -804,9 +791,8 @@ export const webviewMessageHandler = async (
 				try {
 					return await getModels(options)
 				} catch (error) {
-					console.error(
-						`Failed to fetch models in webviewMessageHandler requestRouterModels for ${options.provider}:`,
-						error,
+					provider.log(
+						`Failed to fetch models in webviewMessageHandler requestRouterModels for ${options.provider}: ${error instanceof Error ? error.message : String(error)}`,
 					)
 					throw error
 				}
@@ -835,14 +821,14 @@ export const webviewMessageHandler = async (
 					},
 				},
 				{
-					key: "roo" as RouterName,
+					key: "roo",
 					options: {
-						provider: "roo" as any,
+						provider: "roo",
 						baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
 						apiKey: CloudService.hasInstance()
 							? CloudService.instance.authService?.getSessionToken()
 							: undefined,
-					} as GetModelsOptions,
+					},
 				},
 			]
 
@@ -870,7 +856,10 @@ export const webviewMessageHandler = async (
 
 			// If nothing matched (edge case), still post empty structure for stability
 			if (modelFetchPromises.length === 0) {
-				await provider.postMessageToWebview({ type: "routerModels", routerModels })
+				await provider.postMessageToWebview({
+					type: "routerModels",
+					routerModels: routerModels as RouterModels,
+				})
 				break
 			}
 
@@ -887,7 +876,7 @@ export const webviewMessageHandler = async (
 					routerModels[routerName] = result.value.models
 				} else {
 					const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
-					console.error(`Error fetching models for ${routerName}:`, result.reason)
+					provider.log(`Error fetching models for ${routerName}: ${errorMessage}`)
 					routerModels[routerName] = {}
 					provider.postMessageToWebview({
 						type: "singleRouterModelFetchResponse",
@@ -898,22 +887,14 @@ export const webviewMessageHandler = async (
 				}
 			})
 
-			provider.postMessageToWebview({ type: "routerModels", routerModels })
+			provider.postMessageToWebview({ type: "routerModels", routerModels: routerModels as RouterModels })
 			break
 		}
 		case "requestRouterModelsAll": {
-			// Phase 3: Debounce to collapse rapid repeats
-			const now = Date.now()
-			if (now - lastRouterModelsAllRequestTime < ROUTER_MODELS_DEBOUNCE_MS) {
-				// Skip this request - too soon after last one
-				break
-			}
-			lastRouterModelsAllRequestTime = now
-
 			// Settings and activation: fetch all providers (legacy behavior)
 			const { apiConfiguration } = await provider.getState()
 
-			const routerModels: any = {
+			const routerModels: Partial<Record<RouterName, ModelRecord>> = {
 				openrouter: {},
 				"vercel-ai-gateway": {},
 				huggingface: {},
@@ -932,9 +913,8 @@ export const webviewMessageHandler = async (
 				try {
 					return await getModels(options)
 				} catch (error) {
-					console.error(
-						`Failed to fetch models in webviewMessageHandler requestRouterModelsAll for ${options.provider}:`,
-						error,
+					provider.log(
+						`Failed to fetch models in webviewMessageHandler requestRouterModelsAll for ${options.provider}: ${error instanceof Error ? error.message : String(error)}`,
 					)
 					throw error
 				}
@@ -962,14 +942,14 @@ export const webviewMessageHandler = async (
 					},
 				},
 				{
-					key: "roo" as RouterName,
+					key: "roo",
 					options: {
-						provider: "roo" as any,
+						provider: "roo",
 						baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
 						apiKey: CloudService.hasInstance()
 							? CloudService.instance.authService?.getSessionToken()
 							: undefined,
-					} as GetModelsOptions,
+					},
 				},
 			]
 
@@ -1022,7 +1002,7 @@ export const webviewMessageHandler = async (
 				} else {
 					// Handle rejection: Post a specific error message for this provider.
 					const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
-					console.error(`Error fetching models for ${routerName}:`, result.reason)
+					provider.log(`Error fetching models for ${routerName}: ${errorMessage}`)
 
 					routerModels[routerName] = {}
 
@@ -1035,7 +1015,7 @@ export const webviewMessageHandler = async (
 				}
 			})
 
-			provider.postMessageToWebview({ type: "routerModels", routerModels })
+			provider.postMessageToWebview({ type: "routerModels", routerModels: routerModels as RouterModels })
 			break
 		}
 		case "requestOllamaModels": {
@@ -1055,7 +1035,8 @@ export const webviewMessageHandler = async (
 					provider.postMessageToWebview({ type: "ollamaModels", ollamaModels: ollamaModels })
 				}
 			} catch (error) {
-				// Silently fail - user hasn't configured Ollama yet
+				// Silently fail - user hasn't configured Ollama yet (debug level only)
+				// Using console.debug since this is expected when Ollama isn't configured
 				console.debug("Ollama models fetch failed:", error)
 			}
 			break
@@ -1079,7 +1060,8 @@ export const webviewMessageHandler = async (
 					})
 				}
 			} catch (error) {
-				// Silently fail - user hasn't configured LM Studio yet.
+				// Silently fail - user hasn't configured LM Studio yet (debug level only)
+				// Using console.debug since this is expected when LM Studio isn't configured
 				console.debug("LM Studio models fetch failed:", error)
 			}
 			break
@@ -1088,15 +1070,15 @@ export const webviewMessageHandler = async (
 			// Specific handler for Roo models only - flushes cache to ensure fresh auth token is used
 			try {
 				// Flush cache first to ensure fresh models with current auth state
-				await flushModels("roo" as RouterName)
+				await flushModels("roo")
 
 				const rooModels = await getModels({
-					provider: "roo" as any,
+					provider: "roo",
 					baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
 					apiKey: CloudService.hasInstance()
 						? CloudService.instance.authService?.getSessionToken()
 						: undefined,
-				} as GetModelsOptions)
+				})
 
 				// Always send a response, even if no models are returned
 				provider.postMessageToWebview({
@@ -1144,7 +1126,9 @@ export const webviewMessageHandler = async (
 					huggingFaceModels: huggingFaceModelsResponse.models,
 				})
 			} catch (error) {
-				console.error("Failed to fetch Hugging Face models:", error)
+				provider.log(
+					`Failed to fetch Hugging Face models: ${error instanceof Error ? error.message : String(error)}`,
+				)
 				provider.postMessageToWebview({ type: "huggingFaceModels", huggingFaceModels: [] })
 			}
 			break
@@ -1463,8 +1447,7 @@ export const webviewMessageHandler = async (
 			break
 		case "checkpointTimeout":
 			const checkpointTimeout = message.value ?? DEFAULT_CHECKPOINT_TIMEOUT_SECONDS
-			// checkpointTimeout is in GlobalSettings but TypeScript inference has issues
-			await provider.contextProxy.setValue("checkpointTimeout" as any, checkpointTimeout)
+			await provider.contextProxy.setValue("checkpointTimeout", checkpointTimeout)
 			await provider.postStateToWebview()
 			break
 		case "browserViewportSize":
@@ -1849,6 +1832,14 @@ export const webviewMessageHandler = async (
 			await updateGlobalState("includeTaskHistoryInEnhance", message.bool ?? true)
 			await provider.postStateToWebview()
 			break
+		case "includeCurrentTime":
+			await updateGlobalState("includeCurrentTime", message.bool ?? true)
+			await provider.postStateToWebview()
+			break
+		case "includeCurrentCost":
+			await updateGlobalState("includeCurrentCost", message.bool ?? true)
+			await provider.postStateToWebview()
+			break
 		case "condensingApiConfigId":
 			await updateGlobalState("condensingApiConfigId", message.text)
 			await provider.postStateToWebview()
diff --git a/webview-ui/src/components/settings/ApiOptions.tsx b/webview-ui/src/components/settings/ApiOptions.tsx
index 9e4d585c97c..7e958b52ec0 100644
--- a/webview-ui/src/components/settings/ApiOptions.tsx
+++ b/webview-ui/src/components/settings/ApiOptions.tsx
@@ -42,7 +42,7 @@ import {
 import { vscode } from "@src/utils/vscode"
 import { validateApiConfigurationExcludingModelErrors, getModelValidationError } from "@src/utils/validate"
 import { useAppTranslation } from "@src/i18n/TranslationContext"
-import { useRouterModels } from "@src/components/ui/hooks/useRouterModels"
+import { useRouterModelsAll } from "@src/components/ui/hooks/useRouterModelsAll"
 import { useSelectedModel } from "@src/components/ui/hooks/useSelectedModel"
 import { useExtensionState } from "@src/context/ExtensionStateContext"
 import {
@@ -188,7 +188,7 @@ const ApiOptions = ({
 		info: selectedModelInfo,
 	} = useSelectedModel(apiConfiguration)
 
-	const { data: routerModels, refetch: refetchRouterModels } = useRouterModels()
+	const { data: routerModels, refetch: refetchRouterModels } = useRouterModelsAll()
 
 	const { data: openRouterModelProviders } = useOpenRouterModelProviders(apiConfiguration?.openRouterModelId, {
 		enabled:
diff --git a/webview-ui/src/components/settings/providers/Unbound.tsx b/webview-ui/src/components/settings/providers/Unbound.tsx
index 15826d0c0b4..de3d906ddaf 100644
--- a/webview-ui/src/components/settings/providers/Unbound.tsx
+++ b/webview-ui/src/components/settings/providers/Unbound.tsx
@@ -100,11 +100,11 @@ export const Unbound = ({
 			window.addEventListener("message", messageHandler)
 		})
 
-		vscode.postMessage({ type: "requestRouterModels" })
+		vscode.postMessage({ type: "requestRouterModelsAll" })
 
 		await modelsPromise
 
-		await queryClient.invalidateQueries({ queryKey: ["routerModels"] })
+		await queryClient.invalidateQueries({ queryKey: ["routerModelsAll"] })
 
 		// After refreshing models, check if current model is in the updated list
 		// If not, select the first available model
diff --git a/webview-ui/src/components/ui/hooks/useRouterModelsAll.ts b/webview-ui/src/components/ui/hooks/useRouterModelsAll.ts
new file mode 100644
index 00000000000..e3d38a4df0c
--- /dev/null
+++ b/webview-ui/src/components/ui/hooks/useRouterModelsAll.ts
@@ -0,0 +1,38 @@
+import { useQuery } from "@tanstack/react-query"
+
+import { RouterModels } from "@roo/api"
+import { ExtensionMessage } from "@roo/ExtensionMessage"
+
+import { vscode } from "@src/utils/vscode"
+
+const getRouterModelsAll = async () =>
+	new Promise<RouterModels>((resolve, reject) => {
+		const cleanup = () => {
+			window.removeEventListener("message", handler)
+		}
+
+		const timeout = setTimeout(() => {
+			cleanup()
+			reject(new Error("Router models (all) request timed out"))
+		}, 10000)
+
+		const handler = (event: MessageEvent) => {
+			const message: ExtensionMessage = event.data
+
+			if (message.type === "routerModels") {
+				clearTimeout(timeout)
+				cleanup()
+
+				if (message.routerModels) {
+					resolve(message.routerModels)
+				} else {
+					reject(new Error("No router models in response"))
+				}
+			}
+		}
+
+		window.addEventListener("message", handler)
+		vscode.postMessage({ type: "requestRouterModelsAll" })
+	})
+
+export const useRouterModelsAll = () => useQuery({ queryKey: ["routerModelsAll"], queryFn: getRouterModelsAll })

From 4cdf54a82f595aebc7753dcd7b1bdb0a396853b9 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 09:49:40 -0500
Subject: [PATCH 3/8] Clean up action-tracking comments and logs in modelCache

- Remove unnecessary String(provider) conversion
- Remove verbose console.log statements for cache operations
- Remove action-tracking comments that don't add value
- Keep only essential error logging for debugging
---
 src/api/providers/fetchers/modelCache.ts | 34 +++++-------------------
 1 file changed, 7 insertions(+), 27 deletions(-)

diff --git a/src/api/providers/fetchers/modelCache.ts b/src/api/providers/fetchers/modelCache.ts
index bcf5554102e..243755c2302 100644
--- a/src/api/providers/fetchers/modelCache.ts
+++ b/src/api/providers/fetchers/modelCache.ts
@@ -58,13 +58,10 @@ async function readModels(router: RouterName): Promise<ModelRecord | undefined>
  */
 export const getModels = async (options: GetModelsOptions): Promise<ModelRecord> => {
 	const { provider } = options
-	const providerStr = String(provider)
 
 	// 1) Try memory cache
 	const cached = getModelsFromCache(provider)
 	if (cached) {
-		// Using console.log for cache layer logging (no provider access in utility functions)
-		console.log(`[modelCache] cache_hit: ${providerStr} (${Object.keys(cached).length} models)`)
 		return cached
 	}
 
@@ -72,9 +69,6 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 	try {
 		const file = await readModels(provider)
 		if (file && Object.keys(file).length > 0) {
-			// Using console.log for cache layer logging (no provider access in utility functions)
-			console.log(`[modelCache] file_hit: ${providerStr} (${Object.keys(file).length} models, bg_refresh queued)`)
-			// Populate memory cache immediately so follow-up callers are instant
 			memoryCache.set(provider, file)
 
 			// Start background refresh if not already in-flight (do not await)
@@ -82,7 +76,7 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 				const signal = AbortSignal.timeout(30_000)
 				const bgPromise = (async (): Promise<ModelRecord> => {
 					let models: ModelRecord = {}
-					switch (providerStr) {
+					switch (provider) {
 						case "openrouter":
 							models = await getOpenRouterModels(undefined, signal)
 							break
@@ -123,16 +117,13 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 							break
 						}
 						default:
-							throw new Error(`Unknown provider: ${providerStr}`)
+							throw new Error(`Unknown provider: ${provider}`)
 					}
 
-					console.log(
-						`[modelCache] bg_refresh_done: ${providerStr} (${Object.keys(models || {}).length} models)`,
-					)
 					memoryCache.set(provider, models)
 					await writeModels(provider, models).catch((err) => {
 						console.error(
-							`[modelCache] Error writing ${providerStr} to file cache during background refresh:`,
+							`[modelCache] Error writing ${provider} to file cache during background refresh:`,
 							err instanceof Error ? err.message : String(err),
 						)
 					})
@@ -142,16 +133,14 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 				inFlightModelFetches.set(provider, bgPromise)
 				Promise.resolve(bgPromise)
 					.catch((err) => {
-						// Log background refresh failures for monitoring
 						console.error(
-							`[modelCache] Background refresh failed for ${providerStr}:`,
+							`[modelCache] Background refresh failed for ${provider}:`,
 							err instanceof Error ? err.message : String(err),
 						)
 					})
 					.finally(() => inFlightModelFetches.delete(provider))
 			}
 
-			// Return the file snapshot immediately
 			return file
 		}
 	} catch {
@@ -161,8 +150,6 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 	// 3) Coalesce concurrent fetches
 	const existing = inFlightModelFetches.get(provider)
 	if (existing) {
-		// Using console.log for cache layer logging (no provider access in utility functions)
-		console.log(`[modelCache] coalesced_wait: ${providerStr}`)
 		return existing
 	}
 
@@ -170,7 +157,7 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 	const signal = AbortSignal.timeout(30_000)
 	const fetchPromise = (async (): Promise<ModelRecord> => {
 		let models: ModelRecord = {}
-		switch (providerStr) {
+		switch (provider) {
 			case "openrouter":
 				models = await getOpenRouterModels(undefined, signal)
 				break
@@ -211,28 +198,21 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 				break
 			}
 			default: {
-				throw new Error(`Unknown provider: ${providerStr}`)
+				throw new Error(`Unknown provider: ${provider}`)
 			}
 		}
-
-		console.log(`[modelCache] network_fetch_done: ${providerStr} (${Object.keys(models || {}).length} models)`)
-
-		// Update memory cache first so waiters get immediate hits
 		memoryCache.set(provider, models)
 
-		// Persist to file cache (best-effort)
 		await writeModels(provider, models).catch((err) => {
 			console.error(
-				`[modelCache] Error writing ${providerStr} to file cache after network fetch:`,
+				`[modelCache] Error writing ${provider} to file cache after network fetch:`,
 				err instanceof Error ? err.message : String(err),
 			)
 		})
 
-		// Return models as-is (skip immediate re-read)
 		return models || {}
 	})()
 
-	// Register and await; ensure cleanup
 	inFlightModelFetches.set(provider, fetchPromise)
 	try {
 		return await fetchPromise

From 6aff586bb500e48a96d1484543f07685e0915168 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 09:50:36 -0500
Subject: [PATCH 4/8] refactor: remove unused import of ProviderName in
 modelCache

---
 src/api/providers/fetchers/modelCache.ts | 2 --
 1 file changed, 2 deletions(-)

diff --git a/src/api/providers/fetchers/modelCache.ts b/src/api/providers/fetchers/modelCache.ts
index 243755c2302..adb54fcb03d 100644
--- a/src/api/providers/fetchers/modelCache.ts
+++ b/src/api/providers/fetchers/modelCache.ts
@@ -3,8 +3,6 @@ import fs from "fs/promises"
 
 import NodeCache from "node-cache"
 
-import type { ProviderName } from "@roo-code/types"
-
 import { safeWriteJson } from "../../../utils/safeWriteJson"
 
 import { ContextProxy } from "../../../core/config/ContextProxy"

From 9d0f01bf92b458f1cde42845410096c9ba1d7379 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 10:15:42 -0500
Subject: [PATCH 5/8] Fix test expectations for AbortSignal parameter

- Update litellm, lmstudio, modelCache, and vercel-ai-gateway tests
- Tests now expect optional AbortSignal parameter (undefined when not provided)
- All 52 tests in affected files now passing
---
 .../fetchers/__tests__/litellm.spec.ts        | 20 +++++++++----------
 .../fetchers/__tests__/lmstudio.test.ts       | 12 +++++------
 .../fetchers/__tests__/modelCache.spec.ts     | 10 +++++++---
 .../__tests__/vercel-ai-gateway.spec.ts       |  4 +++-
 4 files changed, 26 insertions(+), 20 deletions(-)

diff --git a/src/api/providers/fetchers/__tests__/litellm.spec.ts b/src/api/providers/fetchers/__tests__/litellm.spec.ts
index a93c21ee1b0..aa7257f7e7b 100644
--- a/src/api/providers/fetchers/__tests__/litellm.spec.ts
+++ b/src/api/providers/fetchers/__tests__/litellm.spec.ts
@@ -35,7 +35,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -56,7 +56,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -77,7 +77,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -98,7 +98,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -119,7 +119,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -140,7 +140,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -161,7 +161,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -213,7 +213,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 
 		expect(result).toEqual({
@@ -254,7 +254,7 @@ describe("getLiteLLMModels", () => {
 				"Content-Type": "application/json",
 				...DEFAULT_HEADERS,
 			},
-			timeout: 5000,
+			signal: undefined,
 		})
 	})
 
@@ -381,7 +381,7 @@ describe("getLiteLLMModels", () => {
 		expect(mockedAxios.get).toHaveBeenCalledWith(
 			"http://localhost:4000/v1/model/info",
 			expect.objectContaining({
-				timeout: 5000,
+				signal: undefined,
 			}),
 		)
 	})
diff --git a/src/api/providers/fetchers/__tests__/lmstudio.test.ts b/src/api/providers/fetchers/__tests__/lmstudio.test.ts
index a1f06d2e251..d33c991a1f5 100644
--- a/src/api/providers/fetchers/__tests__/lmstudio.test.ts
+++ b/src/api/providers/fetchers/__tests__/lmstudio.test.ts
@@ -113,7 +113,7 @@ describe("LMStudio Fetcher", () => {
 			const result = await getLMStudioModels(baseUrl)
 
 			expect(mockedAxios.get).toHaveBeenCalledTimes(1)
-			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`)
+			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`, { signal: undefined })
 			expect(MockedLMStudioClientConstructor).toHaveBeenCalledTimes(1)
 			expect(MockedLMStudioClientConstructor).toHaveBeenCalledWith({ baseUrl: lmsUrl })
 			expect(mockListDownloadedModels).toHaveBeenCalledTimes(1)
@@ -133,7 +133,7 @@ describe("LMStudio Fetcher", () => {
 			const result = await getLMStudioModels(baseUrl)
 
 			expect(mockedAxios.get).toHaveBeenCalledTimes(1)
-			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`)
+			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`, { signal: undefined })
 			expect(MockedLMStudioClientConstructor).toHaveBeenCalledTimes(1)
 			expect(MockedLMStudioClientConstructor).toHaveBeenCalledWith({ baseUrl: lmsUrl })
 			expect(mockListDownloadedModels).toHaveBeenCalledTimes(1)
@@ -373,7 +373,7 @@ describe("LMStudio Fetcher", () => {
 
 			await getLMStudioModels("")
 
-			expect(mockedAxios.get).toHaveBeenCalledWith(`${defaultBaseUrl}/v1/models`)
+			expect(mockedAxios.get).toHaveBeenCalledWith(`${defaultBaseUrl}/v1/models`, { signal: undefined })
 			expect(MockedLMStudioClientConstructor).toHaveBeenCalledWith({ baseUrl: defaultLmsUrl })
 		})
 
@@ -385,7 +385,7 @@ describe("LMStudio Fetcher", () => {
 
 			await getLMStudioModels(httpsBaseUrl)
 
-			expect(mockedAxios.get).toHaveBeenCalledWith(`${httpsBaseUrl}/v1/models`)
+			expect(mockedAxios.get).toHaveBeenCalledWith(`${httpsBaseUrl}/v1/models`, { signal: undefined })
 			expect(MockedLMStudioClientConstructor).toHaveBeenCalledWith({ baseUrl: wssLmsUrl })
 		})
 
@@ -407,7 +407,7 @@ describe("LMStudio Fetcher", () => {
 			const result = await getLMStudioModels(baseUrl)
 
 			expect(mockedAxios.get).toHaveBeenCalledTimes(1)
-			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`)
+			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`, { signal: undefined })
 			expect(MockedLMStudioClientConstructor).not.toHaveBeenCalled()
 			expect(mockListLoaded).not.toHaveBeenCalled()
 			expect(consoleErrorSpy).toHaveBeenCalledWith(
@@ -426,7 +426,7 @@ describe("LMStudio Fetcher", () => {
 			const result = await getLMStudioModels(baseUrl)
 
 			expect(mockedAxios.get).toHaveBeenCalledTimes(1)
-			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`)
+			expect(mockedAxios.get).toHaveBeenCalledWith(`${baseUrl}/v1/models`, { signal: undefined })
 			expect(MockedLMStudioClientConstructor).not.toHaveBeenCalled()
 			expect(mockListLoaded).not.toHaveBeenCalled()
 			expect(consoleInfoSpy).toHaveBeenCalledWith(`Error connecting to LMStudio at ${baseUrl}`)
diff --git a/src/api/providers/fetchers/__tests__/modelCache.spec.ts b/src/api/providers/fetchers/__tests__/modelCache.spec.ts
index 2a72ef1cc5f..719d553395c 100644
--- a/src/api/providers/fetchers/__tests__/modelCache.spec.ts
+++ b/src/api/providers/fetchers/__tests__/modelCache.spec.ts
@@ -69,7 +69,11 @@ describe("getModels with new GetModelsOptions", () => {
 			baseUrl: "http://localhost:4000",
 		})
 
-		expect(mockGetLiteLLMModels).toHaveBeenCalledWith("test-api-key", "http://localhost:4000")
+		expect(mockGetLiteLLMModels).toHaveBeenCalledWith(
+			"test-api-key",
+			"http://localhost:4000",
+			expect.any(AbortSignal),
+		)
 		expect(result).toEqual(mockModels)
 	})
 
@@ -103,7 +107,7 @@ describe("getModels with new GetModelsOptions", () => {
 
 		const result = await getModels({ provider: "requesty", apiKey: DUMMY_REQUESTY_KEY })
 
-		expect(mockGetRequestyModels).toHaveBeenCalledWith(undefined, DUMMY_REQUESTY_KEY)
+		expect(mockGetRequestyModels).toHaveBeenCalledWith(undefined, DUMMY_REQUESTY_KEY, expect.any(AbortSignal))
 		expect(result).toEqual(mockModels)
 	})
 
@@ -137,7 +141,7 @@ describe("getModels with new GetModelsOptions", () => {
 
 		const result = await getModels({ provider: "unbound", apiKey: DUMMY_UNBOUND_KEY })
 
-		expect(mockGetUnboundModels).toHaveBeenCalledWith(DUMMY_UNBOUND_KEY)
+		expect(mockGetUnboundModels).toHaveBeenCalledWith(DUMMY_UNBOUND_KEY, expect.any(AbortSignal))
 		expect(result).toEqual(mockModels)
 	})
 
diff --git a/src/api/providers/fetchers/__tests__/vercel-ai-gateway.spec.ts b/src/api/providers/fetchers/__tests__/vercel-ai-gateway.spec.ts
index 30ad2f41d5b..b938c0641c4 100644
--- a/src/api/providers/fetchers/__tests__/vercel-ai-gateway.spec.ts
+++ b/src/api/providers/fetchers/__tests__/vercel-ai-gateway.spec.ts
@@ -77,7 +77,9 @@ describe("Vercel AI Gateway Fetchers", () => {
 
 			const models = await getVercelAiGatewayModels()
 
-			expect(mockedAxios.get).toHaveBeenCalledWith("https://ai-gateway.vercel.sh/v1/models")
+			expect(mockedAxios.get).toHaveBeenCalledWith("https://ai-gateway.vercel.sh/v1/models", {
+				signal: undefined,
+			})
 			expect(Object.keys(models)).toHaveLength(2) // Only language models
 			expect(models["anthropic/claude-sonnet-4"]).toBeDefined()
 			expect(models["anthropic/claude-3.5-haiku"]).toBeDefined()

From 3f4edff0960b2c9a6aaa3f753fa4c91e99eb041b Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 10:54:31 -0500
Subject: [PATCH 6/8] Remove in-flight coalescing and fix active-provider gap
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Address review feedback:

1. Remove in-flight coalescing logic (out of scope for this PR)
   - Remove inFlightModelFetches map and related logic from modelCache.ts
   - Remove inFlightEndpointFetches map and related logic from modelEndpointCache.ts
   - Remove background refresh on file cache hit
   - Simplify to: memory cache → file cache → network fetch

2. Fix active-provider scoping gap for local providers
   - Include ollama/lmstudio/huggingface in allFetches when they are the active provider
   - Prevents empty routerModels response that breaks chat flows for these providers

The PR now focuses solely on its primary goal: scope model fetching to
the active provider to reduce unnecessary network requests.

From 97beb1366cd4f4f1fb37c02d547c0080649bae76 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 11:00:30 -0500
Subject: [PATCH 7/8] Remove coalescing, background refresh, and cache logging
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Address review feedback by removing out-of-scope optimizations:

1. Remove in-flight coalescing infrastructure
   - Delete inFlightModelFetches and inFlightEndpointFetches maps
   - Eliminate promise sharing across concurrent requests

2. Remove background refresh on file cache hit
   - Simplify to synchronous flow: memory → file → network
   - No more fire-and-forget background updates

3. Remove cache performance logging
   - Delete console.log statements for cache_hit, file_hit, bg_refresh
   - Clean up debugging artifacts from development

4. Fix active-provider scoping gap
   - Include ollama/lmstudio/huggingface in requestRouterModels when active
   - Prevents empty response that breaks chat flows for local providers

Result: Simpler, more maintainable code focused on core goal of
reducing unnecessary network requests by scoping to active provider.
---
 src/api/providers/fetchers/modelCache.ts      | 198 +++++-------------
 .../providers/fetchers/modelEndpointCache.ts  | 109 ++--------
 src/core/webview/webviewMessageHandler.ts     |  29 +++
 3 files changed, 107 insertions(+), 229 deletions(-)

diff --git a/src/api/providers/fetchers/modelCache.ts b/src/api/providers/fetchers/modelCache.ts
index adb54fcb03d..a60044d2d58 100644
--- a/src/api/providers/fetchers/modelCache.ts
+++ b/src/api/providers/fetchers/modelCache.ts
@@ -26,9 +26,6 @@ import { getRooModels } from "./roo"
 
 const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 
-// Coalesce concurrent fetches per provider within this extension host
-const inFlightModelFetches = new Map<RouterName, Promise<ModelRecord>>()
-
 async function writeModels(router: RouterName, data: ModelRecord) {
 	const filename = `${router}_models.json`
 	const cacheDir = await getCacheDirectoryPath(ContextProxy.instance.globalStorageUri.fsPath)
@@ -63,160 +60,75 @@ export const getModels = async (options: GetModelsOptions): Promise<ModelRecord>
 		return cached
 	}
 
-	// 2) Try file cache snapshot (Option A), then kick off background refresh
+	// 2) Try file cache snapshot
 	try {
 		const file = await readModels(provider)
 		if (file && Object.keys(file).length > 0) {
 			memoryCache.set(provider, file)
-
-			// Start background refresh if not already in-flight (do not await)
-			if (!inFlightModelFetches.has(provider)) {
-				const signal = AbortSignal.timeout(30_000)
-				const bgPromise = (async (): Promise<ModelRecord> => {
-					let models: ModelRecord = {}
-					switch (provider) {
-						case "openrouter":
-							models = await getOpenRouterModels(undefined, signal)
-							break
-						case "requesty":
-							models = await getRequestyModels(options.baseUrl, options.apiKey, signal)
-							break
-						case "glama":
-							models = await getGlamaModels(signal)
-							break
-						case "unbound":
-							models = await getUnboundModels(options.apiKey, signal)
-							break
-						case "litellm":
-							models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string, signal)
-							break
-						case "ollama":
-							models = await getOllamaModels(options.baseUrl, options.apiKey, signal)
-							break
-						case "lmstudio":
-							models = await getLMStudioModels(options.baseUrl, signal)
-							break
-						case "deepinfra":
-							models = await getDeepInfraModels(options.apiKey, options.baseUrl, signal)
-							break
-						case "io-intelligence":
-							models = await getIOIntelligenceModels(options.apiKey, signal)
-							break
-						case "vercel-ai-gateway":
-							models = await getVercelAiGatewayModels(undefined, signal)
-							break
-						case "huggingface":
-							models = await getHuggingFaceModels(signal)
-							break
-						case "roo": {
-							const rooBaseUrl =
-								options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
-							models = await getRooModels(rooBaseUrl, options.apiKey, signal)
-							break
-						}
-						default:
-							throw new Error(`Unknown provider: ${provider}`)
-					}
-
-					memoryCache.set(provider, models)
-					await writeModels(provider, models).catch((err) => {
-						console.error(
-							`[modelCache] Error writing ${provider} to file cache during background refresh:`,
-							err instanceof Error ? err.message : String(err),
-						)
-					})
-					return models || {}
-				})()
-
-				inFlightModelFetches.set(provider, bgPromise)
-				Promise.resolve(bgPromise)
-					.catch((err) => {
-						console.error(
-							`[modelCache] Background refresh failed for ${provider}:`,
-							err instanceof Error ? err.message : String(err),
-						)
-					})
-					.finally(() => inFlightModelFetches.delete(provider))
-			}
-
 			return file
 		}
 	} catch {
-		// ignore file read errors; fall through to network/coalesce path
-	}
-
-	// 3) Coalesce concurrent fetches
-	const existing = inFlightModelFetches.get(provider)
-	if (existing) {
-		return existing
+		// ignore file read errors; fall through to network fetch
 	}
 
-	// 4) Network fetch wrapped as a single in-flight promise for this provider
+	// 3) Network fetch
 	const signal = AbortSignal.timeout(30_000)
-	const fetchPromise = (async (): Promise<ModelRecord> => {
-		let models: ModelRecord = {}
-		switch (provider) {
-			case "openrouter":
-				models = await getOpenRouterModels(undefined, signal)
-				break
-			case "requesty":
-				models = await getRequestyModels(options.baseUrl, options.apiKey, signal)
-				break
-			case "glama":
-				models = await getGlamaModels(signal)
-				break
-			case "unbound":
-				models = await getUnboundModels(options.apiKey, signal)
-				break
-			case "litellm":
-				models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string, signal)
-				break
-			case "ollama":
-				models = await getOllamaModels(options.baseUrl, options.apiKey, signal)
-				break
-			case "lmstudio":
-				models = await getLMStudioModels(options.baseUrl, signal)
-				break
-			case "deepinfra":
-				models = await getDeepInfraModels(options.apiKey, options.baseUrl, signal)
-				break
-			case "io-intelligence":
-				models = await getIOIntelligenceModels(options.apiKey, signal)
-				break
-			case "vercel-ai-gateway":
-				models = await getVercelAiGatewayModels(undefined, signal)
-				break
-			case "huggingface":
-				models = await getHuggingFaceModels(signal)
-				break
-			case "roo": {
-				const rooBaseUrl =
-					options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
-				models = await getRooModels(rooBaseUrl, options.apiKey, signal)
-				break
-			}
-			default: {
-				throw new Error(`Unknown provider: ${provider}`)
-			}
+	let models: ModelRecord = {}
+
+	switch (provider) {
+		case "openrouter":
+			models = await getOpenRouterModels(undefined, signal)
+			break
+		case "requesty":
+			models = await getRequestyModels(options.baseUrl, options.apiKey, signal)
+			break
+		case "glama":
+			models = await getGlamaModels(signal)
+			break
+		case "unbound":
+			models = await getUnboundModels(options.apiKey, signal)
+			break
+		case "litellm":
+			models = await getLiteLLMModels(options.apiKey as string, options.baseUrl as string, signal)
+			break
+		case "ollama":
+			models = await getOllamaModels(options.baseUrl, options.apiKey, signal)
+			break
+		case "lmstudio":
+			models = await getLMStudioModels(options.baseUrl, signal)
+			break
+		case "deepinfra":
+			models = await getDeepInfraModels(options.apiKey, options.baseUrl, signal)
+			break
+		case "io-intelligence":
+			models = await getIOIntelligenceModels(options.apiKey, signal)
+			break
+		case "vercel-ai-gateway":
+			models = await getVercelAiGatewayModels(undefined, signal)
+			break
+		case "huggingface":
+			models = await getHuggingFaceModels(signal)
+			break
+		case "roo": {
+			const rooBaseUrl = options.baseUrl ?? process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy"
+			models = await getRooModels(rooBaseUrl, options.apiKey, signal)
+			break
 		}
-		memoryCache.set(provider, models)
+		default: {
+			throw new Error(`Unknown provider: ${provider}`)
+		}
+	}
 
-		await writeModels(provider, models).catch((err) => {
-			console.error(
-				`[modelCache] Error writing ${provider} to file cache after network fetch:`,
-				err instanceof Error ? err.message : String(err),
-			)
-		})
+	memoryCache.set(provider, models)
 
-		return models || {}
-	})()
+	await writeModels(provider, models).catch((err) => {
+		console.error(
+			`[modelCache] Error writing ${provider} to file cache after network fetch:`,
+			err instanceof Error ? err.message : String(err),
+		)
+	})
 
-	inFlightModelFetches.set(provider, fetchPromise)
-	try {
-		return await fetchPromise
-	} finally {
-		inFlightModelFetches.delete(provider)
-	}
+	return models || {}
 }
 
 /**
diff --git a/src/api/providers/fetchers/modelEndpointCache.ts b/src/api/providers/fetchers/modelEndpointCache.ts
index 9a9018e4d95..49322a6a7de 100644
--- a/src/api/providers/fetchers/modelEndpointCache.ts
+++ b/src/api/providers/fetchers/modelEndpointCache.ts
@@ -14,9 +14,6 @@ import { getOpenRouterModelEndpoints } from "./openrouter"
 
 const memoryCache = new NodeCache({ stdTTL: 5 * 60, checkperiod: 5 * 60 })
 
-// Coalesce concurrent endpoint fetches per (router,modelId)
-const inFlightEndpointFetches = new Map<string, Promise<ModelRecord>>()
-
 const getCacheKey = (router: RouterName, modelId: string) => sanitize(`${router}_${modelId}`)
 
 async function writeModelEndpoints(key: string, data: ModelRecord) {
@@ -53,107 +50,47 @@ export const getModelEndpoints = async ({
 	// 1) Try memory cache
 	const cached = memoryCache.get<ModelRecord>(key)
 	if (cached) {
-		// Using console.log for cache layer logging (no provider access in utility functions)
-		console.log(`[endpointCache] cache_hit: ${key} (${Object.keys(cached).length} endpoints)`)
 		return cached
 	}
 
-	// 2) Try file cache snapshot (Option A), then kick off background refresh
+	// 2) Try file cache snapshot
 	try {
 		const file = await readModelEndpoints(key)
 		if (file && Object.keys(file).length > 0) {
-			// Using console.log for cache layer logging (no provider access in utility functions)
-			console.log(`[endpointCache] file_hit: ${key} (${Object.keys(file).length} endpoints, bg_refresh queued)`)
-			// Populate memory cache immediately
 			memoryCache.set(key, file)
-
-			// Start background refresh if not already in-flight (do not await)
-			if (!inFlightEndpointFetches.has(key)) {
-				const signal = AbortSignal.timeout(30_000)
-				const bgPromise = (async (): Promise<ModelRecord> => {
-					const modelProviders = await getOpenRouterModelEndpoints(modelId, undefined, signal)
-					if (Object.keys(modelProviders).length > 0) {
-						console.log(
-							`[endpointCache] bg_refresh_done: ${key} (${Object.keys(modelProviders).length} endpoints)`,
-						)
-						memoryCache.set(key, modelProviders)
-						try {
-							await writeModelEndpoints(key, modelProviders)
-						} catch (error) {
-							console.error(
-								`[endpointCache] Error writing ${key} to file cache during background refresh:`,
-								error instanceof Error ? error.message : String(error),
-							)
-						}
-						return modelProviders
-					}
-					return {}
-				})()
-
-				inFlightEndpointFetches.set(key, bgPromise)
-				Promise.resolve(bgPromise)
-					.catch((err) => {
-						// Log background refresh failures for monitoring
-						console.error(
-							`[endpointCache] Background refresh failed for ${key}:`,
-							err instanceof Error ? err.message : String(err),
-						)
-					})
-					.finally(() => inFlightEndpointFetches.delete(key))
-			}
-
 			return file
 		}
 	} catch {
-		// ignore file read errors; fall through
+		// ignore file read errors; fall through to network fetch
 	}
 
-	// 3) Coalesce concurrent fetches
-	const inFlight = inFlightEndpointFetches.get(key)
-	if (inFlight) {
-		// Using console.log for cache layer logging (no provider access in utility functions)
-		console.log(`[endpointCache] coalesced_wait: ${key}`)
-		return inFlight
-	}
-
-	// 4) Single network fetch for this key
+	// 3) Network fetch
 	const signal = AbortSignal.timeout(30_000)
-	const fetchPromise = (async (): Promise<ModelRecord> => {
-		let modelProviders: ModelRecord = {}
-		modelProviders = await getOpenRouterModelEndpoints(modelId, undefined, signal)
-
-		if (Object.keys(modelProviders).length > 0) {
-			console.log(`[endpointCache] network_fetch_done: ${key} (${Object.keys(modelProviders).length} endpoints)`)
-			// Update memory cache first
-			memoryCache.set(key, modelProviders)
-
-			// Best-effort persist
-			try {
-				await writeModelEndpoints(key, modelProviders)
-			} catch (error) {
-				console.error(
-					`[endpointCache] Error writing ${key} to file cache after network fetch:`,
-					error instanceof Error ? error.message : String(error),
-				)
-			}
-
-			return modelProviders
-		}
+	let modelProviders: ModelRecord = {}
+
+	modelProviders = await getOpenRouterModelEndpoints(modelId, undefined, signal)
+
+	if (Object.keys(modelProviders).length > 0) {
+		memoryCache.set(key, modelProviders)
 
-		// Fallback to file cache if network returned empty (rare)
 		try {
-			const file = await readModelEndpoints(key)
-			return file ?? {}
-		} catch {
-			return {}
+			await writeModelEndpoints(key, modelProviders)
+		} catch (error) {
+			console.error(
+				`[endpointCache] Error writing ${key} to file cache after network fetch:`,
+				error instanceof Error ? error.message : String(error),
+			)
 		}
-	})()
 
-	inFlightEndpointFetches.set(key, fetchPromise)
+		return modelProviders
+	}
+
+	// Fallback to file cache if network returned empty (rare)
 	try {
-		return await fetchPromise
-	} finally {
-		inFlightEndpointFetches.delete(key)
+		const file = await readModelEndpoints(key)
+		return file ?? {}
+	} catch {
+		return {}
 	}
 }
 
diff --git a/src/core/webview/webviewMessageHandler.ts b/src/core/webview/webviewMessageHandler.ts
index a3ef6ff49d2..3d0f497a9ec 100644
--- a/src/core/webview/webviewMessageHandler.ts
+++ b/src/core/webview/webviewMessageHandler.ts
@@ -832,6 +832,35 @@ export const webviewMessageHandler = async (
 				},
 			]
 
+			// Include local providers (ollama, lmstudio, huggingface) when they are the active provider
+			if (activeProvider === "ollama") {
+				allFetches.push({
+					key: "ollama",
+					options: {
+						provider: "ollama",
+						baseUrl: apiConfiguration.ollamaBaseUrl,
+						apiKey: apiConfiguration.ollamaApiKey,
+					},
+				})
+			}
+			if (activeProvider === "lmstudio") {
+				allFetches.push({
+					key: "lmstudio",
+					options: {
+						provider: "lmstudio",
+						baseUrl: apiConfiguration.lmStudioBaseUrl,
+					},
+				})
+			}
+			if (activeProvider === "huggingface") {
+				allFetches.push({
+					key: "huggingface",
+					options: {
+						provider: "huggingface",
+					},
+				})
+			}
+
 			// IO Intelligence (optional)
 			if (apiConfiguration.ioIntelligenceApiKey) {
 				allFetches.push({

From f5cc227c094cd111a54855f4d4f03f847c142194 Mon Sep 17 00:00:00 2001
From: daniel-lxs <ricciodaniel98@gmail.com>
Date: Thu, 30 Oct 2025 11:21:31 -0500
Subject: [PATCH 8/8] Extract router models fetching logic into dedicated
 service

Refactor to improve separation of concerns:

- Create src/services/router-models/index.ts to handle provider model fetching
- Extract buildProviderFetchList() function for fetch options construction
- Extract fetchRouterModels() function for coordinated model fetching
- Move 150+ lines of provider-specific logic out of webviewMessageHandler
- Add comprehensive tests in router-models-service.spec.ts (11 test cases)

Benefits:
- Cleaner webviewMessageHandler with less business logic
- Reusable service for router model operations
- Better testability with isolated unit tests
- Clear separation between UI message handling and data fetching

Files changed:
- New: src/services/router-models/index.ts
- New: src/services/router-models/__tests__/router-models-service.spec.ts
- Modified: src/core/webview/webviewMessageHandler.ts (simplified)
---
 src/core/webview/webviewMessageHandler.ts     | 308 +++---------------
 .../__tests__/router-models-service.spec.ts   | 266 +++++++++++++++
 src/services/router-models/index.ts           | 171 ++++++++++
 3 files changed, 486 insertions(+), 259 deletions(-)
 create mode 100644 src/services/router-models/__tests__/router-models-service.spec.ts
 create mode 100644 src/services/router-models/index.ts

diff --git a/src/core/webview/webviewMessageHandler.ts b/src/core/webview/webviewMessageHandler.ts
index 3d0f497a9ec..71b7954b094 100644
--- a/src/core/webview/webviewMessageHandler.ts
+++ b/src/core/webview/webviewMessageHandler.ts
@@ -54,9 +54,9 @@ import { openMention } from "../mentions"
 import { getWorkspacePath } from "../../utils/path"
 import { Mode, defaultModeSlug } from "../../shared/modes"
 import { getModels, flushModels } from "../../api/providers/fetchers/modelCache"
-import { GetModelsOptions } from "../../shared/api"
 import { generateSystemPrompt } from "./generateSystemPrompt"
 import { getCommand } from "../../utils/commands"
+import { fetchRouterModels } from "../../services/router-models"
 
 const ALLOWED_VSCODE_SETTINGS = new Set(["terminal.integrated.inheritEnv"])
 
@@ -768,152 +768,27 @@ export const webviewMessageHandler = async (
 		case "requestRouterModels": {
 			// Phase 2: Scope to active provider during chat/task flows
 			const { apiConfiguration } = await provider.getState()
-			const providerStr = apiConfiguration.apiProvider
-			const activeProvider: RouterName | undefined =
-				providerStr && isRouterName(providerStr) ? providerStr : undefined
-
-			const routerModels: Partial<Record<RouterName, ModelRecord>> = {
-				openrouter: {},
-				"vercel-ai-gateway": {},
-				huggingface: {},
-				litellm: {},
-				deepinfra: {},
-				"io-intelligence": {},
-				requesty: {},
-				unbound: {},
-				glama: {},
-				ollama: {},
-				lmstudio: {},
-				roo: {},
-			}
-
-			const safeGetModels = async (options: GetModelsOptions): Promise<ModelRecord> => {
-				try {
-					return await getModels(options)
-				} catch (error) {
-					provider.log(
-						`Failed to fetch models in webviewMessageHandler requestRouterModels for ${options.provider}: ${error instanceof Error ? error.message : String(error)}`,
-					)
-					throw error
-				}
-			}
 
-			// Build full list then filter to active provider
-			const allFetches: { key: RouterName; options: GetModelsOptions }[] = [
-				{ key: "openrouter", options: { provider: "openrouter" } },
-				{
-					key: "requesty",
-					options: {
-						provider: "requesty",
-						apiKey: apiConfiguration.requestyApiKey,
-						baseUrl: apiConfiguration.requestyBaseUrl,
-					},
-				},
-				{ key: "glama", options: { provider: "glama" } },
-				{ key: "unbound", options: { provider: "unbound", apiKey: apiConfiguration.unboundApiKey } },
-				{ key: "vercel-ai-gateway", options: { provider: "vercel-ai-gateway" } },
-				{
-					key: "deepinfra",
-					options: {
-						provider: "deepinfra",
-						apiKey: apiConfiguration.deepInfraApiKey,
-						baseUrl: apiConfiguration.deepInfraBaseUrl,
-					},
-				},
-				{
-					key: "roo",
-					options: {
-						provider: "roo",
-						baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
-						apiKey: CloudService.hasInstance()
-							? CloudService.instance.authService?.getSessionToken()
-							: undefined,
-					},
-				},
-			]
-
-			// Include local providers (ollama, lmstudio, huggingface) when they are the active provider
-			if (activeProvider === "ollama") {
-				allFetches.push({
-					key: "ollama",
-					options: {
-						provider: "ollama",
-						baseUrl: apiConfiguration.ollamaBaseUrl,
-						apiKey: apiConfiguration.ollamaApiKey,
-					},
-				})
-			}
-			if (activeProvider === "lmstudio") {
-				allFetches.push({
-					key: "lmstudio",
-					options: {
-						provider: "lmstudio",
-						baseUrl: apiConfiguration.lmStudioBaseUrl,
-					},
-				})
-			}
-			if (activeProvider === "huggingface") {
-				allFetches.push({
-					key: "huggingface",
-					options: {
-						provider: "huggingface",
-					},
-				})
-			}
-
-			// IO Intelligence (optional)
-			if (apiConfiguration.ioIntelligenceApiKey) {
-				allFetches.push({
-					key: "io-intelligence",
-					options: { provider: "io-intelligence", apiKey: apiConfiguration.ioIntelligenceApiKey },
-				})
-			}
-
-			// LiteLLM (optional)
-			const litellmApiKey = apiConfiguration.litellmApiKey || message?.values?.litellmApiKey
-			const litellmBaseUrl = apiConfiguration.litellmBaseUrl || message?.values?.litellmBaseUrl
-			if (litellmApiKey && litellmBaseUrl) {
-				allFetches.push({
-					key: "litellm",
-					options: { provider: "litellm", apiKey: litellmApiKey, baseUrl: litellmBaseUrl },
-				})
-			}
-
-			const modelFetchPromises = activeProvider
-				? allFetches.filter(({ key }) => key === activeProvider)
-				: allFetches
+			const { routerModels, errors } = await fetchRouterModels({
+				apiConfiguration,
+				activeProviderOnly: true,
+				litellmOverrides: message?.values
+					? {
+							apiKey: message.values.litellmApiKey,
+							baseUrl: message.values.litellmBaseUrl,
+						}
+					: undefined,
+			})
 
-			// If nothing matched (edge case), still post empty structure for stability
-			if (modelFetchPromises.length === 0) {
-				await provider.postMessageToWebview({
-					type: "routerModels",
-					routerModels: routerModels as RouterModels,
+			// Send error notifications for failed providers
+			errors.forEach((err) => {
+				provider.log(`Error fetching models for ${err.provider}: ${err.error}`)
+				provider.postMessageToWebview({
+					type: "singleRouterModelFetchResponse",
+					success: false,
+					error: err.error,
+					values: { provider: err.provider },
 				})
-				break
-			}
-
-			const results = await Promise.allSettled(
-				modelFetchPromises.map(async ({ key, options }) => {
-					const models = await safeGetModels(options)
-					return { key, models }
-				}),
-			)
-
-			results.forEach((result, index) => {
-				const routerName = modelFetchPromises[index].key
-				if (result.status === "fulfilled") {
-					routerModels[routerName] = result.value.models
-				} else {
-					const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
-					provider.log(`Error fetching models for ${routerName}: ${errorMessage}`)
-					routerModels[routerName] = {}
-					provider.postMessageToWebview({
-						type: "singleRouterModelFetchResponse",
-						success: false,
-						error: errorMessage,
-						values: { provider: routerName },
-					})
-				}
 			})
 
 			provider.postMessageToWebview({ type: "routerModels", routerModels: routerModels as RouterModels })
@@ -923,126 +798,41 @@ export const webviewMessageHandler = async (
 			// Settings and activation: fetch all providers (legacy behavior)
 			const { apiConfiguration } = await provider.getState()
 
-			const routerModels: Partial<Record<RouterName, ModelRecord>> = {
-				openrouter: {},
-				"vercel-ai-gateway": {},
-				huggingface: {},
-				litellm: {},
-				deepinfra: {},
-				"io-intelligence": {},
-				requesty: {},
-				unbound: {},
-				glama: {},
-				ollama: {},
-				lmstudio: {},
-				roo: {},
-			}
-
-			const safeGetModels = async (options: GetModelsOptions): Promise<ModelRecord> => {
-				try {
-					return await getModels(options)
-				} catch (error) {
-					provider.log(
-						`Failed to fetch models in webviewMessageHandler requestRouterModelsAll for ${options.provider}: ${error instanceof Error ? error.message : String(error)}`,
-					)
-					throw error
-				}
-			}
+			const { routerModels, errors } = await fetchRouterModels({
+				apiConfiguration,
+				activeProviderOnly: false,
+				litellmOverrides: message?.values
+					? {
+							apiKey: message.values.litellmApiKey,
+							baseUrl: message.values.litellmBaseUrl,
+						}
+					: undefined,
+			})
 
-			const modelFetchPromises: { key: RouterName; options: GetModelsOptions }[] = [
-				{ key: "openrouter", options: { provider: "openrouter" } },
-				{
-					key: "requesty",
-					options: {
-						provider: "requesty",
-						apiKey: apiConfiguration.requestyApiKey,
-						baseUrl: apiConfiguration.requestyBaseUrl,
-					},
-				},
-				{ key: "glama", options: { provider: "glama" } },
-				{ key: "unbound", options: { provider: "unbound", apiKey: apiConfiguration.unboundApiKey } },
-				{ key: "vercel-ai-gateway", options: { provider: "vercel-ai-gateway" } },
-				{
-					key: "deepinfra",
-					options: {
-						provider: "deepinfra",
-						apiKey: apiConfiguration.deepInfraApiKey,
-						baseUrl: apiConfiguration.deepInfraBaseUrl,
-					},
-				},
-				{
-					key: "roo",
-					options: {
-						provider: "roo",
-						baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
-						apiKey: CloudService.hasInstance()
-							? CloudService.instance.authService?.getSessionToken()
-							: undefined,
-					},
-				},
-			]
-
-			// Add IO Intelligence if API key is provided.
-			const ioIntelligenceApiKey = apiConfiguration.ioIntelligenceApiKey
-			if (ioIntelligenceApiKey) {
-				modelFetchPromises.push({
-					key: "io-intelligence",
-					options: { provider: "io-intelligence", apiKey: ioIntelligenceApiKey },
+			// Send error notifications for failed providers
+			errors.forEach((err) => {
+				provider.log(`Error fetching models for ${err.provider}: ${err.error}`)
+				provider.postMessageToWebview({
+					type: "singleRouterModelFetchResponse",
+					success: false,
+					error: err.error,
+					values: { provider: err.provider },
 				})
-			}
-
-			// Don't fetch Ollama and LM Studio models by default anymore.
-			// They have their own specific handlers: requestOllamaModels and requestLmStudioModels.
+			})
 
-			const litellmApiKey = apiConfiguration.litellmApiKey || message?.values?.litellmApiKey
-			const litellmBaseUrl = apiConfiguration.litellmBaseUrl || message?.values?.litellmBaseUrl
-			if (litellmApiKey && litellmBaseUrl) {
-				modelFetchPromises.push({
-					key: "litellm",
-					options: { provider: "litellm", apiKey: litellmApiKey, baseUrl: litellmBaseUrl },
+			// Send ollama/lmstudio-specific messages if models were fetched
+			if (routerModels.ollama && Object.keys(routerModels.ollama).length > 0) {
+				provider.postMessageToWebview({
+					type: "ollamaModels",
+					ollamaModels: routerModels.ollama,
+				})
+			}
+			if (routerModels.lmstudio && Object.keys(routerModels.lmstudio).length > 0) {
+				provider.postMessageToWebview({
+					type: "lmStudioModels",
+					lmStudioModels: routerModels.lmstudio,
 				})
 			}
-
-			const results = await Promise.allSettled(
-				modelFetchPromises.map(async ({ key, options }) => {
-					const models = await safeGetModels(options)
-					return { key, models }
-				}),
-			)
-
-			results.forEach((result, index) => {
-				const routerName = modelFetchPromises[index].key
-
-				if (result.status === "fulfilled") {
-					routerModels[routerName] = result.value.models
-
-					// Ollama and LM Studio settings pages still need these events.
-					if (routerName === "ollama" && Object.keys(result.value.models).length > 0) {
-						provider.postMessageToWebview({
-							type: "ollamaModels",
-							ollamaModels: result.value.models,
-						})
-					} else if (routerName === "lmstudio" && Object.keys(result.value.models).length > 0) {
-						provider.postMessageToWebview({
-							type: "lmStudioModels",
-							lmStudioModels: result.value.models,
-						})
-					}
-				} else {
-					// Handle rejection: Post a specific error message for this provider.
-					const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
-					provider.log(`Error fetching models for ${routerName}: ${errorMessage}`)
-
-					routerModels[routerName] = {}
-
-					provider.postMessageToWebview({
-						type: "singleRouterModelFetchResponse",
-						success: false,
-						error: errorMessage,
-						values: { provider: routerName },
-					})
-				}
-			})
 
 			provider.postMessageToWebview({ type: "routerModels", routerModels: routerModels as RouterModels })
 			break
diff --git a/src/services/router-models/__tests__/router-models-service.spec.ts b/src/services/router-models/__tests__/router-models-service.spec.ts
new file mode 100644
index 00000000000..55c05de9cdd
--- /dev/null
+++ b/src/services/router-models/__tests__/router-models-service.spec.ts
@@ -0,0 +1,266 @@
+import { describe, it, expect, beforeEach, vi } from "vitest"
+import type { Mock } from "vitest"
+import type { ProviderSettings } from "@roo-code/types"
+import { fetchRouterModels } from "../index"
+import { getModels } from "../../../api/providers/fetchers/modelCache"
+import { CloudService } from "@roo-code/cloud"
+
+// Mock dependencies
+vi.mock("../../../api/providers/fetchers/modelCache")
+vi.mock("@roo-code/cloud")
+
+const mockGetModels = getModels as Mock<typeof getModels>
+const mockCloudService = CloudService as any
+
+describe("RouterModelsService", () => {
+	const mockModels = {
+		"test-model": {
+			maxTokens: 4096,
+			contextWindow: 8192,
+			supportsPromptCache: false,
+			description: "Test model",
+		},
+	}
+
+	const baseApiConfiguration: ProviderSettings = {
+		apiProvider: "openrouter",
+		openRouterApiKey: "test-key",
+		requestyApiKey: "requesty-key",
+		unboundApiKey: "unbound-key",
+		ioIntelligenceApiKey: "io-key",
+		deepInfraApiKey: "deepinfra-key",
+		litellmApiKey: "litellm-key",
+		litellmBaseUrl: "http://localhost:4000",
+	}
+
+	beforeEach(() => {
+		vi.clearAllMocks()
+		mockGetModels.mockResolvedValue(mockModels)
+		mockCloudService.hasInstance = vi.fn().mockReturnValue(false)
+	})
+
+	describe("fetchRouterModels", () => {
+		it("fetches all providers when activeProviderOnly is false", async () => {
+			const result = await fetchRouterModels({
+				apiConfiguration: baseApiConfiguration,
+				activeProviderOnly: false,
+			})
+
+			// Should fetch all standard providers
+			expect(mockGetModels).toHaveBeenCalledWith({ provider: "openrouter" })
+			expect(mockGetModels).toHaveBeenCalledWith(
+				expect.objectContaining({ provider: "requesty", apiKey: "requesty-key" }),
+			)
+			expect(mockGetModels).toHaveBeenCalledWith({ provider: "glama" })
+			expect(mockGetModels).toHaveBeenCalledWith({ provider: "unbound", apiKey: "unbound-key" })
+			expect(mockGetModels).toHaveBeenCalledWith({ provider: "vercel-ai-gateway" })
+			expect(mockGetModels).toHaveBeenCalledWith(
+				expect.objectContaining({ provider: "deepinfra", apiKey: "deepinfra-key" }),
+			)
+			expect(mockGetModels).toHaveBeenCalledWith(
+				expect.objectContaining({
+					provider: "roo",
+					baseUrl: "https://api.roocode.com/proxy",
+				}),
+			)
+			expect(mockGetModels).toHaveBeenCalledWith({ provider: "io-intelligence", apiKey: "io-key" })
+			expect(mockGetModels).toHaveBeenCalledWith({
+				provider: "litellm",
+				apiKey: "litellm-key",
+				baseUrl: "http://localhost:4000",
+			})
+
+			// Should return models for all providers
+			expect(result.routerModels).toHaveProperty("openrouter")
+			expect(result.routerModels).toHaveProperty("requesty")
+			expect(result.routerModels).toHaveProperty("glama")
+			expect(result.errors).toEqual([])
+		})
+
+		it("fetches only active provider when activeProviderOnly is true", async () => {
+			const result = await fetchRouterModels({
+				apiConfiguration: { ...baseApiConfiguration, apiProvider: "openrouter" },
+				activeProviderOnly: true,
+			})
+
+			// Should only fetch openrouter
+			expect(mockGetModels).toHaveBeenCalledTimes(1)
+			expect(mockGetModels).toHaveBeenCalledWith({ provider: "openrouter" })
+
+			// Should return models only for openrouter
+			expect(result.routerModels.openrouter).toEqual(mockModels)
+			expect(result.errors).toEqual([])
+		})
+
+		it("includes ollama when it is the active provider", async () => {
+			const config: ProviderSettings = {
+				...baseApiConfiguration,
+				apiProvider: "ollama",
+				ollamaBaseUrl: "http://localhost:11434",
+			}
+
+			await fetchRouterModels({
+				apiConfiguration: config,
+				activeProviderOnly: true,
+			})
+
+			expect(mockGetModels).toHaveBeenCalledWith({
+				provider: "ollama",
+				baseUrl: "http://localhost:11434",
+				apiKey: undefined,
+			})
+		})
+
+		it("includes lmstudio when it is the active provider", async () => {
+			const config: ProviderSettings = {
+				...baseApiConfiguration,
+				apiProvider: "lmstudio",
+				lmStudioBaseUrl: "http://localhost:1234",
+			}
+
+			await fetchRouterModels({
+				apiConfiguration: config,
+				activeProviderOnly: true,
+			})
+
+			expect(mockGetModels).toHaveBeenCalledWith({
+				provider: "lmstudio",
+				baseUrl: "http://localhost:1234",
+			})
+		})
+
+		it("includes huggingface when it is the active provider", async () => {
+			const config: ProviderSettings = {
+				...baseApiConfiguration,
+				apiProvider: "huggingface",
+			}
+
+			await fetchRouterModels({
+				apiConfiguration: config,
+				activeProviderOnly: true,
+			})
+
+			expect(mockGetModels).toHaveBeenCalledWith({
+				provider: "huggingface",
+			})
+		})
+
+		it("uses litellmOverrides when provided", async () => {
+			await fetchRouterModels({
+				apiConfiguration: { ...baseApiConfiguration, litellmApiKey: undefined, litellmBaseUrl: undefined },
+				activeProviderOnly: false,
+				litellmOverrides: {
+					apiKey: "override-key",
+					baseUrl: "http://override:5000",
+				},
+			})
+
+			expect(mockGetModels).toHaveBeenCalledWith({
+				provider: "litellm",
+				apiKey: "override-key",
+				baseUrl: "http://override:5000",
+			})
+		})
+
+		it("handles provider fetch errors gracefully", async () => {
+			mockGetModels
+				.mockResolvedValueOnce(mockModels) // openrouter succeeds
+				.mockRejectedValueOnce(new Error("Requesty API error")) // requesty fails
+				.mockResolvedValueOnce(mockModels) // glama succeeds
+
+			const result = await fetchRouterModels({
+				apiConfiguration: baseApiConfiguration,
+				activeProviderOnly: false,
+			})
+
+			// Should have errors for failed provider
+			expect(result.errors).toHaveLength(1)
+			expect(result.errors[0]).toEqual({
+				provider: "requesty",
+				error: "Requesty API error",
+			})
+
+			// Should have empty object for failed provider
+			expect(result.routerModels.requesty).toEqual({})
+
+			// Should have models for successful providers
+			expect(result.routerModels.openrouter).toEqual(mockModels)
+		})
+
+		it("skips litellm when no api key or base url provided", async () => {
+			const config: ProviderSettings = {
+				...baseApiConfiguration,
+				litellmApiKey: undefined,
+				litellmBaseUrl: undefined,
+			}
+
+			await fetchRouterModels({
+				apiConfiguration: config,
+				activeProviderOnly: false,
+			})
+
+			// Should not call getModels for litellm
+			expect(mockGetModels).not.toHaveBeenCalledWith(expect.objectContaining({ provider: "litellm" }))
+		})
+
+		it("skips io-intelligence when no api key provided", async () => {
+			const config: ProviderSettings = {
+				...baseApiConfiguration,
+				ioIntelligenceApiKey: undefined,
+			}
+
+			await fetchRouterModels({
+				apiConfiguration: config,
+				activeProviderOnly: false,
+			})
+
+			// Should not call getModels for io-intelligence
+			expect(mockGetModels).not.toHaveBeenCalledWith(expect.objectContaining({ provider: "io-intelligence" }))
+		})
+
+		it("uses roo session token when CloudService is available", async () => {
+			const mockAuthService = {
+				getSessionToken: vi.fn().mockReturnValue("session-token-123"),
+			}
+
+			vi.mocked(CloudService.hasInstance).mockReturnValue(true)
+			Object.defineProperty(CloudService, "instance", {
+				get: () => ({ authService: mockAuthService }),
+				configurable: true,
+			})
+
+			await fetchRouterModels({
+				apiConfiguration: baseApiConfiguration,
+				activeProviderOnly: false,
+			})
+
+			expect(mockGetModels).toHaveBeenCalledWith(
+				expect.objectContaining({
+					provider: "roo",
+					apiKey: "session-token-123",
+				}),
+			)
+		})
+
+		it("initializes all providers with empty objects", async () => {
+			const result = await fetchRouterModels({
+				apiConfiguration: { apiProvider: "openrouter" } as ProviderSettings,
+				activeProviderOnly: true,
+			})
+
+			// All providers should be initialized even if not fetched
+			expect(result.routerModels).toHaveProperty("openrouter")
+			expect(result.routerModels).toHaveProperty("requesty")
+			expect(result.routerModels).toHaveProperty("glama")
+			expect(result.routerModels).toHaveProperty("unbound")
+			expect(result.routerModels).toHaveProperty("vercel-ai-gateway")
+			expect(result.routerModels).toHaveProperty("deepinfra")
+			expect(result.routerModels).toHaveProperty("roo")
+			expect(result.routerModels).toHaveProperty("litellm")
+			expect(result.routerModels).toHaveProperty("ollama")
+			expect(result.routerModels).toHaveProperty("lmstudio")
+			expect(result.routerModels).toHaveProperty("huggingface")
+			expect(result.routerModels).toHaveProperty("io-intelligence")
+		})
+	})
+})
diff --git a/src/services/router-models/index.ts b/src/services/router-models/index.ts
new file mode 100644
index 00000000000..52a27ee5997
--- /dev/null
+++ b/src/services/router-models/index.ts
@@ -0,0 +1,171 @@
+import type { ProviderSettings } from "@roo-code/types"
+import { CloudService } from "@roo-code/cloud"
+import type { RouterName, ModelRecord, GetModelsOptions } from "../../shared/api"
+import { getModels } from "../../api/providers/fetchers/modelCache"
+
+export interface RouterModelsFetchOptions {
+	apiConfiguration: ProviderSettings
+	activeProviderOnly?: boolean
+	litellmOverrides?: {
+		apiKey?: string
+		baseUrl?: string
+	}
+}
+
+export interface RouterModelsFetchResult {
+	routerModels: Partial<Record<RouterName, ModelRecord>>
+	errors: Array<{
+		provider: RouterName
+		error: string
+	}>
+}
+
+/**
+ * Builds the list of provider fetch options based on configuration and mode.
+ */
+function buildProviderFetchList(
+	options: RouterModelsFetchOptions,
+): Array<{ key: RouterName; options: GetModelsOptions }> {
+	const { apiConfiguration, activeProviderOnly, litellmOverrides } = options
+
+	const allFetches: Array<{ key: RouterName; options: GetModelsOptions }> = [
+		{ key: "openrouter", options: { provider: "openrouter" } },
+		{
+			key: "requesty",
+			options: {
+				provider: "requesty",
+				apiKey: apiConfiguration.requestyApiKey,
+				baseUrl: apiConfiguration.requestyBaseUrl,
+			},
+		},
+		{ key: "glama", options: { provider: "glama" } },
+		{ key: "unbound", options: { provider: "unbound", apiKey: apiConfiguration.unboundApiKey } },
+		{ key: "vercel-ai-gateway", options: { provider: "vercel-ai-gateway" } },
+		{
+			key: "deepinfra",
+			options: {
+				provider: "deepinfra",
+				apiKey: apiConfiguration.deepInfraApiKey,
+				baseUrl: apiConfiguration.deepInfraBaseUrl,
+			},
+		},
+		{
+			key: "roo",
+			options: {
+				provider: "roo",
+				baseUrl: process.env.ROO_CODE_PROVIDER_URL ?? "https://api.roocode.com/proxy",
+				apiKey: CloudService.hasInstance() ? CloudService.instance.authService?.getSessionToken() : undefined,
+			},
+		},
+	]
+
+	// Include local providers when in active-provider mode and they are selected
+	if (activeProviderOnly) {
+		const activeProvider = apiConfiguration.apiProvider
+
+		if (activeProvider === "ollama") {
+			allFetches.push({
+				key: "ollama",
+				options: {
+					provider: "ollama",
+					baseUrl: apiConfiguration.ollamaBaseUrl,
+					apiKey: apiConfiguration.ollamaApiKey,
+				},
+			})
+		}
+		if (activeProvider === "lmstudio") {
+			allFetches.push({
+				key: "lmstudio",
+				options: {
+					provider: "lmstudio",
+					baseUrl: apiConfiguration.lmStudioBaseUrl,
+				},
+			})
+		}
+		if (activeProvider === "huggingface") {
+			allFetches.push({
+				key: "huggingface",
+				options: {
+					provider: "huggingface",
+				},
+			})
+		}
+	}
+
+	// Add IO Intelligence if API key is provided
+	if (apiConfiguration.ioIntelligenceApiKey) {
+		allFetches.push({
+			key: "io-intelligence",
+			options: { provider: "io-intelligence", apiKey: apiConfiguration.ioIntelligenceApiKey },
+		})
+	}
+
+	// Add LiteLLM if configured (with potential overrides from message)
+	const litellmApiKey = apiConfiguration.litellmApiKey || litellmOverrides?.apiKey
+	const litellmBaseUrl = apiConfiguration.litellmBaseUrl || litellmOverrides?.baseUrl
+	if (litellmApiKey && litellmBaseUrl) {
+		allFetches.push({
+			key: "litellm",
+			options: { provider: "litellm", apiKey: litellmApiKey, baseUrl: litellmBaseUrl },
+		})
+	}
+
+	return allFetches
+}
+
+/**
+ * Fetches router models based on the provided options.
+ * Can fetch all providers or only the active provider.
+ */
+export async function fetchRouterModels(options: RouterModelsFetchOptions): Promise<RouterModelsFetchResult> {
+	const { apiConfiguration, activeProviderOnly } = options
+
+	// Initialize empty results for all providers
+	const routerModels: Partial<Record<RouterName, ModelRecord>> = {
+		openrouter: {},
+		"vercel-ai-gateway": {},
+		huggingface: {},
+		litellm: {},
+		deepinfra: {},
+		"io-intelligence": {},
+		requesty: {},
+		unbound: {},
+		glama: {},
+		ollama: {},
+		lmstudio: {},
+		roo: {},
+	}
+
+	const errors: Array<{ provider: RouterName; error: string }> = []
+
+	// Build fetch list
+	const fetchList = buildProviderFetchList(options)
+
+	// Filter to active provider if requested
+	const activeProvider = apiConfiguration.apiProvider as RouterName | undefined
+	const modelFetchPromises =
+		activeProviderOnly && activeProvider ? fetchList.filter(({ key }) => key === activeProvider) : fetchList
+
+	// Execute fetches
+	const results = await Promise.allSettled(
+		modelFetchPromises.map(async ({ key, options }) => {
+			const models = await getModels(options)
+			return { key, models }
+		}),
+	)
+
+	// Process results
+	results.forEach((result, index) => {
+		const routerName = modelFetchPromises[index].key
+
+		if (result.status === "fulfilled") {
+			routerModels[routerName] = result.value.models
+		} else {
+			const errorMessage = result.reason instanceof Error ? result.reason.message : String(result.reason)
+			routerModels[routerName] = {}
+			errors.push({ provider: routerName, error: errorMessage })
+		}
+	})
+
+	return { routerModels, errors }
+}