Added models fetching

2025-09-18 18:25:00 -03:00 · 2025-09-18 18:25:00 -03:00 · d68a787017
commit d68a787017
parent 4cbdf6ed19
7 changed files with 668 additions and 37 deletions
--- a/frontend/src/app/api/queries/useGetModelsQuery.ts
+++ b/frontend/src/app/api/queries/useGetModelsQuery.ts
@ -0,0 +1,140 @@
 import {
  type UseQueryOptions,
  useQuery,
  useQueryClient,
 } from "@tanstack/react-query";
 export interface ModelOption {
  value: string;
  label: string;
  default?: boolean;
 }
 export interface ModelsResponse {
  language_models: ModelOption[];
  embedding_models: ModelOption[];
 }
 export interface OllamaModelsParams {
  endpoint?: string;
 }
 export interface IBMModelsParams {
  api_key?: string;
  endpoint?: string;
  project_id?: string;
 }
 export const useGetOpenAIModelsQuery = (
  options?: Omit<UseQueryOptions<ModelsResponse>, "queryKey" | "queryFn">,
 ) => {
  const queryClient = useQueryClient();
  async function getOpenAIModels(): Promise<ModelsResponse> {
    const response = await fetch("/api/models/openai");
    if (response.ok) {
      return await response.json();
    } else {
      throw new Error("Failed to fetch OpenAI models");
    }
  }
  const queryResult = useQuery(
    {
      queryKey: ["models", "openai"],
      queryFn: getOpenAIModels,
      staleTime: 5 * 60 * 1000, // 5 minutes
      ...options,
    },
    queryClient,
  );
  return queryResult;
 };
 export const useGetOllamaModelsQuery = (
  params?: OllamaModelsParams,
  options?: Omit<UseQueryOptions<ModelsResponse>, "queryKey" | "queryFn">,
 ) => {
  const queryClient = useQueryClient();
  async function getOllamaModels(): Promise<ModelsResponse> {
    const url = new URL("/api/models/ollama", window.location.origin);
    if (params?.endpoint) {
      url.searchParams.set("endpoint", params.endpoint);
    }
    const response = await fetch(url.toString());
    if (response.ok) {
      return await response.json();
    } else {
      throw new Error("Failed to fetch Ollama models");
    }
  }
  const queryResult = useQuery(
    {
      queryKey: ["models", "ollama", params],
      queryFn: getOllamaModels,
      staleTime: 5 * 60 * 1000, // 5 minutes
      enabled: !!params?.endpoint, // Only run if endpoint is provided
      ...options,
    },
    queryClient,
  );
  return queryResult;
 };
 export const useGetIBMModelsQuery = (
  params?: IBMModelsParams,
  options?: Omit<UseQueryOptions<ModelsResponse>, "queryKey" | "queryFn">,
 ) => {
  const queryClient = useQueryClient();
  async function getIBMModels(): Promise<ModelsResponse> {
    const url = "/api/models/ibm";
    // If we have credentials, use POST to send them securely
    if (params?.api_key || params?.endpoint || params?.project_id) {
      const response = await fetch(url, {
        method: "POST",
        headers: {
          "Content-Type": "application/json",
        },
        body: JSON.stringify({
          api_key: params.api_key,
          endpoint: params.endpoint,
          project_id: params.project_id,
        }),
      });
      if (response.ok) {
        return await response.json();
      } else {
        throw new Error("Failed to fetch IBM models");
      }
    } else {
      // Use GET for default models
      const response = await fetch(url);
      if (response.ok) {
        return await response.json();
      } else {
        throw new Error("Failed to fetch IBM models");
      }
    }
  }
  const queryResult = useQuery(
    {
      queryKey: ["models", "ibm", params],
      queryFn: getIBMModels,
      staleTime: 5 * 60 * 1000, // 5 minutes
      enabled: !!(params?.api_key && params?.endpoint && params?.project_id), // Only run if all credentials are provided
      ...options,
    },
    queryClient,
  );
  return queryResult;
 };
--- a/frontend/src/app/onboarding/ibm-onboarding.tsx
+++ b/frontend/src/app/onboarding/ibm-onboarding.tsx
@ -1,7 +1,8 @@
-import { useState } from "react";
+import { useState, useEffect } from "react";
 import { LabelInput } from "@/components/label-input";
 import IBMLogo from "@/components/logo/ibm-logo";
 import type { Settings } from "../api/queries/useGetSettingsQuery";
 import { useGetIBMModelsQuery } from "../api/queries/useGetModelsQuery";
 import { AdvancedOnboarding } from "./advanced";
 export function IBMOnboarding({
@ -15,21 +16,44 @@ export function IBMOnboarding({
  sampleDataset: boolean;
  setSampleDataset: (dataset: boolean) => void;
 }) {
-  const languageModels = [
+  const [endpoint, setEndpoint] = useState("");
-    { value: "gpt-oss", label: "gpt-oss" },
+  const [apiKey, setApiKey] = useState("");
-    { value: "llama3.1", label: "llama3.1" },
+  const [projectId, setProjectId] = useState("");
-    { value: "llama3.2", label: "llama3.2" },
+  const [languageModel, setLanguageModel] = useState("meta-llama/llama-3-1-70b-instruct");
-    { value: "llama3.3", label: "llama3.3" },
+  const [embeddingModel, setEmbeddingModel] = useState("ibm/slate-125m-english-rtrvr");
-    { value: "llama3.4", label: "llama3.4" },
+
-    { value: "llama3.5", label: "llama3.5" },
+  // Fetch models from API when all credentials are provided
-  ];
+  const { data: modelsData } = useGetIBMModelsQuery(
-  const embeddingModels = [
+    (apiKey && endpoint && projectId) ? { api_key: apiKey, endpoint, project_id: projectId } : undefined,
-    { value: "text-embedding-3-small", label: "text-embedding-3-small" },
+    { enabled: !!(apiKey && endpoint && projectId) }
  ];
  const [languageModel, setLanguageModel] = useState("gpt-oss");
  const [embeddingModel, setEmbeddingModel] = useState(
    "text-embedding-3-small",
  );
  // Use fetched models or fallback to defaults
  const languageModels = modelsData?.language_models || [
    { value: "meta-llama/llama-3-1-70b-instruct", label: "Llama 3.1 70B Instruct", default: true },
    { value: "meta-llama/llama-3-1-8b-instruct", label: "Llama 3.1 8B Instruct" },
    { value: "ibm/granite-13b-chat-v2", label: "Granite 13B Chat v2" },
    { value: "ibm/granite-13b-instruct-v2", label: "Granite 13B Instruct v2" },
  ];
  const embeddingModels = modelsData?.embedding_models || [
    { value: "ibm/slate-125m-english-rtrvr", label: "Slate 125M English Retriever", default: true },
    { value: "sentence-transformers/all-minilm-l12-v2", label: "All-MiniLM L12 v2" },
  ];
  // Update default selections when models are loaded
  useEffect(() => {
    if (modelsData) {
      const defaultLangModel = modelsData.language_models.find(m => m.default);
      const defaultEmbedModel = modelsData.embedding_models.find(m => m.default);
      if (defaultLangModel) {
        setLanguageModel(defaultLangModel.value);
      }
      if (defaultEmbedModel) {
        setEmbeddingModel(defaultEmbedModel.value);
      }
    }
  }, [modelsData]);
  const handleLanguageModelChange = (model: string) => {
    setLanguageModel(model);
  };
@ -48,21 +72,27 @@ export function IBMOnboarding({
        helperText="The API endpoint for your watsonx.ai account."
        id="api-endpoint"
        required
-        placeholder="https://..."
+        placeholder="https://us-south.ml.cloud.ibm.com"
        value={endpoint}
        onChange={(e) => setEndpoint(e.target.value)}
      />
      <LabelInput
        label="IBM API key"
        helperText="The API key for your watsonx.ai account."
        id="api-key"
        required
-        placeholder="sk-..."
+        placeholder="your-api-key"
        value={apiKey}
        onChange={(e) => setApiKey(e.target.value)}
      />
      <LabelInput
        label="IBM Project ID"
        helperText="The project ID for your watsonx.ai account."
        id="project-id"
        required
-        placeholder="..."
+        placeholder="your-project-id"
        value={projectId}
        onChange={(e) => setProjectId(e.target.value)}
      />
      <AdvancedOnboarding
        icon={<IBMLogo className="w-4 h-4" />}
--- a/frontend/src/app/onboarding/ollama-onboarding.tsx
+++ b/frontend/src/app/onboarding/ollama-onboarding.tsx
@ -1,8 +1,9 @@
-import { useState } from "react";
+import { useState, useEffect } from "react";
 import { LabelInput } from "@/components/label-input";
 import { LabelWrapper } from "@/components/label-wrapper";
 import OllamaLogo from "@/components/logo/ollama-logo";
 import type { Settings } from "../api/queries/useGetSettingsQuery";
 import { useGetOllamaModelsQuery } from "../api/queries/useGetModelsQuery";
 import { AdvancedOnboarding } from "./advanced";
 import { ModelSelector } from "./model-selector";
@ -17,24 +18,43 @@ export function OllamaOnboarding({
  sampleDataset: boolean;
  setSampleDataset: (dataset: boolean) => void;
 }) {
-  const [open, setOpen] = useState(false);
+  const [endpoint, setEndpoint] = useState("");
-  const [value, setValue] = useState("");
+  const [languageModel, setLanguageModel] = useState("llama3.2");
-  const [languageModel, setLanguageModel] = useState("gpt-oss");
+  const [embeddingModel, setEmbeddingModel] = useState("nomic-embed-text");
-  const [embeddingModel, setEmbeddingModel] = useState(
+
-    "text-embedding-3-small",
+  // Fetch models from API when endpoint is provided
  const { data: modelsData } = useGetOllamaModelsQuery(
    endpoint ? { endpoint } : undefined,
    { enabled: !!endpoint }
  );
-  const languageModels = [
+
-    { value: "gpt-oss", label: "gpt-oss", default: true },
+  // Use fetched models or fallback to defaults
  const languageModels = modelsData?.language_models || [
    { value: "llama3.2", label: "llama3.2", default: true },
    { value: "llama3.1", label: "llama3.1" },
-    { value: "llama3.2", label: "llama3.2" },
+    { value: "llama3", label: "llama3" },
-    { value: "llama3.3", label: "llama3.3" },
+    { value: "mistral", label: "mistral" },
-    { value: "llama3.4", label: "llama3.4" },
+    { value: "codellama", label: "codellama" },
    { value: "llama3.5", label: "llama3.5" },
  ];
-  const embeddingModels = [
+  const embeddingModels = modelsData?.embedding_models || [
-    { value: "text-embedding-3-small", label: "text-embedding-3-small" },
+    { value: "nomic-embed-text", label: "nomic-embed-text", default: true },
  ];
  // Update default selections when models are loaded
  useEffect(() => {
    if (modelsData) {
      const defaultLangModel = modelsData.language_models.find(m => m.default);
      const defaultEmbedModel = modelsData.embedding_models.find(m => m.default);
      if (defaultLangModel) {
        setLanguageModel(defaultLangModel.value);
      }
      if (defaultEmbedModel) {
        setEmbeddingModel(defaultEmbedModel.value);
      }
    }
  }, [modelsData]);
  const handleSampleDatasetChange = (dataset: boolean) => {
    setSampleDataset(dataset);
  };
@ -45,7 +65,9 @@ export function OllamaOnboarding({
        helperText="The endpoint for your Ollama server."
        id="api-endpoint"
        required
-        placeholder="http://..."
+        placeholder="http://localhost:11434"
        value={endpoint}
        onChange={(e) => setEndpoint(e.target.value)}
      />
      <LabelWrapper
        label="Embedding model"
--- a/frontend/src/app/onboarding/openai-onboarding.tsx
+++ b/frontend/src/app/onboarding/openai-onboarding.tsx
@ -1,7 +1,8 @@
-import { useState } from "react";
+import { useState, useEffect } from "react";
 import { LabelInput } from "@/components/label-input";
 import OpenAILogo from "@/components/logo/openai-logo";
 import type { Settings } from "../api/queries/useGetSettingsQuery";
 import { useGetOpenAIModelsQuery } from "../api/queries/useGetModelsQuery";
 import { AdvancedOnboarding } from "./advanced";
 export function OpenAIOnboarding({
@ -19,10 +20,30 @@ export function OpenAIOnboarding({
  const [embeddingModel, setEmbeddingModel] = useState(
    "text-embedding-3-small",
  );
-  const languageModels = [{ value: "gpt-4o-mini", label: "gpt-4o-mini" }];
+
-  const embeddingModels = [
+  // Fetch models from API
-    { value: "text-embedding-3-small", label: "text-embedding-3-small" },
+  const { data: modelsData } = useGetOpenAIModelsQuery();
  // Use fetched models or fallback to defaults
  const languageModels = modelsData?.language_models || [{ value: "gpt-4o-mini", label: "gpt-4o-mini", default: true }];
  const embeddingModels = modelsData?.embedding_models || [
    { value: "text-embedding-3-small", label: "text-embedding-3-small", default: true },
  ];
  // Update default selections when models are loaded
  useEffect(() => {
    if (modelsData) {
      const defaultLangModel = modelsData.language_models.find(m => m.default);
      const defaultEmbedModel = modelsData.embedding_models.find(m => m.default);
      if (defaultLangModel && languageModel === "gpt-4o-mini") {
        setLanguageModel(defaultLangModel.value);
      }
      if (defaultEmbedModel && embeddingModel === "text-embedding-3-small") {
        setEmbeddingModel(defaultEmbedModel.value);
      }
    }
  }, [modelsData, languageModel, embeddingModel]);
  const handleLanguageModelChange = (model: string) => {
    setLanguageModel(model);
  };
--- a/src/api/models.py
+++ b/src/api/models.py
@ -0,0 +1,63 @@
 from starlette.responses import JSONResponse
 from utils.logging_config import get_logger
 logger = get_logger(__name__)
 async def get_openai_models(request, models_service, session_manager):
    """Get available OpenAI models"""
    try:
        models = await models_service.get_openai_models()
        return JSONResponse(models)
    except Exception as e:
        logger.error(f"Failed to get OpenAI models: {str(e)}")
        return JSONResponse(
            {"error": f"Failed to retrieve OpenAI models: {str(e)}"},
            status_code=500
        )
 async def get_ollama_models(request, models_service, session_manager):
    """Get available Ollama models"""
    try:
        # Get endpoint from query parameters if provided
        query_params = dict(request.query_params)
        endpoint = query_params.get("endpoint")
        models = await models_service.get_ollama_models(endpoint=endpoint)
        return JSONResponse(models)
    except Exception as e:
        logger.error(f"Failed to get Ollama models: {str(e)}")
        return JSONResponse(
            {"error": f"Failed to retrieve Ollama models: {str(e)}"},
            status_code=500
        )
 async def get_ibm_models(request, models_service, session_manager):
    """Get available IBM Watson models"""
    try:
        # Get credentials from query parameters or request body if provided
        if request.method == "POST":
            body = await request.json()
            api_key = body.get("api_key")
            endpoint = body.get("endpoint")
            project_id = body.get("project_id")
        else:
            query_params = dict(request.query_params)
            api_key = query_params.get("api_key")
            endpoint = query_params.get("endpoint")
            project_id = query_params.get("project_id")
        models = await models_service.get_ibm_models(
            api_key=api_key,
            endpoint=endpoint,
            project_id=project_id
        )
        return JSONResponse(models)
    except Exception as e:
        logger.error(f"Failed to get IBM models: {str(e)}")
        return JSONResponse(
            {"error": f"Failed to retrieve IBM models: {str(e)}"},
            status_code=500
        )
--- a/src/main.py
+++ b/src/main.py
@ -33,6 +33,7 @@ from api import (
    flows,
    knowledge_filter,
    langflow_files,
    models,
    nudges,
    oidc,
    router,
@ -66,6 +67,7 @@ from services.knowledge_filter_service import KnowledgeFilterService
 # Configuration and setup
 # Services
 from services.langflow_file_service import LangflowFileService
 from services.models_service import ModelsService
 from services.monitor_service import MonitorService
 from services.search_service import SearchService
 from services.task_service import TaskService
@ -409,6 +411,7 @@ async def initialize_services():
    chat_service = ChatService()
    flows_service = FlowsService()
    knowledge_filter_service = KnowledgeFilterService(session_manager)
    models_service = ModelsService()
    monitor_service = MonitorService(session_manager)
    # Set process pool for document service
@ -470,6 +473,7 @@ async def initialize_services():
        "auth_service": auth_service,
        "connector_service": connector_service,
        "knowledge_filter_service": knowledge_filter_service,
        "models_service": models_service,
        "monitor_service": monitor_service,
        "session_manager": session_manager,
    }
@ -909,6 +913,40 @@ async def create_app():
            ),
            methods=["POST"],
        ),
        # Models endpoints
        Route(
            "/models/openai",
            require_auth(services["session_manager"])(
                partial(
                    models.get_openai_models,
                    models_service=services["models_service"],
                    session_manager=services["session_manager"]
                )
            ),
            methods=["GET"],
        ),
        Route(
            "/models/ollama",
            require_auth(services["session_manager"])(
                partial(
                    models.get_ollama_models,
                    models_service=services["models_service"],
                    session_manager=services["session_manager"]
                )
            ),
            methods=["GET"],
        ),
        Route(
            "/models/ibm",
            require_auth(services["session_manager"])(
                partial(
                    models.get_ibm_models,
                    models_service=services["models_service"],
                    session_manager=services["session_manager"]
                )
            ),
            methods=["GET", "POST"],
        ),
        # Onboarding endpoint
        Route(
            "/onboarding",
--- a/src/services/models_service.py
+++ b/src/services/models_service.py
@ -0,0 +1,317 @@
 import httpx
 import os
 from typing import Dict, List
 from utils.logging_config import get_logger
 logger = get_logger(__name__)
 class ModelsService:
    """Service for fetching available models from different AI providers"""
    def __init__(self):
        self.session_manager = None
    async def get_openai_models(self) -> Dict[str, List[Dict[str, str]]]:
        """Fetch available models from OpenAI API"""
        try:
            api_key = os.getenv("OPENAI_API_KEY")
            if not api_key:
                logger.warning("OPENAI_API_KEY not set, using default models")
                return self._get_default_openai_models()
            headers = {
                "Authorization": f"Bearer {api_key}",
                "Content-Type": "application/json",
            }
            async with httpx.AsyncClient() as client:
                response = await client.get(
                    "https://api.openai.com/v1/models", headers=headers, timeout=10.0
                )
            if response.status_code == 200:
                data = response.json()
                models = data.get("data", [])
                # Filter for relevant models
                language_models = []
                embedding_models = []
                for model in models:
                    model_id = model.get("id", "")
                    # Language models (GPT models)
                    if any(prefix in model_id for prefix in ["gpt-4", "gpt-3.5"]):
                        language_models.append(
                            {
                                "value": model_id,
                                "label": model_id,
                                "default": model_id == "gpt-4o-mini",
                            }
                        )
                    # Embedding models
                    elif "text-embedding" in model_id:
                        embedding_models.append(
                            {
                                "value": model_id,
                                "label": model_id,
                                "default": model_id == "text-embedding-3-small",
                            }
                        )
                # Sort by name and ensure defaults are first
                language_models.sort(
                    key=lambda x: (not x.get("default", False), x["value"])
                )
                embedding_models.sort(
                    key=lambda x: (not x.get("default", False), x["value"])
                )
                return {
                    "language_models": language_models,
                    "embedding_models": embedding_models,
                }
            else:
                logger.warning(f"Failed to fetch OpenAI models: {response.status_code}")
                return self._get_default_openai_models()
        except Exception as e:
            logger.error(f"Error fetching OpenAI models: {str(e)}")
            return self._get_default_openai_models()
    async def get_ollama_models(
        self, endpoint: str = None
    ) -> Dict[str, List[Dict[str, str]]]:
        """Fetch available models from Ollama API"""
        try:
            # Use provided endpoint or default
            ollama_url = endpoint or os.getenv(
                "OLLAMA_BASE_URL", "http://localhost:11434"
            )
            async with httpx.AsyncClient() as client:
                response = await client.get(f"{ollama_url}/api/tags", timeout=10.0)
            if response.status_code == 200:
                data = response.json()
                models = data.get("models", [])
                # Extract model names
                language_models = []
                embedding_models = []
                for model in models:
                    model_name = model.get("name", "").split(":")[
                        0
                    ]  # Remove tag if present
                    if model_name:
                        # Most Ollama models can be used as language models
                        language_models.append(
                            {
                                "value": model_name,
                                "label": model_name,
                                "default": "llama3" in model_name.lower(),
                            }
                        )
                        # Some models are specifically for embeddings
                        if any(
                            embed in model_name.lower()
                            for embed in ["embed", "sentence", "all-minilm"]
                        ):
                            embedding_models.append(
                                {
                                    "value": model_name,
                                    "label": model_name,
                                    "default": False,
                                }
                            )
                # Remove duplicates and sort
                language_models = list(
                    {m["value"]: m for m in language_models}.values()
                )
                embedding_models = list(
                    {m["value"]: m for m in embedding_models}.values()
                )
                language_models.sort(
                    key=lambda x: (not x.get("default", False), x["value"])
                )
                embedding_models.sort(key=lambda x: x["value"])
                return {
                    "language_models": language_models,
                    "embedding_models": embedding_models
                    if embedding_models
                    else [
                        {
                            "value": "nomic-embed-text",
                            "label": "nomic-embed-text",
                            "default": True,
                        }
                    ],
                }
            else:
                logger.warning(f"Failed to fetch Ollama models: {response.status_code}")
                return self._get_default_ollama_models()
        except Exception as e:
            logger.error(f"Error fetching Ollama models: {str(e)}")
            return self._get_default_ollama_models()
    async def get_ibm_models(
        self, endpoint: str = None
    ) -> Dict[str, List[Dict[str, str]]]:
        """Fetch available models from IBM Watson API"""
        try:
            # Use provided endpoint or default
            watson_endpoint = endpoint or os.getenv("IBM_WATSON_ENDPOINT", "https://us-south.ml.cloud.ibm.com")
            # Fetch foundation models using the correct endpoint
            models_url = f"{watson_endpoint}/ml/v1/foundation_model_specs"
            language_models = []
            embedding_models = []
            async with httpx.AsyncClient() as client:
                # Fetch text chat models
                text_params = {
                    "version": "2024-09-16",
                    "filters": "function_text_chat,!lifecycle_withdrawn"
                }
                text_response = await client.get(models_url, params=text_params, timeout=10.0)
                if text_response.status_code == 200:
                    text_data = text_response.json()
                    text_models = text_data.get("resources", [])
                    for i, model in enumerate(text_models):
                        model_id = model.get("model_id", "")
                        model_name = model.get("name", model_id)
                        language_models.append({
                            "value": model_id,
                            "label": model_name or model_id,
                            "default": i == 0  # First model is default
                        })
                # Fetch embedding models
                embed_params = {
                    "version": "2024-09-16",
                    "filters": "function_embedding,!lifecycle_withdrawn"
                }
                embed_response = await client.get(models_url, params=embed_params, timeout=10.0)
                if embed_response.status_code == 200:
                    embed_data = embed_response.json()
                    embed_models = embed_data.get("resources", [])
                    for i, model in enumerate(embed_models):
                        model_id = model.get("model_id", "")
                        model_name = model.get("name", model_id)
                        embedding_models.append({
                            "value": model_id,
                            "label": model_name or model_id,
                            "default": i == 0  # First model is default
                        })
            return {
                "language_models": language_models if language_models else self._get_default_ibm_models()["language_models"],
                "embedding_models": embedding_models if embedding_models else self._get_default_ibm_models()["embedding_models"]
            }
        except Exception as e:
            logger.error(f"Error fetching IBM models: {str(e)}")
            return self._get_default_ibm_models()
    def _get_default_openai_models(self) -> Dict[str, List[Dict[str, str]]]:
        """Default OpenAI models when API is not available"""
        return {
            "language_models": [
                {"value": "gpt-4o-mini", "label": "gpt-4o-mini", "default": True},
                {"value": "gpt-4o", "label": "gpt-4o", "default": False},
                {"value": "gpt-4-turbo", "label": "gpt-4-turbo", "default": False},
                {"value": "gpt-3.5-turbo", "label": "gpt-3.5-turbo", "default": False},
            ],
            "embedding_models": [
                {
                    "value": "text-embedding-3-small",
                    "label": "text-embedding-3-small",
                    "default": True,
                },
                {
                    "value": "text-embedding-3-large",
                    "label": "text-embedding-3-large",
                    "default": False,
                },
                {
                    "value": "text-embedding-ada-002",
                    "label": "text-embedding-ada-002",
                    "default": False,
                },
            ],
        }
    def _get_default_ollama_models(self) -> Dict[str, List[Dict[str, str]]]:
        """Default Ollama models when API is not available"""
        return {
            "language_models": [
                {"value": "llama3.2", "label": "llama3.2", "default": True},
                {"value": "llama3.1", "label": "llama3.1", "default": False},
                {"value": "llama3", "label": "llama3", "default": False},
                {"value": "mistral", "label": "mistral", "default": False},
                {"value": "codellama", "label": "codellama", "default": False},
            ],
            "embedding_models": [
                {
                    "value": "nomic-embed-text",
                    "label": "nomic-embed-text",
                    "default": True,
                },
                {"value": "all-minilm", "label": "all-minilm", "default": False},
            ],
        }
    def _get_default_ibm_models(self) -> Dict[str, List[Dict[str, str]]]:
        """Default IBM Watson models when API is not available"""
        return {
            "language_models": [
                {
                    "value": "meta-llama/llama-3-1-70b-instruct",
                    "label": "Llama 3.1 70B Instruct",
                    "default": True,
                },
                {
                    "value": "meta-llama/llama-3-1-8b-instruct",
                    "label": "Llama 3.1 8B Instruct",
                    "default": False,
                },
                {
                    "value": "ibm/granite-13b-chat-v2",
                    "label": "Granite 13B Chat v2",
                    "default": False,
                },
                {
                    "value": "ibm/granite-13b-instruct-v2",
                    "label": "Granite 13B Instruct v2",
                    "default": False,
                },
            ],
            "embedding_models": [
                {
                    "value": "ibm/slate-125m-english-rtrvr",
                    "label": "Slate 125M English Retriever",
                    "default": True,
                },
                {
                    "value": "sentence-transformers/all-minilm-l12-v2",
                    "label": "All-MiniLM L12 v2",
                    "default": False,
                },
            ],
        }