Merge branch 'main' of https://github.com/langflow-ai/openrag into delete-knowledge

2025-09-18 14:09:51 -06:00 · 2025-09-18 14:09:51 -06:00 · 9b5a7be8b0
commit 9b5a7be8b0
parent f65ecf0e68 028ea1506a
29 changed files with 1616 additions and 1305 deletions
--- a/README.md
+++ b/README.md
@ -62,8 +62,7 @@ LANGFLOW_CHAT_FLOW_ID=your_chat_flow_id
 LANGFLOW_INGEST_FLOW_ID=your_ingest_flow_id
 NUDGES_FLOW_ID=your_nudges_flow_id
 ```
-ee extended configuration, including ingestion and optional variables: [docs/configuration.md](docs/
+See extended configuration, including ingestion and optional variables: [docs/configuration.md](docs/configuration.md)
 configuration.md)
 ### 3. Start OpenRAG
 ```bash
--- a/docker-compose-cpu.yml
+++ b/docker-compose-cpu.yml
@ -91,7 +91,7 @@ services:
  langflow:
    volumes:
      - ./flows:/app/flows:Z
-    image: phact/langflow:${LANGFLOW_VERSION:-responses}
+    image: phact/openrag-langflow:${LANGFLOW_VERSION:-latest}
    container_name: langflow
    ports:
      - "7860:7860"
--- a/docker-compose.yml
+++ b/docker-compose.yml
@ -91,7 +91,7 @@ services:
  langflow:
    volumes:
      - ./flows:/app/flows:Z
-    image: phact/langflow:${LANGFLOW_VERSION:-responses}
+    image: phact/openrag-langflow:${LANGFLOW_VERSION:-latest}
    container_name: langflow
    ports:
      - "7860:7860"
--- a/frontend/components/knowledge-actions-dropdown.tsx
+++ b/frontend/components/knowledge-actions-dropdown.tsx
@ -1,6 +1,5 @@
 "use client";
 import { EllipsisVertical } from "lucide-react";
 import { useState } from "react";
 import {
  DropdownMenu,
@ -8,6 +7,7 @@ import {
  DropdownMenuItem,
  DropdownMenuTrigger,
 } from "@/components/ui/dropdown-menu";
 import { EllipsisVertical } from "lucide-react";
 import { Button } from "./ui/button";
 import { DeleteConfirmationDialog } from "./confirmation-dialog";
 import { useDeleteDocument } from "@/app/api/mutations/useDeleteDocument";
--- a/frontend/components/markdown-renderer.tsx
+++ b/frontend/components/markdown-renderer.tsx
@ -62,7 +62,7 @@ export const MarkdownRenderer = ({ chatMessage }: MarkdownRendererProps) => {
      <Markdown
        remarkPlugins={[remarkGfm]}
        rehypePlugins={[rehypeMathjax, rehypeRaw]}
-        linkTarget="_blank"
+        urlTransform={(url) => url}
        components={{
          p({ node, ...props }) {
            return <p className="w-fit max-w-full">{props.children}</p>;
@ -79,7 +79,7 @@ export const MarkdownRenderer = ({ chatMessage }: MarkdownRendererProps) => {
          h3({ node, ...props }) {
            return <h3 className="mb-2 mt-4">{props.children}</h3>;
          },
-          hr({ node, ...props }) {
+          hr() {
            return <hr className="w-full mt-4 mb-8" />;
          },
          ul({ node, ...props }) {
@ -97,8 +97,12 @@ export const MarkdownRenderer = ({ chatMessage }: MarkdownRendererProps) => {
              </div>
            );
          },
          a({ node, ...props }) {
            return <a {...props} target="_blank" rel="noopener noreferrer">{props.children}</a>;
          },
-          code: ({ node, className, inline, children, ...props }) => {
+          code(props) {
            const { children, className, ...rest } = props;
            let content = children as string;
            if (
              Array.isArray(children) &&
@ -120,14 +124,15 @@ export const MarkdownRenderer = ({ chatMessage }: MarkdownRendererProps) => {
              }
              const match = /language-(\w+)/.exec(className || "");
              const isInline = !className?.startsWith("language-");
-              return !inline ? (
+              return !isInline ? (
                <CodeComponent
                  language={(match && match[1]) || ""}
                  code={String(content).replace(/\n$/, "")}
                />
              ) : (
-                <code className={className} {...props}>
+                <code className={className} {...rest}>
                  {content}
                </code>
              );
--- a/frontend/package-lock.json
+++ b/frontend/package-lock.json
--- a/frontend/package.json
+++ b/frontend/package.json
@ -38,11 +38,11 @@
    "react": "^19.0.0",
    "react-dom": "^19.0.0",
    "react-icons": "^5.5.0",
-    "react-markdown": "^8.0.7",
+    "react-markdown": "^10.1.0",
    "react-syntax-highlighter": "^15.6.1",
-    "rehype-mathjax": "^4.0.3",
+    "rehype-mathjax": "^7.1.0",
-    "rehype-raw": "^6.1.1",
+    "rehype-raw": "^7.0.0",
-    "remark-gfm": "3.0.1",
+    "remark-gfm": "^4.0.1",
    "sonner": "^2.0.6",
    "tailwind-merge": "^3.3.1",
    "tailwindcss-animate": "^1.0.7",
@ -53,6 +53,7 @@
    "@types/node": "^20",
    "@types/react": "^19",
    "@types/react-dom": "^19",
    "@types/react-syntax-highlighter": "^15.5.13",
    "autoprefixer": "^10.4.21",
    "eslint": "^9",
    "eslint-config-next": "15.3.5",
--- a/pyproject.toml
+++ b/pyproject.toml
@ -1,6 +1,6 @@
 [project]
 name = "openrag"
-version = "0.1.4"
+version = "0.1.8"
 description = "Add your description here"
 readme = "README.md"
 requires-python = ">=3.13"
@ -37,6 +37,7 @@ openrag = "tui.main:run_tui"
 [tool.uv]
 package = true
 [tool.uv.sources]
 torch = [
  { index = "pytorch-cu128", marker = "sys_platform == 'linux' and platform_machine == 'x86_64'" },
--- a/src/api/chat.py
+++ b/src/api/chat.py
@ -18,8 +18,7 @@ async def chat_endpoint(request: Request, chat_service, session_manager):
    user = request.state.user
    user_id = user.user_id
-    # Get JWT token from auth middleware
+    jwt_token = session_manager.get_effective_jwt_token(user_id, request.state.jwt_token)
    jwt_token = request.state.jwt_token
    if not prompt:
        return JSONResponse({"error": "Prompt is required"}, status_code=400)
@ -76,8 +75,7 @@ async def langflow_endpoint(request: Request, chat_service, session_manager):
    user = request.state.user
    user_id = user.user_id
-    # Get JWT token from auth middleware
+    jwt_token = session_manager.get_effective_jwt_token(user_id, request.state.jwt_token)
    jwt_token = request.state.jwt_token
    if not prompt:
        return JSONResponse({"error": "Prompt is required"}, status_code=400)
--- a/src/api/connectors.py
+++ b/src/api/connectors.py
@ -13,8 +13,8 @@ async def list_connectors(request: Request, connector_service, session_manager):
        )
        return JSONResponse({"connectors": connector_types})
    except Exception as e:
-        logger.error("Error listing connectors", error=str(e))
+        logger.info("Error listing connectors", error=str(e))
-        return JSONResponse({"error": str(e)}, status_code=500)
+        return JSONResponse({"connectors": []})
 async def connector_sync(request: Request, connector_service, session_manager):
@ -31,7 +31,7 @@ async def connector_sync(request: Request, connector_service, session_manager):
            max_files=max_files,
        )
        user = request.state.user
-        jwt_token = request.state.jwt_token
+        jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
        # Get all active connections for this connector type and user
        connections = await connector_service.connection_manager.list_connections(
--- a/src/api/knowledge_filter.py
+++ b/src/api/knowledge_filter.py
@ -26,7 +26,7 @@ async def create_knowledge_filter(
        return JSONResponse({"error": "Query data is required"}, status_code=400)
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    # Create knowledge filter document
    filter_id = str(uuid.uuid4())
@ -70,7 +70,7 @@ async def search_knowledge_filters(
    limit = payload.get("limit", 20)
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    result = await knowledge_filter_service.search_knowledge_filters(
        query, user_id=user.user_id, jwt_token=jwt_token, limit=limit
@ -101,7 +101,7 @@ async def get_knowledge_filter(
        )
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    result = await knowledge_filter_service.get_knowledge_filter(
        filter_id, user_id=user.user_id, jwt_token=jwt_token
@ -136,7 +136,7 @@ async def update_knowledge_filter(
    payload = await request.json()
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    # First, get the existing knowledge filter
    existing_result = await knowledge_filter_service.get_knowledge_filter(
@ -205,7 +205,7 @@ async def delete_knowledge_filter(
        )
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    result = await knowledge_filter_service.delete_knowledge_filter(
        filter_id, user_id=user.user_id, jwt_token=jwt_token
@ -239,7 +239,7 @@ async def subscribe_to_knowledge_filter(
    payload = await request.json()
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    # Get the knowledge filter to validate it exists and get its details
    filter_result = await knowledge_filter_service.get_knowledge_filter(
@ -309,7 +309,7 @@ async def list_knowledge_filter_subscriptions(
        )
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    result = await knowledge_filter_service.get_filter_subscriptions(
        filter_id, user_id=user.user_id, jwt_token=jwt_token
@ -341,7 +341,7 @@ async def cancel_knowledge_filter_subscription(
        )
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    # Get subscription details to find the monitor ID
    subscriptions_result = await knowledge_filter_service.get_filter_subscriptions(
--- a/src/api/nudges.py
+++ b/src/api/nudges.py
@ -9,7 +9,7 @@ async def nudges_from_kb_endpoint(request: Request, chat_service, session_manage
    """Get nudges for a user"""
    user = request.state.user
    user_id = user.user_id
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user_id, request.state.jwt_token)
    try:
        result = await chat_service.langflow_nudges_chat(
@ -28,7 +28,8 @@ async def nudges_from_chat_id_endpoint(request: Request, chat_service, session_m
    user = request.state.user
    user_id = user.user_id
    chat_id = request.path_params["chat_id"]
-    jwt_token = request.state.jwt_token
+
    jwt_token = session_manager.get_effective_jwt_token(user_id, request.state.jwt_token)
    try:
        result = await chat_service.langflow_nudges_chat(
--- a/src/api/search.py
+++ b/src/api/search.py
@ -20,8 +20,7 @@ async def search(request: Request, search_service, session_manager):
        )  # Optional score threshold, defaults to 0
        user = request.state.user
-        # Extract JWT token from auth middleware
+        jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
        jwt_token = request.state.jwt_token
        logger.debug(
            "Search API request",
--- a/src/api/upload.py
+++ b/src/api/upload.py
@ -11,7 +11,7 @@ async def upload(request: Request, document_service, session_manager):
        form = await request.form()
        upload_file = form["file"]
        user = request.state.user
-        jwt_token = request.state.jwt_token
+        jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
        from config.settings import is_no_auth_mode
@ -60,7 +60,7 @@ async def upload_path(request: Request, task_service, session_manager):
        return JSONResponse({"error": "No files found in directory"}, status_code=400)
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    from config.settings import is_no_auth_mode
@ -100,8 +100,7 @@ async def upload_context(
    previous_response_id = form.get("previous_response_id")
    endpoint = form.get("endpoint", "langflow")
-    # Get JWT token from auth middleware
+    jwt_token = session_manager.get_effective_jwt_token(user_id, request.state.jwt_token)
    jwt_token = request.state.jwt_token
    # Get user info from request state (set by auth middleware)
    user = request.state.user
@ -169,7 +168,7 @@ async def upload_bucket(request: Request, task_service, session_manager):
        return JSONResponse({"error": "No files found in bucket"}, status_code=400)
    user = request.state.user
-    jwt_token = request.state.jwt_token
+    jwt_token = session_manager.get_effective_jwt_token(user.user_id, request.state.jwt_token)
    from models.processors import S3FileProcessor
    from config.settings import is_no_auth_mode
--- a/src/connectors/connection_manager.py
+++ b/src/connectors/connection_manager.py
@ -321,7 +321,7 @@ class ConnectionManager:
        return None
-    def get_available_connector_types(self) -> Dict[str, Dict[str, str]]:
+    def get_available_connector_types(self) -> Dict[str, Dict[str, Any]]:
        """Get available connector types with their metadata"""
        return {
            "google_drive": {
--- a/src/main.py
+++ b/src/main.py
@ -58,6 +58,7 @@ from config.settings import (
    is_no_auth_mode,
 )
 from services.auth_service import AuthService
 from services.langflow_mcp_service import LangflowMCPService
 from services.chat_service import ChatService
 # Services
@ -438,7 +439,11 @@ async def initialize_services():
    )
    # Initialize auth service
-    auth_service = AuthService(session_manager, connector_service)
+    auth_service = AuthService(
        session_manager,
        connector_service,
        langflow_mcp_service=LangflowMCPService(),
    )
    # Load persisted connector connections at startup so webhooks and syncs
    # can resolve existing subscriptions immediately after server boot
--- a/src/services/auth_service.py
+++ b/src/services/auth_service.py
@ -5,9 +5,11 @@ import httpx
 import aiofiles
 from datetime import datetime, timedelta
 from typing import Optional
 import asyncio
 from config.settings import WEBHOOK_BASE_URL, is_no_auth_mode
 from session_manager import SessionManager
 from services.langflow_mcp_service import LangflowMCPService
 from connectors.google_drive.oauth import GoogleDriveOAuth
 from connectors.onedrive.oauth import OneDriveOAuth
 from connectors.sharepoint.oauth import SharePointOAuth
@ -17,10 +19,12 @@ from connectors.sharepoint import SharePointConnector
 class AuthService:
-    def __init__(self, session_manager: SessionManager, connector_service=None):
+    def __init__(self, session_manager: SessionManager, connector_service=None, langflow_mcp_service: LangflowMCPService | None = None):
        self.session_manager = session_manager
        self.connector_service = connector_service
        self.used_auth_codes = set()  # Track used authorization codes
        self.langflow_mcp_service = langflow_mcp_service
        self._background_tasks = set()
    async def init_oauth(
        self,
@ -287,6 +291,20 @@ class AuthService:
            user_info = await self.session_manager.get_user_info_from_token(
                token_data["access_token"]
            )
            # Best-effort: update Langflow MCP servers to include user's JWT header
            try:
                if self.langflow_mcp_service and isinstance(jwt_token, str) and jwt_token.strip():
                    # Run in background to avoid delaying login flow
                    task = asyncio.create_task(
                        self.langflow_mcp_service.update_mcp_servers_with_jwt(jwt_token)
                    )
                    # Keep reference until done to avoid premature GC
                    self._background_tasks.add(task)
                    task.add_done_callback(self._background_tasks.discard)
            except Exception:
                # Do not block login on MCP update issues
                pass
            response_data = {
                "status": "authenticated",
--- a/src/services/langflow_mcp_service.py
+++ b/src/services/langflow_mcp_service.py
@ -0,0 +1,147 @@
 from typing import List, Dict, Any
 from config.settings import clients
 from utils.logging_config import get_logger
 logger = get_logger(__name__)
 class LangflowMCPService:
    async def list_mcp_servers(self) -> List[Dict[str, Any]]:
        """Fetch list of MCP servers from Langflow (v2 API)."""
        try:
            response = await clients.langflow_request(
                method="GET",
                endpoint="/api/v2/mcp/servers",
                params={"action_count": "false"},
            )
            response.raise_for_status()
            data = response.json()
            if isinstance(data, list):
                return data
            logger.warning("Unexpected response format for MCP servers list", data_type=type(data).__name__)
            return []
        except Exception as e:
            logger.error("Failed to list MCP servers", error=str(e))
            return []
    async def get_mcp_server(self, server_name: str) -> Dict[str, Any]:
        """Get MCP server configuration by name."""
        response = await clients.langflow_request(
            method="GET",
            endpoint=f"/api/v2/mcp/servers/{server_name}",
        )
        response.raise_for_status()
        return response.json()
    def _upsert_jwt_header_in_args(self, args: List[str], jwt_token: str) -> List[str]:
        """Ensure args contains a header triplet for X-Langflow-Global-Var-JWT with the provided JWT.
        Args are expected in the pattern: [..., "--headers", key, value, ...].
        If the header exists, update its value; otherwise append the triplet at the end.
        """
        if not isinstance(args, list):
            return [
                "mcp-proxy",
                "--headers",
                "X-Langflow-Global-Var-JWT",
                jwt_token,
            ]
        updated_args = list(args)
        i = 0
        found_index = -1
        while i < len(updated_args):
            token = updated_args[i]
            if token == "--headers" and i + 2 < len(updated_args):
                header_key = updated_args[i + 1]
                if isinstance(header_key, str) and header_key.lower() == "x-langflow-global-var-jwt".lower():
                    found_index = i
                    break
                i += 3
                continue
            i += 1
        if found_index >= 0:
            # Replace existing value at found_index + 2
            if found_index + 2 < len(updated_args):
                updated_args[found_index + 2] = jwt_token
            else:
                # Malformed existing header triplet; make sure to append a value
                updated_args.append(jwt_token)
        else:
            updated_args.extend([
                "--headers",
                "X-Langflow-Global-Var-JWT",
                jwt_token,
            ])
        return updated_args
    async def patch_mcp_server_args_with_jwt(self, server_name: str, jwt_token: str) -> bool:
        """Patch a single MCP server to include/update the JWT header in args."""
        try:
            current = await self.get_mcp_server(server_name)
            command = current.get("command")
            args = current.get("args", [])
            updated_args = self._upsert_jwt_header_in_args(args, jwt_token)
            payload = {"command": command, "args": updated_args}
            response = await clients.langflow_request(
                method="PATCH",
                endpoint=f"/api/v2/mcp/servers/{server_name}",
                json=payload,
            )
            if response.status_code in (200, 201):
                logger.info(
                    "Patched MCP server with JWT header",
                    server_name=server_name,
                    args_len=len(updated_args),
                )
                return True
            else:
                logger.warning(
                    "Failed to patch MCP server",
                    server_name=server_name,
                    status_code=response.status_code,
                    body=response.text,
                )
                return False
        except Exception as e:
            logger.error(
                "Exception while patching MCP server",
                server_name=server_name,
                error=str(e),
            )
            return False
    async def update_mcp_servers_with_jwt(self, jwt_token: str) -> Dict[str, Any]:
        """Fetch all MCP servers and ensure each includes the JWT header in args.
        Returns a summary dict with counts.
        """
        servers = await self.list_mcp_servers()
        if not servers:
            return {"updated": 0, "failed": 0, "total": 0}
        updated = 0
        failed = 0
        for server in servers:
            name = server.get("name") or server.get("server") or server.get("id")
            if not name:
                continue
            ok = await self.patch_mcp_server_args_with_jwt(name, jwt_token)
            if ok:
                updated += 1
            else:
                failed += 1
        summary = {"updated": updated, "failed": failed, "total": len(servers)}
        if failed == 0:
            logger.info("MCP servers updated with JWT header", **summary)
        else:
            logger.warning("MCP servers update had failures", **summary)
        return summary
--- a/src/services/task_service.py
+++ b/src/services/task_service.py
@ -85,6 +85,8 @@ class TaskService:
    async def create_custom_task(self, user_id: str, items: list, processor) -> str:
        """Create a new task with custom processor for any type of items"""
        # Store anonymous tasks under a stable key so they can be retrieved later
        store_user_id = user_id or AnonymousUser().user_id
        task_id = str(uuid.uuid4())
        upload_task = UploadTask(
            task_id=task_id,
@ -95,12 +97,14 @@ class TaskService:
        # Attach the custom processor to the task
        upload_task.processor = processor
-        if user_id not in self.task_store:
+        if store_user_id not in self.task_store:
-            self.task_store[user_id] = {}
+            self.task_store[store_user_id] = {}
-        self.task_store[user_id][task_id] = upload_task
+        self.task_store[store_user_id][task_id] = upload_task
        # Start background processing
-        background_task = asyncio.create_task(self.background_custom_processor(user_id, task_id, items))
+        background_task = asyncio.create_task(
            self.background_custom_processor(store_user_id, task_id, items)
        )
        self.background_tasks.add(background_task)
        background_task.add_done_callback(self.background_tasks.discard)
--- a/src/session_manager.py
+++ b/src/session_manager.py
@ -191,26 +191,8 @@ class SessionManager:
    def get_user_opensearch_client(self, user_id: str, jwt_token: str):
        """Get or create OpenSearch client for user with their JWT"""
-        from config.settings import is_no_auth_mode
+        # Get the effective JWT token (handles anonymous JWT creation)
-
+        jwt_token = self.get_effective_jwt_token(user_id, jwt_token)
        logger.debug(
            "get_user_opensearch_client",
            user_id=user_id,
            jwt_token_present=(jwt_token is not None),
            no_auth_mode=is_no_auth_mode(),
        )
        # In no-auth mode, create anonymous JWT for OpenSearch DLS
        if jwt_token is None and (is_no_auth_mode() or user_id in (None, AnonymousUser().user_id)):
            if not hasattr(self, "_anonymous_jwt"):
                # Create anonymous JWT token for OpenSearch OIDC
                logger.debug("Creating anonymous JWT")
                self._anonymous_jwt = self._create_anonymous_jwt()
                logger.debug(
                    "Anonymous JWT created", jwt_prefix=self._anonymous_jwt[:50]
                )
            jwt_token = self._anonymous_jwt
            logger.debug("Using anonymous JWT for OpenSearch")
        # Check if we have a cached client for this user
        if user_id not in self.user_opensearch_clients:
@ -222,6 +204,31 @@ class SessionManager:
        return self.user_opensearch_clients[user_id]
    def get_effective_jwt_token(self, user_id: str, jwt_token: str) -> str:
        """Get the effective JWT token, creating anonymous JWT if needed in no-auth mode"""
        from config.settings import is_no_auth_mode
        logger.debug(
            "get_effective_jwt_token",
            user_id=user_id,
            jwt_token_present=(jwt_token is not None),
            no_auth_mode=is_no_auth_mode(),
        )
        # In no-auth mode, create anonymous JWT if needed
        if jwt_token is None and (is_no_auth_mode() or user_id in (None, AnonymousUser().user_id)):
            if not hasattr(self, "_anonymous_jwt"):
                # Create anonymous JWT token for OpenSearch OIDC
                logger.debug("Creating anonymous JWT")
                self._anonymous_jwt = self._create_anonymous_jwt()
                logger.debug(
                    "Anonymous JWT created", jwt_prefix=self._anonymous_jwt[:50]
                )
            jwt_token = self._anonymous_jwt
            logger.debug("Using anonymous JWT")
        return jwt_token
    def _create_anonymous_jwt(self) -> str:
        """Create JWT token for anonymous user in no-auth mode"""
        anonymous_user = AnonymousUser()
--- a/src/tui/_assets/docker-compose-cpu.yml
+++ b/src/tui/_assets/docker-compose-cpu.yml
@ -0,0 +1,111 @@
 services:
  opensearch:
    image: phact/openrag-opensearch:${OPENRAG_VERSION:-latest}
    #build:
    #  context: .
    #  dockerfile: Dockerfile
    container_name: os
    depends_on:
      - openrag-backend
    environment:
      - discovery.type=single-node
      - OPENSEARCH_INITIAL_ADMIN_PASSWORD=${OPENSEARCH_PASSWORD}
    # Run security setup in background after OpenSearch starts
    command: >
      bash -c "
        # Start OpenSearch in background
        /usr/share/opensearch/opensearch-docker-entrypoint.sh opensearch &
        # Wait a bit for OpenSearch to start, then apply security config
        sleep 10 && /usr/share/opensearch/setup-security.sh &
        # Wait for background processes
        wait
      "
    ports:
      - "9200:9200"
      - "9600:9600"
  dashboards:
    image: opensearchproject/opensearch-dashboards:3.0.0
    container_name: osdash
    depends_on:
      - opensearch
    environment:
      OPENSEARCH_HOSTS: '["https://opensearch:9200"]'
      OPENSEARCH_USERNAME: "admin"
      OPENSEARCH_PASSWORD: ${OPENSEARCH_PASSWORD}
    ports:
      - "5601:5601"
  openrag-backend:
    image: phact/openrag-backend:${OPENRAG_VERSION:-latest}
    #build:
    #context: .
    #dockerfile: Dockerfile.backend
    container_name: openrag-backend
    depends_on:
      - langflow
    environment:
      - OPENSEARCH_HOST=opensearch
      - LANGFLOW_URL=http://langflow:7860
      - LANGFLOW_PUBLIC_URL=${LANGFLOW_PUBLIC_URL}
      - LANGFLOW_SECRET_KEY=${LANGFLOW_SECRET_KEY}
      - LANGFLOW_SUPERUSER=${LANGFLOW_SUPERUSER}
      - LANGFLOW_SUPERUSER_PASSWORD=${LANGFLOW_SUPERUSER_PASSWORD}
      - LANGFLOW_CHAT_FLOW_ID=${LANGFLOW_CHAT_FLOW_ID}
      - LANGFLOW_INGEST_FLOW_ID=${LANGFLOW_INGEST_FLOW_ID}
      - DISABLE_INGEST_WITH_LANGFLOW=${DISABLE_INGEST_WITH_LANGFLOW:-false}
      - NUDGES_FLOW_ID=${NUDGES_FLOW_ID}
      - OPENSEARCH_PORT=9200
      - OPENSEARCH_USERNAME=admin
      - OPENSEARCH_PASSWORD=${OPENSEARCH_PASSWORD}
      - OPENAI_API_KEY=${OPENAI_API_KEY}
      - NVIDIA_DRIVER_CAPABILITIES=compute,utility
      - NVIDIA_VISIBLE_DEVICES=all
      - GOOGLE_OAUTH_CLIENT_ID=${GOOGLE_OAUTH_CLIENT_ID}
      - GOOGLE_OAUTH_CLIENT_SECRET=${GOOGLE_OAUTH_CLIENT_SECRET}
      - MICROSOFT_GRAPH_OAUTH_CLIENT_ID=${MICROSOFT_GRAPH_OAUTH_CLIENT_ID}
      - MICROSOFT_GRAPH_OAUTH_CLIENT_SECRET=${MICROSOFT_GRAPH_OAUTH_CLIENT_SECRET}
      - WEBHOOK_BASE_URL=${WEBHOOK_BASE_URL}
      - AWS_ACCESS_KEY_ID=${AWS_ACCESS_KEY_ID}
      - AWS_SECRET_ACCESS_KEY=${AWS_SECRET_ACCESS_KEY}
    volumes:
      - ./documents:/app/documents:Z
      - ./keys:/app/keys:Z
      - ./flows:/app/flows:Z
  openrag-frontend:
    image: phact/openrag-frontend:${OPENRAG_VERSION:-latest}
    #build:
    #context: .
    #dockerfile: Dockerfile.frontend
    container_name: openrag-frontend
    depends_on:
      - openrag-backend
    environment:
      - OPENRAG_BACKEND_HOST=openrag-backend
    ports:
      - "3000:3000"
  langflow:
    volumes:
      - ./flows:/app/flows:Z
    image: phact/openrag-langflow:${LANGFLOW_VERSION:-latest}
    container_name: langflow
    ports:
      - "7860:7860"
    environment:
      - OPENAI_API_KEY=${OPENAI_API_KEY}
      - LANGFLOW_LOAD_FLOWS_PATH=/app/flows
      - LANGFLOW_SECRET_KEY=${LANGFLOW_SECRET_KEY}
      - JWT="dummy"
      - OPENRAG-QUERY-FILTER="{}"
      - OPENSEARCH_PASSWORD=${OPENSEARCH_PASSWORD}
      - LANGFLOW_VARIABLES_TO_GET_FROM_ENVIRONMENT=JWT,OPENRAG-QUERY-FILTER,OPENSEARCH_PASSWORD
      - LANGFLOW_LOG_LEVEL=DEBUG
      - LANGFLOW_AUTO_LOGIN=${LANGFLOW_AUTO_LOGIN}
      - LANGFLOW_SUPERUSER=${LANGFLOW_SUPERUSER}
      - LANGFLOW_SUPERUSER_PASSWORD=${LANGFLOW_SUPERUSER_PASSWORD}
      - LANGFLOW_NEW_USER_IS_ACTIVE=${LANGFLOW_NEW_USER_IS_ACTIVE}
      - LANGFLOW_ENABLE_SUPERUSER_CLI=${LANGFLOW_ENABLE_SUPERUSER_CLI}
--- a/src/tui/_assets/docker-compose.yml
+++ b/src/tui/_assets/docker-compose.yml
@ -0,0 +1,111 @@
 services:
  opensearch:
    image: phact/openrag-opensearch:${OPENRAG_VERSION:-latest}
    #build:
    #context: .
    #dockerfile: Dockerfile
    container_name: os
    depends_on:
      - openrag-backend
    environment:
      - discovery.type=single-node
      - OPENSEARCH_INITIAL_ADMIN_PASSWORD=${OPENSEARCH_PASSWORD}
    # Run security setup in background after OpenSearch starts
    command: >
      bash -c "
        # Start OpenSearch in background
        /usr/share/opensearch/opensearch-docker-entrypoint.sh opensearch &
        # Wait a bit for OpenSearch to start, then apply security config
        sleep 10 && /usr/share/opensearch/setup-security.sh &
        # Wait for background processes
        wait
      "
    ports:
      - "9200:9200"
      - "9600:9600"
  dashboards:
    image: opensearchproject/opensearch-dashboards:3.0.0
    container_name: osdash
    depends_on:
      - opensearch
    environment:
      OPENSEARCH_HOSTS: '["https://opensearch:9200"]'
      OPENSEARCH_USERNAME: "admin"
      OPENSEARCH_PASSWORD: ${OPENSEARCH_PASSWORD}
    ports:
      - "5601:5601"
  openrag-backend:
    image: phact/openrag-backend:${OPENRAG_VERSION:-latest}
    #build:
    #context: .
    #dockerfile: Dockerfile.backend
    container_name: openrag-backend
    depends_on:
      - langflow
    environment:
      - OPENSEARCH_HOST=opensearch
      - LANGFLOW_URL=http://langflow:7860
      - LANGFLOW_PUBLIC_URL=${LANGFLOW_PUBLIC_URL}
      - LANGFLOW_SUPERUSER=${LANGFLOW_SUPERUSER}
      - LANGFLOW_SUPERUSER_PASSWORD=${LANGFLOW_SUPERUSER_PASSWORD}
      - LANGFLOW_CHAT_FLOW_ID=${LANGFLOW_CHAT_FLOW_ID}
      - LANGFLOW_INGEST_FLOW_ID=${LANGFLOW_INGEST_FLOW_ID}
      - DISABLE_INGEST_WITH_LANGFLOW=${DISABLE_INGEST_WITH_LANGFLOW:-false}
      - NUDGES_FLOW_ID=${NUDGES_FLOW_ID}
      - OPENSEARCH_PORT=9200
      - OPENSEARCH_USERNAME=admin
      - OPENSEARCH_PASSWORD=${OPENSEARCH_PASSWORD}
      - OPENAI_API_KEY=${OPENAI_API_KEY}
      - NVIDIA_DRIVER_CAPABILITIES=compute,utility
      - NVIDIA_VISIBLE_DEVICES=all
      - GOOGLE_OAUTH_CLIENT_ID=${GOOGLE_OAUTH_CLIENT_ID}
      - GOOGLE_OAUTH_CLIENT_SECRET=${GOOGLE_OAUTH_CLIENT_SECRET}
      - MICROSOFT_GRAPH_OAUTH_CLIENT_ID=${MICROSOFT_GRAPH_OAUTH_CLIENT_ID}
      - MICROSOFT_GRAPH_OAUTH_CLIENT_SECRET=${MICROSOFT_GRAPH_OAUTH_CLIENT_SECRET}
      - WEBHOOK_BASE_URL=${WEBHOOK_BASE_URL}
      - AWS_ACCESS_KEY_ID=${AWS_ACCESS_KEY_ID}
      - AWS_SECRET_ACCESS_KEY=${AWS_SECRET_ACCESS_KEY}
    volumes:
      - ./documents:/app/documents:Z
      - ./keys:/app/keys:Z
      - ./flows:/app/flows:Z
    gpus: all
  openrag-frontend:
    image: phact/openrag-frontend:${OPENRAG_VERSION:-latest}
    #build:
    #context: .
    #dockerfile: Dockerfile.frontend
    container_name: openrag-frontend
    depends_on:
      - openrag-backend
    environment:
      - OPENRAG_BACKEND_HOST=openrag-backend
    ports:
      - "3000:3000"
  langflow:
    volumes:
      - ./flows:/app/flows:Z
    image: phact/openrag-langflow:${LANGFLOW_VERSION:-latest}
    container_name: langflow
    ports:
      - "7860:7860"
    environment:
      - OPENAI_API_KEY=${OPENAI_API_KEY}
      - LANGFLOW_LOAD_FLOWS_PATH=/app/flows
      - LANGFLOW_SECRET_KEY=${LANGFLOW_SECRET_KEY}
      - JWT="dummy"
      - OPENRAG-QUERY-FILTER="{}"
      - OPENSEARCH_PASSWORD=${OPENSEARCH_PASSWORD}
      - LANGFLOW_VARIABLES_TO_GET_FROM_ENVIRONMENT=JWT,OPENRAG-QUERY-FILTER,OPENSEARCH_PASSWORD
      - LANGFLOW_LOG_LEVEL=DEBUG
      - LANGFLOW_AUTO_LOGIN=${LANGFLOW_AUTO_LOGIN}
      - LANGFLOW_SUPERUSER=${LANGFLOW_SUPERUSER}
      - LANGFLOW_SUPERUSER_PASSWORD=${LANGFLOW_SUPERUSER_PASSWORD}
      - LANGFLOW_NEW_USER_IS_ACTIVE=${LANGFLOW_NEW_USER_IS_ACTIVE}
      - LANGFLOW_ENABLE_SUPERUSER_CLI=${LANGFLOW_ENABLE_SUPERUSER_CLI}
--- a/src/tui/_assets/documents/2506.08231v1.pdf
+++ b/src/tui/_assets/documents/2506.08231v1.pdf
--- a/src/tui/_assets/documents/ai-human-resources.pdf
+++ b/src/tui/_assets/documents/ai-human-resources.pdf
--- a/src/tui/_assets/documents/warmup_ocr.pdf
+++ b/src/tui/_assets/documents/warmup_ocr.pdf
--- a/src/tui/main.py
+++ b/src/tui/main.py
@ -4,6 +4,10 @@ import sys
 from pathlib import Path
 from textual.app import App, ComposeResult
 from utils.logging_config import get_logger
 try:
    from importlib.resources import files
 except ImportError:
    from importlib_resources import files
 logger = get_logger(__name__)
@ -301,10 +305,42 @@ class OpenRAGTUI(App):
        return True, "Runtime requirements satisfied"
 def copy_sample_documents():
    """Copy sample documents from package to current directory if they don't exist."""
    documents_dir = Path("documents")
    # Check if documents directory already exists and has files
    if documents_dir.exists() and any(documents_dir.glob("*.pdf")):
        return  # Documents already exist, don't overwrite
    try:
        # Get sample documents from package assets
        assets_files = files("tui._assets.documents")
        # Create documents directory if it doesn't exist
        documents_dir.mkdir(exist_ok=True)
        # Copy each sample document
        for resource in assets_files.iterdir():
            if resource.is_file() and resource.name.endswith('.pdf'):
                dest_path = documents_dir / resource.name
                if not dest_path.exists():
                    content = resource.read_bytes()
                    dest_path.write_bytes(content)
                    logger.info(f"Copied sample document: {resource.name}")
    except Exception as e:
        logger.debug(f"Could not copy sample documents: {e}")
        # This is not a critical error - the app can work without sample documents
 def run_tui():
    """Run the OpenRAG TUI application."""
    app = None
    try:
        # Copy sample documents on first run
        copy_sample_documents()
        app = OpenRAGTUI()
        app.run()
    except KeyboardInterrupt:
--- a/src/tui/managers/container_manager.py
+++ b/src/tui/managers/container_manager.py
@ -9,6 +9,10 @@ from enum import Enum
 from pathlib import Path
 from typing import Dict, List, Optional, AsyncIterator
 from utils.logging_config import get_logger
 try:
    from importlib.resources import files
 except ImportError:
    from importlib_resources import files
 logger = get_logger(__name__)
@ -51,8 +55,8 @@ class ContainerManager:
    def __init__(self, compose_file: Optional[Path] = None):
        self.platform_detector = PlatformDetector()
        self.runtime_info = self.platform_detector.detect_runtime()
-        self.compose_file = compose_file or Path("docker-compose.yml")
+        self.compose_file = compose_file or self._find_compose_file("docker-compose.yml")
-        self.cpu_compose_file = Path("docker-compose-cpu.yml")
+        self.cpu_compose_file = self._find_compose_file("docker-compose-cpu.yml")
        self.services_cache: Dict[str, ServiceInfo] = {}
        self.last_status_update = 0
        # Auto-select CPU compose if no GPU available
@ -80,6 +84,42 @@ class ContainerManager:
            "langflow": "langflow",
        }
    def _find_compose_file(self, filename: str) -> Path:
        """Find compose file in current directory or package resources."""
        # First check current working directory
        cwd_path = Path(filename)
        self._compose_search_log = f"Searching for {filename}:\n"
        self._compose_search_log += f"  1. Current directory: {cwd_path.absolute()}"
        if cwd_path.exists():
            self._compose_search_log += " ✓ FOUND"
            return cwd_path
        else:
            self._compose_search_log += " ✗ NOT FOUND"
        # Then check package resources
        self._compose_search_log += f"\n  2. Package resources: "
        try:
            pkg_files = files("tui._assets")
            self._compose_search_log += f"{pkg_files}"
            compose_resource = pkg_files / filename
            if compose_resource.is_file():
                self._compose_search_log += f" ✓ FOUND, copying to current directory"
                # Copy to cwd for compose command to work
                content = compose_resource.read_text()
                cwd_path.write_text(content)
                return cwd_path
            else:
                self._compose_search_log += f" ✗ NOT FOUND"
        except Exception as e:
            self._compose_search_log += f" ✗ SKIPPED ({e})"
            # Don't log this as an error since it's expected when running from source
        # Fall back to original path (will fail later if not found)
        self._compose_search_log += f"\n  3. Falling back to: {cwd_path.absolute()}"
        return Path(filename)
    def is_available(self) -> bool:
        """Check if container runtime is available."""
        return self.runtime_info.runtime_type != RuntimeType.NONE
@ -469,6 +509,20 @@ class ContainerManager:
            yield False, "No container runtime available"
            return
        # Diagnostic info about compose files
        compose_file = self.cpu_compose_file if (cpu_mode if cpu_mode is not None else self.use_cpu_compose) else self.compose_file
        # Show the search process for debugging
        if hasattr(self, '_compose_search_log'):
            for line in self._compose_search_log.split('\n'):
                if line.strip():
                    yield False, line
        yield False, f"Final compose file: {compose_file.absolute()}"
        if not compose_file.exists():
            yield False, f"ERROR: Compose file not found at {compose_file.absolute()}"
            return
        yield False, "Starting OpenRAG services..."
        missing_images: List[str] = []
--- a/src/tui/managers/env_manager.py
+++ b/src/tui/managers/env_manager.py
@ -79,6 +79,15 @@ class EnvManager:
        """Generate a secure secret key for Langflow."""
        return secrets.token_urlsafe(32)
    def _quote_env_value(self, value: str) -> str:
        """Single quote all environment variable values for consistency."""
        if not value:
            return "''"
        # Escape any existing single quotes by replacing ' with '\''
        escaped_value = value.replace("'", "'\\''")
        return f"'{escaped_value}'"
    def load_existing_env(self) -> bool:
        """Load existing .env file if it exists."""
        if not self.env_file.exists():
@ -237,36 +246,36 @@ class EnvManager:
                # Core settings
                f.write("# Core settings\n")
-                f.write(f"LANGFLOW_SECRET_KEY={self.config.langflow_secret_key}\n")
+                f.write(f"LANGFLOW_SECRET_KEY={self._quote_env_value(self.config.langflow_secret_key)}\n")
-                f.write(f"LANGFLOW_SUPERUSER={self.config.langflow_superuser}\n")
+                f.write(f"LANGFLOW_SUPERUSER={self._quote_env_value(self.config.langflow_superuser)}\n")
                f.write(
-                    f"LANGFLOW_SUPERUSER_PASSWORD={self.config.langflow_superuser_password}\n"
+                    f"LANGFLOW_SUPERUSER_PASSWORD={self._quote_env_value(self.config.langflow_superuser_password)}\n"
                )
-                f.write(f"LANGFLOW_CHAT_FLOW_ID={self.config.langflow_chat_flow_id}\n")
+                f.write(f"LANGFLOW_CHAT_FLOW_ID={self._quote_env_value(self.config.langflow_chat_flow_id)}\n")
                f.write(
-                    f"LANGFLOW_INGEST_FLOW_ID={self.config.langflow_ingest_flow_id}\n"
+                    f"LANGFLOW_INGEST_FLOW_ID={self._quote_env_value(self.config.langflow_ingest_flow_id)}\n"
                )
-                f.write(f"NUDGES_FLOW_ID={self.config.nudges_flow_id}\n")
+                f.write(f"NUDGES_FLOW_ID={self._quote_env_value(self.config.nudges_flow_id)}\n")
-                f.write(f"OPENSEARCH_PASSWORD={self.config.opensearch_password}\n")
+                f.write(f"OPENSEARCH_PASSWORD={self._quote_env_value(self.config.opensearch_password)}\n")
-                f.write(f"OPENAI_API_KEY={self.config.openai_api_key}\n")
+                f.write(f"OPENAI_API_KEY={self._quote_env_value(self.config.openai_api_key)}\n")
                f.write(
-                    f"OPENRAG_DOCUMENTS_PATHS={self.config.openrag_documents_paths}\n"
+                    f"OPENRAG_DOCUMENTS_PATHS={self._quote_env_value(self.config.openrag_documents_paths)}\n"
                )
                f.write("\n")
                # Ingestion settings
                f.write("# Ingestion settings\n")
-                f.write(f"DISABLE_INGEST_WITH_LANGFLOW={self.config.disable_ingest_with_langflow}\n")
+                f.write(f"DISABLE_INGEST_WITH_LANGFLOW={self._quote_env_value(self.config.disable_ingest_with_langflow)}\n")
                f.write("\n")
                # Langflow auth settings
                f.write("# Langflow auth settings\n")
-                f.write(f"LANGFLOW_AUTO_LOGIN={self.config.langflow_auto_login}\n")
+                f.write(f"LANGFLOW_AUTO_LOGIN={self._quote_env_value(self.config.langflow_auto_login)}\n")
                f.write(
-                    f"LANGFLOW_NEW_USER_IS_ACTIVE={self.config.langflow_new_user_is_active}\n"
+                    f"LANGFLOW_NEW_USER_IS_ACTIVE={self._quote_env_value(self.config.langflow_new_user_is_active)}\n"
                )
                f.write(
-                    f"LANGFLOW_ENABLE_SUPERUSER_CLI={self.config.langflow_enable_superuser_cli}\n"
+                    f"LANGFLOW_ENABLE_SUPERUSER_CLI={self._quote_env_value(self.config.langflow_enable_superuser_cli)}\n"
                )
                f.write("\n")
@ -277,10 +286,10 @@ class EnvManager:
                ):
                    f.write("# Google OAuth settings\n")
                    f.write(
-                        f"GOOGLE_OAUTH_CLIENT_ID={self.config.google_oauth_client_id}\n"
+                        f"GOOGLE_OAUTH_CLIENT_ID={self._quote_env_value(self.config.google_oauth_client_id)}\n"
                    )
                    f.write(
-                        f"GOOGLE_OAUTH_CLIENT_SECRET={self.config.google_oauth_client_secret}\n"
+                        f"GOOGLE_OAUTH_CLIENT_SECRET={self._quote_env_value(self.config.google_oauth_client_secret)}\n"
                    )
                    f.write("\n")
@ -290,10 +299,10 @@ class EnvManager:
                ):
                    f.write("# Microsoft Graph OAuth settings\n")
                    f.write(
-                        f"MICROSOFT_GRAPH_OAUTH_CLIENT_ID={self.config.microsoft_graph_oauth_client_id}\n"
+                        f"MICROSOFT_GRAPH_OAUTH_CLIENT_ID={self._quote_env_value(self.config.microsoft_graph_oauth_client_id)}\n"
                    )
                    f.write(
-                        f"MICROSOFT_GRAPH_OAUTH_CLIENT_SECRET={self.config.microsoft_graph_oauth_client_secret}\n"
+                        f"MICROSOFT_GRAPH_OAUTH_CLIENT_SECRET={self._quote_env_value(self.config.microsoft_graph_oauth_client_secret)}\n"
                    )
                    f.write("\n")
@ -311,7 +320,7 @@ class EnvManager:
                        if not optional_written:
                            f.write("# Optional settings\n")
                            optional_written = True
-                        f.write(f"{var_name}={var_value}\n")
+                        f.write(f"{var_name}={self._quote_env_value(var_value)}\n")
                if optional_written:
                    f.write("\n")
--- a/uv.lock
+++ b/uv.lock
@ -1,5 +1,5 @@
 version = 1
-revision = 3
+revision = 2
 requires-python = ">=3.13"
 resolution-markers = [
    "sys_platform == 'darwin'",
@ -2282,7 +2282,7 @@ wheels = [
 [[package]]
 name = "openrag"
-version = "0.1.3"
+version = "0.1.8"
 source = { editable = "." }
 dependencies = [
    { name = "agentd" },