Update operate.py

2025-07-14 18:43:22 +08:00 · 2025-07-14 18:43:22 +08:00 · 7edf087baa
commit 7edf087baa
parent 541653ef6d
1 changed files with 7 additions and 23 deletions
--- a/lightrag/operate.py
+++ b/lightrag/operate.py
@ -1949,28 +1949,8 @@ async def _build_query_context(
            hl_relations_context, ll_relations_context
        )

-    # Process all chunks uniformly: deduplication, reranking, and token truncation
-    processed_chunks = await process_chunks_unified(
-        query=query,
-        chunks=all_chunks,
-        query_param=query_param,
-        global_config=text_chunks_db.global_config,
-        source_type="mixed",
-    )
-
-    # Build final text_units_context from processed chunks
-    text_units_context = []
-    for i, chunk in enumerate(processed_chunks):
-        text_units_context.append(
-            {
-                "id": i + 1,
-                "content": chunk["content"],
-                "file_path": chunk.get("file_path", "unknown_source"),
-            }
-        )
-
    logger.info(
-        f"Final context: {len(entities_context)} entities, {len(relations_context)} relations, {len(text_units_context)} chunks"
+        f"Initial context: {len(entities_context)} entities, {len(relations_context)} relations, {len(all_chunks)} chunks"
    )

    # Unified token control system - Apply precise token limits to entities and relations
@ -2098,11 +2078,11 @@ async def _build_query_context(
        )

        # Re-process chunks with dynamic token limit
-        if text_units_context:
+        if all_chunks:
            # Create a temporary query_param copy with adjusted chunk token limit
            temp_chunks = [
                {"content": chunk["content"], "file_path": chunk["file_path"]}
-                for chunk in text_units_context
+                for chunk in all_chunks
            ]

            # Apply token truncation to chunks using the dynamic limit
@ -2130,6 +2110,10 @@ async def _build_query_context(
                f"Re-truncated chunks for dynamic token limit: {len(temp_chunks)} -> {len(text_units_context)} (chunk available tokens: {available_chunk_tokens})"
            )

+    logger.info(
+        f"Final context: {len(entities_context)} entities, {len(relations_context)} relations, {len(text_units_context)} chunks"
+    )
+
    # not necessary to use LLM to generate a response
    if not entities_context and not relations_context:
        return None