From c8d5c45269c394e75d8108a929bfe79094107da3 Mon Sep 17 00:00:00 2001
From: Preston Rasmussen <109292228+prasmussen15@users.noreply.github.com>
Date: Mon, 14 Apr 2025 21:02:36 -0400
Subject: [PATCH] update to 4.1 models (#352)

---
 examples/langgraph-agent/agent.ipynb          |  2 +-
 .../cross_encoder/openai_reranker_client.py   |  2 +-
 graphiti_core/llm_client/config.py            |  2 +-
 graphiti_core/llm_client/openai_client.py     |  2 +-
 .../llm_client/openai_generic_client.py       |  2 +-
 mcp_server/.env.example                       |  2 +-
 mcp_server/README.md                          | 10 +++---
 mcp_server/graphiti_mcp_server.py             |  4 +--
 mcp_server/mcp_config_stdio_example.json      | 36 +++++++++----------
 tests/evals/eval_e2e_graph_building.py        |  3 +-
 10 files changed, 31 insertions(+), 34 deletions(-)

diff --git a/examples/langgraph-agent/agent.ipynb b/examples/langgraph-agent/agent.ipynb
index f8a7388b..cef3df7d 100644
--- a/examples/langgraph-agent/agent.ipynb
+++ b/examples/langgraph-agent/agent.ipynb
@@ -283,7 +283,7 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "llm = ChatOpenAI(model='gpt-4o-mini', temperature=0).bind_tools(tools)"
+    "llm = ChatOpenAI(model='gpt-4.1-mini', temperature=0).bind_tools(tools)"
    ]
   },
   {
diff --git a/graphiti_core/cross_encoder/openai_reranker_client.py b/graphiti_core/cross_encoder/openai_reranker_client.py
index 7b8dbe7b..7682b23b 100644
--- a/graphiti_core/cross_encoder/openai_reranker_client.py
+++ b/graphiti_core/cross_encoder/openai_reranker_client.py
@@ -28,7 +28,7 @@ from .client import CrossEncoderClient
 
 logger = logging.getLogger(__name__)
 
-DEFAULT_MODEL = 'gpt-4o-mini'
+DEFAULT_MODEL = 'gpt-4.1-nano'
 
 
 class BooleanClassifier(BaseModel):
diff --git a/graphiti_core/llm_client/config.py b/graphiti_core/llm_client/config.py
index 8a4a35b6..97a43e62 100644
--- a/graphiti_core/llm_client/config.py
+++ b/graphiti_core/llm_client/config.py
@@ -43,7 +43,7 @@ class LLMConfig:
                                                 This is required for making authorized requests.
 
                 model (str, optional): The specific LLM model to use for generating responses.
-                                                                Defaults to "gpt-4o-mini", which appears to be a custom model name.
+                                                                Defaults to "gpt-4.1-mini", which appears to be a custom model name.
                                                                 Common values might include "gpt-3.5-turbo" or "gpt-4".
 
                 base_url (str, optional): The base URL of the LLM API service.
diff --git a/graphiti_core/llm_client/openai_client.py b/graphiti_core/llm_client/openai_client.py
index 5c187d21..6726e3d2 100644
--- a/graphiti_core/llm_client/openai_client.py
+++ b/graphiti_core/llm_client/openai_client.py
@@ -30,7 +30,7 @@ from .errors import RateLimitError, RefusalError
 
 logger = logging.getLogger(__name__)
 
-DEFAULT_MODEL = 'gpt-4o-mini'
+DEFAULT_MODEL = 'gpt-4.1-mini'
 
 
 class OpenAIClient(LLMClient):
diff --git a/graphiti_core/llm_client/openai_generic_client.py b/graphiti_core/llm_client/openai_generic_client.py
index 184348cc..ba799d38 100644
--- a/graphiti_core/llm_client/openai_generic_client.py
+++ b/graphiti_core/llm_client/openai_generic_client.py
@@ -31,7 +31,7 @@ from .errors import RateLimitError, RefusalError
 
 logger = logging.getLogger(__name__)
 
-DEFAULT_MODEL = 'gpt-4o-mini'
+DEFAULT_MODEL = 'gpt-4.1-mini'
 
 
 class OpenAIGenericClient(LLMClient):
diff --git a/mcp_server/.env.example b/mcp_server/.env.example
index 4457709e..f46469da 100644
--- a/mcp_server/.env.example
+++ b/mcp_server/.env.example
@@ -9,7 +9,7 @@ NEO4J_PASSWORD=demodemo
 # OpenAI API Configuration
 # Required for LLM operations
 OPENAI_API_KEY=your_openai_api_key_here
-MODEL_NAME=gpt-4o-mini
+MODEL_NAME=gpt-4.1-mini
 
 # Optional: Only needed for non-standard OpenAI endpoints
 # OPENAI_BASE_URL=https://api.openai.com/v1
diff --git a/mcp_server/README.md b/mcp_server/README.md
index 4e2126a1..bc16bd9c 100644
--- a/mcp_server/README.md
+++ b/mcp_server/README.md
@@ -66,7 +66,7 @@ uv run graphiti_mcp_server.py
 With options:
 
 ```bash
-uv run graphiti_mcp_server.py --model gpt-4o-mini --transport sse
+uv run graphiti_mcp_server.py --model gpt-4.1-mini --transport sse
 ```
 
 Available arguments:
@@ -96,7 +96,7 @@ Before running the Docker Compose setup, you need to configure the environment v
       ```
       # Required for LLM operations
       OPENAI_API_KEY=your_openai_api_key_here
-      MODEL_NAME=gpt-4o-mini
+      MODEL_NAME=gpt-4.1-mini
       # Optional: OPENAI_BASE_URL only needed for non-standard OpenAI endpoints
       # OPENAI_BASE_URL=https://api.openai.com/v1
       ```
@@ -105,7 +105,7 @@ Before running the Docker Compose setup, you need to configure the environment v
 2. **Using environment variables directly**:
     - You can also set the environment variables when running the Docker Compose command:
       ```bash
-      OPENAI_API_KEY=your_key MODEL_NAME=gpt-4o-mini docker compose up
+      OPENAI_API_KEY=your_key MODEL_NAME=gpt-4.1-mini docker compose up
       ```
 
 #### Neo4j Configuration
@@ -162,7 +162,7 @@ To use the Graphiti MCP server with an MCP-compatible client, configure it to co
         "NEO4J_USER": "neo4j",
         "NEO4J_PASSWORD": "demodemo",
         "OPENAI_API_KEY": "${OPENAI_API_KEY}",
-        "MODEL_NAME": "gpt-4o-mini"
+        "MODEL_NAME": "gpt-4.1-mini"
       }
     }
   }
@@ -200,7 +200,7 @@ Or start the server with uv and connect to it:
         "NEO4J_USER": "neo4j",
         "NEO4J_PASSWORD": "demodemo",
         "OPENAI_API_KEY": "${OPENAI_API_KEY}",
-        "MODEL_NAME": "gpt-4o-mini"
+        "MODEL_NAME": "gpt-4.1-mini"
       }
     }
   }
diff --git a/mcp_server/graphiti_mcp_server.py b/mcp_server/graphiti_mcp_server.py
index b71b3b7d..9f108939 100644
--- a/mcp_server/graphiti_mcp_server.py
+++ b/mcp_server/graphiti_mcp_server.py
@@ -31,7 +31,7 @@ from graphiti_core.utils.maintenance.graph_data_operations import clear_data
 
 load_dotenv()
 
-DEFAULT_LLM_MODEL = 'gpt-4o-mini'
+DEFAULT_LLM_MODEL = 'gpt-4.1-mini'
 
 
 class Requirement(BaseModel):
@@ -344,14 +344,12 @@ For optimal performance, ensure the database is properly configured and accessib
 API keys are provided for any language model operations.
 """
 
-
 # MCP server instance
 mcp = FastMCP(
     'graphiti',
     instructions=GRAPHITI_MCP_INSTRUCTIONS,
 )
 
-
 # Initialize Graphiti client
 graphiti_client: Graphiti | None = None
 
diff --git a/mcp_server/mcp_config_stdio_example.json b/mcp_server/mcp_config_stdio_example.json
index f6e437bc..0cb44203 100644
--- a/mcp_server/mcp_config_stdio_example.json
+++ b/mcp_server/mcp_config_stdio_example.json
@@ -1,21 +1,21 @@
 {
-    "mcpServers": {
-        "graphiti": {
-            "transport": "stdio",
-            "command": "uv",
-            "args": [
-                "run",
-                "/ABSOLUTE/PATH/TO/graphiti_mcp_server.py",
-                "--transport",
-                "stdio"
-            ],
-            "env": {
-                "NEO4J_URI": "bolt://localhost:7687",
-                "NEO4J_USER": "neo4j",
-                "NEO4J_PASSWORD": "demodemo",
-                "OPENAI_API_KEY": "${OPENAI_API_KEY}",
-                "MODEL_NAME": "gpt-4o-mini"
-            }
-        }
+  "mcpServers": {
+    "graphiti": {
+      "transport": "stdio",
+      "command": "uv",
+      "args": [
+        "run",
+        "/ABSOLUTE/PATH/TO/graphiti_mcp_server.py",
+        "--transport",
+        "stdio"
+      ],
+      "env": {
+        "NEO4J_URI": "bolt://localhost:7687",
+        "NEO4J_USER": "neo4j",
+        "NEO4J_PASSWORD": "demodemo",
+        "OPENAI_API_KEY": "${OPENAI_API_KEY}",
+        "MODEL_NAME": "gpt-4.1-mini"
+      }
     }
+  }
 }
diff --git a/tests/evals/eval_e2e_graph_building.py b/tests/evals/eval_e2e_graph_building.py
index 70163410..5e3b2573 100644
--- a/tests/evals/eval_e2e_graph_building.py
+++ b/tests/evals/eval_e2e_graph_building.py
@@ -99,7 +99,7 @@ async def build_baseline_graph(multi_session: list[int], session_length: int):
 
 async def eval_graph(multi_session: list[int], session_length: int, llm_client=None) -> float:
     if llm_client is None:
-        llm_client = OpenAIClient()
+        llm_client = OpenAIClient(config=LLMConfig(model='gpt-4.1-mini'))
     graphiti = Graphiti(NEO4J_URI, NEO4j_USER, NEO4j_PASSWORD, llm_client=llm_client)
     with open('baseline_graph_results.json') as file:
         baseline_results_raw = json.load(file)
@@ -127,7 +127,6 @@ async def eval_graph(multi_session: list[int], session_length: int, llm_client=N
     for user_id in add_episode_results:
         user_count += 1
         user_raw_score = 0
-        print('add_episode_context: ', add_episode_context)
         for baseline_result, add_episode_result, episodes in zip(
             baseline_results[user_id],
             add_episode_results[user_id],