update test db url and redis client

azliu0 · azliu0 · commit acb8e55530d5 · 2024-04-15T22:01:26.000Z
diff --git a/server/__init__.py b/server/__init__.py
@@ -3,6 +3,7 @@
 from typing import Type, cast
 
 import numpy
+import redis
 from apiflask import APIFlask
 from flask import redirect, render_template
 from flask_cors import CORS
@@ -59,6 +60,8 @@ class ProperlyTypedSQLAlchemy(SQLAlchemy):
 db = SQLAlchemy(model_class=Base)
 db = cast(ProperlyTypedSQLAlchemy, db)
 
+redis_client: redis.Redis | None = None
+
 
 def create_app():
     """Create the Flask app."""
@@ -78,6 +81,11 @@ def create_app():
     with app.app_context():
         db.init_app(app)
 
+        global redis_client
+        redis_client = redis.Redis(
+            host=app.config["REDIS_HOST"], port=6379, decode_responses=True
+        )
+
         allowed_domains = app.config.get("ALLOWED_DOMAINS")
 
         cors.init_app(
diff --git a/server/nlp/embeddings.py b/server/nlp/embeddings.py
@@ -8,7 +8,6 @@
 
 import numpy as np
 import openai
-import redis
 from redis.commands.search.field import (
     NumericField,
     TextField,
@@ -17,15 +16,15 @@
 from redis.commands.search.indexDefinition import IndexDefinition, IndexType
 from redis.commands.search.query import Query
 
-from server.config import REDIS_HOST, RedisDocument
+from server import redis_client
+from server.config import RedisDocument
+
+assert redis_client is not None
 
 cwd = os.path.dirname(__file__)
 
 VECTOR_DIMENSION = 1536
 
-# load redis client
-client = redis.Redis(host=REDIS_HOST, port=6379, decode_responses=True)
-
 # load corpus
 # with open('corpus.json', 'r') as f:
 #     corpus = json.load(f)
@@ -46,7 +45,7 @@ def load_corpus(corpus: list[RedisDocument]):
     """
     print("loading corpus...")
 
-    pipeline = client.pipeline()
+    pipeline = redis_client.pipeline()
     for i, doc in enumerate(corpus, start=1):
         redis_key = f"documents:{i:03}"
         pipeline.json().set(redis_key, "$", doc)
@@ -81,9 +80,9 @@ def compute_embeddings():
     print("computing embeddings...")
 
     # get keys, questions, content
-    keys = sorted(client.keys("documents:*"))  # type: ignore
-    questions = client.json().mget(keys, "$.question")
-    content = client.json().mget(keys, "$.content")
+    keys = sorted(redis_client.keys("documents:*"))  # type: ignore
+    questions = redis_client.json().mget(keys, "$.question")
+    content = redis_client.json().mget(keys, "$.content")
 
     # compute embeddings
     question_and_content = [
@@ -110,7 +109,7 @@ def load_embeddings(embeddings: list[list[float]]):
     print("loading embeddings into redis...")
 
     # load embeddings into redis
-    pipeline = client.pipeline()
+    pipeline = redis_client.pipeline()
     for i, embedding in enumerate(embeddings, start=1):
         redis_key = f"documents:{i:03}"
         pipeline.json().set(redis_key, "$.question_and_content_embeddings", embedding)
@@ -153,17 +152,17 @@ def create_index(corpus_len: int):
         ),
     )
     definition = IndexDefinition(prefix=["documents:"], index_type=IndexType.JSON)
-    res = client.ft("idx:documents_vss").create_index(
+    res = redis_client.ft("idx:documents_vss").create_index(
         fields=schema, definition=definition
     )
 
     if res == "OK":
         start = time.time()
         while 1:
-            if str(client.ft("idx:documents_vss").info()["num_docs"]) == str(
+            if str(redis_client.ft("idx:documents_vss").info()["num_docs"]) == str(
                 corpus_len
             ):
-                info = client.ft("idx:documents_vss").info()
+                info = redis_client.ft("idx:documents_vss").info()
                 num_docs = info["num_docs"]
                 indexing_failures = info["hash_indexing_failures"]
                 print("num_docs", num_docs, "indexing_failures", indexing_failures)
@@ -209,7 +208,7 @@ def queries(query, queries: list[str]) -> list[dict]:
     results_list = []
     for i, encoded_query in enumerate(encoded_queries):
         result_docs = (
-            client.ft("idx:documents_vss")
+            redis_client.ft("idx:documents_vss")
             .search(
                 query,
                 {"query_vector": np.array(encoded_query, dtype=np.float32).tobytes()},
@@ -259,7 +258,7 @@ def embed_corpus(corpus: list[RedisDocument]):
     """
     # flush database
     print("cleaning database...")
-    client.flushdb()
+    redis_client.flushdb()
     print("done cleaning database")
 
     # embed corpus
diff --git a/server_tests/conftest.py b/server_tests/conftest.py
@@ -40,11 +40,11 @@ def db_url(db_name="pigeondb_test"):
 
     conn.close()
 
-    yield "postgresql://postgres:password@database/pigeondb_test"
+    yield f"postgresql://postgres:password@{host}/{db_name}"
 
 
 @pytest.fixture(scope="session")
-def redis_db_index():
+def redis_host():
     """Yields test redis db host.
 
     Flushes test db if it already exists.
@@ -58,9 +58,9 @@ def redis_db_index():
 
 
 @pytest.fixture(scope="session")
-def app(db_url: str, redis_db_index: str):
+def app(db_url: str, redis_host: str):
     os.environ["DATABASE_URL"] = db_url
-    os.environ["REDIS_HOST"] = redis_db_index
+    os.environ["REDIS_HOST"] = redis_host
 
     app = create_app()
     app.config.update(