Fix: Disable Chroma Telemetry

Opts-out of anonymized telemetry being tracked in Chroma. See: https://docs.trychroma.com/telemetry
2023-05-11 10:17:18 -04:00 · 2023-05-11 10:17:18 -04:00 · 8c6a81a07f
parent 60225698b6
commit 8c6a81a07f
3 changed files with 17 additions and 4 deletions
--- a/chroma_preference.py
+++ b/chroma_preference.py
@ -0,0 +1,11 @@
 from chromadb.config import Settings
 # Define the folder for storing database
 PERSIST_DIRECTORY = 'db'
 # Define the Chroma settings
 CHROMA_SETTINGS = Settings(
        chroma_db_impl='duckdb+parquet',
        persist_directory=PERSIST_DIRECTORY,
        anonymized_telemetry=False
 )
--- a/ingest.py
+++ b/ingest.py
@ -3,6 +3,8 @@ from langchain.text_splitter import RecursiveCharacterTextSplitter
 from langchain.vectorstores import Chroma
 from langchain.embeddings import LlamaCppEmbeddings
 from sys import argv
 from chroma_preference import PERSIST_DIRECTORY
 from chroma_preference import CHROMA_SETTINGS
 def main():
    # Load document and split in chunks
@ -13,8 +15,7 @@ def main():
    # Create embeddings
    llama = LlamaCppEmbeddings(model_path="./models/ggml-model-q4_0.bin")
    # Create and store locally vectorstore
-    persist_directory = 'db'
+    db = Chroma.from_documents(texts, llama, persist_directory=PERSIST_DIRECTORY, client_settings=CHROMA_SETTINGS)
    db = Chroma.from_documents(texts, llama, persist_directory=persist_directory)
    db.persist()
    db = None
--- a/privateGPT.py
+++ b/privateGPT.py
@ -3,12 +3,13 @@ from langchain.embeddings import LlamaCppEmbeddings
 from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
 from langchain.vectorstores import Chroma
 from langchain.llms import GPT4All
 from chroma_preference import PERSIST_DIRECTORY
 from chroma_preference import CHROMA_SETTINGS
 def main():        
    # Load stored vectorstore
    llama = LlamaCppEmbeddings(model_path="./models/ggml-model-q4_0.bin")
-    persist_directory = 'db'
+    db = Chroma(persist_directory=PERSIST_DIRECTORY, embedding_function=llama, client_settings=CHROMA_SETTINGS)
    db = Chroma(persist_directory=persist_directory, embedding_function=llama)
    retriever = db.as_retriever()
    # Prepare the LLM
    callbacks = [StreamingStdOutCallbackHandler()]