Allow passing HF access token to download tokenizer. Fallback to default tokenizer.

2024-04-19 15:38:25 +02:00 · 2024-04-19 15:38:25 +02:00 · 49ef729abc
parent 347be643f7
commit 49ef729abc
3 changed files with 22 additions and 6 deletions
--- a/private_gpt/components/llm/llm_component.py
+++ b/private_gpt/components/llm/llm_component.py
@ -22,13 +22,24 @@ class LLMComponent:
    @inject
    def __init__(self, settings: Settings) -> None:
        llm_mode = settings.llm.mode
-        if settings.llm.tokenizer:
-            set_global_tokenizer(
-                AutoTokenizer.from_pretrained(
-                    pretrained_model_name_or_path=settings.llm.tokenizer,
-                    cache_dir=str(models_cache_path),
+        if settings.llm.tokenizer and settings.llm.mode != "mock":
+            # Try to download the tokenizer. If it fails, the LLM will still work
+            # using the default one, which is less accurate.
+            try:
+                set_global_tokenizer(
+                    AutoTokenizer.from_pretrained(
+                        pretrained_model_name_or_path=settings.llm.tokenizer,
+                        cache_dir=str(models_cache_path),
+                        token=settings.huggingface.access_token,
+                    )
+                )
+            except Exception as e:
+                logger.warning(
+                    "Failed to download tokenizer %s. Falling back to "
+                    "default tokenizer.",
+                    settings.llm.tokenizer,
+                    e,
                )
-            )

        logger.info("Initializing the LLM in mode=%s", llm_mode)
        match settings.llm.mode:
--- a/private_gpt/settings/settings.py
+++ b/private_gpt/settings/settings.py
@ -151,6 +151,10 @@ class HuggingFaceSettings(BaseModel):
    embedding_hf_model_name: str = Field(
        description="Name of the HuggingFace model to use for embeddings"
    )
+    access_token: str = Field(
+        None,
+        description="Huggingface access token, required to download some models",
+    )


 class EmbeddingSettings(BaseModel):
--- a/settings.yaml
+++ b/settings.yaml
@ -69,6 +69,7 @@ embedding:

 huggingface:
  embedding_hf_model_name: BAAI/bge-small-en-v1.5
+  access_token: ${HUGGINGFACE_TOKEN:}

 vectorstore:
  database: qdrant