Adding default parameter for max_new_tokens in TransformersModel (#604)

2025-02-13 12:03:44 +01:00 · 2025-02-13 12:03:44 +01:00 · f3ee6052db
parent a427c84c1c
commit f3ee6052db
1 changed files with 9 additions and 0 deletions
--- a/src/smolagents/models.py
+++ b/src/smolagents/models.py
@ -599,7 +599,16 @@ class TransformersModel(Model):
            model_id = default_model_id
            logger.warning(f"`model_id`not provided, using this default tokenizer for token counts: '{model_id}'")
        self.model_id = model_id
        default_max_tokens = 5000
        max_new_tokens = kwargs.get("max_new_tokens") or kwargs.get("max_tokens")
        if not max_new_tokens:
            kwargs["max_new_tokens"] = default_max_tokens
            logger.warning(
                f"`max_new_tokens` not provided, using this default value for `max_new_tokens`: {default_max_tokens}"
            )
        self.kwargs = kwargs
        if device_map is None:
            device_map = "cuda" if torch.cuda.is_available() else "cpu"
        logger.info(f"Using device: {device_map}")