unsloth
/

Llama-4-Scout-17B-16E-Instruct-unsloth-bnb-4bit

Image-Text-to-Text

text-generation-inference

4-bit precision

Model card Files Files and versions

danielhanchen commited on Apr 12

Commit

301fe74

·

verified ·

1 Parent(s): 3971a82

Upload folder using huggingface_hub

Files changed (3) hide show

config.json +4 -3
special_tokens_map.json +1 -1
tokenizer_config.json +1 -1

config.json CHANGED Viewed

@@ -18,7 +18,8 @@
     "llm_int8_skip_modules": [
       "vision_model",
       "multi_modal_projector",
-      "lm_head"
     ],
     "llm_int8_threshold": 6.0,
     "load_in_4bit": true,
@@ -158,8 +159,8 @@
     "pad_token_id": 200018,
     "rms_norm_eps": 1e-05,
     "rope_scaling": {
-      "factor": 8.0,
-      "high_freq_factor": 4.0,
       "low_freq_factor": 1.0,
       "original_max_position_embeddings": 8192,
       "rope_type": "llama3"

     "llm_int8_skip_modules": [
       "vision_model",
       "multi_modal_projector",
+      "lm_head",
+      "vision_model"
     ],
     "llm_int8_threshold": 6.0,
     "load_in_4bit": true,
     "pad_token_id": 200018,
     "rms_norm_eps": 1e-05,
     "rope_scaling": {
+      "factor": 16.0,
+      "high_freq_factor": 1.0,
       "low_freq_factor": 1.0,
       "original_max_position_embeddings": 8192,
       "rope_type": "llama3"

special_tokens_map.json CHANGED Viewed

@@ -14,7 +14,7 @@
     "single_word": false
   },
   "pad_token": {
-    "content": "<|finetune_right_pad_id|>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

     "single_word": false
   },
   "pad_token": {
+    "content": "<|finetune_right_pad|>",
     "lstrip": false,
     "normalized": false,
     "rstrip": false,

tokenizer_config.json CHANGED Viewed

@@ -9091,7 +9091,7 @@
     "attention_mask"
   ],
   "model_max_length": 10485760,
-  "pad_token": "<|finetune_right_pad_id|>",
   "processor_class": "Llama4Processor",
   "tokenizer_class": "PreTrainedTokenizer"
 }

     "attention_mask"
   ],
   "model_max_length": 10485760,
+  "pad_token": "<|finetune_right_pad|>",
   "processor_class": "Llama4Processor",
   "tokenizer_class": "PreTrainedTokenizer"
 }