tricktreat
/

Llama-2-7b-chat-hf-guanaco-freeze-embed-tokens-q-v-proj-lora

Model card Files Files and versions

Metrics Training metrics Community

tricktreat commited on Apr 16, 2024

Commit

f2bdf5c

·

verified ·

1 Parent(s): a4a02e4

Update README.md

Files changed (1) hide show

README.md +7 -4

README.md CHANGED Viewed

@@ -7,7 +7,7 @@ license: apache-2.0
 # Training
 ```
-deepspeed --include=node-0:3 --master_port=12001 sft_prompt_tuning.py --deepspeed dp_zero0.json \
     --model_name_or_path="guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_proj" \
     --dataset_name="timdettmers/openassistant-guanaco" \
     --dataset_text_field="text" \
@@ -15,13 +15,16 @@ deepspeed --include=node-0:3 --master_port=12001 sft_prompt_tuning.py --deepspee
     --learning_rate=1e-5 \
     --per_device_train_batch_size=32 \
     --gradient_accumulation_steps=4 \
-    --output_dir="guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_projs_prompttuning" \
     --logging_steps=1 \
     --num_train_epochs=15 \
     --max_steps=-1 \
-    --save_steps=0.3 \
     --gradient_checkpointing \
-    --fp16
 ```
 # Model Card for Model ID

 # Training
 ```
+deepspeed --include=node-0:2 sft_fix_target_modules.py --deepspeed dp_zero0.json \
     --model_name_or_path="guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_proj" \
     --dataset_name="timdettmers/openassistant-guanaco" \
     --dataset_text_field="text" \
     --learning_rate=1e-5 \
     --per_device_train_batch_size=32 \
     --gradient_accumulation_steps=4 \
+    --output_dir="guanaco_Llama-2-7b-chat-hf_freeze_embed_tokens_q_v_proj_lora" \
     --logging_steps=1 \
     --num_train_epochs=15 \
     --max_steps=-1 \
     --gradient_checkpointing \
+    --fp16 \
+    --save_steps=0.3 \
+    --use_peft \
+    --lora_r=64 \
+    --lora_alpha=16
 ```
 # Model Card for Model ID