trollek
/

ThoughtStream-4B-v0.1

Text Generation

text-generation-inference

Model card Files Files and versions

trollek commited on Jul 16, 2024

Commit

8526f56

·

verified ·

1 Parent(s): 7847e2a

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -18,10 +18,12 @@ base_model: trollek/danube2-1.8b-SlimOrcaDedup
 dtype: bfloat16
 ```
 ### LLama-Factory config
 ```yaml
 ### model
-model_name_or_path: /home/trolle/Documents/Projects/trollek/danube2/thinking-base-chatml
 ### method
 stage: sft
@@ -68,5 +70,3 @@ per_device_eval_batch_size: 1
 eval_strategy: steps
 eval_steps: 100
 ```
-The eval went up after 1 epoch so I stopped and merged that.

 dtype: bfloat16
 ```
+The thought tokens were added to the merged model before training a LoRA.
 ### LLama-Factory config
 ```yaml
 ### model
+model_name_or_path: merged-base-chatml
 ### method
 stage: sft
 eval_strategy: steps
 eval_steps: 100
 ```