hdong0
/

Qwen2.5-Math-1.5B-GRPO_deepscaler_temp1_prompt1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-Math-1.5B-GRPO_deepscaler_temp1_prompt1

3.57 GB

1 contributor

History: 23 commits

hdong0's picture

End of training

f65eafe verified 4 months ago