CodeGoat24
/

UnifiedReward-Think-qwen-7b

Model card Files Files and versions

CodeGoat24 commited on Aug 29

Commit

459e37d

·

verified ·

1 Parent(s): ec27f05

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -114,9 +114,9 @@ print(output)
 ## Citation
 ```
-@article{UnifiedReward-Think,
-  title={Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning.},
-  author={Wang, Yibin and Li, Zhimin and Zang, Yuhang and Wang, Chunyu and Lu, Qinglin, and Jin, Cheng and Wang, Jiaqi},
   journal={arXiv preprint arXiv:2505.03318},
   year={2025}
 }

 ## Citation
 ```
+@article{unifiedreward-think,
+  title={Unified multimodal chain-of-thought reward model through reinforcement fine-tuning},
+  author={Wang, Yibin and Li, Zhimin and Zang, Yuhang and Wang, Chunyu and Lu, Qinglin and Jin, Cheng and Wang, Jiaqi},
   journal={arXiv preprint arXiv:2505.03318},
   year={2025}
 }