hkust-nlp
/

Qwen-2.5-7B-Verifier-R1-Qwen-1.5B

Reinforcement Learning

Model card Files Files and versions

Qwen-2.5-7B-Verifier-R1-Qwen-1.5B / model-00002-of-00004.safetensors

Commit History

Initial commit

5185a35
verified

yuzhen17 commited on May 24, 2025