princeton-nlp
/

warm-startgrpothink__Llama-3.1-8B-Instruct

Model card Files Files and versions

warm-start__grpo__think__Llama-3.1-8B-Instruct / model-00004-of-00004.safetensors

Commit History

Uploading the models

d6d5150
verified

princeton-nlp commited on Sep 23, 2025