sttjr
/

paganini-qwen35-27b-grpo-lora

Reinforcement Learning

Model card Files Files and versions

paganini-qwen35-27b-grpo-lora

966 MB

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

sttjr's picture

Update model card: add full GRPO training details, reward function, agent architecture

1213e19 verified 3 months ago