zerg2187
/

GRPO_structeval_t_qwen3_v1

Reinforcement Learning

text-generation

structured-output

text-generation-inference

4-bit precision

Model card Files Files and versions

GRPO_structeval_t_qwen3_v1 / generation_config.json

zerg2187's picture

Upload GRPO fine-tuned merged model

a49ffcb verified 5 months ago

211 Bytes

	{
	"do_sample": true,
	"eos_token_id": [
	151645,
	151643
	],
	"max_length": 262144,
	"pad_token_id": 151643,
	"temperature": 0.7,
	"top_k": 20,
	"top_p": 0.8,
	"transformers_version": "4.56.2"
	}