File size: 321 Bytes
6c89092
141b8b7
97a1c5e
 
 
1
2
3
4
5
Base model : unsloth/Qwen3.5-9B

dataset :     "nvidia/Nemotron-Terminal-Corpus" subset "skill_based_easy", 10k

Eğitim esnasında datasette multi-turn yapısı doğru ayarlanmadı. Chat template geçmiş mesajlardaki think kısmını kaldırdığı için multi-turn şeklindeki training'de think üretmemeyi öğrenmiş