aleynahukmet's picture
Update README.md
97a1c5e verified
|
Raw
History Blame Contribute Delete
321 Bytes

Base model : unsloth/Qwen3.5-9B

dataset : "nvidia/Nemotron-Terminal-Corpus" subset "skill_based_easy", 10k

Eğitim esnasında datasette multi-turn yapısı doğru ayarlanmadı. Chat template geçmiş mesajlardaki think kısmını kaldırdığı için multi-turn şeklindeki training'de think üretmemeyi öğrenmiş