ValueFX9507 commited on
Commit
42bda0d
·
verified ·
1 Parent(s): 2fcaab1

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +105 -3
README.md CHANGED
@@ -1,3 +1,105 @@
1
- ---
2
- license: apache-2.0
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model:
3
+ - deepseek-ai/deepseek-r1-14b
4
+ language:
5
+ - zh
6
+ - en
7
+ library_name: transformers
8
+ tags:
9
+ - incremental-pretraining
10
+ - sft
11
+ - reinforcement-learning
12
+ - roleplay
13
+ - cot
14
+ - sex
15
+ license: apache-2.0
16
+ ---
17
+ # Tifa-Deepseek-14b-CoT
18
+
19
+ - **HF Model**: [ValueFX9507/Tifa-Deepsex-14b-CoT](https://huggingface.co/ValueFX9507/Tifa-Deepsex-14b-CoT)
20
+ - **GGUF**: [F16](https://huggingface.co/ValueFX9507/Tifa-Deepsex-14b-CoT)(更多量化版本持续更新中)
21
+ - **Demo APK**: [点击下载](http://app.visionsic.com/download/projectchat.apk)
22
+
23
+ 本模型基于Deepseek-R1-14B进行深度优化,通过三重训练策略显著增强角色扮演、小说文本生成与思维链(CoT)能力。特别适合需要长程上下文关联的创作场景。
24
+
25
+
26
+ ## 示例(因COT模型特点,上下文不连贯时可以使用Demo软件中的故事模式)
27
+ ![2.jpg](https://cdn-uploads.huggingface.co/production/uploads/650762d0eac45ee2e420a38b/-80ha-J8PpwSaiyHgr1k2.jpeg)
28
+
29
+ ## 目标
30
+ 针对原版Deepseek-R1-14B在长文本生成连贯性不足和角色扮演能力薄弱的核心缺陷(主要由于训练数据中小说类语料占比过低),本模型通过多阶段优化提升其角色扮演能力。
31
+
32
+ ## 模型亮点
33
+ 🔥 **四阶段进化架构**:
34
+ 1. **增量预训练**:注入0.4T Token 小说,使用16k上下文训练,增强文本连贯性(70%爱情动作小说)
35
+ 2. **Tifa-SFT**:融合全球Top4角色扮演模型Tifa的10万条高质量数据
36
+ 3. **CoT恢复训练**:采用Deepseek-32B/685B数据重建推理能力
37
+ 4. **RL强化**:保留发散性思维标签的同时优化生成质量
38
+
39
+ 💡 **工程创新**:
40
+ - 16k超长上下文训练
41
+ - 随机截断训练增强鲁棒性
42
+ - 8×H20 GPU全量微调
43
+
44
+ ## 模型详情
45
+ | 属性 | 规格 |
46
+ |-------|------|
47
+ | 基础架构 | Deepseek-R1-14B |
48
+ | 最大上下文 | 128k |
49
+ | 训练数据 | 0.4T小说 + 10万条SFT + Deepseek混合数据 |
50
+ | 训练设备 | 8×H20 GPU集群 |
51
+ | 量化支持 | GGUF(全系列量化计划中) |
52
+
53
+ ## 使用场景
54
+ ✅ **推荐场景**:
55
+ - 角色扮演对话
56
+ - 需要发散性思维的创意写作
57
+ - 复杂逻辑的思维链(CoT)推理
58
+ - 基于上下文的深度角色交互
59
+
60
+ ❌ **局限场景**:
61
+ - 数学计算与代码生成
62
+ - 短文本即时问答
63
+ - 需要严格事实性的场景
64
+
65
+ ## 注意事项
66
+ ⚠️ 本模型使用数据包含小说版权内容及Tifa模型衍生数据,请遵守:
67
+ 1. 禁止商用
68
+ 2. 角色扮演数据需遵循[Tifa使用协议](https://leftnorth.com/terms.html)
69
+ 3. 生成内容需符合当地法律法规
70
+
71
+
72
+ ## 💡 使用建议
73
+ **最佳实践**:
74
+ ```python
75
+ # 启用角色扮演模式
76
+ prompt = """<system>进入Tifa角色引擎...</system>
77
+ <user>你现在是流浪武士楚夜,正站在长安城屋顶上</user>
78
+ <think>
79
+ 需要体现人物孤傲的气质
80
+ 加入武侠特有的环境描写
81
+ 保持对话的冷峻风格
82
+ </think>
83
+ <楚夜>"""
84
+ ```
85
+
86
+ **参数推荐**:
87
+ ```python
88
+ generation_config = {
89
+ "temperature": 0.8,
90
+ "top_p": 0.8,
91
+ "repetition_penalty": 1.17,
92
+ "max_new_tokens": 1536,
93
+ "do_sample": True
94
+ }
95
+ ```
96
+
97
+ ## 致谢
98
+ - Deepseek系列模型提供的强大基座
99
+ - Tifa角色扮演模型的创新架构
100
+ - HuggingFace社区的量化工具支持
101
+
102
+
103
+ ---
104
+ license: apache-2.0
105
+ ---