lvyufeng commited on
Commit
8667bda
·
verified ·
1 Parent(s): e394149

Upload metadata/dsv4_dynamic_iq1m_complete.tensor_types.txt with huggingface_hub

Browse files
metadata/dsv4_dynamic_iq1m_complete.tensor_types.txt ADDED
@@ -0,0 +1,1328 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ^blk\.0\.ffn_gate_tid2eid\.weight$=i32
2
+ ^blk\.1\.ffn_gate_tid2eid\.weight$=i32
3
+ ^blk\.2\.ffn_gate_tid2eid\.weight$=i32
4
+ ^blk\.0\.ffn_gate_exps\.weight$=iq1_m
5
+ ^blk\.0\.ffn_down_exps\.weight$=q2_k
6
+ ^blk\.0\.ffn_up_exps\.weight$=iq1_m
7
+ ^blk\.1\.ffn_gate_exps\.weight$=iq1_m
8
+ ^blk\.1\.ffn_down_exps\.weight$=q2_k
9
+ ^blk\.1\.ffn_up_exps\.weight$=iq1_m
10
+ ^blk\.2\.ffn_gate_exps\.weight$=iq1_m
11
+ ^blk\.2\.ffn_down_exps\.weight$=q2_k
12
+ ^blk\.2\.ffn_up_exps\.weight$=iq1_m
13
+ ^blk\.3\.ffn_gate_exps\.weight$=iq1_m
14
+ ^blk\.3\.ffn_down_exps\.weight$=q2_k
15
+ ^blk\.3\.ffn_up_exps\.weight$=iq1_m
16
+ ^blk\.4\.ffn_gate_exps\.weight$=iq1_m
17
+ ^blk\.4\.ffn_down_exps\.weight$=q2_k
18
+ ^blk\.4\.ffn_up_exps\.weight$=iq1_m
19
+ ^blk\.5\.ffn_gate_exps\.weight$=iq1_m
20
+ ^blk\.5\.ffn_down_exps\.weight$=q2_k
21
+ ^blk\.5\.ffn_up_exps\.weight$=iq1_m
22
+ ^blk\.6\.ffn_gate_exps\.weight$=iq1_m
23
+ ^blk\.6\.ffn_down_exps\.weight$=iq1_m
24
+ ^blk\.6\.ffn_up_exps\.weight$=iq1_m
25
+ ^blk\.7\.ffn_gate_exps\.weight$=iq1_m
26
+ ^blk\.7\.ffn_down_exps\.weight$=iq1_m
27
+ ^blk\.7\.ffn_up_exps\.weight$=iq1_m
28
+ ^blk\.8\.ffn_gate_exps\.weight$=iq1_m
29
+ ^blk\.8\.ffn_down_exps\.weight$=iq1_m
30
+ ^blk\.8\.ffn_up_exps\.weight$=iq1_m
31
+ ^blk\.9\.ffn_gate_exps\.weight$=iq1_m
32
+ ^blk\.9\.ffn_down_exps\.weight$=iq1_m
33
+ ^blk\.9\.ffn_up_exps\.weight$=iq1_m
34
+ ^blk\.10\.ffn_gate_exps\.weight$=iq1_m
35
+ ^blk\.10\.ffn_down_exps\.weight$=iq1_m
36
+ ^blk\.10\.ffn_up_exps\.weight$=iq1_m
37
+ ^blk\.11\.ffn_gate_exps\.weight$=iq1_m
38
+ ^blk\.11\.ffn_down_exps\.weight$=iq1_m
39
+ ^blk\.11\.ffn_up_exps\.weight$=iq1_m
40
+ ^blk\.12\.ffn_gate_exps\.weight$=iq1_m
41
+ ^blk\.12\.ffn_down_exps\.weight$=iq1_m
42
+ ^blk\.12\.ffn_up_exps\.weight$=iq1_m
43
+ ^blk\.13\.ffn_gate_exps\.weight$=iq1_m
44
+ ^blk\.13\.ffn_down_exps\.weight$=iq1_m
45
+ ^blk\.13\.ffn_up_exps\.weight$=iq1_m
46
+ ^blk\.14\.ffn_gate_exps\.weight$=iq1_m
47
+ ^blk\.14\.ffn_down_exps\.weight$=iq1_m
48
+ ^blk\.14\.ffn_up_exps\.weight$=iq1_m
49
+ ^blk\.15\.ffn_gate_exps\.weight$=iq1_m
50
+ ^blk\.15\.ffn_down_exps\.weight$=iq1_m
51
+ ^blk\.15\.ffn_up_exps\.weight$=iq1_m
52
+ ^blk\.16\.ffn_gate_exps\.weight$=iq1_m
53
+ ^blk\.16\.ffn_down_exps\.weight$=iq1_m
54
+ ^blk\.16\.ffn_up_exps\.weight$=iq1_m
55
+ ^blk\.17\.ffn_gate_exps\.weight$=iq1_m
56
+ ^blk\.17\.ffn_down_exps\.weight$=iq1_m
57
+ ^blk\.17\.ffn_up_exps\.weight$=iq1_m
58
+ ^blk\.18\.ffn_gate_exps\.weight$=iq1_m
59
+ ^blk\.18\.ffn_down_exps\.weight$=iq1_m
60
+ ^blk\.18\.ffn_up_exps\.weight$=iq1_m
61
+ ^blk\.19\.ffn_gate_exps\.weight$=iq1_m
62
+ ^blk\.19\.ffn_down_exps\.weight$=iq1_m
63
+ ^blk\.19\.ffn_up_exps\.weight$=iq1_m
64
+ ^blk\.20\.ffn_gate_exps\.weight$=iq1_m
65
+ ^blk\.20\.ffn_down_exps\.weight$=iq1_m
66
+ ^blk\.20\.ffn_up_exps\.weight$=iq1_m
67
+ ^blk\.21\.ffn_gate_exps\.weight$=iq1_m
68
+ ^blk\.21\.ffn_down_exps\.weight$=iq1_m
69
+ ^blk\.21\.ffn_up_exps\.weight$=iq1_m
70
+ ^blk\.22\.ffn_gate_exps\.weight$=iq1_m
71
+ ^blk\.22\.ffn_down_exps\.weight$=iq1_m
72
+ ^blk\.22\.ffn_up_exps\.weight$=iq1_m
73
+ ^blk\.23\.ffn_gate_exps\.weight$=iq1_m
74
+ ^blk\.23\.ffn_down_exps\.weight$=iq1_m
75
+ ^blk\.23\.ffn_up_exps\.weight$=iq1_m
76
+ ^blk\.24\.ffn_gate_exps\.weight$=iq1_m
77
+ ^blk\.24\.ffn_down_exps\.weight$=iq1_m
78
+ ^blk\.24\.ffn_up_exps\.weight$=iq1_m
79
+ ^blk\.25\.ffn_gate_exps\.weight$=iq1_m
80
+ ^blk\.25\.ffn_down_exps\.weight$=iq1_m
81
+ ^blk\.25\.ffn_up_exps\.weight$=iq1_m
82
+ ^blk\.26\.ffn_gate_exps\.weight$=iq1_m
83
+ ^blk\.26\.ffn_down_exps\.weight$=iq1_m
84
+ ^blk\.26\.ffn_up_exps\.weight$=iq1_m
85
+ ^blk\.27\.ffn_gate_exps\.weight$=iq1_m
86
+ ^blk\.27\.ffn_down_exps\.weight$=iq1_m
87
+ ^blk\.27\.ffn_up_exps\.weight$=iq1_m
88
+ ^blk\.28\.ffn_gate_exps\.weight$=iq1_m
89
+ ^blk\.28\.ffn_down_exps\.weight$=iq1_m
90
+ ^blk\.28\.ffn_up_exps\.weight$=iq1_m
91
+ ^blk\.29\.ffn_gate_exps\.weight$=iq1_m
92
+ ^blk\.29\.ffn_down_exps\.weight$=iq1_m
93
+ ^blk\.29\.ffn_up_exps\.weight$=iq1_m
94
+ ^blk\.30\.ffn_gate_exps\.weight$=iq1_m
95
+ ^blk\.30\.ffn_down_exps\.weight$=iq1_m
96
+ ^blk\.30\.ffn_up_exps\.weight$=iq1_m
97
+ ^blk\.31\.ffn_gate_exps\.weight$=iq1_m
98
+ ^blk\.31\.ffn_down_exps\.weight$=iq1_m
99
+ ^blk\.31\.ffn_up_exps\.weight$=iq1_m
100
+ ^blk\.32\.ffn_gate_exps\.weight$=iq1_m
101
+ ^blk\.32\.ffn_down_exps\.weight$=iq1_m
102
+ ^blk\.32\.ffn_up_exps\.weight$=iq1_m
103
+ ^blk\.33\.ffn_gate_exps\.weight$=iq1_m
104
+ ^blk\.33\.ffn_down_exps\.weight$=iq1_m
105
+ ^blk\.33\.ffn_up_exps\.weight$=iq1_m
106
+ ^blk\.34\.ffn_gate_exps\.weight$=iq1_m
107
+ ^blk\.34\.ffn_down_exps\.weight$=iq1_m
108
+ ^blk\.34\.ffn_up_exps\.weight$=iq1_m
109
+ ^blk\.35\.ffn_gate_exps\.weight$=iq1_m
110
+ ^blk\.35\.ffn_down_exps\.weight$=iq1_m
111
+ ^blk\.35\.ffn_up_exps\.weight$=iq1_m
112
+ ^blk\.36\.ffn_gate_exps\.weight$=iq1_m
113
+ ^blk\.36\.ffn_down_exps\.weight$=iq1_m
114
+ ^blk\.36\.ffn_up_exps\.weight$=iq1_m
115
+ ^blk\.37\.ffn_gate_exps\.weight$=iq1_m
116
+ ^blk\.37\.ffn_down_exps\.weight$=iq1_m
117
+ ^blk\.37\.ffn_up_exps\.weight$=iq1_m
118
+ ^blk\.38\.ffn_gate_exps\.weight$=iq1_m
119
+ ^blk\.38\.ffn_down_exps\.weight$=iq1_m
120
+ ^blk\.38\.ffn_up_exps\.weight$=iq1_m
121
+ ^blk\.39\.ffn_gate_exps\.weight$=iq1_m
122
+ ^blk\.39\.ffn_down_exps\.weight$=iq1_m
123
+ ^blk\.39\.ffn_up_exps\.weight$=iq1_m
124
+ ^blk\.40\.ffn_gate_exps\.weight$=iq1_m
125
+ ^blk\.40\.ffn_down_exps\.weight$=iq1_m
126
+ ^blk\.40\.ffn_up_exps\.weight$=iq1_m
127
+ ^blk\.41\.ffn_gate_exps\.weight$=iq1_m
128
+ ^blk\.41\.ffn_down_exps\.weight$=iq1_m
129
+ ^blk\.41\.ffn_up_exps\.weight$=iq1_m
130
+ ^blk\.42\.ffn_gate_exps\.weight$=iq1_m
131
+ ^blk\.42\.ffn_down_exps\.weight$=iq1_m
132
+ ^blk\.42\.ffn_up_exps\.weight$=iq1_m
133
+ ^token_embd\.weight$=f16
134
+ ^blk\.0\.attn_kv\.weight$=q8_0
135
+ ^blk\.0\.attn_output_a\.weight$=q8_0
136
+ ^blk\.0\.attn_output_b\.weight$=q8_0
137
+ ^blk\.0\.attn_q_a\.weight$=q8_0
138
+ ^blk\.0\.attn_q_b\.weight$=q8_0
139
+ ^blk\.0\.ffn_gate_inp\.weight$=f16
140
+ ^blk\.0\.ffn_gate_shexp\.weight$=q8_0
141
+ ^blk\.0\.ffn_down_shexp\.weight$=q8_0
142
+ ^blk\.0\.ffn_up_shexp\.weight$=q8_0
143
+ ^blk\.0\.hc_attn_fn\.weight$=f16
144
+ ^blk\.0\.hc_ffn_fn\.weight$=f16
145
+ ^blk\.1\.attn_kv\.weight$=q8_0
146
+ ^blk\.1\.attn_output_a\.weight$=q8_0
147
+ ^blk\.1\.attn_output_b\.weight$=q8_0
148
+ ^blk\.1\.attn_q_a\.weight$=q8_0
149
+ ^blk\.1\.attn_q_b\.weight$=q8_0
150
+ ^blk\.1\.ffn_gate_inp\.weight$=f16
151
+ ^blk\.1\.ffn_gate_shexp\.weight$=q8_0
152
+ ^blk\.1\.ffn_down_shexp\.weight$=q8_0
153
+ ^blk\.1\.ffn_up_shexp\.weight$=q8_0
154
+ ^blk\.1\.hc_attn_fn\.weight$=f16
155
+ ^blk\.1\.hc_ffn_fn\.weight$=f16
156
+ ^blk\.2\.attn_compressor_ape\.weight$=f16
157
+ ^blk\.2\.attn_compressor_gate\.weight$=f16
158
+ ^blk\.2\.attn_compressor_kv\.weight$=f16
159
+ ^blk\.2\.indexer_compressor_ape\.weight$=f16
160
+ ^blk\.2\.indexer_compressor_gate\.weight$=f16
161
+ ^blk\.2\.indexer_compressor_kv\.weight$=f16
162
+ ^blk\.2\.indexer\.proj\.weight$=f16
163
+ ^blk\.2\.indexer\.attn_q_b\.weight$=f16
164
+ ^blk\.2\.attn_kv\.weight$=q8_0
165
+ ^blk\.2\.attn_output_a\.weight$=q8_0
166
+ ^blk\.2\.attn_output_b\.weight$=q8_0
167
+ ^blk\.2\.attn_q_a\.weight$=q8_0
168
+ ^blk\.2\.attn_q_b\.weight$=q8_0
169
+ ^blk\.2\.ffn_gate_inp\.weight$=f16
170
+ ^blk\.2\.ffn_gate_shexp\.weight$=q8_0
171
+ ^blk\.2\.ffn_down_shexp\.weight$=q8_0
172
+ ^blk\.2\.ffn_up_shexp\.weight$=q8_0
173
+ ^blk\.2\.hc_attn_fn\.weight$=f16
174
+ ^blk\.2\.hc_ffn_fn\.weight$=f16
175
+ ^blk\.3\.attn_compressor_ape\.weight$=f16
176
+ ^blk\.3\.attn_compressor_gate\.weight$=f16
177
+ ^blk\.3\.attn_compressor_kv\.weight$=f16
178
+ ^blk\.3\.attn_kv\.weight$=q8_0
179
+ ^blk\.3\.attn_output_a\.weight$=q8_0
180
+ ^blk\.3\.attn_output_b\.weight$=q8_0
181
+ ^blk\.3\.attn_q_a\.weight$=q8_0
182
+ ^blk\.3\.attn_q_b\.weight$=q8_0
183
+ ^blk\.3\.ffn_gate_inp\.weight$=f16
184
+ ^blk\.3\.ffn_gate_shexp\.weight$=q8_0
185
+ ^blk\.3\.ffn_down_shexp\.weight$=q8_0
186
+ ^blk\.3\.ffn_up_shexp\.weight$=q8_0
187
+ ^blk\.3\.hc_attn_fn\.weight$=f16
188
+ ^blk\.3\.hc_ffn_fn\.weight$=f16
189
+ ^blk\.4\.attn_compressor_ape\.weight$=f16
190
+ ^blk\.4\.attn_compressor_gate\.weight$=f16
191
+ ^blk\.4\.attn_compressor_kv\.weight$=f16
192
+ ^blk\.4\.indexer_compressor_ape\.weight$=f16
193
+ ^blk\.4\.indexer_compressor_gate\.weight$=f16
194
+ ^blk\.4\.indexer_compressor_kv\.weight$=f16
195
+ ^blk\.4\.indexer\.proj\.weight$=f16
196
+ ^blk\.4\.indexer\.attn_q_b\.weight$=f16
197
+ ^blk\.4\.attn_kv\.weight$=q8_0
198
+ ^blk\.4\.attn_output_a\.weight$=q8_0
199
+ ^blk\.4\.attn_output_b\.weight$=q8_0
200
+ ^blk\.4\.attn_q_a\.weight$=q8_0
201
+ ^blk\.4\.attn_q_b\.weight$=q8_0
202
+ ^blk\.4\.ffn_gate_inp\.weight$=f16
203
+ ^blk\.4\.ffn_gate_shexp\.weight$=q8_0
204
+ ^blk\.4\.ffn_down_shexp\.weight$=q8_0
205
+ ^blk\.4\.ffn_up_shexp\.weight$=q8_0
206
+ ^blk\.4\.hc_attn_fn\.weight$=f16
207
+ ^blk\.4\.hc_ffn_fn\.weight$=f16
208
+ ^blk\.5\.attn_compressor_ape\.weight$=f16
209
+ ^blk\.5\.attn_compressor_gate\.weight$=f16
210
+ ^blk\.5\.attn_compressor_kv\.weight$=f16
211
+ ^blk\.5\.attn_kv\.weight$=q8_0
212
+ ^blk\.5\.attn_output_a\.weight$=q8_0
213
+ ^blk\.5\.attn_output_b\.weight$=q8_0
214
+ ^blk\.5\.attn_q_a\.weight$=q8_0
215
+ ^blk\.5\.attn_q_b\.weight$=q8_0
216
+ ^blk\.5\.ffn_gate_inp\.weight$=f16
217
+ ^blk\.5\.ffn_gate_shexp\.weight$=q8_0
218
+ ^blk\.5\.ffn_down_shexp\.weight$=q8_0
219
+ ^blk\.5\.ffn_up_shexp\.weight$=q8_0
220
+ ^blk\.5\.hc_attn_fn\.weight$=f16
221
+ ^blk\.5\.hc_ffn_fn\.weight$=f16
222
+ ^blk\.6\.attn_compressor_ape\.weight$=f16
223
+ ^blk\.6\.attn_compressor_gate\.weight$=f16
224
+ ^blk\.6\.attn_compressor_kv\.weight$=f16
225
+ ^blk\.6\.indexer_compressor_ape\.weight$=f16
226
+ ^blk\.6\.indexer_compressor_gate\.weight$=f16
227
+ ^blk\.6\.indexer_compressor_kv\.weight$=f16
228
+ ^blk\.6\.indexer\.proj\.weight$=f16
229
+ ^blk\.6\.indexer\.attn_q_b\.weight$=f16
230
+ ^blk\.6\.attn_kv\.weight$=q8_0
231
+ ^blk\.6\.attn_output_a\.weight$=q8_0
232
+ ^blk\.6\.attn_output_b\.weight$=q8_0
233
+ ^blk\.6\.attn_q_a\.weight$=q8_0
234
+ ^blk\.6\.attn_q_b\.weight$=q8_0
235
+ ^blk\.6\.ffn_gate_inp\.weight$=f16
236
+ ^blk\.6\.ffn_gate_shexp\.weight$=q8_0
237
+ ^blk\.6\.ffn_down_shexp\.weight$=q8_0
238
+ ^blk\.6\.ffn_up_shexp\.weight$=q8_0
239
+ ^blk\.6\.hc_attn_fn\.weight$=f16
240
+ ^blk\.6\.hc_ffn_fn\.weight$=f16
241
+ ^blk\.7\.attn_compressor_ape\.weight$=f16
242
+ ^blk\.7\.attn_compressor_gate\.weight$=f16
243
+ ^blk\.7\.attn_compressor_kv\.weight$=f16
244
+ ^blk\.7\.attn_kv\.weight$=q8_0
245
+ ^blk\.7\.attn_output_a\.weight$=q8_0
246
+ ^blk\.7\.attn_output_b\.weight$=q8_0
247
+ ^blk\.7\.attn_q_a\.weight$=q8_0
248
+ ^blk\.7\.attn_q_b\.weight$=q8_0
249
+ ^blk\.7\.ffn_gate_inp\.weight$=f16
250
+ ^blk\.7\.ffn_gate_shexp\.weight$=q8_0
251
+ ^blk\.7\.ffn_down_shexp\.weight$=q8_0
252
+ ^blk\.7\.ffn_up_shexp\.weight$=q8_0
253
+ ^blk\.7\.hc_attn_fn\.weight$=f16
254
+ ^blk\.7\.hc_ffn_fn\.weight$=f16
255
+ ^blk\.8\.attn_compressor_ape\.weight$=f16
256
+ ^blk\.8\.attn_compressor_gate\.weight$=f16
257
+ ^blk\.8\.attn_compressor_kv\.weight$=f16
258
+ ^blk\.8\.indexer_compressor_ape\.weight$=f16
259
+ ^blk\.8\.indexer_compressor_gate\.weight$=f16
260
+ ^blk\.8\.indexer_compressor_kv\.weight$=f16
261
+ ^blk\.8\.indexer\.proj\.weight$=f16
262
+ ^blk\.8\.indexer\.attn_q_b\.weight$=f16
263
+ ^blk\.8\.attn_kv\.weight$=q8_0
264
+ ^blk\.8\.attn_output_a\.weight$=q8_0
265
+ ^blk\.8\.attn_output_b\.weight$=q8_0
266
+ ^blk\.8\.attn_q_a\.weight$=q8_0
267
+ ^blk\.8\.attn_q_b\.weight$=q8_0
268
+ ^blk\.8\.ffn_gate_inp\.weight$=f16
269
+ ^blk\.8\.ffn_gate_shexp\.weight$=q8_0
270
+ ^blk\.8\.ffn_down_shexp\.weight$=q8_0
271
+ ^blk\.8\.ffn_up_shexp\.weight$=q8_0
272
+ ^blk\.8\.hc_attn_fn\.weight$=f16
273
+ ^blk\.8\.hc_ffn_fn\.weight$=f16
274
+ ^blk\.9\.attn_compressor_ape\.weight$=f16
275
+ ^blk\.9\.attn_compressor_gate\.weight$=f16
276
+ ^blk\.9\.attn_compressor_kv\.weight$=f16
277
+ ^blk\.9\.attn_kv\.weight$=q8_0
278
+ ^blk\.9\.attn_output_a\.weight$=q8_0
279
+ ^blk\.9\.attn_output_b\.weight$=q8_0
280
+ ^blk\.9\.attn_q_a\.weight$=q8_0
281
+ ^blk\.9\.attn_q_b\.weight$=q8_0
282
+ ^blk\.9\.ffn_gate_inp\.weight$=f16
283
+ ^blk\.9\.ffn_gate_shexp\.weight$=q8_0
284
+ ^blk\.9\.ffn_down_shexp\.weight$=q8_0
285
+ ^blk\.9\.ffn_up_shexp\.weight$=q8_0
286
+ ^blk\.9\.hc_attn_fn\.weight$=f16
287
+ ^blk\.9\.hc_ffn_fn\.weight$=f16
288
+ ^blk\.10\.attn_compressor_ape\.weight$=f16
289
+ ^blk\.10\.attn_compressor_gate\.weight$=f16
290
+ ^blk\.10\.attn_compressor_kv\.weight$=f16
291
+ ^blk\.10\.indexer_compressor_ape\.weight$=f16
292
+ ^blk\.10\.indexer_compressor_gate\.weight$=f16
293
+ ^blk\.10\.indexer_compressor_kv\.weight$=f16
294
+ ^blk\.10\.indexer\.proj\.weight$=f16
295
+ ^blk\.10\.indexer\.attn_q_b\.weight$=f16
296
+ ^blk\.10\.attn_kv\.weight$=q8_0
297
+ ^blk\.10\.attn_output_a\.weight$=q8_0
298
+ ^blk\.10\.attn_output_b\.weight$=q8_0
299
+ ^blk\.10\.attn_q_a\.weight$=q8_0
300
+ ^blk\.10\.attn_q_b\.weight$=q8_0
301
+ ^blk\.10\.ffn_gate_inp\.weight$=f16
302
+ ^blk\.10\.ffn_gate_shexp\.weight$=q8_0
303
+ ^blk\.10\.ffn_down_shexp\.weight$=q8_0
304
+ ^blk\.10\.ffn_up_shexp\.weight$=q8_0
305
+ ^blk\.10\.hc_attn_fn\.weight$=f16
306
+ ^blk\.10\.hc_ffn_fn\.weight$=f16
307
+ ^blk\.11\.attn_compressor_ape\.weight$=f16
308
+ ^blk\.11\.attn_compressor_gate\.weight$=f16
309
+ ^blk\.11\.attn_compressor_kv\.weight$=f16
310
+ ^blk\.11\.attn_kv\.weight$=q8_0
311
+ ^blk\.11\.attn_output_a\.weight$=q8_0
312
+ ^blk\.11\.attn_output_b\.weight$=q8_0
313
+ ^blk\.11\.attn_q_a\.weight$=q8_0
314
+ ^blk\.11\.attn_q_b\.weight$=q8_0
315
+ ^blk\.11\.ffn_gate_inp\.weight$=f16
316
+ ^blk\.11\.ffn_gate_shexp\.weight$=q8_0
317
+ ^blk\.11\.ffn_down_shexp\.weight$=q8_0
318
+ ^blk\.11\.ffn_up_shexp\.weight$=q8_0
319
+ ^blk\.11\.hc_attn_fn\.weight$=f16
320
+ ^blk\.11\.hc_ffn_fn\.weight$=f16
321
+ ^blk\.12\.attn_compressor_ape\.weight$=f16
322
+ ^blk\.12\.attn_compressor_gate\.weight$=f16
323
+ ^blk\.12\.attn_compressor_kv\.weight$=f16
324
+ ^blk\.12\.indexer_compressor_ape\.weight$=f16
325
+ ^blk\.12\.indexer_compressor_gate\.weight$=f16
326
+ ^blk\.12\.indexer_compressor_kv\.weight$=f16
327
+ ^blk\.12\.indexer\.proj\.weight$=f16
328
+ ^blk\.12\.indexer\.attn_q_b\.weight$=f16
329
+ ^blk\.12\.attn_kv\.weight$=q8_0
330
+ ^blk\.12\.attn_output_a\.weight$=q8_0
331
+ ^blk\.12\.attn_output_b\.weight$=q8_0
332
+ ^blk\.12\.attn_q_a\.weight$=q8_0
333
+ ^blk\.12\.attn_q_b\.weight$=q8_0
334
+ ^blk\.12\.ffn_gate_inp\.weight$=f16
335
+ ^blk\.12\.ffn_gate_shexp\.weight$=q8_0
336
+ ^blk\.12\.ffn_down_shexp\.weight$=q8_0
337
+ ^blk\.12\.ffn_up_shexp\.weight$=q8_0
338
+ ^blk\.12\.hc_attn_fn\.weight$=f16
339
+ ^blk\.12\.hc_ffn_fn\.weight$=f16
340
+ ^blk\.13\.attn_compressor_ape\.weight$=f16
341
+ ^blk\.13\.attn_compressor_gate\.weight$=f16
342
+ ^blk\.13\.attn_compressor_kv\.weight$=f16
343
+ ^blk\.13\.attn_kv\.weight$=q8_0
344
+ ^blk\.13\.attn_output_a\.weight$=q8_0
345
+ ^blk\.13\.attn_output_b\.weight$=q8_0
346
+ ^blk\.13\.attn_q_a\.weight$=q8_0
347
+ ^blk\.13\.attn_q_b\.weight$=q8_0
348
+ ^blk\.13\.ffn_gate_inp\.weight$=f16
349
+ ^blk\.13\.ffn_gate_shexp\.weight$=q8_0
350
+ ^blk\.13\.ffn_down_shexp\.weight$=q8_0
351
+ ^blk\.13\.ffn_up_shexp\.weight$=q8_0
352
+ ^blk\.13\.hc_attn_fn\.weight$=f16
353
+ ^blk\.13\.hc_ffn_fn\.weight$=f16
354
+ ^blk\.14\.attn_compressor_ape\.weight$=f16
355
+ ^blk\.14\.attn_compressor_gate\.weight$=f16
356
+ ^blk\.14\.attn_compressor_kv\.weight$=f16
357
+ ^blk\.14\.indexer_compressor_ape\.weight$=f16
358
+ ^blk\.14\.indexer_compressor_gate\.weight$=f16
359
+ ^blk\.14\.indexer_compressor_kv\.weight$=f16
360
+ ^blk\.14\.indexer\.proj\.weight$=f16
361
+ ^blk\.14\.indexer\.attn_q_b\.weight$=f16
362
+ ^blk\.14\.attn_kv\.weight$=q8_0
363
+ ^blk\.14\.attn_output_a\.weight$=q8_0
364
+ ^blk\.14\.attn_output_b\.weight$=q8_0
365
+ ^blk\.14\.attn_q_a\.weight$=q8_0
366
+ ^blk\.14\.attn_q_b\.weight$=q8_0
367
+ ^blk\.14\.ffn_gate_inp\.weight$=f16
368
+ ^blk\.14\.ffn_gate_shexp\.weight$=q8_0
369
+ ^blk\.14\.ffn_down_shexp\.weight$=q8_0
370
+ ^blk\.14\.ffn_up_shexp\.weight$=q8_0
371
+ ^blk\.14\.hc_attn_fn\.weight$=f16
372
+ ^blk\.14\.hc_ffn_fn\.weight$=f16
373
+ ^blk\.15\.attn_compressor_ape\.weight$=f16
374
+ ^blk\.15\.attn_compressor_gate\.weight$=f16
375
+ ^blk\.15\.attn_compressor_kv\.weight$=f16
376
+ ^blk\.15\.attn_kv\.weight$=q8_0
377
+ ^blk\.15\.attn_output_a\.weight$=q8_0
378
+ ^blk\.15\.attn_output_b\.weight$=q8_0
379
+ ^blk\.15\.attn_q_a\.weight$=q8_0
380
+ ^blk\.15\.attn_q_b\.weight$=q8_0
381
+ ^blk\.15\.ffn_gate_inp\.weight$=f16
382
+ ^blk\.15\.ffn_gate_shexp\.weight$=q8_0
383
+ ^blk\.15\.ffn_down_shexp\.weight$=q8_0
384
+ ^blk\.15\.ffn_up_shexp\.weight$=q8_0
385
+ ^blk\.15\.hc_attn_fn\.weight$=f16
386
+ ^blk\.15\.hc_ffn_fn\.weight$=f16
387
+ ^blk\.16\.attn_compressor_ape\.weight$=f16
388
+ ^blk\.16\.attn_compressor_gate\.weight$=f16
389
+ ^blk\.16\.attn_compressor_kv\.weight$=f16
390
+ ^blk\.16\.indexer_compressor_ape\.weight$=f16
391
+ ^blk\.16\.indexer_compressor_gate\.weight$=f16
392
+ ^blk\.16\.indexer_compressor_kv\.weight$=f16
393
+ ^blk\.16\.indexer\.proj\.weight$=f16
394
+ ^blk\.16\.indexer\.attn_q_b\.weight$=f16
395
+ ^blk\.16\.attn_kv\.weight$=q8_0
396
+ ^blk\.16\.attn_output_a\.weight$=q8_0
397
+ ^blk\.16\.attn_output_b\.weight$=q8_0
398
+ ^blk\.16\.attn_q_a\.weight$=q8_0
399
+ ^blk\.16\.attn_q_b\.weight$=q8_0
400
+ ^blk\.16\.ffn_gate_inp\.weight$=f16
401
+ ^blk\.16\.ffn_gate_shexp\.weight$=q8_0
402
+ ^blk\.16\.ffn_down_shexp\.weight$=q8_0
403
+ ^blk\.16\.ffn_up_shexp\.weight$=q8_0
404
+ ^blk\.16\.hc_attn_fn\.weight$=f16
405
+ ^blk\.16\.hc_ffn_fn\.weight$=f16
406
+ ^blk\.17\.attn_compressor_ape\.weight$=f16
407
+ ^blk\.17\.attn_compressor_gate\.weight$=f16
408
+ ^blk\.17\.attn_compressor_kv\.weight$=f16
409
+ ^blk\.17\.attn_kv\.weight$=q8_0
410
+ ^blk\.17\.attn_output_a\.weight$=q8_0
411
+ ^blk\.17\.attn_output_b\.weight$=q8_0
412
+ ^blk\.17\.attn_q_a\.weight$=q8_0
413
+ ^blk\.17\.attn_q_b\.weight$=q8_0
414
+ ^blk\.17\.ffn_gate_inp\.weight$=f16
415
+ ^blk\.17\.ffn_gate_shexp\.weight$=q8_0
416
+ ^blk\.17\.ffn_down_shexp\.weight$=q8_0
417
+ ^blk\.17\.ffn_up_shexp\.weight$=q8_0
418
+ ^blk\.17\.hc_attn_fn\.weight$=f16
419
+ ^blk\.17\.hc_ffn_fn\.weight$=f16
420
+ ^blk\.18\.attn_compressor_ape\.weight$=f16
421
+ ^blk\.18\.attn_compressor_gate\.weight$=f16
422
+ ^blk\.18\.attn_compressor_kv\.weight$=f16
423
+ ^blk\.18\.indexer_compressor_ape\.weight$=f16
424
+ ^blk\.18\.indexer_compressor_gate\.weight$=f16
425
+ ^blk\.18\.indexer_compressor_kv\.weight$=f16
426
+ ^blk\.18\.indexer\.proj\.weight$=f16
427
+ ^blk\.18\.indexer\.attn_q_b\.weight$=f16
428
+ ^blk\.18\.attn_kv\.weight$=q8_0
429
+ ^blk\.18\.attn_output_a\.weight$=q8_0
430
+ ^blk\.18\.attn_output_b\.weight$=q8_0
431
+ ^blk\.18\.attn_q_a\.weight$=q8_0
432
+ ^blk\.18\.attn_q_b\.weight$=q8_0
433
+ ^blk\.18\.ffn_gate_inp\.weight$=f16
434
+ ^blk\.18\.ffn_gate_shexp\.weight$=q8_0
435
+ ^blk\.18\.ffn_down_shexp\.weight$=q8_0
436
+ ^blk\.18\.ffn_up_shexp\.weight$=q8_0
437
+ ^blk\.18\.hc_attn_fn\.weight$=f16
438
+ ^blk\.18\.hc_ffn_fn\.weight$=f16
439
+ ^blk\.19\.attn_compressor_ape\.weight$=f16
440
+ ^blk\.19\.attn_compressor_gate\.weight$=f16
441
+ ^blk\.19\.attn_compressor_kv\.weight$=f16
442
+ ^blk\.19\.attn_kv\.weight$=q8_0
443
+ ^blk\.19\.attn_output_a\.weight$=q8_0
444
+ ^blk\.19\.attn_output_b\.weight$=q8_0
445
+ ^blk\.19\.attn_q_a\.weight$=q8_0
446
+ ^blk\.19\.attn_q_b\.weight$=q8_0
447
+ ^blk\.19\.ffn_gate_inp\.weight$=f16
448
+ ^blk\.19\.ffn_gate_shexp\.weight$=q8_0
449
+ ^blk\.19\.ffn_down_shexp\.weight$=q8_0
450
+ ^blk\.19\.ffn_up_shexp\.weight$=q8_0
451
+ ^blk\.19\.hc_attn_fn\.weight$=f16
452
+ ^blk\.19\.hc_ffn_fn\.weight$=f16
453
+ ^blk\.20\.attn_compressor_ape\.weight$=f16
454
+ ^blk\.20\.attn_compressor_gate\.weight$=f16
455
+ ^blk\.20\.attn_compressor_kv\.weight$=f16
456
+ ^blk\.20\.indexer_compressor_ape\.weight$=f16
457
+ ^blk\.20\.indexer_compressor_gate\.weight$=f16
458
+ ^blk\.20\.indexer_compressor_kv\.weight$=f16
459
+ ^blk\.20\.indexer\.proj\.weight$=f16
460
+ ^blk\.20\.indexer\.attn_q_b\.weight$=f16
461
+ ^blk\.20\.attn_kv\.weight$=q8_0
462
+ ^blk\.20\.attn_output_a\.weight$=q8_0
463
+ ^blk\.20\.attn_output_b\.weight$=q8_0
464
+ ^blk\.20\.attn_q_a\.weight$=q8_0
465
+ ^blk\.20\.attn_q_b\.weight$=q8_0
466
+ ^blk\.20\.ffn_gate_inp\.weight$=f16
467
+ ^blk\.20\.ffn_gate_shexp\.weight$=q8_0
468
+ ^blk\.20\.ffn_down_shexp\.weight$=q8_0
469
+ ^blk\.20\.ffn_up_shexp\.weight$=q8_0
470
+ ^blk\.20\.hc_attn_fn\.weight$=f16
471
+ ^blk\.20\.hc_ffn_fn\.weight$=f16
472
+ ^blk\.21\.attn_compressor_ape\.weight$=f16
473
+ ^blk\.21\.attn_compressor_gate\.weight$=f16
474
+ ^blk\.21\.attn_compressor_kv\.weight$=f16
475
+ ^blk\.21\.attn_kv\.weight$=q8_0
476
+ ^blk\.21\.attn_output_a\.weight$=q8_0
477
+ ^blk\.21\.attn_output_b\.weight$=q8_0
478
+ ^blk\.21\.attn_q_a\.weight$=q8_0
479
+ ^blk\.21\.attn_q_b\.weight$=q8_0
480
+ ^blk\.21\.ffn_gate_inp\.weight$=f16
481
+ ^blk\.21\.ffn_gate_shexp\.weight$=q8_0
482
+ ^blk\.21\.ffn_down_shexp\.weight$=q8_0
483
+ ^blk\.21\.ffn_up_shexp\.weight$=q8_0
484
+ ^blk\.21\.hc_attn_fn\.weight$=f16
485
+ ^blk\.21\.hc_ffn_fn\.weight$=f16
486
+ ^blk\.22\.attn_compressor_ape\.weight$=f16
487
+ ^blk\.22\.attn_compressor_gate\.weight$=f16
488
+ ^blk\.22\.attn_compressor_kv\.weight$=f16
489
+ ^blk\.22\.indexer_compressor_ape\.weight$=f16
490
+ ^blk\.22\.indexer_compressor_gate\.weight$=f16
491
+ ^blk\.22\.indexer_compressor_kv\.weight$=f16
492
+ ^blk\.22\.indexer\.proj\.weight$=f16
493
+ ^blk\.22\.indexer\.attn_q_b\.weight$=f16
494
+ ^blk\.22\.attn_kv\.weight$=q8_0
495
+ ^blk\.22\.attn_output_a\.weight$=q8_0
496
+ ^blk\.22\.attn_output_b\.weight$=q8_0
497
+ ^blk\.22\.attn_q_a\.weight$=q8_0
498
+ ^blk\.22\.attn_q_b\.weight$=q8_0
499
+ ^blk\.22\.ffn_gate_inp\.weight$=f16
500
+ ^blk\.22\.ffn_gate_shexp\.weight$=q8_0
501
+ ^blk\.22\.ffn_down_shexp\.weight$=q8_0
502
+ ^blk\.22\.ffn_up_shexp\.weight$=q8_0
503
+ ^blk\.22\.hc_attn_fn\.weight$=f16
504
+ ^blk\.22\.hc_ffn_fn\.weight$=f16
505
+ ^blk\.23\.attn_compressor_ape\.weight$=f16
506
+ ^blk\.23\.attn_compressor_gate\.weight$=f16
507
+ ^blk\.23\.attn_compressor_kv\.weight$=f16
508
+ ^blk\.23\.attn_kv\.weight$=q8_0
509
+ ^blk\.23\.attn_output_a\.weight$=q8_0
510
+ ^blk\.23\.attn_output_b\.weight$=q8_0
511
+ ^blk\.23\.attn_q_a\.weight$=q8_0
512
+ ^blk\.23\.attn_q_b\.weight$=q8_0
513
+ ^blk\.23\.ffn_gate_inp\.weight$=f16
514
+ ^blk\.23\.ffn_gate_shexp\.weight$=q8_0
515
+ ^blk\.23\.ffn_down_shexp\.weight$=q8_0
516
+ ^blk\.23\.ffn_up_shexp\.weight$=q8_0
517
+ ^blk\.23\.hc_attn_fn\.weight$=f16
518
+ ^blk\.23\.hc_ffn_fn\.weight$=f16
519
+ ^blk\.24\.attn_compressor_ape\.weight$=f16
520
+ ^blk\.24\.attn_compressor_gate\.weight$=f16
521
+ ^blk\.24\.attn_compressor_kv\.weight$=f16
522
+ ^blk\.24\.indexer_compressor_ape\.weight$=f16
523
+ ^blk\.24\.indexer_compressor_gate\.weight$=f16
524
+ ^blk\.24\.indexer_compressor_kv\.weight$=f16
525
+ ^blk\.24\.indexer\.proj\.weight$=f16
526
+ ^blk\.24\.indexer\.attn_q_b\.weight$=f16
527
+ ^blk\.24\.attn_kv\.weight$=q8_0
528
+ ^blk\.24\.attn_output_a\.weight$=q8_0
529
+ ^blk\.24\.attn_output_b\.weight$=q8_0
530
+ ^blk\.24\.attn_q_a\.weight$=q8_0
531
+ ^blk\.24\.attn_q_b\.weight$=q8_0
532
+ ^blk\.24\.ffn_gate_inp\.weight$=f16
533
+ ^blk\.24\.ffn_gate_shexp\.weight$=q8_0
534
+ ^blk\.24\.ffn_down_shexp\.weight$=q8_0
535
+ ^blk\.24\.ffn_up_shexp\.weight$=q8_0
536
+ ^blk\.24\.hc_attn_fn\.weight$=f16
537
+ ^blk\.24\.hc_ffn_fn\.weight$=f16
538
+ ^blk\.25\.attn_compressor_ape\.weight$=f16
539
+ ^blk\.25\.attn_compressor_gate\.weight$=f16
540
+ ^blk\.25\.attn_compressor_kv\.weight$=f16
541
+ ^blk\.25\.attn_kv\.weight$=q8_0
542
+ ^blk\.25\.attn_output_a\.weight$=q8_0
543
+ ^blk\.25\.attn_output_b\.weight$=q8_0
544
+ ^blk\.25\.attn_q_a\.weight$=q8_0
545
+ ^blk\.25\.attn_q_b\.weight$=q8_0
546
+ ^blk\.25\.ffn_gate_inp\.weight$=f16
547
+ ^blk\.25\.ffn_gate_shexp\.weight$=q8_0
548
+ ^blk\.25\.ffn_down_shexp\.weight$=q8_0
549
+ ^blk\.25\.ffn_up_shexp\.weight$=q8_0
550
+ ^blk\.25\.hc_attn_fn\.weight$=f16
551
+ ^blk\.25\.hc_ffn_fn\.weight$=f16
552
+ ^blk\.26\.attn_compressor_ape\.weight$=f16
553
+ ^blk\.26\.attn_compressor_gate\.weight$=f16
554
+ ^blk\.26\.attn_compressor_kv\.weight$=f16
555
+ ^blk\.26\.indexer_compressor_ape\.weight$=f16
556
+ ^blk\.26\.indexer_compressor_gate\.weight$=f16
557
+ ^blk\.26\.indexer_compressor_kv\.weight$=f16
558
+ ^blk\.26\.indexer\.proj\.weight$=f16
559
+ ^blk\.26\.indexer\.attn_q_b\.weight$=f16
560
+ ^blk\.26\.attn_kv\.weight$=q8_0
561
+ ^blk\.26\.attn_output_a\.weight$=q8_0
562
+ ^blk\.26\.attn_output_b\.weight$=q8_0
563
+ ^blk\.26\.attn_q_a\.weight$=q8_0
564
+ ^blk\.26\.attn_q_b\.weight$=q8_0
565
+ ^blk\.26\.ffn_gate_inp\.weight$=f16
566
+ ^blk\.26\.ffn_gate_shexp\.weight$=q8_0
567
+ ^blk\.26\.ffn_down_shexp\.weight$=q8_0
568
+ ^blk\.26\.ffn_up_shexp\.weight$=q8_0
569
+ ^blk\.26\.hc_attn_fn\.weight$=f16
570
+ ^blk\.26\.hc_ffn_fn\.weight$=f16
571
+ ^blk\.27\.attn_compressor_ape\.weight$=f16
572
+ ^blk\.27\.attn_compressor_gate\.weight$=f16
573
+ ^blk\.27\.attn_compressor_kv\.weight$=f16
574
+ ^blk\.27\.attn_kv\.weight$=q8_0
575
+ ^blk\.27\.attn_output_a\.weight$=q8_0
576
+ ^blk\.27\.attn_output_b\.weight$=q8_0
577
+ ^blk\.27\.attn_q_a\.weight$=q8_0
578
+ ^blk\.27\.attn_q_b\.weight$=q8_0
579
+ ^blk\.27\.ffn_gate_inp\.weight$=f16
580
+ ^blk\.27\.ffn_gate_shexp\.weight$=q8_0
581
+ ^blk\.27\.ffn_down_shexp\.weight$=q8_0
582
+ ^blk\.27\.ffn_up_shexp\.weight$=q8_0
583
+ ^blk\.27\.hc_attn_fn\.weight$=f16
584
+ ^blk\.27\.hc_ffn_fn\.weight$=f16
585
+ ^blk\.28\.attn_compressor_ape\.weight$=f16
586
+ ^blk\.28\.attn_compressor_gate\.weight$=f16
587
+ ^blk\.28\.attn_compressor_kv\.weight$=f16
588
+ ^blk\.28\.indexer_compressor_ape\.weight$=f16
589
+ ^blk\.28\.indexer_compressor_gate\.weight$=f16
590
+ ^blk\.28\.indexer_compressor_kv\.weight$=f16
591
+ ^blk\.28\.indexer\.proj\.weight$=f16
592
+ ^blk\.28\.indexer\.attn_q_b\.weight$=f16
593
+ ^blk\.28\.attn_kv\.weight$=q8_0
594
+ ^blk\.28\.attn_output_a\.weight$=q8_0
595
+ ^blk\.28\.attn_output_b\.weight$=q8_0
596
+ ^blk\.28\.attn_q_a\.weight$=q8_0
597
+ ^blk\.28\.attn_q_b\.weight$=q8_0
598
+ ^blk\.28\.ffn_gate_inp\.weight$=f16
599
+ ^blk\.28\.ffn_gate_shexp\.weight$=q8_0
600
+ ^blk\.28\.ffn_down_shexp\.weight$=q8_0
601
+ ^blk\.28\.ffn_up_shexp\.weight$=q8_0
602
+ ^blk\.28\.hc_attn_fn\.weight$=f16
603
+ ^blk\.28\.hc_ffn_fn\.weight$=f16
604
+ ^blk\.29\.attn_compressor_ape\.weight$=f16
605
+ ^blk\.29\.attn_compressor_gate\.weight$=f16
606
+ ^blk\.29\.attn_compressor_kv\.weight$=f16
607
+ ^blk\.29\.attn_kv\.weight$=q8_0
608
+ ^blk\.29\.attn_output_a\.weight$=q8_0
609
+ ^blk\.29\.attn_output_b\.weight$=q8_0
610
+ ^blk\.29\.attn_q_a\.weight$=q8_0
611
+ ^blk\.29\.attn_q_b\.weight$=q8_0
612
+ ^blk\.29\.ffn_gate_inp\.weight$=f16
613
+ ^blk\.29\.ffn_gate_shexp\.weight$=q8_0
614
+ ^blk\.29\.ffn_down_shexp\.weight$=q8_0
615
+ ^blk\.29\.ffn_up_shexp\.weight$=q8_0
616
+ ^blk\.29\.hc_attn_fn\.weight$=f16
617
+ ^blk\.29\.hc_ffn_fn\.weight$=f16
618
+ ^blk\.30\.attn_compressor_ape\.weight$=f16
619
+ ^blk\.30\.attn_compressor_gate\.weight$=f16
620
+ ^blk\.30\.attn_compressor_kv\.weight$=f16
621
+ ^blk\.30\.indexer_compressor_ape\.weight$=f16
622
+ ^blk\.30\.indexer_compressor_gate\.weight$=f16
623
+ ^blk\.30\.indexer_compressor_kv\.weight$=f16
624
+ ^blk\.30\.indexer\.proj\.weight$=f16
625
+ ^blk\.30\.indexer\.attn_q_b\.weight$=f16
626
+ ^blk\.30\.attn_kv\.weight$=q8_0
627
+ ^blk\.30\.attn_output_a\.weight$=q8_0
628
+ ^blk\.30\.attn_output_b\.weight$=q8_0
629
+ ^blk\.30\.attn_q_a\.weight$=q8_0
630
+ ^blk\.30\.attn_q_b\.weight$=q8_0
631
+ ^blk\.30\.ffn_gate_inp\.weight$=f16
632
+ ^blk\.30\.ffn_gate_shexp\.weight$=q8_0
633
+ ^blk\.30\.ffn_down_shexp\.weight$=q8_0
634
+ ^blk\.30\.ffn_up_shexp\.weight$=q8_0
635
+ ^blk\.30\.hc_attn_fn\.weight$=f16
636
+ ^blk\.30\.hc_ffn_fn\.weight$=f16
637
+ ^blk\.31\.attn_compressor_ape\.weight$=f16
638
+ ^blk\.31\.attn_compressor_gate\.weight$=f16
639
+ ^blk\.31\.attn_compressor_kv\.weight$=f16
640
+ ^blk\.31\.attn_kv\.weight$=q8_0
641
+ ^blk\.31\.attn_output_a\.weight$=q8_0
642
+ ^blk\.31\.attn_output_b\.weight$=q8_0
643
+ ^blk\.31\.attn_q_a\.weight$=q8_0
644
+ ^blk\.31\.attn_q_b\.weight$=q8_0
645
+ ^blk\.31\.ffn_gate_inp\.weight$=f16
646
+ ^blk\.31\.ffn_gate_shexp\.weight$=q8_0
647
+ ^blk\.31\.ffn_down_shexp\.weight$=q8_0
648
+ ^blk\.31\.ffn_up_shexp\.weight$=q8_0
649
+ ^blk\.31\.hc_attn_fn\.weight$=f16
650
+ ^blk\.31\.hc_ffn_fn\.weight$=f16
651
+ ^blk\.32\.attn_compressor_ape\.weight$=f16
652
+ ^blk\.32\.attn_compressor_gate\.weight$=f16
653
+ ^blk\.32\.attn_compressor_kv\.weight$=f16
654
+ ^blk\.32\.indexer_compressor_ape\.weight$=f16
655
+ ^blk\.32\.indexer_compressor_gate\.weight$=f16
656
+ ^blk\.32\.indexer_compressor_kv\.weight$=f16
657
+ ^blk\.32\.indexer\.proj\.weight$=f16
658
+ ^blk\.32\.indexer\.attn_q_b\.weight$=f16
659
+ ^blk\.32\.attn_kv\.weight$=q8_0
660
+ ^blk\.32\.attn_output_a\.weight$=q8_0
661
+ ^blk\.32\.attn_output_b\.weight$=q8_0
662
+ ^blk\.32\.attn_q_a\.weight$=q8_0
663
+ ^blk\.32\.attn_q_b\.weight$=q8_0
664
+ ^blk\.32\.ffn_gate_inp\.weight$=f16
665
+ ^blk\.32\.ffn_gate_shexp\.weight$=q8_0
666
+ ^blk\.32\.ffn_down_shexp\.weight$=q8_0
667
+ ^blk\.32\.ffn_up_shexp\.weight$=q8_0
668
+ ^blk\.32\.hc_attn_fn\.weight$=f16
669
+ ^blk\.32\.hc_ffn_fn\.weight$=f16
670
+ ^blk\.33\.attn_compressor_ape\.weight$=f16
671
+ ^blk\.33\.attn_compressor_gate\.weight$=f16
672
+ ^blk\.33\.attn_compressor_kv\.weight$=f16
673
+ ^blk\.33\.attn_kv\.weight$=q8_0
674
+ ^blk\.33\.attn_output_a\.weight$=q8_0
675
+ ^blk\.33\.attn_output_b\.weight$=q8_0
676
+ ^blk\.33\.attn_q_a\.weight$=q8_0
677
+ ^blk\.33\.attn_q_b\.weight$=q8_0
678
+ ^blk\.33\.ffn_gate_inp\.weight$=f16
679
+ ^blk\.33\.ffn_gate_shexp\.weight$=q8_0
680
+ ^blk\.33\.ffn_down_shexp\.weight$=q8_0
681
+ ^blk\.33\.ffn_up_shexp\.weight$=q8_0
682
+ ^blk\.33\.hc_attn_fn\.weight$=f16
683
+ ^blk\.33\.hc_ffn_fn\.weight$=f16
684
+ ^blk\.34\.attn_compressor_ape\.weight$=f16
685
+ ^blk\.34\.attn_compressor_gate\.weight$=f16
686
+ ^blk\.34\.attn_compressor_kv\.weight$=f16
687
+ ^blk\.34\.indexer_compressor_ape\.weight$=f16
688
+ ^blk\.34\.indexer_compressor_gate\.weight$=f16
689
+ ^blk\.34\.indexer_compressor_kv\.weight$=f16
690
+ ^blk\.34\.indexer\.proj\.weight$=f16
691
+ ^blk\.34\.indexer\.attn_q_b\.weight$=f16
692
+ ^blk\.34\.attn_kv\.weight$=q8_0
693
+ ^blk\.34\.attn_output_a\.weight$=q8_0
694
+ ^blk\.34\.attn_output_b\.weight$=q8_0
695
+ ^blk\.34\.attn_q_a\.weight$=q8_0
696
+ ^blk\.34\.attn_q_b\.weight$=q8_0
697
+ ^blk\.34\.ffn_gate_inp\.weight$=f16
698
+ ^blk\.34\.ffn_gate_shexp\.weight$=q8_0
699
+ ^blk\.34\.ffn_down_shexp\.weight$=q8_0
700
+ ^blk\.34\.ffn_up_shexp\.weight$=q8_0
701
+ ^blk\.34\.hc_attn_fn\.weight$=f16
702
+ ^blk\.34\.hc_ffn_fn\.weight$=f16
703
+ ^blk\.35\.attn_compressor_ape\.weight$=f16
704
+ ^blk\.35\.attn_compressor_gate\.weight$=f16
705
+ ^blk\.35\.attn_compressor_kv\.weight$=f16
706
+ ^blk\.35\.attn_kv\.weight$=q8_0
707
+ ^blk\.35\.attn_output_a\.weight$=q8_0
708
+ ^blk\.35\.attn_output_b\.weight$=q8_0
709
+ ^blk\.35\.attn_q_a\.weight$=q8_0
710
+ ^blk\.35\.attn_q_b\.weight$=q8_0
711
+ ^blk\.35\.ffn_gate_inp\.weight$=f16
712
+ ^blk\.35\.ffn_gate_shexp\.weight$=q8_0
713
+ ^blk\.35\.ffn_down_shexp\.weight$=q8_0
714
+ ^blk\.35\.ffn_up_shexp\.weight$=q8_0
715
+ ^blk\.35\.hc_attn_fn\.weight$=f16
716
+ ^blk\.35\.hc_ffn_fn\.weight$=f16
717
+ ^blk\.36\.attn_compressor_ape\.weight$=f16
718
+ ^blk\.36\.attn_compressor_gate\.weight$=f16
719
+ ^blk\.36\.attn_compressor_kv\.weight$=f16
720
+ ^blk\.36\.indexer_compressor_ape\.weight$=f16
721
+ ^blk\.36\.indexer_compressor_gate\.weight$=f16
722
+ ^blk\.36\.indexer_compressor_kv\.weight$=f16
723
+ ^blk\.36\.indexer\.proj\.weight$=f16
724
+ ^blk\.36\.indexer\.attn_q_b\.weight$=f16
725
+ ^blk\.36\.attn_kv\.weight$=q8_0
726
+ ^blk\.36\.attn_output_a\.weight$=q8_0
727
+ ^blk\.36\.attn_output_b\.weight$=q8_0
728
+ ^blk\.36\.attn_q_a\.weight$=q8_0
729
+ ^blk\.36\.attn_q_b\.weight$=q8_0
730
+ ^blk\.36\.ffn_gate_inp\.weight$=f16
731
+ ^blk\.36\.ffn_gate_shexp\.weight$=q8_0
732
+ ^blk\.36\.ffn_down_shexp\.weight$=q8_0
733
+ ^blk\.36\.ffn_up_shexp\.weight$=q8_0
734
+ ^blk\.36\.hc_attn_fn\.weight$=f16
735
+ ^blk\.36\.hc_ffn_fn\.weight$=f16
736
+ ^blk\.37\.attn_compressor_ape\.weight$=f16
737
+ ^blk\.37\.attn_compressor_gate\.weight$=f16
738
+ ^blk\.37\.attn_compressor_kv\.weight$=f16
739
+ ^blk\.37\.attn_kv\.weight$=q8_0
740
+ ^blk\.37\.attn_output_a\.weight$=q8_0
741
+ ^blk\.37\.attn_output_b\.weight$=q8_0
742
+ ^blk\.37\.attn_q_a\.weight$=q8_0
743
+ ^blk\.37\.attn_q_b\.weight$=q8_0
744
+ ^blk\.37\.ffn_gate_inp\.weight$=f16
745
+ ^blk\.37\.ffn_gate_shexp\.weight$=q8_0
746
+ ^blk\.37\.ffn_down_shexp\.weight$=q8_0
747
+ ^blk\.37\.ffn_up_shexp\.weight$=q8_0
748
+ ^blk\.37\.hc_attn_fn\.weight$=f16
749
+ ^blk\.37\.hc_ffn_fn\.weight$=f16
750
+ ^blk\.38\.attn_compressor_ape\.weight$=f16
751
+ ^blk\.38\.attn_compressor_gate\.weight$=f16
752
+ ^blk\.38\.attn_compressor_kv\.weight$=f16
753
+ ^blk\.38\.indexer_compressor_ape\.weight$=f16
754
+ ^blk\.38\.indexer_compressor_gate\.weight$=f16
755
+ ^blk\.38\.indexer_compressor_kv\.weight$=f16
756
+ ^blk\.38\.indexer\.proj\.weight$=f16
757
+ ^blk\.38\.indexer\.attn_q_b\.weight$=f16
758
+ ^blk\.38\.attn_kv\.weight$=q8_0
759
+ ^blk\.38\.attn_output_a\.weight$=q8_0
760
+ ^blk\.38\.attn_output_b\.weight$=q8_0
761
+ ^blk\.38\.attn_q_a\.weight$=q8_0
762
+ ^blk\.38\.attn_q_b\.weight$=q8_0
763
+ ^blk\.38\.ffn_gate_inp\.weight$=f16
764
+ ^blk\.38\.ffn_gate_shexp\.weight$=q8_0
765
+ ^blk\.38\.ffn_down_shexp\.weight$=q8_0
766
+ ^blk\.38\.ffn_up_shexp\.weight$=q8_0
767
+ ^blk\.38\.hc_attn_fn\.weight$=f16
768
+ ^blk\.38\.hc_ffn_fn\.weight$=f16
769
+ ^blk\.39\.attn_compressor_ape\.weight$=f16
770
+ ^blk\.39\.attn_compressor_gate\.weight$=f16
771
+ ^blk\.39\.attn_compressor_kv\.weight$=f16
772
+ ^blk\.39\.attn_kv\.weight$=q8_0
773
+ ^blk\.39\.attn_output_a\.weight$=q8_0
774
+ ^blk\.39\.attn_output_b\.weight$=q8_0
775
+ ^blk\.39\.attn_q_a\.weight$=q8_0
776
+ ^blk\.39\.attn_q_b\.weight$=q8_0
777
+ ^blk\.39\.ffn_gate_inp\.weight$=f16
778
+ ^blk\.39\.ffn_gate_shexp\.weight$=q8_0
779
+ ^blk\.39\.ffn_down_shexp\.weight$=q8_0
780
+ ^blk\.39\.ffn_up_shexp\.weight$=q8_0
781
+ ^blk\.39\.hc_attn_fn\.weight$=f16
782
+ ^blk\.39\.hc_ffn_fn\.weight$=f16
783
+ ^blk\.40\.attn_compressor_ape\.weight$=f16
784
+ ^blk\.40\.attn_compressor_gate\.weight$=f16
785
+ ^blk\.40\.attn_compressor_kv\.weight$=f16
786
+ ^blk\.40\.indexer_compressor_ape\.weight$=f16
787
+ ^blk\.40\.indexer_compressor_gate\.weight$=f16
788
+ ^blk\.40\.indexer_compressor_kv\.weight$=f16
789
+ ^blk\.40\.indexer\.proj\.weight$=f16
790
+ ^blk\.40\.indexer\.attn_q_b\.weight$=f16
791
+ ^blk\.40\.attn_kv\.weight$=q8_0
792
+ ^blk\.40\.attn_output_a\.weight$=q8_0
793
+ ^blk\.40\.attn_output_b\.weight$=q8_0
794
+ ^blk\.40\.attn_q_a\.weight$=q8_0
795
+ ^blk\.40\.attn_q_b\.weight$=q8_0
796
+ ^blk\.40\.ffn_gate_inp\.weight$=f16
797
+ ^blk\.40\.ffn_gate_shexp\.weight$=q8_0
798
+ ^blk\.40\.ffn_down_shexp\.weight$=q8_0
799
+ ^blk\.40\.ffn_up_shexp\.weight$=q8_0
800
+ ^blk\.40\.hc_attn_fn\.weight$=f16
801
+ ^blk\.40\.hc_ffn_fn\.weight$=f16
802
+ ^blk\.41\.attn_compressor_ape\.weight$=f16
803
+ ^blk\.41\.attn_compressor_gate\.weight$=f16
804
+ ^blk\.41\.attn_compressor_kv\.weight$=f16
805
+ ^blk\.41\.attn_kv\.weight$=q8_0
806
+ ^blk\.41\.attn_output_a\.weight$=q8_0
807
+ ^blk\.41\.attn_output_b\.weight$=q8_0
808
+ ^blk\.41\.attn_q_a\.weight$=q8_0
809
+ ^blk\.41\.attn_q_b\.weight$=q8_0
810
+ ^blk\.41\.ffn_gate_inp\.weight$=f16
811
+ ^blk\.41\.ffn_gate_shexp\.weight$=q8_0
812
+ ^blk\.41\.ffn_down_shexp\.weight$=q8_0
813
+ ^blk\.41\.ffn_up_shexp\.weight$=q8_0
814
+ ^blk\.41\.hc_attn_fn\.weight$=f16
815
+ ^blk\.41\.hc_ffn_fn\.weight$=f16
816
+ ^blk\.42\.attn_compressor_ape\.weight$=f16
817
+ ^blk\.42\.attn_compressor_gate\.weight$=f16
818
+ ^blk\.42\.attn_compressor_kv\.weight$=f16
819
+ ^blk\.42\.indexer_compressor_ape\.weight$=f16
820
+ ^blk\.42\.indexer_compressor_gate\.weight$=f16
821
+ ^blk\.42\.indexer_compressor_kv\.weight$=f16
822
+ ^blk\.42\.indexer\.proj\.weight$=f16
823
+ ^blk\.42\.indexer\.attn_q_b\.weight$=f16
824
+ ^blk\.42\.attn_kv\.weight$=q8_0
825
+ ^blk\.42\.attn_output_a\.weight$=q8_0
826
+ ^blk\.42\.attn_output_b\.weight$=q8_0
827
+ ^blk\.42\.attn_q_a\.weight$=q8_0
828
+ ^blk\.42\.attn_q_b\.weight$=q8_0
829
+ ^blk\.42\.ffn_gate_inp\.weight$=f16
830
+ ^blk\.42\.ffn_gate_shexp\.weight$=q8_0
831
+ ^blk\.42\.ffn_down_shexp\.weight$=q8_0
832
+ ^blk\.42\.ffn_up_shexp\.weight$=q8_0
833
+ ^blk\.42\.hc_attn_fn\.weight$=f16
834
+ ^blk\.42\.hc_ffn_fn\.weight$=f16
835
+ ^output_hc_fn\.weight$=f16
836
+ ^output\.weight$=q8_0
837
+ ^blk\.0\.attn_sinks\.weight$=f32
838
+ ^blk\.0\.attn_kv_a_norm\.weight$=f32
839
+ ^blk\.0\.attn_q_a_norm\.weight$=f32
840
+ ^blk\.0\.attn_norm\.weight$=f32
841
+ ^blk\.0\.ffn_norm\.weight$=f32
842
+ ^blk\.0\.hc_attn_base\.weight$=f32
843
+ ^blk\.0\.hc_attn_scale\.weight$=f32
844
+ ^blk\.0\.hc_ffn_base\.weight$=f32
845
+ ^blk\.0\.hc_ffn_scale\.weight$=f32
846
+ ^blk\.1\.attn_sinks\.weight$=f32
847
+ ^blk\.1\.attn_kv_a_norm\.weight$=f32
848
+ ^blk\.1\.attn_q_a_norm\.weight$=f32
849
+ ^blk\.1\.attn_norm\.weight$=f32
850
+ ^blk\.1\.ffn_norm\.weight$=f32
851
+ ^blk\.1\.hc_attn_base\.weight$=f32
852
+ ^blk\.1\.hc_attn_scale\.weight$=f32
853
+ ^blk\.1\.hc_ffn_base\.weight$=f32
854
+ ^blk\.1\.hc_ffn_scale\.weight$=f32
855
+ ^blk\.2\.attn_sinks\.weight$=f32
856
+ ^blk\.2\.attn_compressor_norm\.weight$=f32
857
+ ^blk\.2\.indexer_compressor_norm\.weight$=f32
858
+ ^blk\.2\.attn_kv_a_norm\.weight$=f32
859
+ ^blk\.2\.attn_q_a_norm\.weight$=f32
860
+ ^blk\.2\.attn_norm\.weight$=f32
861
+ ^blk\.2\.ffn_norm\.weight$=f32
862
+ ^blk\.2\.hc_attn_base\.weight$=f32
863
+ ^blk\.2\.hc_attn_scale\.weight$=f32
864
+ ^blk\.2\.hc_ffn_base\.weight$=f32
865
+ ^blk\.2\.hc_ffn_scale\.weight$=f32
866
+ ^blk\.3\.attn_sinks\.weight$=f32
867
+ ^blk\.3\.attn_compressor_norm\.weight$=f32
868
+ ^blk\.3\.attn_kv_a_norm\.weight$=f32
869
+ ^blk\.3\.attn_q_a_norm\.weight$=f32
870
+ ^blk\.3\.attn_norm\.weight$=f32
871
+ ^blk\.3\.exp_probs_b\.bias$=f32
872
+ ^blk\.3\.ffn_norm\.weight$=f32
873
+ ^blk\.3\.hc_attn_base\.weight$=f32
874
+ ^blk\.3\.hc_attn_scale\.weight$=f32
875
+ ^blk\.3\.hc_ffn_base\.weight$=f32
876
+ ^blk\.3\.hc_ffn_scale\.weight$=f32
877
+ ^blk\.4\.attn_sinks\.weight$=f32
878
+ ^blk\.4\.attn_compressor_norm\.weight$=f32
879
+ ^blk\.4\.indexer_compressor_norm\.weight$=f32
880
+ ^blk\.4\.attn_kv_a_norm\.weight$=f32
881
+ ^blk\.4\.attn_q_a_norm\.weight$=f32
882
+ ^blk\.4\.attn_norm\.weight$=f32
883
+ ^blk\.4\.exp_probs_b\.bias$=f32
884
+ ^blk\.4\.ffn_norm\.weight$=f32
885
+ ^blk\.4\.hc_attn_base\.weight$=f32
886
+ ^blk\.4\.hc_attn_scale\.weight$=f32
887
+ ^blk\.4\.hc_ffn_base\.weight$=f32
888
+ ^blk\.4\.hc_ffn_scale\.weight$=f32
889
+ ^blk\.5\.attn_sinks\.weight$=f32
890
+ ^blk\.5\.attn_compressor_norm\.weight$=f32
891
+ ^blk\.5\.attn_kv_a_norm\.weight$=f32
892
+ ^blk\.5\.attn_q_a_norm\.weight$=f32
893
+ ^blk\.5\.attn_norm\.weight$=f32
894
+ ^blk\.5\.exp_probs_b\.bias$=f32
895
+ ^blk\.5\.ffn_norm\.weight$=f32
896
+ ^blk\.5\.hc_attn_base\.weight$=f32
897
+ ^blk\.5\.hc_attn_scale\.weight$=f32
898
+ ^blk\.5\.hc_ffn_base\.weight$=f32
899
+ ^blk\.5\.hc_ffn_scale\.weight$=f32
900
+ ^blk\.6\.attn_sinks\.weight$=f32
901
+ ^blk\.6\.attn_compressor_norm\.weight$=f32
902
+ ^blk\.6\.indexer_compressor_norm\.weight$=f32
903
+ ^blk\.6\.attn_kv_a_norm\.weight$=f32
904
+ ^blk\.6\.attn_q_a_norm\.weight$=f32
905
+ ^blk\.6\.attn_norm\.weight$=f32
906
+ ^blk\.6\.exp_probs_b\.bias$=f32
907
+ ^blk\.6\.ffn_norm\.weight$=f32
908
+ ^blk\.6\.hc_attn_base\.weight$=f32
909
+ ^blk\.6\.hc_attn_scale\.weight$=f32
910
+ ^blk\.6\.hc_ffn_base\.weight$=f32
911
+ ^blk\.6\.hc_ffn_scale\.weight$=f32
912
+ ^blk\.7\.attn_sinks\.weight$=f32
913
+ ^blk\.7\.attn_compressor_norm\.weight$=f32
914
+ ^blk\.7\.attn_kv_a_norm\.weight$=f32
915
+ ^blk\.7\.attn_q_a_norm\.weight$=f32
916
+ ^blk\.7\.attn_norm\.weight$=f32
917
+ ^blk\.7\.exp_probs_b\.bias$=f32
918
+ ^blk\.7\.ffn_norm\.weight$=f32
919
+ ^blk\.7\.hc_attn_base\.weight$=f32
920
+ ^blk\.7\.hc_attn_scale\.weight$=f32
921
+ ^blk\.7\.hc_ffn_base\.weight$=f32
922
+ ^blk\.7\.hc_ffn_scale\.weight$=f32
923
+ ^blk\.8\.attn_sinks\.weight$=f32
924
+ ^blk\.8\.attn_compressor_norm\.weight$=f32
925
+ ^blk\.8\.indexer_compressor_norm\.weight$=f32
926
+ ^blk\.8\.attn_kv_a_norm\.weight$=f32
927
+ ^blk\.8\.attn_q_a_norm\.weight$=f32
928
+ ^blk\.8\.attn_norm\.weight$=f32
929
+ ^blk\.8\.exp_probs_b\.bias$=f32
930
+ ^blk\.8\.ffn_norm\.weight$=f32
931
+ ^blk\.8\.hc_attn_base\.weight$=f32
932
+ ^blk\.8\.hc_attn_scale\.weight$=f32
933
+ ^blk\.8\.hc_ffn_base\.weight$=f32
934
+ ^blk\.8\.hc_ffn_scale\.weight$=f32
935
+ ^blk\.9\.attn_sinks\.weight$=f32
936
+ ^blk\.9\.attn_compressor_norm\.weight$=f32
937
+ ^blk\.9\.attn_kv_a_norm\.weight$=f32
938
+ ^blk\.9\.attn_q_a_norm\.weight$=f32
939
+ ^blk\.9\.attn_norm\.weight$=f32
940
+ ^blk\.9\.exp_probs_b\.bias$=f32
941
+ ^blk\.9\.ffn_norm\.weight$=f32
942
+ ^blk\.9\.hc_attn_base\.weight$=f32
943
+ ^blk\.9\.hc_attn_scale\.weight$=f32
944
+ ^blk\.9\.hc_ffn_base\.weight$=f32
945
+ ^blk\.9\.hc_ffn_scale\.weight$=f32
946
+ ^blk\.10\.attn_sinks\.weight$=f32
947
+ ^blk\.10\.attn_compressor_norm\.weight$=f32
948
+ ^blk\.10\.indexer_compressor_norm\.weight$=f32
949
+ ^blk\.10\.attn_kv_a_norm\.weight$=f32
950
+ ^blk\.10\.attn_q_a_norm\.weight$=f32
951
+ ^blk\.10\.attn_norm\.weight$=f32
952
+ ^blk\.10\.exp_probs_b\.bias$=f32
953
+ ^blk\.10\.ffn_norm\.weight$=f32
954
+ ^blk\.10\.hc_attn_base\.weight$=f32
955
+ ^blk\.10\.hc_attn_scale\.weight$=f32
956
+ ^blk\.10\.hc_ffn_base\.weight$=f32
957
+ ^blk\.10\.hc_ffn_scale\.weight$=f32
958
+ ^blk\.11\.attn_sinks\.weight$=f32
959
+ ^blk\.11\.attn_compressor_norm\.weight$=f32
960
+ ^blk\.11\.attn_kv_a_norm\.weight$=f32
961
+ ^blk\.11\.attn_q_a_norm\.weight$=f32
962
+ ^blk\.11\.attn_norm\.weight$=f32
963
+ ^blk\.11\.exp_probs_b\.bias$=f32
964
+ ^blk\.11\.ffn_norm\.weight$=f32
965
+ ^blk\.11\.hc_attn_base\.weight$=f32
966
+ ^blk\.11\.hc_attn_scale\.weight$=f32
967
+ ^blk\.11\.hc_ffn_base\.weight$=f32
968
+ ^blk\.11\.hc_ffn_scale\.weight$=f32
969
+ ^blk\.12\.attn_sinks\.weight$=f32
970
+ ^blk\.12\.attn_compressor_norm\.weight$=f32
971
+ ^blk\.12\.indexer_compressor_norm\.weight$=f32
972
+ ^blk\.12\.attn_kv_a_norm\.weight$=f32
973
+ ^blk\.12\.attn_q_a_norm\.weight$=f32
974
+ ^blk\.12\.attn_norm\.weight$=f32
975
+ ^blk\.12\.exp_probs_b\.bias$=f32
976
+ ^blk\.12\.ffn_norm\.weight$=f32
977
+ ^blk\.12\.hc_attn_base\.weight$=f32
978
+ ^blk\.12\.hc_attn_scale\.weight$=f32
979
+ ^blk\.12\.hc_ffn_base\.weight$=f32
980
+ ^blk\.12\.hc_ffn_scale\.weight$=f32
981
+ ^blk\.13\.attn_sinks\.weight$=f32
982
+ ^blk\.13\.attn_compressor_norm\.weight$=f32
983
+ ^blk\.13\.attn_kv_a_norm\.weight$=f32
984
+ ^blk\.13\.attn_q_a_norm\.weight$=f32
985
+ ^blk\.13\.attn_norm\.weight$=f32
986
+ ^blk\.13\.exp_probs_b\.bias$=f32
987
+ ^blk\.13\.ffn_norm\.weight$=f32
988
+ ^blk\.13\.hc_attn_base\.weight$=f32
989
+ ^blk\.13\.hc_attn_scale\.weight$=f32
990
+ ^blk\.13\.hc_ffn_base\.weight$=f32
991
+ ^blk\.13\.hc_ffn_scale\.weight$=f32
992
+ ^blk\.14\.attn_sinks\.weight$=f32
993
+ ^blk\.14\.attn_compressor_norm\.weight$=f32
994
+ ^blk\.14\.indexer_compressor_norm\.weight$=f32
995
+ ^blk\.14\.attn_kv_a_norm\.weight$=f32
996
+ ^blk\.14\.attn_q_a_norm\.weight$=f32
997
+ ^blk\.14\.attn_norm\.weight$=f32
998
+ ^blk\.14\.exp_probs_b\.bias$=f32
999
+ ^blk\.14\.ffn_norm\.weight$=f32
1000
+ ^blk\.14\.hc_attn_base\.weight$=f32
1001
+ ^blk\.14\.hc_attn_scale\.weight$=f32
1002
+ ^blk\.14\.hc_ffn_base\.weight$=f32
1003
+ ^blk\.14\.hc_ffn_scale\.weight$=f32
1004
+ ^blk\.15\.attn_sinks\.weight$=f32
1005
+ ^blk\.15\.attn_compressor_norm\.weight$=f32
1006
+ ^blk\.15\.attn_kv_a_norm\.weight$=f32
1007
+ ^blk\.15\.attn_q_a_norm\.weight$=f32
1008
+ ^blk\.15\.attn_norm\.weight$=f32
1009
+ ^blk\.15\.exp_probs_b\.bias$=f32
1010
+ ^blk\.15\.ffn_norm\.weight$=f32
1011
+ ^blk\.15\.hc_attn_base\.weight$=f32
1012
+ ^blk\.15\.hc_attn_scale\.weight$=f32
1013
+ ^blk\.15\.hc_ffn_base\.weight$=f32
1014
+ ^blk\.15\.hc_ffn_scale\.weight$=f32
1015
+ ^blk\.16\.attn_sinks\.weight$=f32
1016
+ ^blk\.16\.attn_compressor_norm\.weight$=f32
1017
+ ^blk\.16\.indexer_compressor_norm\.weight$=f32
1018
+ ^blk\.16\.attn_kv_a_norm\.weight$=f32
1019
+ ^blk\.16\.attn_q_a_norm\.weight$=f32
1020
+ ^blk\.16\.attn_norm\.weight$=f32
1021
+ ^blk\.16\.exp_probs_b\.bias$=f32
1022
+ ^blk\.16\.ffn_norm\.weight$=f32
1023
+ ^blk\.16\.hc_attn_base\.weight$=f32
1024
+ ^blk\.16\.hc_attn_scale\.weight$=f32
1025
+ ^blk\.16\.hc_ffn_base\.weight$=f32
1026
+ ^blk\.16\.hc_ffn_scale\.weight$=f32
1027
+ ^blk\.17\.attn_sinks\.weight$=f32
1028
+ ^blk\.17\.attn_compressor_norm\.weight$=f32
1029
+ ^blk\.17\.attn_kv_a_norm\.weight$=f32
1030
+ ^blk\.17\.attn_q_a_norm\.weight$=f32
1031
+ ^blk\.17\.attn_norm\.weight$=f32
1032
+ ^blk\.17\.exp_probs_b\.bias$=f32
1033
+ ^blk\.17\.ffn_norm\.weight$=f32
1034
+ ^blk\.17\.hc_attn_base\.weight$=f32
1035
+ ^blk\.17\.hc_attn_scale\.weight$=f32
1036
+ ^blk\.17\.hc_ffn_base\.weight$=f32
1037
+ ^blk\.17\.hc_ffn_scale\.weight$=f32
1038
+ ^blk\.18\.attn_sinks\.weight$=f32
1039
+ ^blk\.18\.attn_compressor_norm\.weight$=f32
1040
+ ^blk\.18\.indexer_compressor_norm\.weight$=f32
1041
+ ^blk\.18\.attn_kv_a_norm\.weight$=f32
1042
+ ^blk\.18\.attn_q_a_norm\.weight$=f32
1043
+ ^blk\.18\.attn_norm\.weight$=f32
1044
+ ^blk\.18\.exp_probs_b\.bias$=f32
1045
+ ^blk\.18\.ffn_norm\.weight$=f32
1046
+ ^blk\.18\.hc_attn_base\.weight$=f32
1047
+ ^blk\.18\.hc_attn_scale\.weight$=f32
1048
+ ^blk\.18\.hc_ffn_base\.weight$=f32
1049
+ ^blk\.18\.hc_ffn_scale\.weight$=f32
1050
+ ^blk\.19\.attn_sinks\.weight$=f32
1051
+ ^blk\.19\.attn_compressor_norm\.weight$=f32
1052
+ ^blk\.19\.attn_kv_a_norm\.weight$=f32
1053
+ ^blk\.19\.attn_q_a_norm\.weight$=f32
1054
+ ^blk\.19\.attn_norm\.weight$=f32
1055
+ ^blk\.19\.exp_probs_b\.bias$=f32
1056
+ ^blk\.19\.ffn_norm\.weight$=f32
1057
+ ^blk\.19\.hc_attn_base\.weight$=f32
1058
+ ^blk\.19\.hc_attn_scale\.weight$=f32
1059
+ ^blk\.19\.hc_ffn_base\.weight$=f32
1060
+ ^blk\.19\.hc_ffn_scale\.weight$=f32
1061
+ ^blk\.20\.attn_sinks\.weight$=f32
1062
+ ^blk\.20\.attn_compressor_norm\.weight$=f32
1063
+ ^blk\.20\.indexer_compressor_norm\.weight$=f32
1064
+ ^blk\.20\.attn_kv_a_norm\.weight$=f32
1065
+ ^blk\.20\.attn_q_a_norm\.weight$=f32
1066
+ ^blk\.20\.attn_norm\.weight$=f32
1067
+ ^blk\.20\.exp_probs_b\.bias$=f32
1068
+ ^blk\.20\.ffn_norm\.weight$=f32
1069
+ ^blk\.20\.hc_attn_base\.weight$=f32
1070
+ ^blk\.20\.hc_attn_scale\.weight$=f32
1071
+ ^blk\.20\.hc_ffn_base\.weight$=f32
1072
+ ^blk\.20\.hc_ffn_scale\.weight$=f32
1073
+ ^blk\.21\.attn_sinks\.weight$=f32
1074
+ ^blk\.21\.attn_compressor_norm\.weight$=f32
1075
+ ^blk\.21\.attn_kv_a_norm\.weight$=f32
1076
+ ^blk\.21\.attn_q_a_norm\.weight$=f32
1077
+ ^blk\.21\.attn_norm\.weight$=f32
1078
+ ^blk\.21\.exp_probs_b\.bias$=f32
1079
+ ^blk\.21\.ffn_norm\.weight$=f32
1080
+ ^blk\.21\.hc_attn_base\.weight$=f32
1081
+ ^blk\.21\.hc_attn_scale\.weight$=f32
1082
+ ^blk\.21\.hc_ffn_base\.weight$=f32
1083
+ ^blk\.21\.hc_ffn_scale\.weight$=f32
1084
+ ^blk\.22\.attn_sinks\.weight$=f32
1085
+ ^blk\.22\.attn_compressor_norm\.weight$=f32
1086
+ ^blk\.22\.indexer_compressor_norm\.weight$=f32
1087
+ ^blk\.22\.attn_kv_a_norm\.weight$=f32
1088
+ ^blk\.22\.attn_q_a_norm\.weight$=f32
1089
+ ^blk\.22\.attn_norm\.weight$=f32
1090
+ ^blk\.22\.exp_probs_b\.bias$=f32
1091
+ ^blk\.22\.ffn_norm\.weight$=f32
1092
+ ^blk\.22\.hc_attn_base\.weight$=f32
1093
+ ^blk\.22\.hc_attn_scale\.weight$=f32
1094
+ ^blk\.22\.hc_ffn_base\.weight$=f32
1095
+ ^blk\.22\.hc_ffn_scale\.weight$=f32
1096
+ ^blk\.23\.attn_sinks\.weight$=f32
1097
+ ^blk\.23\.attn_compressor_norm\.weight$=f32
1098
+ ^blk\.23\.attn_kv_a_norm\.weight$=f32
1099
+ ^blk\.23\.attn_q_a_norm\.weight$=f32
1100
+ ^blk\.23\.attn_norm\.weight$=f32
1101
+ ^blk\.23\.exp_probs_b\.bias$=f32
1102
+ ^blk\.23\.ffn_norm\.weight$=f32
1103
+ ^blk\.23\.hc_attn_base\.weight$=f32
1104
+ ^blk\.23\.hc_attn_scale\.weight$=f32
1105
+ ^blk\.23\.hc_ffn_base\.weight$=f32
1106
+ ^blk\.23\.hc_ffn_scale\.weight$=f32
1107
+ ^blk\.24\.attn_sinks\.weight$=f32
1108
+ ^blk\.24\.attn_compressor_norm\.weight$=f32
1109
+ ^blk\.24\.indexer_compressor_norm\.weight$=f32
1110
+ ^blk\.24\.attn_kv_a_norm\.weight$=f32
1111
+ ^blk\.24\.attn_q_a_norm\.weight$=f32
1112
+ ^blk\.24\.attn_norm\.weight$=f32
1113
+ ^blk\.24\.exp_probs_b\.bias$=f32
1114
+ ^blk\.24\.ffn_norm\.weight$=f32
1115
+ ^blk\.24\.hc_attn_base\.weight$=f32
1116
+ ^blk\.24\.hc_attn_scale\.weight$=f32
1117
+ ^blk\.24\.hc_ffn_base\.weight$=f32
1118
+ ^blk\.24\.hc_ffn_scale\.weight$=f32
1119
+ ^blk\.25\.attn_sinks\.weight$=f32
1120
+ ^blk\.25\.attn_compressor_norm\.weight$=f32
1121
+ ^blk\.25\.attn_kv_a_norm\.weight$=f32
1122
+ ^blk\.25\.attn_q_a_norm\.weight$=f32
1123
+ ^blk\.25\.attn_norm\.weight$=f32
1124
+ ^blk\.25\.exp_probs_b\.bias$=f32
1125
+ ^blk\.25\.ffn_norm\.weight$=f32
1126
+ ^blk\.25\.hc_attn_base\.weight$=f32
1127
+ ^blk\.25\.hc_attn_scale\.weight$=f32
1128
+ ^blk\.25\.hc_ffn_base\.weight$=f32
1129
+ ^blk\.25\.hc_ffn_scale\.weight$=f32
1130
+ ^blk\.26\.attn_sinks\.weight$=f32
1131
+ ^blk\.26\.attn_compressor_norm\.weight$=f32
1132
+ ^blk\.26\.indexer_compressor_norm\.weight$=f32
1133
+ ^blk\.26\.attn_kv_a_norm\.weight$=f32
1134
+ ^blk\.26\.attn_q_a_norm\.weight$=f32
1135
+ ^blk\.26\.attn_norm\.weight$=f32
1136
+ ^blk\.26\.exp_probs_b\.bias$=f32
1137
+ ^blk\.26\.ffn_norm\.weight$=f32
1138
+ ^blk\.26\.hc_attn_base\.weight$=f32
1139
+ ^blk\.26\.hc_attn_scale\.weight$=f32
1140
+ ^blk\.26\.hc_ffn_base\.weight$=f32
1141
+ ^blk\.26\.hc_ffn_scale\.weight$=f32
1142
+ ^blk\.27\.attn_sinks\.weight$=f32
1143
+ ^blk\.27\.attn_compressor_norm\.weight$=f32
1144
+ ^blk\.27\.attn_kv_a_norm\.weight$=f32
1145
+ ^blk\.27\.attn_q_a_norm\.weight$=f32
1146
+ ^blk\.27\.attn_norm\.weight$=f32
1147
+ ^blk\.27\.exp_probs_b\.bias$=f32
1148
+ ^blk\.27\.ffn_norm\.weight$=f32
1149
+ ^blk\.27\.hc_attn_base\.weight$=f32
1150
+ ^blk\.27\.hc_attn_scale\.weight$=f32
1151
+ ^blk\.27\.hc_ffn_base\.weight$=f32
1152
+ ^blk\.27\.hc_ffn_scale\.weight$=f32
1153
+ ^blk\.28\.attn_sinks\.weight$=f32
1154
+ ^blk\.28\.attn_compressor_norm\.weight$=f32
1155
+ ^blk\.28\.indexer_compressor_norm\.weight$=f32
1156
+ ^blk\.28\.attn_kv_a_norm\.weight$=f32
1157
+ ^blk\.28\.attn_q_a_norm\.weight$=f32
1158
+ ^blk\.28\.attn_norm\.weight$=f32
1159
+ ^blk\.28\.exp_probs_b\.bias$=f32
1160
+ ^blk\.28\.ffn_norm\.weight$=f32
1161
+ ^blk\.28\.hc_attn_base\.weight$=f32
1162
+ ^blk\.28\.hc_attn_scale\.weight$=f32
1163
+ ^blk\.28\.hc_ffn_base\.weight$=f32
1164
+ ^blk\.28\.hc_ffn_scale\.weight$=f32
1165
+ ^blk\.29\.attn_sinks\.weight$=f32
1166
+ ^blk\.29\.attn_compressor_norm\.weight$=f32
1167
+ ^blk\.29\.attn_kv_a_norm\.weight$=f32
1168
+ ^blk\.29\.attn_q_a_norm\.weight$=f32
1169
+ ^blk\.29\.attn_norm\.weight$=f32
1170
+ ^blk\.29\.exp_probs_b\.bias$=f32
1171
+ ^blk\.29\.ffn_norm\.weight$=f32
1172
+ ^blk\.29\.hc_attn_base\.weight$=f32
1173
+ ^blk\.29\.hc_attn_scale\.weight$=f32
1174
+ ^blk\.29\.hc_ffn_base\.weight$=f32
1175
+ ^blk\.29\.hc_ffn_scale\.weight$=f32
1176
+ ^blk\.30\.attn_sinks\.weight$=f32
1177
+ ^blk\.30\.attn_compressor_norm\.weight$=f32
1178
+ ^blk\.30\.indexer_compressor_norm\.weight$=f32
1179
+ ^blk\.30\.attn_kv_a_norm\.weight$=f32
1180
+ ^blk\.30\.attn_q_a_norm\.weight$=f32
1181
+ ^blk\.30\.attn_norm\.weight$=f32
1182
+ ^blk\.30\.exp_probs_b\.bias$=f32
1183
+ ^blk\.30\.ffn_norm\.weight$=f32
1184
+ ^blk\.30\.hc_attn_base\.weight$=f32
1185
+ ^blk\.30\.hc_attn_scale\.weight$=f32
1186
+ ^blk\.30\.hc_ffn_base\.weight$=f32
1187
+ ^blk\.30\.hc_ffn_scale\.weight$=f32
1188
+ ^blk\.31\.attn_sinks\.weight$=f32
1189
+ ^blk\.31\.attn_compressor_norm\.weight$=f32
1190
+ ^blk\.31\.attn_kv_a_norm\.weight$=f32
1191
+ ^blk\.31\.attn_q_a_norm\.weight$=f32
1192
+ ^blk\.31\.attn_norm\.weight$=f32
1193
+ ^blk\.31\.exp_probs_b\.bias$=f32
1194
+ ^blk\.31\.ffn_norm\.weight$=f32
1195
+ ^blk\.31\.hc_attn_base\.weight$=f32
1196
+ ^blk\.31\.hc_attn_scale\.weight$=f32
1197
+ ^blk\.31\.hc_ffn_base\.weight$=f32
1198
+ ^blk\.31\.hc_ffn_scale\.weight$=f32
1199
+ ^blk\.32\.attn_sinks\.weight$=f32
1200
+ ^blk\.32\.attn_compressor_norm\.weight$=f32
1201
+ ^blk\.32\.indexer_compressor_norm\.weight$=f32
1202
+ ^blk\.32\.attn_kv_a_norm\.weight$=f32
1203
+ ^blk\.32\.attn_q_a_norm\.weight$=f32
1204
+ ^blk\.32\.attn_norm\.weight$=f32
1205
+ ^blk\.32\.exp_probs_b\.bias$=f32
1206
+ ^blk\.32\.ffn_norm\.weight$=f32
1207
+ ^blk\.32\.hc_attn_base\.weight$=f32
1208
+ ^blk\.32\.hc_attn_scale\.weight$=f32
1209
+ ^blk\.32\.hc_ffn_base\.weight$=f32
1210
+ ^blk\.32\.hc_ffn_scale\.weight$=f32
1211
+ ^blk\.33\.attn_sinks\.weight$=f32
1212
+ ^blk\.33\.attn_compressor_norm\.weight$=f32
1213
+ ^blk\.33\.attn_kv_a_norm\.weight$=f32
1214
+ ^blk\.33\.attn_q_a_norm\.weight$=f32
1215
+ ^blk\.33\.attn_norm\.weight$=f32
1216
+ ^blk\.33\.exp_probs_b\.bias$=f32
1217
+ ^blk\.33\.ffn_norm\.weight$=f32
1218
+ ^blk\.33\.hc_attn_base\.weight$=f32
1219
+ ^blk\.33\.hc_attn_scale\.weight$=f32
1220
+ ^blk\.33\.hc_ffn_base\.weight$=f32
1221
+ ^blk\.33\.hc_ffn_scale\.weight$=f32
1222
+ ^blk\.34\.attn_sinks\.weight$=f32
1223
+ ^blk\.34\.attn_compressor_norm\.weight$=f32
1224
+ ^blk\.34\.indexer_compressor_norm\.weight$=f32
1225
+ ^blk\.34\.attn_kv_a_norm\.weight$=f32
1226
+ ^blk\.34\.attn_q_a_norm\.weight$=f32
1227
+ ^blk\.34\.attn_norm\.weight$=f32
1228
+ ^blk\.34\.exp_probs_b\.bias$=f32
1229
+ ^blk\.34\.ffn_norm\.weight$=f32
1230
+ ^blk\.34\.hc_attn_base\.weight$=f32
1231
+ ^blk\.34\.hc_attn_scale\.weight$=f32
1232
+ ^blk\.34\.hc_ffn_base\.weight$=f32
1233
+ ^blk\.34\.hc_ffn_scale\.weight$=f32
1234
+ ^blk\.35\.attn_sinks\.weight$=f32
1235
+ ^blk\.35\.attn_compressor_norm\.weight$=f32
1236
+ ^blk\.35\.attn_kv_a_norm\.weight$=f32
1237
+ ^blk\.35\.attn_q_a_norm\.weight$=f32
1238
+ ^blk\.35\.attn_norm\.weight$=f32
1239
+ ^blk\.35\.exp_probs_b\.bias$=f32
1240
+ ^blk\.35\.ffn_norm\.weight$=f32
1241
+ ^blk\.35\.hc_attn_base\.weight$=f32
1242
+ ^blk\.35\.hc_attn_scale\.weight$=f32
1243
+ ^blk\.35\.hc_ffn_base\.weight$=f32
1244
+ ^blk\.35\.hc_ffn_scale\.weight$=f32
1245
+ ^blk\.36\.attn_sinks\.weight$=f32
1246
+ ^blk\.36\.attn_compressor_norm\.weight$=f32
1247
+ ^blk\.36\.indexer_compressor_norm\.weight$=f32
1248
+ ^blk\.36\.attn_kv_a_norm\.weight$=f32
1249
+ ^blk\.36\.attn_q_a_norm\.weight$=f32
1250
+ ^blk\.36\.attn_norm\.weight$=f32
1251
+ ^blk\.36\.exp_probs_b\.bias$=f32
1252
+ ^blk\.36\.ffn_norm\.weight$=f32
1253
+ ^blk\.36\.hc_attn_base\.weight$=f32
1254
+ ^blk\.36\.hc_attn_scale\.weight$=f32
1255
+ ^blk\.36\.hc_ffn_base\.weight$=f32
1256
+ ^blk\.36\.hc_ffn_scale\.weight$=f32
1257
+ ^blk\.37\.attn_sinks\.weight$=f32
1258
+ ^blk\.37\.attn_compressor_norm\.weight$=f32
1259
+ ^blk\.37\.attn_kv_a_norm\.weight$=f32
1260
+ ^blk\.37\.attn_q_a_norm\.weight$=f32
1261
+ ^blk\.37\.attn_norm\.weight$=f32
1262
+ ^blk\.37\.exp_probs_b\.bias$=f32
1263
+ ^blk\.37\.ffn_norm\.weight$=f32
1264
+ ^blk\.37\.hc_attn_base\.weight$=f32
1265
+ ^blk\.37\.hc_attn_scale\.weight$=f32
1266
+ ^blk\.37\.hc_ffn_base\.weight$=f32
1267
+ ^blk\.37\.hc_ffn_scale\.weight$=f32
1268
+ ^blk\.38\.attn_sinks\.weight$=f32
1269
+ ^blk\.38\.attn_compressor_norm\.weight$=f32
1270
+ ^blk\.38\.indexer_compressor_norm\.weight$=f32
1271
+ ^blk\.38\.attn_kv_a_norm\.weight$=f32
1272
+ ^blk\.38\.attn_q_a_norm\.weight$=f32
1273
+ ^blk\.38\.attn_norm\.weight$=f32
1274
+ ^blk\.38\.exp_probs_b\.bias$=f32
1275
+ ^blk\.38\.ffn_norm\.weight$=f32
1276
+ ^blk\.38\.hc_attn_base\.weight$=f32
1277
+ ^blk\.38\.hc_attn_scale\.weight$=f32
1278
+ ^blk\.38\.hc_ffn_base\.weight$=f32
1279
+ ^blk\.38\.hc_ffn_scale\.weight$=f32
1280
+ ^blk\.39\.attn_sinks\.weight$=f32
1281
+ ^blk\.39\.attn_compressor_norm\.weight$=f32
1282
+ ^blk\.39\.attn_kv_a_norm\.weight$=f32
1283
+ ^blk\.39\.attn_q_a_norm\.weight$=f32
1284
+ ^blk\.39\.attn_norm\.weight$=f32
1285
+ ^blk\.39\.exp_probs_b\.bias$=f32
1286
+ ^blk\.39\.ffn_norm\.weight$=f32
1287
+ ^blk\.39\.hc_attn_base\.weight$=f32
1288
+ ^blk\.39\.hc_attn_scale\.weight$=f32
1289
+ ^blk\.39\.hc_ffn_base\.weight$=f32
1290
+ ^blk\.39\.hc_ffn_scale\.weight$=f32
1291
+ ^blk\.40\.attn_sinks\.weight$=f32
1292
+ ^blk\.40\.attn_compressor_norm\.weight$=f32
1293
+ ^blk\.40\.indexer_compressor_norm\.weight$=f32
1294
+ ^blk\.40\.attn_kv_a_norm\.weight$=f32
1295
+ ^blk\.40\.attn_q_a_norm\.weight$=f32
1296
+ ^blk\.40\.attn_norm\.weight$=f32
1297
+ ^blk\.40\.exp_probs_b\.bias$=f32
1298
+ ^blk\.40\.ffn_norm\.weight$=f32
1299
+ ^blk\.40\.hc_attn_base\.weight$=f32
1300
+ ^blk\.40\.hc_attn_scale\.weight$=f32
1301
+ ^blk\.40\.hc_ffn_base\.weight$=f32
1302
+ ^blk\.40\.hc_ffn_scale\.weight$=f32
1303
+ ^blk\.41\.attn_sinks\.weight$=f32
1304
+ ^blk\.41\.attn_compressor_norm\.weight$=f32
1305
+ ^blk\.41\.attn_kv_a_norm\.weight$=f32
1306
+ ^blk\.41\.attn_q_a_norm\.weight$=f32
1307
+ ^blk\.41\.attn_norm\.weight$=f32
1308
+ ^blk\.41\.exp_probs_b\.bias$=f32
1309
+ ^blk\.41\.ffn_norm\.weight$=f32
1310
+ ^blk\.41\.hc_attn_base\.weight$=f32
1311
+ ^blk\.41\.hc_attn_scale\.weight$=f32
1312
+ ^blk\.41\.hc_ffn_base\.weight$=f32
1313
+ ^blk\.41\.hc_ffn_scale\.weight$=f32
1314
+ ^blk\.42\.attn_sinks\.weight$=f32
1315
+ ^blk\.42\.attn_compressor_norm\.weight$=f32
1316
+ ^blk\.42\.indexer_compressor_norm\.weight$=f32
1317
+ ^blk\.42\.attn_kv_a_norm\.weight$=f32
1318
+ ^blk\.42\.attn_q_a_norm\.weight$=f32
1319
+ ^blk\.42\.attn_norm\.weight$=f32
1320
+ ^blk\.42\.exp_probs_b\.bias$=f32
1321
+ ^blk\.42\.ffn_norm\.weight$=f32
1322
+ ^blk\.42\.hc_attn_base\.weight$=f32
1323
+ ^blk\.42\.hc_attn_scale\.weight$=f32
1324
+ ^blk\.42\.hc_ffn_base\.weight$=f32
1325
+ ^blk\.42\.hc_ffn_scale\.weight$=f32
1326
+ ^output_hc_base\.weight$=f32
1327
+ ^output_hc_scale\.weight$=f32
1328
+ ^output_norm\.weight$=f32