Instructions to use RWKV/RWKV7-Goose-World3-2.9B-HF with libraries, inference providers, notebooks, and local apps. Follow these links to get started.

Libraries

How to use RWKV/RWKV7-Goose-World3-2.9B-HF with Transformers:

# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="RWKV/RWKV7-Goose-World3-2.9B-HF", trust_remote_code=True)
messages = [
    {"role": "user", "content": "Who are you?"},
]
pipe(messages)

# Load model directly
from transformers import AutoModelForCausalLM
model = AutoModelForCausalLM.from_pretrained("RWKV/RWKV7-Goose-World3-2.9B-HF", trust_remote_code=True, dtype="auto")

Notebooks
Google Colab
Kaggle
Local Apps Settings

vLLM

How to use RWKV/RWKV7-Goose-World3-2.9B-HF with vLLM:

Install from pip and serve model

# Install vLLM from pip:
pip install vllm
# Start the vLLM server:
vllm serve "RWKV/RWKV7-Goose-World3-2.9B-HF"
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:8000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "RWKV/RWKV7-Goose-World3-2.9B-HF",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker

docker model run hf.co/RWKV/RWKV7-Goose-World3-2.9B-HF

SGLang

How to use RWKV/RWKV7-Goose-World3-2.9B-HF with SGLang:

Install from pip and serve model

# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "RWKV/RWKV7-Goose-World3-2.9B-HF" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "RWKV/RWKV7-Goose-World3-2.9B-HF",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Use Docker images

docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "RWKV/RWKV7-Goose-World3-2.9B-HF" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "RWKV/RWKV7-Goose-World3-2.9B-HF",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'

Docker Model Runner
How to use RWKV/RWKV7-Goose-World3-2.9B-HF with Docker Model Runner:
```
docker model run hf.co/RWKV/RWKV7-Goose-World3-2.9B-HF
```

SmerkyG commited on Jul 23, 2025

Commit

3c84827

verified ·

1 Parent(s): bcc8b25

Upload folder using huggingface_hub

Browse files

Files changed (4) hide show

README.md +14 -11
model-00001-of-00002.safetensors +3 -0
model-00002-of-00002.safetensors +3 -0
model.safetensors.index.json +1066 -0

README.md CHANGED Viewed

@@ -1,5 +1,6 @@
 ---
-license: apache-2.0
 language:
 - en
 - zh
@@ -9,14 +10,14 @@ language:
 - ar
 - es
 - pt
 metrics:
 - accuracy
-base_model:
-- BlinkDL/rwkv-7-world
 pipeline_tag: text-generation
 library_name: transformers
 ---
 # rwkv7-2.9B-world
 <!-- Provide a quick summary of what the model is/does. -->
@@ -44,15 +45,15 @@ This is RWKV-7 model under flash-linear attention format.
 <!-- Provide the basic links for the model. -->
 - **Repository:** https://github.com/fla-org/flash-linear-attention ; https://github.com/BlinkDL/RWKV-LM
-- **Paper:** [RWKV-7 "Goose" with Expressive Dynamic State Evolution](https://arxiv.org/abs/2503.14456)
 ## Uses
 <!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
-Install `flash-linear-attention` <= 0.1.2 and the latest version of `transformers` before using this model:
 ```bash
-pip install --no-use-pep517 flash-linear-attention==0.1.2
 pip install 'transformers>=4.48.0'
 ```
@@ -64,11 +65,9 @@ You can use this model just as any other HuggingFace models:
 from transformers import AutoModelForCausalLM, AutoTokenizer
 model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
-model = model.cuda()
 prompt = "What is a large language model?"
 messages = [
-    {"role": "user", "content": "Who are you?"},
-    {"role": "assistant", "content": "I am a GPT-3 based model."},
     {"role": "user", "content": prompt}
 ]
 text = tokenizer.apply_chat_template(
@@ -81,7 +80,11 @@ model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
 generated_ids = model.generate(
     **model_inputs,
-    max_new_tokens=1024,
 )
 generated_ids = [
     output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
@@ -104,4 +107,4 @@ This model is trained on the World v3 with a total of 3.119 trillion tokens.
 ## FAQ
 Q: safetensors metadata is none.
-A: upgrade transformers to >=4.48.0: `pip install 'transformers>=4.48.0'`

 ---
+base_model:
+- BlinkDL/rwkv-7-world
 language:
 - en
 - zh
 - ar
 - es
 - pt
+license: apache-2.0
 metrics:
 - accuracy
 pipeline_tag: text-generation
 library_name: transformers
 ---
 # rwkv7-2.9B-world
 <!-- Provide a quick summary of what the model is/does. -->
 <!-- Provide the basic links for the model. -->
 - **Repository:** https://github.com/fla-org/flash-linear-attention ; https://github.com/BlinkDL/RWKV-LM
+- **Paper:** https://arxiv.org/abs/2503.14456
 ## Uses
 <!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+Install `flash-linear-attention` and the latest version of `transformers` before using this model:
 ```bash
+pip install git+https://github.com/fla-org/flash-linear-attention
 pip install 'transformers>=4.48.0'
 ```
 from transformers import AutoModelForCausalLM, AutoTokenizer
 model = AutoModelForCausalLM.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
 tokenizer = AutoTokenizer.from_pretrained('fla-hub/rwkv7-2.9B-world', trust_remote_code=True)
+model = model.cuda() # Supported on Nvidia/AMD/Intel eg. model.xpu()
 prompt = "What is a large language model?"
 messages = [
     {"role": "user", "content": prompt}
 ]
 text = tokenizer.apply_chat_template(
 generated_ids = model.generate(
     **model_inputs,
+    max_new_tokens=4096,
+    do_sample=True,
+    temperature=1.0,
+    top_p=0.3,
+    repetition_penalty=1.2
 )
 generated_ids = [
     output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
 ## FAQ
 Q: safetensors metadata is none.
+A: upgrade transformers to >=4.48.0: `pip install 'transformers>=4.48.0'`

model-00001-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d02085ce601ff0aa911d5442b047f9f040496a4c0a3754cc1da001b3822399b
+size 4965315576

model-00002-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3abf5b979251acd9c6bad770fb72934b0074bf4c31f678ff8ad766ce1486b29
+size 930269032

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,1066 @@

+{
+  "metadata": {
+    "total_size": 5895470080
+  },
+  "weight_map": {
+    "lm_head.weight": "model-00002-of-00002.safetensors",
+    "model.embeddings.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.0.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.0.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.0.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.0.pre_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.0.pre_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.1.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.1.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.1.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.1.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.10.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.10.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.10.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.10.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.11.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.11.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.11.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.11.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.12.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.12.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.12.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.12.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.13.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.13.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.13.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.13.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.14.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.14.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.14.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.14.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.15.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.15.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.15.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.15.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.16.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.16.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.16.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.16.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.17.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.17.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.17.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.17.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.18.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.18.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.18.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.18.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.19.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.19.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.19.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.19.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.2.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.2.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.2.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.2.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.20.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.20.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.20.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.20.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.21.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.21.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.21.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.21.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.22.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.22.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.22.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.22.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.23.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.23.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.23.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.23.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.24.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.24.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.24.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.24.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.25.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.25.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.25.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.25.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.26.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.26.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.26.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.26.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.27.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.27.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.27.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.27.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.28.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.28.ffn.key.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.ffn.value.weight": "model-00002-of-00002.safetensors",
+    "model.layers.28.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.28.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.28.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.29.attn.a_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.a_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.a_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.g_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.g_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.g_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.g_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.k_a": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.k_k": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.r_k": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.r_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.v_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.v_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.v_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.w_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.w_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.w_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.x_a": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.x_g": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.x_k": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.x_r": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.x_v": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn.x_w": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.29.attn_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.ffn.key.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.ffn.value.weight": "model-00002-of-00002.safetensors",
+    "model.layers.29.ffn.x_k": "model-00002-of-00002.safetensors",
+    "model.layers.29.ffn_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.29.ffn_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.3.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.3.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.3.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.3.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.3.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.30.attn.a_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.a_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.a_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.g_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.g_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.g_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.g_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.k_a": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.k_k": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.r_k": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.r_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.v_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.v_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.v_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.w_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.w_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.w_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.x_a": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.x_g": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.x_k": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.x_r": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.x_v": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn.x_w": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.30.attn_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.ffn.key.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.ffn.value.weight": "model-00002-of-00002.safetensors",
+    "model.layers.30.ffn.x_k": "model-00002-of-00002.safetensors",
+    "model.layers.30.ffn_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.30.ffn_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.a_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.a_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.a_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.g_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.g_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.g_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.g_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.k_a": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.k_k": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.r_k": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.r_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.v_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.v_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.v_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.w_lora.lora.0.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.w_lora.lora.2.bias": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.w_lora.lora.2.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.x_a": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.x_g": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.x_k": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.x_r": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.x_v": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn.x_w": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.31.attn_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.ffn.key.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.ffn.value.weight": "model-00002-of-00002.safetensors",
+    "model.layers.31.ffn.x_k": "model-00002-of-00002.safetensors",
+    "model.layers.31.ffn_norm.bias": "model-00002-of-00002.safetensors",
+    "model.layers.31.ffn_norm.weight": "model-00002-of-00002.safetensors",
+    "model.layers.4.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.4.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.4.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.4.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.4.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.5.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.5.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.5.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.5.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.6.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.6.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.6.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.6.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.7.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.7.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.7.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.7.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.8.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.8.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.8.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.8.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.a_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.a_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.a_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.g_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.g_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.g_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.g_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.k_a": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.k_k": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.r_k": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.r_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.v_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.v_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.v_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.w_lora.lora.0.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.w_lora.lora.2.bias": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.w_lora.lora.2.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.x_a": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.x_g": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.x_r": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.x_v": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn.x_w": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.9.attn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.ffn.key.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.ffn.value.weight": "model-00001-of-00002.safetensors",
+    "model.layers.9.ffn.x_k": "model-00001-of-00002.safetensors",
+    "model.layers.9.ffn_norm.bias": "model-00001-of-00002.safetensors",
+    "model.layers.9.ffn_norm.weight": "model-00001-of-00002.safetensors",
+    "model.norm.bias": "model-00002-of-00002.safetensors",
+    "model.norm.weight": "model-00002-of-00002.safetensors"
+  }
+}