Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

README.md +82 -0
transformer/0.safetensors +3 -0
transformer/1.safetensors +3 -0
transformer/2.safetensors +3 -0
transformer/model.safetensors.index.json +0 -0
vae/0.safetensors +3 -0
vae/model.safetensors.index.json +274 -0

README.md ADDED Viewed

	@@ -0,0 +1,82 @@

+---
+license: apache-2.0
+base_model: ByteDance-Seed/SeedVR2-7B
+pipeline_tag: image-to-image
+library_name: mlx-gen
+tags:
+- mlx
+- mlx-gen
+- mflux
+- apple-silicon
+- 4-bit
+- seedvr2
+- image-upscaling
+- super-resolution
+---
+# seedvr2-7b-4bit
+This repository contains MLX-Gen saved weights for `ByteDance-Seed/SeedVR2-7B`. The checkpoint is designed for local Apple Silicon inference with [`mlx-gen`](https://github.com/lpalbou/mlx-gen).
+It uses the mflux/MLX saved-weight layout. Quantized checkpoints include MLX quantization tensors. It is not a Diffusers or Transformers `from_pretrained()` checkpoint.
+## Source Model
+Original model: [`ByteDance-Seed/SeedVR2-7B`](https://huggingface.co/ByteDance-Seed/SeedVR2-7B).
+## License and Access
+This quantized derivative follows the Apache 2.0 license of the source model.
+## Quantization
+This is an MLX 4-bit checkpoint for SeedVR2 7B image super-resolution.
+- q4 for quantizable SeedVR2 transformer linears and VAE attention linears.
+- BF16 for convolutions, normalization layers, and other non-quantizable parameters.
+- The static SeedVR2 positive embedding is provided by the MLX-Gen runtime.
+See the [MLX-Gen quantization docs](https://github.com/lpalbou/mlx-gen/blob/main/docs/quantization.md) for compatibility notes and measured behavior.
+## Validation
+Measured on an Apple M5 Max with 128 GB unified memory using `mlx-gen 0.18.13`.
+The profile upscales `docs/assets/upscaling/seedvr2-5x-source.jpg` from `133x113`
+to `658x560` with `--resolution 5x --seed 42 --metadata`.
+| Package | Storage | Generation time | Wall time | Max RSS |
+| --- | ---: | ---: | ---: | ---: |
+| `ByteDance-Seed/SeedVR2-7B` source generation files | 31.63 GiB | 2.64 s | 8.69 s | 61.62 GiB |
+| `AbstractFramework/seedvr2-7b-4bit` | 4.79 GiB | 2.21 s | 3.24 s | 5.10 GiB |
+See the [SeedVR2 upscaling guide](https://github.com/lpalbou/mlx-gen/blob/main/docs/upscaling.md)
+for the 3B/7B source, q8, and q4 comparison sheet generated from this profile.
+## Compatibility
+Requires `mlx-gen >= 0.18.13`.
+Generated with `mlx-gen 0.18.13`.
+Use `mlxgen download` and `mlxgen upscale` for this SeedVR2 package.
+## Usage
+```bash
+python -m pip install -U mlx-gen
+mlxgen download --model AbstractFramework/seedvr2-7b-4bit
+mlxgen upscale \
+  --model AbstractFramework/seedvr2-7b-4bit \
+  --image-path input.png \
+  --resolution 2x \
+  --seed 42 \
+  --metadata \
+  --output upscaled.png
+```
+## Attribution
+MLX-Gen is based on [mflux](https://github.com/filipstrand/mflux) by Filip Strand and the original mflux contributors. This model card is generated by MLX-Gen so derived checkpoints keep that attribution visible.
+Quantized and contributed by [@lpalbou](https://huggingface.co/lpalbou).

transformer/0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ac398fa0983edca076627fd4dc8bb13cd9ea4094c60d56ca3b852b31f83a31ff
+size 2130692977

transformer/1.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2773096ae8d324c69f8816789221e9344c06c8951bf6a3db049347b1d22c8759
+size 2147202171

transformer/2.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a520462eac3e3a3711db5aac0340093e501ebaaaddb6afe284f7d8ecdad6e9df
+size 361536118

transformer/model.safetensors.index.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vae/0.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:df03120c5c02d862dd0b78c42cc58b9dce3c7b28252ac9604e7544ddcd14e37c
+size 498312006

vae/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,274 @@

+{
+  "metadata": {
+    "quantization_level": "4",
+    "mflux_version": "0.18.13"
+  },
+  "weight_map": {
+    "encoder.conv_in.weight": "0.safetensors",
+    "encoder.conv_in.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.0.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.0.resnets.1.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.0.downsamplers.0.conv.weight": "0.safetensors",
+    "encoder.down_blocks.0.downsamplers.0.conv.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv_shortcut.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.0.conv_shortcut.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.1.resnets.1.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.1.downsamplers.0.conv.weight": "0.safetensors",
+    "encoder.down_blocks.1.downsamplers.0.conv.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv_shortcut.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.0.conv_shortcut.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.2.resnets.1.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.2.downsamplers.0.conv.weight": "0.safetensors",
+    "encoder.down_blocks.2.downsamplers.0.conv.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.0.conv2.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.norm1.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.norm2.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv1.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv1.bias": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv2.weight": "0.safetensors",
+    "encoder.down_blocks.3.resnets.1.conv2.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.group_norm.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.group_norm.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_q.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_q.scales": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_q.biases": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_q.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_k.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_k.scales": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_k.biases": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_k.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_v.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_v.scales": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_v.biases": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_v.bias": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_out.0.weight": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_out.0.scales": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_out.0.biases": "0.safetensors",
+    "encoder.mid_block.attentions.0.to_out.0.bias": "0.safetensors",
+    "encoder.mid_block.resnets.0.norm1.bias": "0.safetensors",
+    "encoder.mid_block.resnets.0.norm1.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.norm2.bias": "0.safetensors",
+    "encoder.mid_block.resnets.0.norm2.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv1.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv1.bias": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv2.weight": "0.safetensors",
+    "encoder.mid_block.resnets.0.conv2.bias": "0.safetensors",
+    "encoder.mid_block.resnets.1.norm1.bias": "0.safetensors",
+    "encoder.mid_block.resnets.1.norm1.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.norm2.bias": "0.safetensors",
+    "encoder.mid_block.resnets.1.norm2.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv1.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv1.bias": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv2.weight": "0.safetensors",
+    "encoder.mid_block.resnets.1.conv2.bias": "0.safetensors",
+    "encoder.conv_norm_out.bias": "0.safetensors",
+    "encoder.conv_norm_out.weight": "0.safetensors",
+    "encoder.conv_out.weight": "0.safetensors",
+    "encoder.conv_out.bias": "0.safetensors",
+    "decoder.conv_in.weight": "0.safetensors",
+    "decoder.conv_in.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.group_norm.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.group_norm.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_q.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_q.scales": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_q.biases": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_q.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_k.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_k.scales": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_k.biases": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_k.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_v.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_v.scales": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_v.biases": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_v.bias": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_out.0.weight": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_out.0.scales": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_out.0.biases": "0.safetensors",
+    "decoder.mid_block.attentions.0.to_out.0.bias": "0.safetensors",
+    "decoder.mid_block.resnets.0.norm1.bias": "0.safetensors",
+    "decoder.mid_block.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.norm2.bias": "0.safetensors",
+    "decoder.mid_block.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv1.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv1.bias": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv2.weight": "0.safetensors",
+    "decoder.mid_block.resnets.0.conv2.bias": "0.safetensors",
+    "decoder.mid_block.resnets.1.norm1.bias": "0.safetensors",
+    "decoder.mid_block.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.norm2.bias": "0.safetensors",
+    "decoder.mid_block.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv1.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv1.bias": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv2.weight": "0.safetensors",
+    "decoder.mid_block.resnets.1.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.0.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.1.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.0.resnets.2.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.0.upsamplers.0.conv.weight": "0.safetensors",
+    "decoder.up_blocks.0.upsamplers.0.conv.bias": "0.safetensors",
+    "decoder.up_blocks.0.upsamplers.0.upscale_conv.weight": "0.safetensors",
+    "decoder.up_blocks.0.upsamplers.0.upscale_conv.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.0.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.1.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.1.resnets.2.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.1.upsamplers.0.conv.weight": "0.safetensors",
+    "decoder.up_blocks.1.upsamplers.0.conv.bias": "0.safetensors",
+    "decoder.up_blocks.1.upsamplers.0.upscale_conv.weight": "0.safetensors",
+    "decoder.up_blocks.1.upsamplers.0.upscale_conv.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv_shortcut.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.0.conv_shortcut.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.1.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.2.resnets.2.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.2.upsamplers.0.conv.weight": "0.safetensors",
+    "decoder.up_blocks.2.upsamplers.0.conv.bias": "0.safetensors",
+    "decoder.up_blocks.2.upsamplers.0.upscale_conv.weight": "0.safetensors",
+    "decoder.up_blocks.2.upsamplers.0.upscale_conv.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv_shortcut.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.0.conv_shortcut.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.1.conv2.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.norm1.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.norm1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.norm2.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.norm2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv1.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv1.bias": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv2.weight": "0.safetensors",
+    "decoder.up_blocks.3.resnets.2.conv2.bias": "0.safetensors",
+    "decoder.conv_norm_out.bias": "0.safetensors",
+    "decoder.conv_norm_out.weight": "0.safetensors",
+    "decoder.conv_out.weight": "0.safetensors",
+    "decoder.conv_out.bias": "0.safetensors"
+  }
+}