Qwen2.5 EOQ Quantized - a caiovicentino1 Collection

caiovicentino1 's Collections

HLWQ Large MoE (100B+)

HLWQ Video & Diffusion Models

HLWQ Gemma Models

Nemotron 30B — Consumer GPU Inference

HLWQ Unified (Weights Q5 + KV Cache Q3)

HLWQ MLX (Apple Silicon)

Large Models (27B-35B) HLWQ

Qwen3.5-4B EOQ Quantized

Qwen2.5 EOQ Quantized

Qwen3.5-9B HLWQ

EOQ Compressed Models

Qwen3.5-27B HLWQ

Qwen2.5 EOQ Quantized

updated Mar 31

EOQ quantized Qwen2.5 models (Q4/Q5/Q6/Q8). Dequant at load, zero inference overhead.