--- library_name: transformers license: mit license_link: https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B/blob/main/LICENSE pipeline_tag: text-generation tags: - qwen3_5_moe - qwen3_5 - reasoning - agentic-coding - mtp - apex - quantization - gguf - multimodal base_model: - deepreinforce-ai/Ornith-1.0-35B ---
APEX MTP 多模态 MIT

Ornith-1.0-35B-MTP-APEX

📖 English | 中文文档

自改进 agentic coding 推理模型 · APEX 量化 GGUF + BF16 + mmproj

🐦 关于 Ornith

Ornith-1.0-35BDeepReinforce AI 推出的自改进 agentic coding 推理模型,基于 Qwen3.5 后训练,采用 RL 联合优化 scaffold 生成和解决方案 rollout。

在 Terminal-Bench 2.1、SWE-Bench Verified/Pro/Multilingual、NL2Repo、OpenClaw 等编码基准上达到同参数量开源模型 SOTA。

本 GGUF 包含 mmproj-F16.gguf 视觉投影器,可配合 llama.cpp 实现多模态(图像+文本)功能。MTP 层来源于 Qwen3.5-35B-A3B(同架构,权重兼容)。许可证:MIT。

🧠 模型详情
架构Qwen3.5 MoE(混合专家)
参数量总计 35B,每 token 激活 3B
专家256 路由专家,每 token 激活 8 个
层数40 transformer 层 + 1 MTP 层
上下文262,144 tokens
MTP1 个 MTP 层(785 tensors),来自 Qwen3.5-35B-A3B
许可证MIT
📊 BenchLocal 测试成绩(APEX-I-Compact, 15.85 GB)
模式ToolCall-15BugFind-15HermesAgent-20能力上限实用得分
思考100938993.575.5
无思考100928993.285.2

RTX 5070 Ti · 无思考模式实际可靠性更优(重试更少)。

🚀 使用方法

llama.cpp(纯文本)

hf download SC117/Ornith-1.0-35B-MTP-APEX-GGUF --include "*.gguf" --local-dir ./models ./llama-server -m ./models/Ornith-1.0-35B-MTP-APEX-I-Compact.gguf -ngl 99 -c 131072

llama.cpp(视觉 + 文本)

./llama-server -m ./models/Ornith-1.0-35B-MTP-APEX-I-Compact.gguf --mmproj ./models/mmproj-F16.gguf -ngl 99 -c 131072

🎛️ 推荐参数
模式参数
通用temperature=0.6, top_p=0.95, top_k=20
编程temperature=0.6, top_p=0.95, top_k=20
💡 什么是 APEX?

这些 GGUF 文件使用 APEX 量化,这是一种 MoE 感知的混合精度量化技术。APEX 按 tensor 角色分类——路由专家、共享专家、注意力层——并应用逐层精度梯度,对最敏感的边缘层赋予更高精度,对冗余的中间层进行更激进的压缩。

APEX 以一半的体积达到 Q8_0 的困惑度——甚至超越 F16。

📦 APEX 量化档位
文件大小档位适用场景
*-APEX-I-Quality.gguf21.90 GBI-Quality最高质量,最佳精度
*-APEX-I-Balanced.gguf24.18 GBI-Balanced均衡之选,推荐使用
*-APEX-I-Compact.gguf15.85 GBI-Compact最佳质量/体积比
## 链接 - **原始模型**: https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B - **Ornith 博客**: https://deep-reinforce.com/ornith.html - **APEX 量化**: https://github.com/mudler/apex-quant - **BenchLocal 测试结果**: https://scorp1o117.github.io/benchlocal-results/ ## 引用 ```bibtex @misc{ornith-35b, title = {{Ornith-1.0-35B}: Agentic Coding, Open to All}, url = {https://deep-reinforce.com/ornith_1_0.html}, author = {{DeepReinforce Team}}, year = {2026} } ```