SC117's picture
Upload 2 files
228ce5f verified
|
Raw
History Blame Contribute Delete
16.3 kB
metadata
library_name: transformers
license: mit
license_link: https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B/blob/main/LICENSE
pipeline_tag: text-generation
tags:
  - qwen3_5_moe
  - qwen3_5
  - reasoning
  - agentic-coding
  - mtp
  - apex
  - quantization
  - gguf
  - multimodal
base_model:
  - deepreinforce-ai/Ornith-1.0-35B
APEX MTP 多模态 MIT

Ornith-1.0-35B-MTP-APEX

📖 English | 中文文档

自改进 agentic coding 推理模型 · APEX 量化 GGUF + BF16 + mmproj

🐦 关于 Ornith

Ornith-1.0-35BDeepReinforce AI 推出的自改进 agentic coding 推理模型,基于 Qwen3.5 后训练,采用 RL 联合优化 scaffold 生成和解决方案 rollout。

在 Terminal-Bench 2.1、SWE-Bench Verified/Pro/Multilingual、NL2Repo、OpenClaw 等编码基准上达到同参数量开源模型 SOTA。

本 GGUF 包含 mmproj-F16.gguf 视觉投影器,可配合 llama.cpp 实现多模态(图像+文本)功能。MTP 层来源于 Qwen3.5-35B-A3B(同架构,权重兼容)。许可证:MIT。

🧠 模型详情
架构Qwen3.5 MoE(混合专家)
参数量总计 35B,每 token 激活 3B
专家256 路由专家,每 token 激活 8 个
层数40 transformer 层 + 1 MTP 层
上下文262,144 tokens
MTP1 个 MTP 层(785 tensors),来自 Qwen3.5-35B-A3B
许可证MIT
📊 BenchLocal 测试成绩(APEX-I-Compact, 15.85 GB)
模式ToolCall-15BugFind-15HermesAgent-20能力上限实用得分
思考100938993.575.5
无思考100928993.285.2

RTX 5070 Ti · 无思考模式实际可靠性更优(重试更少)。

🚀 使用方法

llama.cpp(纯文本)

hf download SC117/Ornith-1.0-35B-MTP-APEX-GGUF --include "*.gguf" --local-dir ./models ./llama-server -m ./models/Ornith-1.0-35B-MTP-APEX-I-Compact.gguf -ngl 99 -c 131072

llama.cpp(视觉 + 文本)

./llama-server -m ./models/Ornith-1.0-35B-MTP-APEX-I-Compact.gguf --mmproj ./models/mmproj-F16.gguf -ngl 99 -c 131072

🎛️ 推荐参数
模式参数
通用temperature=0.6, top_p=0.95, top_k=20
编程temperature=0.6, top_p=0.95, top_k=20
💡 什么是 APEX?

这些 GGUF 文件使用 APEX 量化,这是一种 MoE 感知的混合精度量化技术。APEX 按 tensor 角色分类——路由专家、共享专家、注意力层——并应用逐层精度梯度,对最敏感的边缘层赋予更高精度,对冗余的中间层进行更激进的压缩。

APEX 以一半的体积达到 Q8_0 的困惑度——甚至超越 F16。

📦 APEX 量化档位
文件大小档位适用场景
*-APEX-I-Quality.gguf21.90 GBI-Quality最高质量,最佳精度
*-APEX-I-Balanced.gguf24.18 GBI-Balanced均衡之选,推荐使用
*-APEX-I-Compact.gguf15.85 GBI-Compact最佳质量/体积比

链接

引用

@misc{ornith-35b,
    title = {{Ornith-1.0-35B}: Agentic Coding, Open to All},
    url = {https://deep-reinforce.com/ornith_1_0.html},
    author = {{DeepReinforce Team}},
    year = {2026}
}