Qubit NeuroQuantum (small) — LiteRT-LM bundle

NeuroQuantum / QBNN モデルを Google LiteRT-LM 互換のバンドル形式 (.litertlm) で配布しています。

ファイル

  • qubit-neuroquantum-small.litertlm — モデルバンドル (66.99 MB)
    • TFLITE_MODEL_OR_WEIGHTS セクション: モデル重み (fp16 NPZ archive)
    • SP_MODEL セクション: SentencePiece トークナイザ
    • LLM_METADATA_JSON セクション: モデル / ランタイム設定
    • MODEL_CARD_MD セクション: モデルカード

モデル仕様

Field Value
Architecture NeuroQuantum
Size small
Parameters 34,606,620
embed_dim 256
hidden_dim 512
num_heads 8
num_layers 4
max_seq_len 4096
vocab_size 32000

推奨ランタイム設定

{
  "n_ctx": 4096,
  "n_batch": 64,
  "n_threads": 4,
  "n_gpu_layers": 0,
  "temperature": 0.8,
  "top_p": 0.9,
  "top_k": 40
}

ロード例

import struct, json
from pathlib import Path

MAGIC = b"LITERTLM"
with open("qubit-neuroquantum-small.litertlm", "rb") as f:
    assert f.read(8) == MAGIC
    version, count = struct.unpack("<II", f.read(8))
    # ... see generate_litertlm_models.py:read_litertlm_header

完全なパーサ実装と生成スクリプトは tapiocatakeshi/Qubitgenerate_litertlm_models.py を参照してください。

License

MIT

Downloads last month
8
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Collection including tapiocaTakeshi/qubit-small-litertlm