---
license: other
license_name: refer-to-base-model
license_link: https://huggingface.co/docs/hub/repositories-licenses
base_model: lordx64/Qwable-v1
base_model_relation: quantized
pipeline_tag: text-generation
library_name: gguf
quantized_by: Brunobkr
language:
- en
- pt
tags:
- gguf
- llama.cpp
- quantized
- offellia
- zetahelicoidal
- helicoidal-zeta
- multilingual
- portuguese
- brasil
- heretic
- abliterated
- uncensored
- conversational
---
# ΩFFΣLLIα — Quantização GGUF Zetahelicoidal
Derivado **GGUF** do modelo base, processado com a quantização **ΩFFΣLLIα / Zetahelicoidal** sobre o pipeline do **llama.cpp**.
Compatível com qualquer runtime que carregue GGUF: `llama.cpp`, `llama-server`, `Ollama`, `LM Studio`, `KoboldCpp`, `text-generation-webui`, entre outros.
> **Créditos.** Todos os pesos e a arquitetura pertencem ao modelo base. Este repositório distribui apenas o derivado quantizado.
> Modelo base: **[lordx64/Qwable-v1](https://huggingface.co/lordx64/Qwable-v1)**
---
## 📌 Visão geral
| Item | Valor |
| --- | --- |
| **Variante** | ΩFFΣLLIα / Zetahelicoidal |
| **Formato** | GGUF |
| **Relação com o base** | Derivado quantizado |
| **Quantização** | Brunobkr ([ΩFFΣLLIα](https://huggingface.co/Brunobkr)) |
| **Abliteração** | Heretic (AGPL-3.0) |
| **Idiomas** | Conforme o modelo base (multilíngue) |
> Os pesos efetivos durante a inferência correspondem aos do modelo base sob o formato de quantização escolhido.
---
## 🧬 Quantização Zetahelicoidal (ΩFFΣLLIα)
A **ΩFFΣLLIα / Zetahelicoidal** é uma camada de **pré-condicionamento determinística e reversível**, aplicada **bloco a bloco antes** da quantização padrão do GGML/llama.cpp e **desfeita na dequantização**.
Ela **não substitui** os formatos nativos (Q-K, IQ, MXFP4_MOE, etc.) — **opera sobre eles**, preservando **compatibilidade total** com qualquer runtime GGUF. Por ser determinística e reversível, não altera a interface do arquivo nem exige patches no consumidor: carrega como um GGUF comum.
---
## 🚀 Uso rápido com llama.cpp
```bash
# CLI
llama-cli -m .gguf \
-p "Escreva um haiku sobre GPUs" \
-c 8192 -ngl 99
# Servidor (API compatível com OpenAI)
llama-server -m .gguf \
-c 8192 -ngl 99 --port 8080
```
> `-ngl 99` envia todas as camadas para a GPU. Em CPU-only ou VRAM limitada, reduza o valor (ex.: `-ngl 0` para CPU).
Chamada à API do `llama-server`:
```bash
curl http://127.0.0.1:8080/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"messages":[{"role":"user","content":"Olá!"}],"stream":false}'
```
### Download
```bash
huggingface-cli download Brunobkr/ \
.gguf \
--local-dir ./models
```
### Outras ferramentas
- **Ollama:** crie um `Modelfile` com `FROM ./.gguf` e rode `ollama create -f Modelfile`.
- **LM Studio / KoboldCpp / text-generation-webui:** carregue o `.gguf` diretamente pela interface.
---
## 🎯 Casos de uso
Geração e edição de texto, chat e IA conversacional, sumarização, assistentes de código e fluxos agênticos — conforme as capacidades do modelo base.
---
## 🔓 Heretic — Abliteração e licença (AGPL-3.0)
Este derivado teve o alinhamento de segurança modificado via **[Heretic](https://github.com/p-e-w/heretic)** (AGPL-3.0).
> **Uso responsável.** Por se tratar de um modelo com alinhamento modificado, o usuário é o único responsável pelo uso, em conformidade com a licença do modelo base e a legislação aplicável.
---
## ⚠️ Notas e limitações
- **Derivado quantizado:** os pesos efetivos na inferência correspondem aos do modelo base sob o formato de quant escolhido.
- **Parâmetros de geração** (temperatura, `top_p`, `top_k`, template de chat, tokens especiais) seguem as **recomendações do modelo base** — consulte o card original.
- **Alinhamento:** quando abliterado via Heretic, o comportamento de recusa é alterado — avalie no seu caso de uso.
- **Validação:** avalie empiricamente perplexidade/qualidade do GGUF no seu fluxo antes de produção.
---
## 📚 Referências
- **Modelo base:** https://huggingface.co/lordx64/Qwable-v1
- **Heretic (abliteração):** https://github.com/p-e-w/heretic
- **llama.cpp / GGUF:** https://github.com/ggml-org/llama.cpp
- **Especificação GGUF:** https://huggingface.co/docs/hub/gguf
- **ΩFFΣLLIα (Hugging Face):** https://huggingface.co/Brunobkr
- **Kernel (dataset):** https://huggingface.co/datasets/Brunobkr/OFFELLIA_Kernel_llama-server
- **Depósito de pesquisa (Zenodo):** https://doi.org/10.5281/zenodo.20026837
---
## ✍️ Citação
```bibtex
@misc{becker_offsellia_zetahelicoidal,
title = {{ΩFFΣLLIα: Zetahelicoidal quantization layer for GGUF / llama.cpp}},
author = {Becker, Bruno},
year = {2026},
howpublished = {Hugging Face},
note = {Deterministic, reversible per-block pre-conditioning kernel},
url = {https://huggingface.co/Brunobkr},
doi = {10.5281/zenodo.20026837}
}
```