--- license: other license_name: refer-to-base-model license_link: https://huggingface.co/docs/hub/repositories-licenses base_model: lordx64/Qwable-v1 base_model_relation: quantized pipeline_tag: text-generation library_name: gguf quantized_by: Brunobkr language: - en - pt tags: - gguf - llama.cpp - quantized - offellia - zetahelicoidal - helicoidal-zeta - multilingual - portuguese - brasil - heretic - abliterated - uncensored - conversational ---

ΩFFΣLLIα

# ΩFFΣLLIα — Quantização GGUF Zetahelicoidal Derivado **GGUF** do modelo base, processado com a quantização **ΩFFΣLLIα / Zetahelicoidal** sobre o pipeline do **llama.cpp**. Compatível com qualquer runtime que carregue GGUF: `llama.cpp`, `llama-server`, `Ollama`, `LM Studio`, `KoboldCpp`, `text-generation-webui`, entre outros. > **Créditos.** Todos os pesos e a arquitetura pertencem ao modelo base. Este repositório distribui apenas o derivado quantizado. > Modelo base: **[lordx64/Qwable-v1](https://huggingface.co/lordx64/Qwable-v1)** --- ## 📌 Visão geral | Item | Valor | | --- | --- | | **Variante** | ΩFFΣLLIα / Zetahelicoidal | | **Formato** | GGUF | | **Relação com o base** | Derivado quantizado | | **Quantização** | Brunobkr ([ΩFFΣLLIα](https://huggingface.co/Brunobkr)) | | **Abliteração** | Heretic (AGPL-3.0) | | **Idiomas** | Conforme o modelo base (multilíngue) | > Os pesos efetivos durante a inferência correspondem aos do modelo base sob o formato de quantização escolhido. --- ## 🧬 Quantização Zetahelicoidal (ΩFFΣLLIα) A **ΩFFΣLLIα / Zetahelicoidal** é uma camada de **pré-condicionamento determinística e reversível**, aplicada **bloco a bloco antes** da quantização padrão do GGML/llama.cpp e **desfeita na dequantização**. Ela **não substitui** os formatos nativos (Q-K, IQ, MXFP4_MOE, etc.) — **opera sobre eles**, preservando **compatibilidade total** com qualquer runtime GGUF. Por ser determinística e reversível, não altera a interface do arquivo nem exige patches no consumidor: carrega como um GGUF comum. --- ## 🚀 Uso rápido com llama.cpp ```bash # CLI llama-cli -m .gguf \ -p "Escreva um haiku sobre GPUs" \ -c 8192 -ngl 99 # Servidor (API compatível com OpenAI) llama-server -m .gguf \ -c 8192 -ngl 99 --port 8080 ``` > `-ngl 99` envia todas as camadas para a GPU. Em CPU-only ou VRAM limitada, reduza o valor (ex.: `-ngl 0` para CPU). Chamada à API do `llama-server`: ```bash curl http://127.0.0.1:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{"messages":[{"role":"user","content":"Olá!"}],"stream":false}' ``` ### Download ```bash huggingface-cli download Brunobkr/ \ .gguf \ --local-dir ./models ``` ### Outras ferramentas - **Ollama:** crie um `Modelfile` com `FROM ./.gguf` e rode `ollama create -f Modelfile`. - **LM Studio / KoboldCpp / text-generation-webui:** carregue o `.gguf` diretamente pela interface. --- ## 🎯 Casos de uso Geração e edição de texto, chat e IA conversacional, sumarização, assistentes de código e fluxos agênticos — conforme as capacidades do modelo base. --- ## 🔓 Heretic — Abliteração e licença (AGPL-3.0) Este derivado teve o alinhamento de segurança modificado via **[Heretic](https://github.com/p-e-w/heretic)** (AGPL-3.0). > **Uso responsável.** Por se tratar de um modelo com alinhamento modificado, o usuário é o único responsável pelo uso, em conformidade com a licença do modelo base e a legislação aplicável. --- ## ⚠️ Notas e limitações - **Derivado quantizado:** os pesos efetivos na inferência correspondem aos do modelo base sob o formato de quant escolhido. - **Parâmetros de geração** (temperatura, `top_p`, `top_k`, template de chat, tokens especiais) seguem as **recomendações do modelo base** — consulte o card original. - **Alinhamento:** quando abliterado via Heretic, o comportamento de recusa é alterado — avalie no seu caso de uso. - **Validação:** avalie empiricamente perplexidade/qualidade do GGUF no seu fluxo antes de produção. --- ## 📚 Referências - **Modelo base:** https://huggingface.co/lordx64/Qwable-v1 - **Heretic (abliteração):** https://github.com/p-e-w/heretic - **llama.cpp / GGUF:** https://github.com/ggml-org/llama.cpp - **Especificação GGUF:** https://huggingface.co/docs/hub/gguf - **ΩFFΣLLIα (Hugging Face):** https://huggingface.co/Brunobkr - **Kernel (dataset):** https://huggingface.co/datasets/Brunobkr/OFFELLIA_Kernel_llama-server - **Depósito de pesquisa (Zenodo):** https://doi.org/10.5281/zenodo.20026837 --- ## ✍️ Citação ```bibtex @misc{becker_offsellia_zetahelicoidal, title = {{ΩFFΣLLIα: Zetahelicoidal quantization layer for GGUF / llama.cpp}}, author = {Becker, Bruno}, year = {2026}, howpublished = {Hugging Face}, note = {Deterministic, reversible per-block pre-conditioning kernel}, url = {https://huggingface.co/Brunobkr}, doi = {10.5281/zenodo.20026837} } ```