How to use from
llama.cpp
Install (macOS, Linux)
curl -LsSf https://llama.app/install.sh | sh
# Start a local OpenAI-compatible server with a web UI:
llama serve -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
# Run inference directly in the terminal:
llama cli -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
Install from WinGet (Windows)
winget install llama.cpp
# Start a local OpenAI-compatible server with a web UI:
llama serve -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
# Run inference directly in the terminal:
llama cli -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
Use pre-built binary
# Download pre-built binary from:
# https://github.com/ggerganov/llama.cpp/releases
# Start a local OpenAI-compatible server with a web UI:
./llama-server -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
# Run inference directly in the terminal:
./llama-cli -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
Build from source code
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
cmake -B build
cmake --build build -j --target llama-server llama-cli
# Start a local OpenAI-compatible server with a web UI:
./build/bin/llama-server -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
# Run inference directly in the terminal:
./build/bin/llama-cli -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
Use Docker
docker model run hf.co/hung2903/gemma-4-E2B-vaccine-xai-merged-qat:F16
Quick Links

VaccineNLP - Gemma-4 E2B QAT Misinfo Engine (GGUF Q4_0)

File GGUF Q4_0 của adapter QAT hung2903/gemma-4-E2B-unsloth-vaccine-xai-qat merged với base google/gemma-4-E2B-it-qat-q4_0-unquantized.

Mô hình này chỉ phục vụ trục Misinfo chính theo taxonomy nội bộ Fake / Real và sinh JSON có cấu trúc tương thích parse_deep_output.

Hiệu suất (Gold Test Set, n=186) — chấm trên RAW model output (trung thực)

Engine này CHỈ tái phân loại trục Misinfo (Fake/Real) theo kiến trúc tách trục (§3.10); Stance & Sentiment do PhoBERT đảm nhiệm. Số liệu đo trên đầu ra thô của mô hình (không qua tầng sửa lỗi/repair) nên phản ánh đúng năng lực thật.

Metric Score
Macro F1 (Misinfo) 0.6428
Recall (Fake) 0.7143
Precision (Fake) 0.3333
F1 (Fake) 0.4545
F1 (Real) 0.831
Parse success rate 96.8%
Banned-label outputs 0

Confusion matrix (hàng = nhãn thật, cột = dự đoán):

→ Fake → Real
Fake (n=28) 20 8
Real (n=158) 40 118

Acceptance gate: parse-fail < 5%, banned-label = 0, recall Fake >= 0.70 — tất cả ĐẠT. Output là JSON có cấu trúc {"label","confidence","sufficient_context","rationale","key_spans"} tương thích parse_deep_output; confidence/key_spans cuối do tầng code hệ thống xác minh.

Sử dụng với LM Studio / Ollama local

import openai
client = openai.OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")
response = client.chat.completions.create(
    model="local-model",
    messages=[{"role": "user", "content": "Van ban: Vac-xin COVID gay vo sinh."}],
    max_tokens=512,
    temperature=0.1,
)
print(response.choices[0].message.content)

Trích dẫn

@thesis{vaccinenlp2026,
  title={Ứng dụng Xử lý Ngôn ngữ Tự nhiên trong phát hiện thông tin sai lệch về vaccine},
  author={Kim Mạnh Hưng and Đinh Lê Quỳnh Phương},
  school={Trường Đại học Y tế Công cộng (HUPH)},
  year={2026},
}
Downloads last month
232
GGUF
Model size
5B params
Architecture
gemma4
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for hung2903/gemma-4-E2B-vaccine-xai-merged-qat

Quantized
(28)
this model

Collection including hung2903/gemma-4-E2B-vaccine-xai-merged-qat