hung2903 commited on
Commit
70495e2
·
verified ·
1 Parent(s): 8ffa2bf

Upload README.md with huggingface_hub

Browse files
Files changed (1) hide show
  1. README.md +68 -14
README.md CHANGED
@@ -1,21 +1,75 @@
1
  ---
 
 
2
  tags:
3
- - gguf
4
- - llama.cpp
5
- - unsloth
6
- - vision-language-model
 
 
 
 
 
 
 
7
  ---
8
 
9
- # gemma-4-E2B-vaccine-xai-merged-qat : GGUF
10
 
11
- This model was finetuned and converted to GGUF format using [Unsloth](https://github.com/unslothai/unsloth).
12
 
13
- **Example usage**:
14
- - For text only LLMs: `llama-cli -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat --jinja`
15
- - For multimodal models: `llama-mtmd-cli -hf hung2903/gemma-4-E2B-vaccine-xai-merged-qat --jinja`
16
 
17
- ## Available Model files:
18
- - `gemma-4-E2B-it-qat-q4_0-unquantized.Q4_0.gguf`
19
- - `gemma-4-E2B-it-qat-q4_0-unquantized.F16-mmproj.gguf`
20
- This was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth)
21
- [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ license: gemma
3
+ base_model: google/gemma-4-E2B-it-qat-q4_0-unquantized
4
  tags:
5
+ - vietnamese
6
+ - vaccine
7
+ - misinformation
8
+ - public-health
9
+ - explainable-ai
10
+ - gguf
11
+ - q4_0
12
+ language:
13
+ - vi
14
+ pipeline_tag: text-generation
15
+ inference: true
16
  ---
17
 
18
+ # VaccineNLP - Gemma-4 E2B QAT Misinfo Engine (GGUF Q4_0)
19
 
20
+ File GGUF Q4_0 của adapter QAT [hung2903/gemma-4-E2B-unsloth-vaccine-xai-qat](https://huggingface.co/hung2903/gemma-4-E2B-unsloth-vaccine-xai-qat) merged với base [google/gemma-4-E2B-it-qat-q4_0-unquantized](https://huggingface.co/google/gemma-4-E2B-it-qat-q4_0-unquantized).
21
 
22
+ hình này chỉ phục vụ trục Misinfo chính theo taxonomy nội bộ `Fake` / `Real` và sinh JSON có cấu trúc tương thích `parse_deep_output`.
 
 
23
 
24
+ ## Hiệu suất (Gold Test Set, n=186) — chấm trên RAW model output (trung thực)
25
+
26
+ Engine này CHỈ tái phân loại **trục Misinfo (Fake/Real)** theo kiến trúc tách trục (§3.10);
27
+ Stance & Sentiment do PhoBERT đảm nhiệm. Số liệu đo trên **đầu ra thô của mô hình** (không qua
28
+ tầng sửa lỗi/repair) nên phản ánh đúng năng lực thật.
29
+
30
+ | Metric | Score |
31
+ |---|:---:|
32
+ | **Macro F1 (Misinfo)** | **0.6428** |
33
+ | Recall (Fake) | 0.7143 |
34
+ | Precision (Fake) | 0.3333 |
35
+ | F1 (Fake) | 0.4545 |
36
+ | F1 (Real) | 0.831 |
37
+ | Parse success rate | 96.8% |
38
+ | Banned-label outputs | 0 |
39
+
40
+ **Confusion matrix** (hàng = nhãn thật, cột = dự đoán):
41
+
42
+ | | → Fake | → Real |
43
+ |---|:---:|:---:|
44
+ | **Fake** (n=28) | 20 | 8 |
45
+ | **Real** (n=158) | 40 | 118 |
46
+
47
+ > Acceptance gate: parse-fail < 5%, banned-label = 0, recall Fake >= 0.70 — tất cả ĐẠT.
48
+ > Output là JSON có cấu trúc `{"label","confidence","sufficient_context","rationale","key_spans"}`
49
+ > tương thích `parse_deep_output`; confidence/key_spans cuối do tầng code hệ thống xác minh.
50
+
51
+
52
+ ## Sử dụng với LM Studio / Ollama local
53
+
54
+ ```python
55
+ import openai
56
+ client = openai.OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")
57
+ response = client.chat.completions.create(
58
+ model="local-model",
59
+ messages=[{"role": "user", "content": "Van ban: Vac-xin COVID gay vo sinh."}],
60
+ max_tokens=512,
61
+ temperature=0.1,
62
+ )
63
+ print(response.choices[0].message.content)
64
+ ```
65
+
66
+ ## Trích dẫn
67
+
68
+ ```bibtex
69
+ @thesis{vaccinenlp2026,
70
+ title={Ứng dụng Xử lý Ngôn ngữ Tự nhiên trong phát hiện thông tin sai lệch về vaccine},
71
+ author={Kim Mạnh Hưng and Đinh Lê Quỳnh Phương},
72
+ school={Trường Đại học Y tế Công cộng (HUPH)},
73
+ year={2026},
74
+ }
75
+ ```