Safetensors
GGUF
PyTorch
Vietnamese
vision-language
qwen
vlm
conversational
minhduc168 commited on
Commit
02dadc4
·
verified ·
1 Parent(s): 708e7a7

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +4 -5
README.md CHANGED
@@ -16,14 +16,14 @@ base_model:
16
 
17
  # Qwen3-VL-2B-Instruct Vietnamese (4-bit)
18
 
19
- Mô hình **Qwen3-VL-2B-Instruct** được fine-tune cho tác vụ **trích xuất thông tin hóa đơn, phiếu thu đơn thuốc tiếng Việt**.
20
  Model hỗ trợ hiểu hình ảnh và văn bản, phù hợp cho các bài toán OCR nâng cao, document understanding và information extraction.
21
 
22
  ---
23
 
24
  ## 🔥 Điểm nổi bật
25
  - ✅ Tối ưu cho **tiếng Việt**
26
- - ✅ Fine-tune cho **bill / invoice / prescription extraction**
27
  - ✅ Phiên bản **4-bit (bnb)** giúp giảm VRAM khi inference
28
  - ✅ Có thể chuyển sang **GGUF** để chạy local CPU
29
  - ✅ Tương thích với `transformers`
@@ -74,13 +74,12 @@ processor = AutoProcessor.from_pretrained(
74
 
75
  ## 📊 Dataset
76
 
77
- Model được huấn luyện trên:**[minhduc168/dataset-qwen-vlm-extract-bill](https://huggingface.co/datasets/minhduc168/dataset-qwen-vlm-extract-bill)**
78
-
79
  **Bao gồm:**
80
  - Hóa đơn bán lẻ
81
  - Phiếu thu
82
  - Đơn thuốc
83
- - Chứng từ tiếng Việt
 
84
 
85
  Định dạng **instruction-following** giúp model trích xuất dữ liệu có cấu trúc chính xác hơn.
86
 
 
16
 
17
  # Qwen3-VL-2B-Instruct Vietnamese (4-bit)
18
 
19
+ Mô hình **Qwen3-VL-2B-Instruct** được fine-tune cho tác vụ **trích xuất thông tin hóa đơn, phiếu thu, đơn thuốc và chuẩn đoán bệnh tiếng Việt**.
20
  Model hỗ trợ hiểu hình ảnh và văn bản, phù hợp cho các bài toán OCR nâng cao, document understanding và information extraction.
21
 
22
  ---
23
 
24
  ## 🔥 Điểm nổi bật
25
  - ✅ Tối ưu cho **tiếng Việt**
26
+ - ✅ Fine-tune cho **bill / invoice / prescription / diagnosis extraction**
27
  - ✅ Phiên bản **4-bit (bnb)** giúp giảm VRAM khi inference
28
  - ✅ Có thể chuyển sang **GGUF** để chạy local CPU
29
  - ✅ Tương thích với `transformers`
 
74
 
75
  ## 📊 Dataset
76
 
 
 
77
  **Bao gồm:**
78
  - Hóa đơn bán lẻ
79
  - Phiếu thu
80
  - Đơn thuốc
81
+ - Chứng từ tiếng Việt
82
+ - Chuẩn đoán bệnh
83
 
84
  Định dạng **instruction-following** giúp model trích xuất dữ liệu có cấu trúc chính xác hơn.
85