Instructions to use takumi123xxx/deepseek-ocr-calendar-finetuned with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- PEFT
How to use takumi123xxx/deepseek-ocr-calendar-finetuned with PEFT:
from peft import PeftModel from transformers import AutoModelForCausalLM base_model = AutoModelForCausalLM.from_pretrained("deepseek-ai/DeepSeek-OCR") model = PeftModel.from_pretrained(base_model, "takumi123xxx/deepseek-ocr-calendar-finetuned") - Notebooks
- Google Colab
- Kaggle
Upload folder using huggingface_hub
Browse files- README.md +7 -7
- handler.py +2 -2
README.md
CHANGED
|
@@ -1,10 +1,10 @@
|
|
| 1 |
---
|
| 2 |
-
base_model: deepseek-ai/
|
| 3 |
library_name: peft
|
| 4 |
pipeline_tag: image-text-to-text
|
| 5 |
tags:
|
| 6 |
- lora
|
| 7 |
-
- deepseek-
|
| 8 |
- ocr
|
| 9 |
- calendar
|
| 10 |
- vision-language
|
|
@@ -16,7 +16,7 @@ language:
|
|
| 16 |
|
| 17 |
# DeepSeek-OCR Calendar Fine-tuned (LoRA)
|
| 18 |
|
| 19 |
-
カレンダー画像から丸印のついた日付を抽出するために特化したDeepSeek-
|
| 20 |
|
| 21 |
## モデル概要
|
| 22 |
|
|
@@ -24,7 +24,7 @@ language:
|
|
| 24 |
|
| 25 |
### 主な特徴
|
| 26 |
|
| 27 |
-
- **ベースモデル**: deepseek-ai/
|
| 28 |
- **ファインチューニング手法**: LoRA (Low-Rank Adaptation)
|
| 29 |
- **トレーニングデータ**: 1,000件の合成カレンダー画像
|
| 30 |
- **エポック数**: 9エポック(Loss収束により早期停止)
|
|
@@ -84,8 +84,8 @@ from peft import PeftModel
|
|
| 84 |
from PIL import Image
|
| 85 |
import torch
|
| 86 |
|
| 87 |
-
# ベースモデルをロード
|
| 88 |
-
base_model_name = "deepseek-ai/
|
| 89 |
tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
|
| 90 |
base_model = AutoModelForCausalLM.from_pretrained(
|
| 91 |
base_model_name,
|
|
@@ -215,7 +215,7 @@ MIT License
|
|
| 215 |
|
| 216 |
## 謝辞
|
| 217 |
|
| 218 |
-
このモデルは、DeepSeek-AIの[
|
| 219 |
|
| 220 |
## 連絡先
|
| 221 |
|
|
|
|
| 1 |
---
|
| 2 |
+
base_model: deepseek-ai/DeepSeek-OCR
|
| 3 |
library_name: peft
|
| 4 |
pipeline_tag: image-text-to-text
|
| 5 |
tags:
|
| 6 |
- lora
|
| 7 |
+
- deepseek-ocr
|
| 8 |
- ocr
|
| 9 |
- calendar
|
| 10 |
- vision-language
|
|
|
|
| 16 |
|
| 17 |
# DeepSeek-OCR Calendar Fine-tuned (LoRA)
|
| 18 |
|
| 19 |
+
カレンダー画像から丸印のついた日付を抽出するために特化したDeepSeek-OCR 3BモデルのLoRAファインチューニング版です。
|
| 20 |
|
| 21 |
## モデル概要
|
| 22 |
|
|
|
|
| 24 |
|
| 25 |
### 主な特徴
|
| 26 |
|
| 27 |
+
- **ベースモデル**: deepseek-ai/DeepSeek-OCR (3B)
|
| 28 |
- **ファインチューニング手法**: LoRA (Low-Rank Adaptation)
|
| 29 |
- **トレーニングデータ**: 1,000件の合成カレンダー画像
|
| 30 |
- **エポック数**: 9エポック(Loss収束により早期停止)
|
|
|
|
| 84 |
from PIL import Image
|
| 85 |
import torch
|
| 86 |
|
| 87 |
+
# ベースモデル(DeepSeek-OCR 3B)をロード
|
| 88 |
+
base_model_name = "deepseek-ai/DeepSeek-OCR"
|
| 89 |
tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
|
| 90 |
base_model = AutoModelForCausalLM.from_pretrained(
|
| 91 |
base_model_name,
|
|
|
|
| 215 |
|
| 216 |
## 謝辞
|
| 217 |
|
| 218 |
+
このモデルは、DeepSeek-AIの[DeepSeek-OCR](https://huggingface.co/deepseek-ai/DeepSeek-OCR)をベースにしています。
|
| 219 |
|
| 220 |
## 連絡先
|
| 221 |
|
handler.py
CHANGED
|
@@ -18,8 +18,8 @@ class EndpointHandler:
|
|
| 18 |
Args:
|
| 19 |
path: モデルのパス(自動的に設定される)
|
| 20 |
"""
|
| 21 |
-
# ベースモデル(DeepSeek-OCR)のロード
|
| 22 |
-
base_model_name = "deepseek-ai/
|
| 23 |
|
| 24 |
self.tokenizer = AutoTokenizer.from_pretrained(
|
| 25 |
base_model_name,
|
|
|
|
| 18 |
Args:
|
| 19 |
path: モデルのパス(自動的に設定される)
|
| 20 |
"""
|
| 21 |
+
# ベースモデル(DeepSeek-OCR 3B)のロード
|
| 22 |
+
base_model_name = "deepseek-ai/DeepSeek-OCR"
|
| 23 |
|
| 24 |
self.tokenizer = AutoTokenizer.from_pretrained(
|
| 25 |
base_model_name,
|