takumi123xxx commited on
Commit
ee1ea62
·
verified ·
1 Parent(s): effa90f

Upload folder using huggingface_hub

Browse files
Files changed (2) hide show
  1. README.md +7 -7
  2. handler.py +2 -2
README.md CHANGED
@@ -1,10 +1,10 @@
1
  ---
2
- base_model: deepseek-ai/deepseek-vl-1.3b-chat
3
  library_name: peft
4
  pipeline_tag: image-text-to-text
5
  tags:
6
  - lora
7
- - deepseek-vl
8
  - ocr
9
  - calendar
10
  - vision-language
@@ -16,7 +16,7 @@ language:
16
 
17
  # DeepSeek-OCR Calendar Fine-tuned (LoRA)
18
 
19
- カレンダー画像から丸印のついた日付を抽出するために特化したDeepSeek-VL 1.3B ChatモデルのLoRAファインチューニング版です。
20
 
21
  ## モデル概要
22
 
@@ -24,7 +24,7 @@ language:
24
 
25
  ### 主な特徴
26
 
27
- - **ベースモデル**: deepseek-ai/deepseek-vl-1.3b-chat
28
  - **ファインチューニング手法**: LoRA (Low-Rank Adaptation)
29
  - **トレーニングデータ**: 1,000件の合成カレンダー画像
30
  - **エポック数**: 9エポック(Loss収束により早期停止)
@@ -84,8 +84,8 @@ from peft import PeftModel
84
  from PIL import Image
85
  import torch
86
 
87
- # ベースモデルをロード
88
- base_model_name = "deepseek-ai/deepseek-vl-1.3b-chat"
89
  tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
90
  base_model = AutoModelForCausalLM.from_pretrained(
91
  base_model_name,
@@ -215,7 +215,7 @@ MIT License
215
 
216
  ## 謝辞
217
 
218
- このモデルは、DeepSeek-AIの[deepseek-vl-1.3b-chat](https://huggingface.co/deepseek-ai/deepseek-vl-1.3b-chat)をベースにしています。
219
 
220
  ## 連絡先
221
 
 
1
  ---
2
+ base_model: deepseek-ai/DeepSeek-OCR
3
  library_name: peft
4
  pipeline_tag: image-text-to-text
5
  tags:
6
  - lora
7
+ - deepseek-ocr
8
  - ocr
9
  - calendar
10
  - vision-language
 
16
 
17
  # DeepSeek-OCR Calendar Fine-tuned (LoRA)
18
 
19
+ カレンダー画像から丸印のついた日付を抽出するために特化したDeepSeek-OCR 3BモデルのLoRAファインチューニング版です。
20
 
21
  ## モデル概要
22
 
 
24
 
25
  ### 主な特徴
26
 
27
+ - **ベースモデル**: deepseek-ai/DeepSeek-OCR (3B)
28
  - **ファインチューニング手法**: LoRA (Low-Rank Adaptation)
29
  - **トレーニングデータ**: 1,000件の合成カレンダー画像
30
  - **エポック数**: 9エポック(Loss収束により早期停止)
 
84
  from PIL import Image
85
  import torch
86
 
87
+ # ベースモデル(DeepSeek-OCR 3B)をロード
88
+ base_model_name = "deepseek-ai/DeepSeek-OCR"
89
  tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
90
  base_model = AutoModelForCausalLM.from_pretrained(
91
  base_model_name,
 
215
 
216
  ## 謝辞
217
 
218
+ このモデルは、DeepSeek-AIの[DeepSeek-OCR](https://huggingface.co/deepseek-ai/DeepSeek-OCR)をベースにしています。
219
 
220
  ## 連絡先
221
 
handler.py CHANGED
@@ -18,8 +18,8 @@ class EndpointHandler:
18
  Args:
19
  path: モデルのパス(自動的に設定される)
20
  """
21
- # ベースモデル(DeepSeek-OCR)のロード
22
- base_model_name = "deepseek-ai/deepseek-vl-1.3b-chat"
23
 
24
  self.tokenizer = AutoTokenizer.from_pretrained(
25
  base_model_name,
 
18
  Args:
19
  path: モデルのパス(自動的に設定される)
20
  """
21
+ # ベースモデル(DeepSeek-OCR 3B)のロード
22
+ base_model_name = "deepseek-ai/DeepSeek-OCR"
23
 
24
  self.tokenizer = AutoTokenizer.from_pretrained(
25
  base_model_name,