takumi123xxx
/

deepseek-ocr-calendar-finetuned

@@ -1,10 +1,10 @@
 ---
-base_model: deepseek-ai/deepseek-vl-1.3b-chat
 library_name: peft
 pipeline_tag: image-text-to-text
 tags:
 - lora
-- deepseek-vl
 - ocr
 - calendar
 - vision-language
@@ -16,7 +16,7 @@ language:
 # DeepSeek-OCR Calendar Fine-tuned (LoRA)
-カレンダー画像から丸印のついた日付を抽出するために特化したDeepSeek-VL 1.3B ChatモデルのLoRAファインチューニング版です。
 ## モデル概要
@@ -24,7 +24,7 @@ language:
 ### 主な特徴
-- **ベースモデル**: deepseek-ai/deepseek-vl-1.3b-chat
 - **ファインチューニング手法**: LoRA (Low-Rank Adaptation)
 - **トレーニングデータ**: 1,000件の合成カレンダー画像
 - **エポック数**: 9エポック（Loss収束により早期停止）
@@ -84,8 +84,8 @@ from peft import PeftModel
 from PIL import Image
 import torch
-# ベースモデルをロード
-base_model_name = "deepseek-ai/deepseek-vl-1.3b-chat"
 tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
 base_model = AutoModelForCausalLM.from_pretrained(
     base_model_name,
@@ -215,7 +215,7 @@ MIT License
 ## 謝辞
-このモデルは、DeepSeek-AIの[deepseek-vl-1.3b-chat](https://huggingface.co/deepseek-ai/deepseek-vl-1.3b-chat)をベースにしています。
 ## 連絡先

 ---
+base_model: deepseek-ai/DeepSeek-OCR
 library_name: peft
 pipeline_tag: image-text-to-text
 tags:
 - lora
+- deepseek-ocr
 - ocr
 - calendar
 - vision-language
 # DeepSeek-OCR Calendar Fine-tuned (LoRA)
+カレンダー画像から丸印のついた日付を抽出するために特化したDeepSeek-OCR 3BモデルのLoRAファインチューニング版です。
 ## モデル概要
 ### 主な特徴
+- **ベースモデル**: deepseek-ai/DeepSeek-OCR (3B)
 - **ファインチューニング手法**: LoRA (Low-Rank Adaptation)
 - **トレーニングデータ**: 1,000件の合成カレンダー画像
 - **エポック数**: 9エポック（Loss収束により早期停止）
 from PIL import Image
 import torch
+# ベースモデル（DeepSeek-OCR 3B）をロード
+base_model_name = "deepseek-ai/DeepSeek-OCR"
 tokenizer = AutoTokenizer.from_pretrained(base_model_name, trust_remote_code=True)
 base_model = AutoModelForCausalLM.from_pretrained(
     base_model_name,
 ## 謝辞
+このモデルは、DeepSeek-AIの[DeepSeek-OCR](https://huggingface.co/deepseek-ai/DeepSeek-OCR)をベースにしています。
 ## 連絡先

handler.py CHANGED Viewed

@@ -18,8 +18,8 @@ class EndpointHandler:
         Args:
             path: モデルのパス（自動的に設定される）
         """
-        # ベースモデル（DeepSeek-OCR）のロード
-        base_model_name = "deepseek-ai/deepseek-vl-1.3b-chat"
         self.tokenizer = AutoTokenizer.from_pretrained(
             base_model_name,

         Args:
             path: モデルのパス（自動的に設定される）
         """
+        # ベースモデル（DeepSeek-OCR 3B）のロード
+        base_model_name = "deepseek-ai/DeepSeek-OCR"
         self.tokenizer = AutoTokenizer.from_pretrained(
             base_model_name,