Spaces:

rikunarita-2
/

Space-of-Anima-series

Sleeping

App Files Files Community

rikunarita-2 commited on May 22

Commit

3a5ed88

verified ·

1 Parent(s): af023a0

Update Dockerfile

Browse files

Files changed (1) hide show

Dockerfile +54 -53

Dockerfile CHANGED Viewed

@@ -1,14 +1,14 @@
-FROM pytorch/pytorch:2.11.0-cuda13.0-cudnn9-runtime
 # ------------------------------------------------
-# System packages
 # ------------------------------------------------
 RUN apt-get update && \
     apt-get install -y --no-install-recommends \
         git \
         wget \
-        python3-venv \
-        python3-setuptools \
         libjemalloc2 && \
     apt-get clean && \
     rm -rf /var/lib/apt/lists/*
@@ -23,43 +23,27 @@ ENV HF_HOME=/tmp/hf_cache
 ENV PYTHONUNBUFFERED=1
 ENV PYTHONDONTWRITEBYTECODE=1
-# ------------------------------------------------
-# メモリアロケータ設定の強化
-# ------------------------------------------------
 ENV LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libjemalloc.so.2
-# 💡 jemallocのバックグラウンドスレッドを有効化し、断片化とメモリ肥大化を徹底抑制
 ENV MALLOC_CONF="background_thread:true,metadata_thp:auto,dirty_decay_ms:20000,muzzy_decay_ms:20000"
 # ------------------------------------------------
-# スレッド数 (🔥 物理2コアに合わせて「2」に削減)
 # ------------------------------------------------
-# ディープラーニングのCPU推論では、HT(論理コア)を使うとAVX-512ユニットを奪い合って逆に遅くなります
-ENV OMP_NUM_THREADS=2
-ENV MKL_NUM_THREADS=2
-ENV TORCH_NUM_INTEROP_THREADS=1
-# ------------------------------------------------
-# Intel OpenMP チューニング (🔥 常時100%全力スピンモード)
-# ------------------------------------------------
-# 物理2コアに綺麗にバインド
-ENV KMP_AFFINITY=granularity=fine,compact
-# 💡 スレッドを絶対に休ませないための2つの魔法
-ENV OMP_WAIT_POLICY=ACTIVE
-ENV KMP_BLOCKTIME=infinite
-# ------------------------------------------------
-# oneDNN チューニング
-# ------------------------------------------------
 ENV DNNL_DEFAULT_FPMATH_MODE=BF16
 ENV ONEDNN_PRIMITIVE_CACHE_CAPACITY=512
 WORKDIR /home/hf
 USER hf
 # ------------------------------------------------
-# ComfyUI
 # ------------------------------------------------
 RUN git clone https://github.com/comfyanonymous/ComfyUI
 WORKDIR /home/hf/ComfyUI
@@ -68,36 +52,53 @@ ENV VIRTUAL_ENV=/home/hf/ComfyUI/venv
 RUN python3 -m venv $VIRTUAL_ENV
 ENV PATH="$VIRTUAL_ENV/bin:$PATH"
-# 💡 キャッシュを生成せず、IPEX(Intel Extension for PyTorch)を追加インストール
 RUN pip install --no-cache-dir --upgrade pip && \
-    pip install --no-cache-dir --prefer-binary -r requirements.txt && \
     pip install --no-cache-dir intel-extension-for-pytorch
 # ------------------------------------------------
-# models
 # ------------------------------------------------
-RUN wget -nv -c \
-https://huggingface.co/circlestone-labs/Anima/resolve/main/split_files/diffusion_models/anima-base-v1.0.safetensors \
--P ./models/diffusion_models/
-RUN wget -nv -c \
-https://huggingface.co/circlestone-labs/Anima/resolve/main/split_files/text_encoders/qwen_3_06b_base.safetensors \
--P ./models/text_encoders/
-RUN wget -nv -c \
-https://huggingface.co/circlestone-labs/Anima/resolve/main/split_files/vae/qwen_image_vae.safetensors \
--P ./models/vae/
 RUN mkdir temp && chmod 777 temp
-CMD ["python", "main.py", \
-     "--cpu", \
-     "--listen", "0.0.0.0", \
-     "--port", "7860", \
-     "--output-directory", "./temp", \
-     "--bf16-unet", \
-     "--bf16-vae", \
-     "--bf16-text-enc", \
-     "--use-pytorch-cross-attention", \
-     "--preview-method", "none"]

+FROM python:3.10-slim
 # ------------------------------------------------
+# システムパッケージ & jemalloc の導入
 # ------------------------------------------------
 RUN apt-get update && \
     apt-get install -y --no-install-recommends \
         git \
         wget \
+        gcc \
+        g++ \
         libjemalloc2 && \
     apt-get clean && \
     rm -rf /var/lib/apt/lists/*
 ENV PYTHONUNBUFFERED=1
 ENV PYTHONDONTWRITEBYTECODE=1
+# 💡 バグ修正：構文エラーを直し、jemallocによるメモリ断片化抑制を確実に有効化
 ENV LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libjemalloc.so.2
 ENV MALLOC_CONF="background_thread:true,metadata_thp:auto,dirty_decay_ms:20000,muzzy_decay_ms:20000"
 # ------------------------------------------------
+# OpenMP / スレッドチューニング（コンテナ環境向け最適化）
 # ------------------------------------------------
+# 💡 仮想化（vCPU）コンテナ環境の鉄則である「PASSIVE」に変更。
+# 無駄なスレッドのスピン（CPUの奪い合い）を排除し、処理効率を劇的に向上させます。
+ENV OMP_WAIT_POLICY=PASSIVE
+ENV KMP_BLOCKTIME=0
+# oneDNN チューニング（BF16高速化を有効化）
 ENV DNNL_DEFAULT_FPMATH_MODE=BF16
 ENV ONEDNN_PRIMITIVE_CACHE_CAPACITY=512
 WORKDIR /home/hf
 USER hf
 # ------------------------------------------------
+# ComfyUI のセットアップ
 # ------------------------------------------------
 RUN git clone https://github.com/comfyanonymous/ComfyUI
 WORKDIR /home/hf/ComfyUI
 RUN python3 -m venv $VIRTUAL_ENV
 ENV PATH="$VIRTUAL_ENV/bin:$PATH"
+# 💡 変更：CPU専用版のPyTorchを明示的にインストール。
+# これにより、Intel CPUのoneDNN（高速化命令）を直接叩ける最適なバイナリが導入されます。
 RUN pip install --no-cache-dir --upgrade pip && \
+    pip install --no-cache-dir torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu && \
+    pip install --no-cache-dir -r requirements.txt && \
     pip install --no-cache-dir intel-extension-for-pytorch
 # ------------------------------------------------
+# モデルのダウンロード（高速化のためレイヤーを統合）
 # ------------------------------------------------
+RUN wget -nv -c https://huggingface.co/circlestone-labs/Anima/resolve/main/split_files/diffusion_models/anima-base-v1.0.safetensors -P ./models/diffusion_models/ && \
+    wget -nv -c https://huggingface.co/circlestone-labs/Anima/resolve/main/split_files/text_encoders/qwen_3_06b_base.safetensors -P ./models/text_encoders/ && \
+    wget -nv -c https://huggingface.co/circlestone-labs/Anima/resolve/main/split_files/vae/qwen_image_vae.safetensors -P ./models/vae/
 RUN mkdir temp && chmod 777 temp
+# ------------------------------------------------
+# 5. 起動コマンド（cgroupsによる割り当てコア数の厳密な自動検知）
+# ------------------------------------------------
+# 💡 誤検知防止: ホストの物理コア数ではなく、cgroups (v1/v2) のリソース制限から
+# コンテナに真に割り当てられている実効コア数（Quota / Period）を動的に算出します。
+CMD export COMPUTE_CORES=$(python3 -c " \
+import os, math; \
+q_v2='/sys/fs/cgroup/cpu.max'; \
+q_v1='/sys/fs/cgroup/cpu/cpu.cfs_quota_us'; \
+p_v1='/sys/fs/cgroup/cpu/cpu.cfs_period_us'; \
+limit=0; \
+if os.path.exists(q_v2): \
+    v=open(q_v2).read().split(); \
+    if len(v)==2 and v[0]!='max': limit=math.ceil(float(v[0])/float(v[1])); \
+elif os.path.exists(q_v1) and os.path.exists(p_v1): \
+    q=float(open(q_v1).read()); p=float(open(p_v1).read()); \
+    if q>0 and p>0: limit=math.ceil(q/p); \
+if limit<=0: \
+    try: limit=len(os.sched_getaffinity(0)) \
+    except: limit=os.cpu_count() or 1; \
+print(max(1, limit))") && \
+    export OMP_NUM_THREADS=$COMPUTE_CORES && \
+    export MKL_NUM_THREADS=$COMPUTE_CORES && \
+    echo "=== Detected Allocated CPU Cores: $COMPUTE_CORES ===" && \
+    python main.py \
+        --cpu \
+        --listen 0.0.0.0 \
+        --port 7860 \
+        --output-directory ./temp \
+        --bf16-unet \
+        --bf16-vae \
+        --bf16-text-enc \
+        --use-pytorch-cross-attention \
+        --preview-method none