Spaces:

rikunarita-2
/

Space-of-Anima-series

Sleeping

App Files Files Community

rikunarita-2 commited on May 20

Commit

af023a0

verified ·

1 Parent(s): 551c222

Update Dockerfile

Browse files

Files changed (1) hide show

Dockerfile +17 -18

Dockerfile CHANGED Viewed

@@ -24,38 +24,35 @@ ENV PYTHONUNBUFFERED=1
 ENV PYTHONDONTWRITEBYTECODE=1
 # ------------------------------------------------
-# メモリアロケータ (x86_64 パス確定)
 # ------------------------------------------------
-# jemalloc: 大テンソルの断片化抑制
 ENV LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libjemalloc.so.2
 # ------------------------------------------------
-# スレッド数 (物理2コア × HT2 = 論理4スレッド)
 # ------------------------------------------------
 ENV OMP_NUM_THREADS=2
 ENV MKL_NUM_THREADS=2
-# PyTorch inter-op 並列度: 単一モデル推論では 1 が最適
 ENV TORCH_NUM_INTEROP_THREADS=1
 # ------------------------------------------------
-# Intel OpenMP チューニング
 # ------------------------------------------------
-# アイドルスレッドを即スリープ → 推論ループ間のウェイクアップ遅延ゼロ
-ENV KMP_BLOCKTIME=0
-ENV KMP_AFFINITY=granularity=fine,compact,1,0
-# 2 物理コアしかないため ACTIVE スピン待機は禁止。
-# スピンすると HT 兄弟スレッドの演算ユニットを奪い実効性能が低下する。
-ENV OMP_WAIT_POLICY=PASSIVE
 # ------------------------------------------------
-# oneDNN チューニング (Ice Lake: AVX-512 BF16 / AMX 対応)
 # ------------------------------------------------
-# FP32 演算も BF16 精度で高速実行 (AVX-512_BF16 カーネルを最大活用)
 ENV DNNL_DEFAULT_FPMATH_MODE=BF16
-# 同一 shape 演算のプリミティブキャッシュ拡大 → 再コンパイル削減
-ENV ONEDNN_PRIMITIVE_CACHE_CAPACITY=1024
 WORKDIR /home/hf
@@ -71,8 +68,10 @@ ENV VIRTUAL_ENV=/home/hf/ComfyUI/venv
 RUN python3 -m venv $VIRTUAL_ENV
 ENV PATH="$VIRTUAL_ENV/bin:$PATH"
-RUN pip install --upgrade pip
-RUN pip install --no-cache-dir --prefer-binary -r requirements.txt
 # ------------------------------------------------
 # models

 ENV PYTHONDONTWRITEBYTECODE=1
 # ------------------------------------------------
+# メモリアロケータ設定の強化
 # ------------------------------------------------
 ENV LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libjemalloc.so.2
+# 💡 jemallocのバックグラウンドスレッドを有効化し、断片化とメモリ肥大化を徹底抑制
+ENV MALLOC_CONF="background_thread:true,metadata_thp:auto,dirty_decay_ms:20000,muzzy_decay_ms:20000"
 # ------------------------------------------------
+# スレッド数 (🔥 物理2コアに合わせて「2」に削減)
 # ------------------------------------------------
+# ディープラーニングのCPU推論では、HT(論理コア)を使うとAVX-512ユニットを奪い合って逆に遅くなります
 ENV OMP_NUM_THREADS=2
 ENV MKL_NUM_THREADS=2
 ENV TORCH_NUM_INTEROP_THREADS=1
 # ------------------------------------------------
+# Intel OpenMP チューニング (🔥 常時100%全力スピンモード)
 # ------------------------------------------------
+# 物理2コアに綺麗にバインド
+ENV KMP_AFFINITY=granularity=fine,compact
+# 💡 スレッドを絶対に休ませないための2つの魔法
+ENV OMP_WAIT_POLICY=ACTIVE
+ENV KMP_BLOCKTIME=infinite
 # ------------------------------------------------
+# oneDNN チューニング
 # ------------------------------------------------
 ENV DNNL_DEFAULT_FPMATH_MODE=BF16
+ENV ONEDNN_PRIMITIVE_CACHE_CAPACITY=512
 WORKDIR /home/hf
 RUN python3 -m venv $VIRTUAL_ENV
 ENV PATH="$VIRTUAL_ENV/bin:$PATH"
+# 💡 キャッシュを生成せず、IPEX(Intel Extension for PyTorch)を追加インストール
+RUN pip install --no-cache-dir --upgrade pip && \
+    pip install --no-cache-dir --prefer-binary -r requirements.txt && \
+    pip install --no-cache-dir intel-extension-for-pytorch
 # ------------------------------------------------
 # models