rikunarita's picture
Create Dockerfile
2422081 verified
Raw
History Blame Contribute Delete
851 Bytes
FROM ghcr.io/ggml-org/llama.cpp:full
# 作業ディレクトリを /app に固定(権限問題の回避)
WORKDIR /app
# 必要なパッケージをインストール
RUN apt update && apt install -y python3-pip
# huggingface_hub のインストール
RUN pip install -U huggingface_hub
# Pythonスクリプトで直接実行
RUN python3 -c 'from huggingface_hub import hf_hub_download; \
hf_hub_download(repo_id="unsloth/Llama-3.2-3B-Instruct-GGUF", \
filename="Llama-3.2-3B-Instruct-IQ4_NL.gguf", \
local_dir=".", \
local_dir_use_symlinks=False)'
# 念のためファイルが存在するか確認する
RUN ls -lh /app/Llama-3.2-3B-Instruct-IQ4_NL.gguf
# CPUでサーバーを起動
CMD ["--server", "-m", "/app/Llama-3.2-3B-Instruct-IQ4_NL.gguf", "--port", "7860", "--host", "0.0.0.0", "-n", "4096", "--ctx-size", "32768"]