FROM ghcr.io/ggml-org/llama.cpp:full # 作業ディレクトリを /app に固定(権限問題の回避) WORKDIR /app # 必要なパッケージをインストール RUN apt update && apt install -y python3-pip # huggingface_hub のインストール RUN pip install -U huggingface_hub # Pythonスクリプトで直接実行 RUN python3 -c 'from huggingface_hub import hf_hub_download; \ hf_hub_download(repo_id="unsloth/Llama-3.2-3B-Instruct-GGUF", \ filename="Llama-3.2-3B-Instruct-IQ4_NL.gguf", \ local_dir=".", \ local_dir_use_symlinks=False)' # 念のためファイルが存在するか確認する RUN ls -lh /app/Llama-3.2-3B-Instruct-IQ4_NL.gguf # CPUでサーバーを起動 CMD ["--server", "-m", "/app/Llama-3.2-3B-Instruct-IQ4_NL.gguf", "--port", "7860", "--host", "0.0.0.0", "-n", "4096", "--ctx-size", "32768"]