Instructions to use devngho/llama-ablation-large-korean-corpus-jamo with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use devngho/llama-ablation-large-korean-corpus-jamo with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("text-generation", model="devngho/llama-ablation-large-korean-corpus-jamo")# Load model directly from transformers import AutoTokenizer, AutoModelForCausalLM tokenizer = AutoTokenizer.from_pretrained("devngho/llama-ablation-large-korean-corpus-jamo") model = AutoModelForCausalLM.from_pretrained("devngho/llama-ablation-large-korean-corpus-jamo") - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- vLLM
How to use devngho/llama-ablation-large-korean-corpus-jamo with vLLM:
Install from pip and serve model
# Install vLLM from pip: pip install vllm # Start the vLLM server: vllm serve "devngho/llama-ablation-large-korean-corpus-jamo" # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:8000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "devngho/llama-ablation-large-korean-corpus-jamo", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker
docker model run hf.co/devngho/llama-ablation-large-korean-corpus-jamo
- SGLang
How to use devngho/llama-ablation-large-korean-corpus-jamo with SGLang:
Install from pip and serve model
# Install SGLang from pip: pip install sglang # Start the SGLang server: python3 -m sglang.launch_server \ --model-path "devngho/llama-ablation-large-korean-corpus-jamo" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "devngho/llama-ablation-large-korean-corpus-jamo", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }'Use Docker images
docker run --gpus all \ --shm-size 32g \ -p 30000:30000 \ -v ~/.cache/huggingface:/root/.cache/huggingface \ --env "HF_TOKEN=<secret>" \ --ipc=host \ lmsysorg/sglang:latest \ python3 -m sglang.launch_server \ --model-path "devngho/llama-ablation-large-korean-corpus-jamo" \ --host 0.0.0.0 \ --port 30000 # Call the server using curl (OpenAI-compatible API): curl -X POST "http://localhost:30000/v1/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "devngho/llama-ablation-large-korean-corpus-jamo", "prompt": "Once upon a time,", "max_tokens": 512, "temperature": 0.5 }' - Docker Model Runner
How to use devngho/llama-ablation-large-korean-corpus-jamo with Docker Model Runner:
docker model run hf.co/devngho/llama-ablation-large-korean-corpus-jamo
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("text-generation", model="devngho/llama-ablation-large-korean-corpus-jamo")# Load model directly
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("devngho/llama-ablation-large-korean-corpus-jamo")
model = AutoModelForCausalLM.from_pretrained("devngho/llama-ablation-large-korean-corpus-jamo")devngho/llama-ablation-large-korean-corpus-jamo
Llama μν€ν μ³λ‘ pretrainλ λͺ¨λΈμ λλ€. μ½ 20.7B ν ν°μΌλ‘ μ½ 2.7μν¬ν¬ νμ΅νμ΅λλ€. MaxTextλ₯Ό ν΅ν΄ νμ΅λμμ΅λλ€.
500stepλ§λ€ 체ν¬ν¬μΈνΈκ° μ 곡λ©λλ€.
μ΄ μ°κ΅¬λ Googleμ TPU Research Cloud (TRC)μ Cloud TPU μ 곡μΌλ‘ μνλμμ΅λλ€. β‘
μ΄ λͺ¨λΈμ νκΈ μλͺ¨λ₯Ό λΆλ¦¬ν ν(NFKD μ κ·ν) ν ν¬λμ΄μ§νλ devngho/jamo-tokenizer-exp1 ν ν¬λμ΄μ κ° μ¬μ©λμ΅λλ€.
μμ
κ΅΅μ λΆλΆμ΄ μ λ ₯μ λλ€.
- max_new_tokens: 256
μμ 1 <s> μΈκ³΅μ§λ₯μ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘. αα ΅α«αα ©αΌαα ΅αα ³αΌαα ³α« 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ͺ 'αα ΅α«αα ©αΌαα ΅αα ³αΌ'αα ΄ αα §α―αα ‘αΈαα ³α α © αα ‘α«αα ’αΌαα ’α»αα ‘.
μμ 2 <s> νκΈμ νΉμ§μ 'αα ‘α«αα ³α―'αα ΅αα ‘. αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α« αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ͺ αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α― αα ‘αΈαα ΅α« αα ‘α―αα ΅αα ‘. αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α« αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ͺ αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α― αα ‘αΈαα ΅α« αα ‘α―αα ΅αα ‘. αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α« αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ͺ αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α― αα ‘αΈαα ΅α« αα ‘α―αα ΅αα ‘. αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α« αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ͺ αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α― αα ‘αΈαα ΅α« αα ‘α―αα ΅αα ‘. αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α« αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ͺ αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α― αα ‘αΈαα ΅α« αα ‘α―αα ΅αα ‘. αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α« αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ͺ αα ‘α«αα ³α―αα ΄ 'αα ‘α«αα ³α―'αα ³α― αα ‘αΈαα ΅α« αα ‘α―αα ΅αα ‘.</s>
μμ 3 <s> 컀νΌλ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ¦αα ₯ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ‘ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯α α © αα ‘αα ±αα ₯ αα ³αα ΅αα © αα ΅α»αα ‘. αα ₯αα ΅αα ³α« 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ¦αα ₯ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ‘ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯α α © αα ‘αα ±αα ₯ αα ³αα ΅αα © αα ΅α»αα ‘. αα ₯αα ΅αα ³α« 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ¦αα ₯ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ‘ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯α α © αα ‘αα ±αα ₯ αα ³αα ΅αα © αα ΅α»αα ‘. αα ₯αα ΅αα ³α« 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ¦αα ₯ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ‘ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯α α © αα ‘αα ±αα ₯ αα ³αα ΅αα © αα ΅α»αα ‘. αα ₯αα ΅αα ³α« 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ¦αα ₯ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯αα ‘ 'αα ₯αα ΅'α α ‘αα ³α« αα ‘α«αα ₯α α © αα ‘αα ±αα ₯ αα ³αα ΅αα © αα ΅α»αα ‘.</s>
μλΉν νκ°κ³Ό μ΄μν¨, λ°λ³΅μ΄ μμ΅λλ€.
μμΈ
- μ μ: devngho
- μΈμ΄: ko
- λΌμ΄μ μ€: mit
νμ΅ μμΈ
- learning_rate: 6e-4 (cosine, initial/end 6e-5)
- warmup_ratio: 0.05
- batch_size: 1024(fsdp 16 * per device 8 * ga 8)
- optimizer: adamw(b1=0.9, b2=0.95, eps=1e-5, weight_decay=0.01)
- duration: about 27h 50m
- steps: 10000
- wandbμμ μ 체 μ€μ κ³Ό κ²°κ³Όλ₯Ό λ³Ό μ μμ΅λλ€.
νμ΅ μ₯λΉ
TPU v4-32
νμ΅ λ°μ΄ν°μ
AI Hub, λͺ¨λμλ§λμΉλ₯Ό dedup, length filteringνμ΅λλ€ (μ½ 16,056,320ν).
AI Hub, λͺ¨λμλ§λμΉ κ·μ μΌλ‘ μΈν΄ λ°μ΄ν°μ μ 곡κ°ν μ μμ§λ§, μλ³Έ λ°μ΄ν°λ₯Ό μ€λΉνλ€λ©΄ devngho/dataset-preprocessμ κ³Όμ μΌλ‘ λμΌνκ² μ μ²λ¦¬ν μ μμ΅λλ€.
μννΈμ¨μ΄
jax==0.4.35
MaxTextλ₯Ό ν¬ν¬ν devngho/MaxText
μλμ λ²€μΉλ§ν¬ κ²°κ³Όκ° μ 곡λ©λλ€.
devngho/llama-ablation-large-korean-corpus-jamo
Pretrained using Llama architecture. Trained with about 20.7B tokens(approximately 34.5 epoch), using MaxText.
Checkpoints for every 500 steps are available.
This research was supported with Cloud TPUs from Google's TPU Research Cloud (TRC). β‘
This model uses devngho/jamo-tokenizer-exp1 tokenizer that tokenizes inputs after splitting Hangul jamo(NFKD normalization)
Details
- Made by: devngho
- Language: ko
- License: mit
Training details
- learning_rate: 6e-4 (cosine, initial/end 6e-5)
- warmup_ratio: 0.05
- batch_size: 1024(fsdp 16 * per device 8 * ga 8)
- optimizer: adamw(b1=0.9, b2=0.95, eps=1e-5, weight_decay=0.01)
- duration: about 27h 50m
- steps: 10000
- You can check all the configs and training results on wandb
Training devices
TPU v4-32
Training datasets
I applied deduplication and length filtering to a corpus from AI Hub and Modu Corpus (16,056,320 rows).
I couldn't make the training dataset public because of the terms of AI Hub and Modu Corpus. You can still preprocess the dataset in the same way as the dataset used during training this model using devngho/dataset-preprocess with the raw datas.
Software
jax==0.4.35
devngho/MaxText, a fork of MaxText
- Downloads last month
- -



# Gated model: Login with a HF token with gated access permission hf auth login