hotchpotch/fineweb-2-edu-japanese
Viewer • Updated • 262M • 3.05k • 32
本モデルはチュートリアル「Let's develop LLMs from scratch」から学習した小型GPTモデルです。
from transformers import AutoModelForCausalLM, AutoTokenizer
tok = AutoTokenizer.from_pretrained("gpt2")
model = AutoModelForCausalLM.from_pretrained(
"itarutomy/llm_workshop_hands_on_gpt-model",
trust_remote_code=True
)
print(tok.decode(model.generate(**tok("こんにちは", return_tensors="pt"))[0]))