Aratako/Synthetic-JP-EN-Coding-Dataset-801k
Viewer • Updated • 801k • 437 • 17
How to use SousiOmine/star-kira-instruct-250426 with Unsloth Studio:
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for SousiOmine/star-kira-instruct-250426 to start chatting
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for SousiOmine/star-kira-instruct-250426 to start chatting
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for SousiOmine/star-kira-instruct-250426 to start chatting
pip install unsloth
from unsloth import FastModel
model, tokenizer = FastModel.from_pretrained(
model_name="SousiOmine/star-kira-instruct-250426",
max_seq_length=2048,
)sarashina2.2-3b-insturuct-v0.1に、まんがタイムきらら作品についての合成対話データセットを追加学習させたモデルです。 きらら作品についての知識量が増加しています。 GGUF版はこちら
まんがタイムきらら作品の解説記事を用いて、Deepseek-V3-0324を用いて2万件の対話データを合成しました。 wikipedia記事によって合成したデータセットの一部はこちらで公開しています。
その他、こちらのデータセットを利用させていただきました。
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, set_seed
# モデルのロード
model_name = "SousiOmine/star-kira-instruct-250426"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_name)
chat_pipeline = pipeline("text-generation", model=model, tokenizer=tokenizer)
set_seed(123)
# ユーザーの入力
user_input = [{"role": "user", "content": "藤川紡がタイムスリップした要因を説明してください"}]
# モデルによる応答生成
responses = chat_pipeline(
user_input,
max_length=500,
do_sample=True,
num_return_sequences=3,
)
# 応答を表示
for i, response in enumerate(responses, 1):
print(f"Response {i}: {response['generated_text']}")
Base model
sbintuitions/sarashina2.2-3b