# 🤖 مدل زبانی ایران نسخه ۱ با معماری بومی یاسین 🇮🇷 ### 🌟 اولین معماری مدل زبانی متن‌باز فارسی

| [🌟 معرفی](#-معرفی-کلی) | [✨ ویژگی‌ها](#-ویژگی%E2%80%8Cهای-منحصربه%E2%80%8Cفرد) | [📊 نمونه خروجی](#-نمونه-خروجی-واقعی) | [⚙️ معماری](#%EF%B8%8F-%D9%85%D8%B9%D9%85%D8%A7%D8%B1%DB%8C-%D9%81%D9%86%DB%8C-%D9%BE%DB%8C%D8%B4%D8%B1%D9%81%D8%AA%D9%87) | |:---:|:---:|:---:|:---:| | [🚀 شروع سریع](#-شروع-%D8%B3%D8%B1%DB%8C%D8%B9) | [📈 نتایج](#-%D9%86%D8%AA%D8%A7%DB%8C%D8%AC-%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D9%88-%D8%A7%D8%B1%D8%B2%DB%8C%D8%A7%D8%A8%DB%8C) | [🎓 آموزش](#-%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D9%88-%D9%81%D8%A7%DB%8C%D9%86%E2%80%8C%D8%AA%DB%8C%D9%88%D9%86) | [📜 مجوز](#-%D9%85%D8%AC%D9%88%D8%B2-%D9%88-%D8%B4%D8%B1%D8%A7%DB%8C%D8%B7-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87) |

🎯 مدل زبانی ایران چیست؟

ایران نسخه ۱ یک مدل زبانی بزرگ (LLM) دوزبانه فارسی-انگلیسی است که با معماری ترنسفورمر پیشرفته و تکنیک‌های مدرن GQA، RoPE و SwiGLU پیاده‌سازی شده است. این مدل حاصل آموزش روی ۷۰ میلیون متن فارسی و استفاده از آخرین دستاوردهای پژوهشی در حوزه پردازش زبان طبیعی است.

ایران نسخه ۱ برای این ساخته شده که زبان فارسی را در دنیای هوش مصنوعی زنده نگه دارد. برخلاف مدل‌های عمومی که فارسی را به‌عنوان زبان دوم می‌بینند، یاسین از ابتدا برای درک عمق ادبیات، فرهنگ و ساختار منحصربه‌فرد زبان فارسی طراحی شده است.

🎯 معماری یاسین با بومی‌سازی عمیق • طراحی شده از پایه برای زبان فارسی • درک اصطلاحات، ضرب‌المثل‌ها و ساختارهای دستوری پیچیده • پشتیبانی کامل از خط و نگارش فارسی	⚡ کارایی فوق‌العاده • مکانیزم GQA با کاهش ۷۵٪ مصرف حافظه • پشتیبانی از Flash Attention 2 • استنتاج سریع‌تر با SDPA
🔄 انعطاف‌پذیری کامل • قابل اجرا روی GPUهای ۴GB تا ۲۴GB • پشتیبانی از quantization 8-bit و 4-bit • مقیاس‌پذیری پویا	🌍 دوزبانه هوشمند • تسلط کامل به فارسی و انگلیسی • ترجمه خودکار بین دو زبان • درک مفاهیم بینافرهنگی

✍️ نویسندگی خلاق کمک به نوشتن مقاله، داستان، شعر و محتوای خلاقانه	📚 آموزش و پژوهش دستیار آموزشی هوشمند، پاسخگویی به سوالات درسی	💬 چت‌بات و پشتیبانی ایجاد دستیارهای هوشمند فارسی، پشتیبانی مشتری
📊 تحلیل داده‌های متنی تحلیل نظرات، بررسی احساسات، دسته‌بندی متون	🏥 سلامت و پزشکی تحلیل بازخورد بیماران، دستیار پرسش و پاسخ پزشکی	🎨 خلاقیت و سرگرمی تولید پادکست، شاعر الکترونیک، داستان‌پردازی

🔹 ورودی:

``` هوش مصنوعی در ایران چه جایگاهی دارد؟ لطفاً با ذکر مثال توضیح دهید. ```

🔸 خروجی مدل ایران 1:

``` هوش مصنوعی در ایران طی سال‌های اخیر رشد قابل توجهی داشته است. دانشگاه‌های برتر مانند صنعتی شریف، تهران و امیرکبیر دوره‌های تخصصی در این حوزه راه‌اندازی کرده‌اند. برای مثال: ✅ دانشگاه صنعتی شریف - آزمایشگاه پردازش زبان طبیعی با تمرکز بر فارسی ✅ دانشگاه تهران - مرکز تحقیقات هوش مصنوعی و رباتیک ✅ دانشگاه امیرکبیر - پژوهشکده فناوری اطلاعات و هوش مصنوعی شرکت‌های دانش‌بنیان متعددی در زمینه پردازش زبان فارسی، بینایی ماشین و رباتیک فعالیت می‌کنند. شرکت‌هایی مانند هوشا، دیجیکالا و اسنپ تیم‌های تخصصی هوش مصنوعی دارند. با این حال، چالش‌هایی مانند: ⚠️ دسترسی محدود به سخت‌افزارهای پیشرفته ⚠️ مهاجرت نخبگان ⚠️ کمبود داده‌های باکیفیت فارسی ⚠️ تحریم‌های بین‌المللی وجود دارد. پیش‌بینی می‌شود با سرمایه‌گذاری بیشتر در این حوزه، ایران بتواند جایگاه بهتری در منطقه کسب کند. ```

🧠 نمای کلی معماری

```
┌─────────────────────────────────────────────────────────────────┐
│                    📝 ورودی متنی (Text Input)                   │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                    ⚡ Embedding + RoPE                          │
│              جاسازی توکن + موقعیت‌یابی چرخشی                      │
│                 (Rotary Position Embedding)                      │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                      🔷 ×۳۲ لایه دیکودر                          │
│                       32 Decoder Layers                          │
├─────────────────────────────────────────────────────────────────┤
│  ┌───────────────────────────────────────────────────────────┐  │
│  │     🎯 Self-Attention (GQA با ۸ سر KV)                    │  │
│  │         Grouped Query Attention (4:1 ratio)               │  │
│  │           • کاهش ۷۵٪ مصرف حافظه                           │  │
│  │           • حفظ کیفیت با اشتراک‌گذاری KV                   │  │
│  └───────────────────────────────────────────────────────────┘  │
│                              ↓                                  │
│  ┌───────────────────────────────────────────────────────────┐  │
│  │              🧮 Feed-Forward (SwiGLU)                    │  │
│  │              • تابع فعال‌سازی SiLU/Swish                   │  │
│  │              • بهبود ۲۰٪ در کیفیت خروجی                   │  │
│  │              • ۳ لایه خطی با گیتینگ هوشمند                 │  │
│  └───────────────────────────────────────────────────────────┘  │
│                              ↓                                  │
│  ┌───────────────────────────────────────────────────────────┐  │
│  │         📊 RMSNorm & Residual Connection                  │  │
│  │               • نرمال‌سازی پایدار                          │  │
│  │          • اتصال باقیمانده برای گرادیان بهتر              │  │
│  └───────────────────────────────────────────────────────────┘  │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                       🎯 LM Head                                │
│                      خروجی نهایی                                │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                   📄 خروجی متنی (Text Output)                   │
└─────────────────────────────────────────────────────────────────┘
```

دسته‌بندی	پارامتر	مقدار پیش‌فرض	توضیح فنی
🏗️ مدل	معماری	Decoder-Only Transformer	مدل تولید متن خودرگرسیو
🏗️ مدل	vocab_size	۳۲,۰۰۰	اندازه واژه‌نامه (شامل ۸۰۰۰ توکن فارسی)
🏗️ مدل	hidden_size	۴,۰۹۶	ابعاد نمایش پنهان
🏗️ مدل	num_hidden_layers	۳۲	عمق شبکه (تعداد لایه‌ها)
🎯 توجه	num_attention_heads	۳۲	تعداد سرهای Query
🎯 توجه	num_key_value_heads	۸	سرهای KV (نسبت GQA 4:1)
🎯 توجه	attention_bias	False	بدون بایاس (بهینه‌تر)
🧮 MLP	intermediate_size	۱۱,۰۰۸	ابعاد لایه میانی
🧮 MLP	hidden_act	silu	تابع فعال‌سازی Swish (SiLU)
📍 موقعیت	max_position_embeddings	۲,۰۴۸	حداکثر طول توالی
📍 موقعیت	rope_theta	۱۰,۰۰۰.۰	پایه فرکانس RoPE
📍 موقعیت	rope_scaling	پویا (dynamic)	مقیاس‌دهی تطبیقی تا ۸ برابر
📊 نرمال‌سازی	rms_norm_eps	1e-6	اپسیلون RMSNorm

🎯 GQA

۴:۱

کاهش ۷۵٪ مصرف حافظه

۳۲ سر Query • ۸ سر KV
اشتراک‌گذاری هوشمند

🔄 RoPE

۸x

افزایش طول توالی

مقیاس‌دهی پویا
پنجره زمینه ۱۶۳۸۴ توکنی

🧠 SwiGLU

۲۰٪

بهبود کیفیت خروجی

SiLU • گیتینگ دوگانه
همگرایی سریع‌تر

🚀 نصب و اجرای فوری

```python # گام ۱: نصب کتابخانه # pip install transformers torch accelerate from transformers import AutoModelForCausalLM, AutoTokenizer # گام ۲: بارگذاری مدل (فقط ۳ خط!) model_name = "your-username/yasin-model" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name) # گام ۳: استفاده از مدل prompt = "داستان کوتاهی در مورد بهار بنویس" inputs = tokenizer(prompt, return_tensors="pt") outputs = model.generate( **inputs, max_length=300, temperature=0.7, do_sample=True, top_p=0.9 ) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ```

📌 نکته: برای اولین بار، مدل به صورت خودکار دانلود می‌شود (~۱۵ گیگابایت). دفعات بعدی از کش استفاده می‌کند.

📦 GPU 4GB (کم‌مصرف)

```python from configuration_yasin import YasinConfig config = YasinConfig( # کاهش ابعاد اصلی hidden_size=512, num_hidden_layers=12, num_attention_heads=8, num_key_value_heads=2, # GQA فعال intermediate_size=1408, # تنظیمات توالی max_position_embeddings=1024, # بهینه‌سازی حافظه use_cache=True, _attn_implementation="sdpa", ) model = YasinForCausalLM(config) ```

✅ مصرف RAM: ~۳.۵ گیگابایت
✅ سرعت: ۴۰-۵۰ توکن/ثانیه
✅ مناسب: لپ‌تاپ، GPUهای خانگی

🚀 GPU 24GB+ (حداکثر کیفیت)

```python config = YasinConfig( # ابعاد کامل hidden_size=4096, num_hidden_layers=40, num_attention_heads=32, num_key_value_heads=8, intermediate_size=11008, # توالی طولانی max_position_embeddings=8192, rope_theta=500000.0, rope_scaling={"rope_type": "dynamic", "factor": 4.0}, # حداکثر سرعت _attn_implementation="flash_attention_2", use_cache=True, ) ```

🔥 مصرف RAM: ~۲۰ گیگابایت
🔥 سرعت: ۸۰-۱۰۰ توکن/ثانیه
🔥 مناسب: سرورها، A100، H100

💾 8-bit Quantization

```python model = AutoModelForCausalLM.from_pretrained( model_name, load_in_8bit=True, device_map="auto" ) ```

✓ کاهش ۵۰٪ حافظه

🔄 4-bit Quantization

```python model = AutoModelForCausalLM.from_pretrained( model_name, load_in_4bit=True, bnb_4bit_compute_dtype=torch.float16 ) ```

✓ کاهش ۷۵٪ حافظه

🧠 Gradient Checkpointing

```python # برای آموزش با حافظه محدود model.gradient_checkpointing_enable() model.config.use_cache = False ```

✓ کاهش ۴۰٪ حافظه

📉 روند کاهش Loss

گام	Training Loss	Perplexity	کاهش نسبی	زمان آموزش
۱۰۰	۴.۸۷۱۶	۱۳۰.۵	پایه	۲ دقیقه
۵۰۰	۱.۸۱۲۶	۶.۱۱	۶۲.۸٪	۱۰ دقیقه
۱۰۰۰	۱.۶۰۱۸	۴.۹۵	۶۷.۱٪	۲۰ دقیقه
۲۰۰۰	۱.۵۱۴۵	۴.۵۳	۶۸.۹٪	۴۰ دقیقه
۳۰۰۰	۱.۴۰۱۱	۴.۰۶	۷۱.۲٪	۶۰ دقیقه
۴۰۰۰	۱.۲۸۹۶	۳.۶۳	۷۳.۵٪	۸۰ دقیقه
۵۰۰۰	۱.۲۸۹۶	۳.۶۳	۷۳.۵٪	۱۰۰ دقیقه

🏆 مقایسه با سایر مدل‌ها

📊

Perplexity

۳.۶۳

یاسین

۴.۸۱

سایر مدل‌ها

⚡

سرعت استنتاج

۸۵

توکن/ثانیه

۵۲

سایر مدل‌ها

💾

مصرف حافظه

۷.۲

گیگابایت

۲۴.۰

سایر مدل‌ها

🎯

دقت فارسی

۹۴٪

یاسین

۷۸٪

سایر مدل‌ها

📚 آموزش مدل روی دیتاست دلخواه

```python from transformers import Trainer, TrainingArguments from datasets import load_dataset # ۱. بارگذاری دیتاست فارسی dataset = load_dataset("text", data_files={"train": "my_persian_texts.txt"}) # ۲. تنظیم پارامترهای آموزش training_args = TrainingArguments( output_dir="./yasin-finetuned", num_train_epochs=3, per_device_train_batch_size=4, gradient_accumulation_steps=4, save_steps=500, logging_steps=50, learning_rate=2e-5, warmup_ratio=0.03, fp16=True, # آموزش با دقت نیمه gradient_checkpointing=True, ) # ۳. شروع آموزش trainer = Trainer( model=model, args=training_args, train_dataset=dataset["train"], ) trainer.train() ```

⭐ به خانواده هوش مصنوعی فیبوناچی بپیوندید!

ما به مشارکت‌کنندگان علاقه‌مند در تمام سطوح خوشامد می‌گوییم.
فرقی نمی‌کند برنامه‌نویس هستید یا نه، هر کمکی ارزشمند است!

⭐

ستاره دادن

ساده‌ترین راه برای حمایت

🐛

گزارش باگ

در GitHub Issues گزارش دهید

📝

مستندات

بهبود و تکمیل راهنماها

💡

ایده جدید

پیشنهاد ویژگی‌های جدید

📄	مجوز Apache 2.0 آزاد برای استفاده تجاری و غیرتجاری

✅ مجاز

✓ استفاده تجاری آزاد
✓ توزیع و تغییر
✓ استفاده شخصی
✓ استفاده در پروژه‌های تجاری

❌ غیرمجاز

✗ ادعای مالکیت مدل
✗ حذف کپی‌رایت
✗ مسئولیت خروجی‌ها با کاربر است
✗ بدون تضمین عملکرد

# ✨ تیم فیبوناچی | Fibonacci Team ✨

ما در فیبوناچی، خانوادهای از متخصصان خلاق و پیشرو هستیم
: که با یک هدف مشترک گرد هم آمدهایم
. پیشرفت صنعت هوش مصنوعی در ایران

--- ## 👥 اعضای تیم | Meet the Team

🚀

امیرحسین مهردوست

بنیان‌گذار

Founder

👩‍💼

ساناز ذوقی

مدیرعامل

CEO

🌐

ارسان جاهد تبریزی

مدیر ارتباطات بین‌الملل

International Relations

💻

علیرضا یعقوبی

برنامه‌نویس وب

Web Developer

🧠

یاسین آریان فرد

YSNRFD

متخصص مدل‌های زبانی

LLM Specialist

📱

علیرضا جهان تیغ

برنامه‌نویس موبایل

Mobile Developer

--- ## 🚀 به ما بپیوندید | Join Us

✨ شما هم می‌توانید ✨

اگر خلاق هستید و انگیزه کافی برای رسیدن به اهداف غیر ممکن
و همراهی پیشروان صنعت هوش مصنوعی ایران را دارید...

🌟 به خانواده فیبوناچی بپیوندید 🌟

بیایید با هم، ناممکن‌ها را ممکن سازیم

🙏 سپاسگزاری

🤗 جامعه Hugging Face
🔥 تیم PyTorch
🦙 پژوهشگران Meta LLaMA

🌪️ تیم Mistral AI
🧠 تیم Google DeepMind
🇮🇷 جامعه فارسی‌زبان هوش مصنوعی

🚀 آماده شروع هستید؟

📧

ایمیل
info@RealRobot.ir

📷

اینستاگرام
@Fibonacci.ai

💬

تلگرام
T.ME/FibonacciAi

🤗

Hugging Face
/fibonacciai/Iran-v1

☕ از هوش مصنوعی ایران حمایت کن

با یک فنجان قهوه، به توسعه مدل زبانی فارسی ایران کمک کن!

☕ قهوه بده ☕

لینک مستقیم: coffeebede.com/realrobot

⭐ از حمایت شما سپاسگزاریم ⭐

توسط تیم جوان فیبوناچی ای آی ساخته شده با عشق ❤️ برای زبان فارسی 🇮🇷

🎯 مدل زبانی ایران چیست؟

معماری یاسین با بومی‌سازی عمیق

کارایی فوق‌العاده

انعطاف‌پذیری کامل

دوزبانه هوشمند

نویسندگی خلاق

آموزش و پژوهش

چت‌بات و پشتیبانی

تحلیل داده‌های متنی

سلامت و پزشکی

خلاقیت و سرگرمی

🔹 ورودی:

🔸 خروجی مدل ایران 1:

🧠 نمای کلی معماری

🎯 GQA

🔄 RoPE

🧠 SwiGLU

🚀 نصب و اجرای فوری

📦 GPU 4GB (کم‌مصرف)

🚀 GPU 24GB+ (حداکثر کیفیت)

💾 8-bit Quantization

🔄 4-bit Quantization

🧠 Gradient Checkpointing

📉 روند کاهش Loss

🏆 مقایسه با سایر مدل‌ها

📚 آموزش مدل روی دیتاست دلخواه

⭐ به خانواده هوش مصنوعی فیبوناچی بپیوندید!

ستاره دادن

گزارش باگ

مستندات

ایده جدید

مجوز Apache 2.0

✅ مجاز

❌ غیرمجاز

امیرحسین مهردوست

ساناز ذوقی

ارسان جاهد تبریزی

علیرضا یعقوبی

یاسین آریان فرد

YSNRFD

علیرضا جهان تیغ

✨ شما هم می‌توانید ✨

🙏 سپاسگزاری

🚀 آماده شروع هستید؟

☕ از هوش مصنوعی ایران حمایت کن