🎯 مدل زبانی ایران چیست؟

ایران نسخه ۱ یک مدل زبانی بزرگ (LLM) دوزبانه فارسی-انگلیسی است که با معماری ترنسفورمر پیشرفته و تکنیک‌های مدرن GQA، RoPE و SwiGLU پیاده‌سازی شده است. این مدل حاصل آموزش روی ۳۰ میلیون متن فارسی و استفاده از آخرین دستاوردهای پژوهشی در حوزه پردازش زبان طبیعی است.

ایران نسخه ۱ برای این ساخته شده که زبان فارسی را در دنیای هوش مصنوعی زنده نگه دارد. برخلاف مدل‌های عمومی که فارسی را به‌عنوان زبان دوم می‌بینند، یاسین از ابتدا برای درک عمق ادبیات، فرهنگ و ساختار منحصربه‌فرد زبان فارسی طراحی شده است.

معماری یاسین با بومی‌سازی عمیق • طراحی شده از پایه برای زبان فارسی • درک اصطلاحات، ضرب‌المثل‌ها و ساختارهای دستوری پیچیده • پشتیبانی کامل از خط و نگارش فارسی	کارایی فوق‌العاده • مکانیزم GQA با کاهش ۷۵٪ مصرف حافظه • پشتیبانی از Flash Attention 2 • استنتاج سریع‌تر با SDPA
انعطاف‌پذیری کامل • قابل اجرا روی GPUهای ۴GB تا ۲۴GB • پشتیبانی از quantization 8-bit و 4-bit • مقیاس‌پذیری پویا	دوزبانه هوشمند • تسلط کامل به فارسی و انگلیسی • ترجمه خودکار بین دو زبان • درک مفاهیم بینافرهنگی

✍️ نویسندگی خلاق کمک به نوشتن مقاله، داستان، شعر و محتوای خلاقانه	📚 آموزش و پژوهش دستیار آموزشی هوشمند، پاسخگویی به سوالات درسی	💬 چت‌بات و پشتیبانی ایجاد دستیارهای هوشمند فارسی، پشتیبانی مشتری
📊 تحلیل داده‌های متنی تحلیل نظرات، بررسی احساسات، دسته‌بندی متون	🏥 سلامت و پزشکی تحلیل بازخورد بیماران، دستیار پرسش و پاسخ پزشکی	🎨 خلاقیت و سرگرمی تولید پادکست، شاعر الکترونیک، داستان‌پردازی

🔹 ورودی:

``` هوش مصنوعی در ایران چه جایگاهی دارد؟ لطفاً با ذکر مثال توضیح دهید. ```

🔸 خروجی مدل یاسین:

``` هوش مصنوعی در ایران طی سال‌های اخیر رشد قابل توجهی داشته است. دانشگاه‌های برتر مانند صنعتی شریف، تهران و امیرکبیر دوره‌های تخصصی در این حوزه راه‌اندازی کرده‌اند. برای مثال: ✅ دانشگاه صنعتی شریف - آزمایشگاه پردازش زبان طبیعی با تمرکز بر فارسی ✅ دانشگاه تهران - مرکز تحقیقات هوش مصنوعی و رباتیک ✅ دانشگاه امیرکبیر - پژوهشکده فناوری اطلاعات و هوش مصنوعی شرکت‌های دانش‌بنیان متعددی در زمینه پردازش زبان فارسی، بینایی ماشین و رباتیک فعالیت می‌کنند. شرکت‌هایی مانند هوشا، دیجیکالا و اسنپ تیم‌های تخصصی هوش مصنوعی دارند. با این حال، چالش‌هایی مانند: ⚠️ دسترسی محدود به سخت‌افزارهای پیشرفته ⚠️ مهاجرت نخبگان ⚠️ کمبود داده‌های باکیفیت فارسی ⚠️ تحریم‌های بین‌المللی وجود دارد. پیش‌بینی می‌شود با سرمایه‌گذاری بیشتر در این حوزه، ایران بتواند جایگاه بهتری در منطقه کسب کند. ```

🧠 نمای کلی معماری

```
┌─────────────────────────────────────────────────────────────────┐
│                    📝 ورودی متنی (Text Input)                    │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                    ⚡ Embedding + RoPE                           │
│              جاسازی توکن + موقعیت‌یابی چرخشی                      │
│                 (Rotary Position Embedding)                      │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                      🔷 ×۳۲ لایه دیکودر                          │
│                       32 Decoder Layers                          │
├─────────────────────────────────────────────────────────────────┤
│  ┌───────────────────────────────────────────────────────────┐  │
│  │     🎯 Self-Attention (GQA با ۸ سر KV)                    │  │
│  │         Grouped Query Attention (4:1 ratio)               │  │
│  │           • کاهش ۷۵٪ مصرف حافظه                           │  │
│  │           • حفظ کیفیت با اشتراک‌گذاری KV                   │  │
│  └───────────────────────────────────────────────────────────┘  │
│                              ↓                                   │
│  ┌───────────────────────────────────────────────────────────┐  │
│  │              🧮 Feed-Forward (SwiGLU)                     │  │
│  │              • تابع فعال‌سازی SiLU/Swish                   │  │
│  │              • بهبود ۲۰٪ در کیفیت خروجی                   │  │
│  │              • ۳ لایه خطی با گیتینگ هوشمند                │  │
│  └───────────────────────────────────────────────────────────┘  │
│                              ↓                                   │
│  ┌───────────────────────────────────────────────────────────┐  │
│  │         📊 RMSNorm & Residual Connection                  │  │
│  │               • نرمال‌سازی پایدار                         │  │
│  │          • اتصال باقیمانده برای گرادیان بهتر              │  │
│  └───────────────────────────────────────────────────────────┘  │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                       🎯 LM Head                                 │
│                      خروجی نهایی                                 │
└────────────────────────────────────┬────────────────────────────┘
                                     ▼
┌─────────────────────────────────────────────────────────────────┐
│                   📄 خروجی متنی (Text Output)                    │
└─────────────────────────────────────────────────────────────────┘
```

🚀 نصب و اجرای فوری

```python # گام ۱: نصب کتابخانه # pip install transformers torch accelerate from transformers import AutoModelForCausalLM, AutoTokenizer # گام ۲: بارگذاری مدل (فقط ۳ خط!) model_name = "your-username/yasin-model" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name) # گام ۳: استفاده از مدل prompt = "داستان کوتاهی در مورد بهار بنویس" inputs = tokenizer(prompt, return_tensors="pt") outputs = model.generate( **inputs, max_length=300, temperature=0.7, do_sample=True, top_p=0.9 ) print(tokenizer.decode(outputs[0], skip_special_tokens=True)) ```

📌 نکته: برای اولین بار، مدل به صورت خودکار دانلود می‌شود (~۱۵ گیگابایت). دفعات بعدی از کش استفاده می‌کند.

📦 GPU 4GB (کم‌مصرف)

```python from configuration_yasin import YasinConfig config = YasinConfig( # کاهش ابعاد اصلی hidden_size=512, num_hidden_layers=12, num_attention_heads=8, num_key_value_heads=2, # GQA فعال intermediate_size=1408, # تنظیمات توالی max_position_embeddings=1024, # بهینه‌سازی حافظه use_cache=True, _attn_implementation="sdpa", ) model = YasinForCausalLM(config) ```

✅ مصرف RAM: ~۳.۵ گیگابایت
✅ سرعت: ۴۰-۵۰ توکن/ثانیه
✅ مناسب: لپ‌تاپ، GPUهای خانگی

🚀 GPU 24GB+ (حداکثر کیفیت)

```python config = YasinConfig( # ابعاد کامل hidden_size=4096, num_hidden_layers=40, num_attention_heads=32, num_key_value_heads=8, intermediate_size=11008, # توالی طولانی max_position_embeddings=8192, rope_theta=500000.0, rope_scaling={"rope_type": "dynamic", "factor": 4.0}, # حداکثر سرعت _attn_implementation="flash_attention_2", use_cache=True, ) ```

🔥 مصرف RAM: ~۲۰ گیگابایت
🔥 سرعت: ۸۰-۱۰۰ توکن/ثانیه
🔥 مناسب: سرورها، A100، H100

📉 روند کاهش Loss

| گام | Training Loss | Perplexity | کاهش نسبی | زمان آموزش | |:---:|:-------------:|:----------:|:---------:|:----------:| | ۱۰۰ | ۴.۸۷۱۶ | ۱۳۰.۵ | پایه | ۲ دقیقه | | ۵۰۰ | ۱.۸۱۲۶ | ۶.۱۱ | ۶۲.۸٪ | ۱۰ دقیقه | | ۱۰۰۰ | ۱.۶۰۱۸ | ۴.۹۵ | ۶۷.۱٪ | ۲۰ دقیقه | | ۲۰۰۰ | ۱.۵۱۴۵ | ۴.۵۳ | ۶۸.۹٪ | ۴۰ دقیقه | | ۳۰۰۰ | ۱.۴۰۱۱ | ۴.۰۶ | ۷۱.۲٪ | ۶۰ دقیقه | | ۴۰۰۰ | ۱.۲۸۹۶ | ۳.۶۳ | ۷۳.۵٪ | ۸۰ دقیقه | | ۵۰۰۰ | ۱.۲۸۹۶ | ۳.۶۳ | ۷۳.۵٪ | ۱۰۰ دقیقه |

🏆 مقایسه با سایر مدل‌ها

📊

Perplexity

۳.۶۳

یاسین

۴.۸۱

سایر مدل‌ها

⚡

سرعت استنتاج

۸۵

توکن/ثانیه

۵۲

سایر مدل‌ها

💾

مصرف حافظه

۷.۲

گیگابایت

۲۴.۰

سایر مدل‌ها

🎯

دقت فارسی

۹۴٪

یاسین

۷۸٪

سایر مدل‌ها

🚀 آماده شروع هستید؟

📧

ایمیل
info@RealRobot.ir

📷

اینستاگرام
@Fibonacci.ai

💬

تلگرام
T.ME/FibonacciAi

🤗

Hugging Face
/fibonacciai/Iran-v1

☕ از هوش مصنوعی ایران حمایت کن

با یک فنجان قهوه، به توسعه مدل زبانی فارسی ایران کمک کن!

☕ قهوه بده ☕

لینک مستقیم: coffeebede.com/realrobot

⭐ از حمایت شما سپاسگزاریم ⭐

توسط تیم جوان ساخته شده با عشق ❤️ برای زبان فارسی 🇮🇷

🌟 معرفی	✨ ویژگی‌ها	📊 نمونه خروجی	⚙️ معماری
🚀 شروع سریع	📈 نتایج	🎓 آموزش	📜 مجوز

🎯 مدل زبانی ایران چیست؟

معماری یاسین با بومی‌سازی عمیق

کارایی فوق‌العاده

انعطاف‌پذیری کامل

دوزبانه هوشمند

نویسندگی خلاق

آموزش و پژوهش

چت‌بات و پشتیبانی

تحلیل داده‌های متنی

سلامت و پزشکی

خلاقیت و سرگرمی

🔹 ورودی:

🔸 خروجی مدل یاسین:

🧠 نمای کلی معماری

🎯 GQA

🔄 RoPE

🧠 SwiGLU

🚀 نصب و اجرای فوری

📦 GPU 4GB (کم‌مصرف)

🚀 GPU 24GB+ (حداکثر کیفیت)

💾 8-bit Quantization

🔄 4-bit Quantization

🧠 Gradient Checkpointing

📉 روند کاهش Loss

🏆 مقایسه با سایر مدل‌ها

📚 آموزش مدل روی دیتاست دلخواه

⭐ به خانواده هوش مصنوعی فیبوناچی بپیوندید!

ستاره دادن

گزارش باگ

مستندات

ایده جدید

مجوز Apache 2.0

✅ مجاز

❌ غیرمجاز

❤️ تیم یاسین

🙏 سپاسگزاری

🚀 آماده شروع هستید؟

☕ از هوش مصنوعی ایران حمایت کن