--- license: apache-2.0 language: - fa - en tags: - persian - llm - text-generation - pytorch - transformers - gpt - conversational - persian-nlp - iran - iran-v1 - yasin library_name: transformers pipeline_tag: text-generation datasets: - ysn-rfd/Fibonacci-Pre_Train-Persian-Corpus-Raw-Texts-Dataset model-index: - name: Yasin-Model results: [] metrics: - accuracy - perplexity ---
--- ## 📋 فهرست مطالب
🎯 مدل زبانی ایران چیست؟
ایران نسخه ۱ یک مدل زبانی بزرگ (LLM) دوزبانه فارسی-انگلیسی است که با معماری ترنسفورمر پیشرفته و تکنیکهای مدرن ایران نسخه ۱ برای این ساخته شده که زبان فارسی را در دنیای هوش مصنوعی زنده نگه دارد. برخلاف مدلهای عمومی که فارسی را بهعنوان زبان دوم میبینند، یاسین از ابتدا برای درک عمق ادبیات، فرهنگ و ساختار منحصربهفرد زبان فارسی طراحی شده است. |
|
🎯
معماری یاسین با بومیسازی عمیق
• طراحی شده از پایه برای زبان فارسی |
⚡
کارایی فوقالعاده
• مکانیزم GQA با کاهش ۷۵٪ مصرف حافظه |
|
🔄
انعطافپذیری کامل
• قابل اجرا روی GPUهای ۴GB تا ۲۴GB |
🌍
دوزبانه هوشمند
• تسلط کامل به فارسی و انگلیسی |
|
✍️
نویسندگی خلاقکمک به نوشتن مقاله، داستان، شعر و محتوای خلاقانه |
📚
آموزش و پژوهشدستیار آموزشی هوشمند، پاسخگویی به سوالات درسی |
💬
چتبات و پشتیبانیایجاد دستیارهای هوشمند فارسی، پشتیبانی مشتری |
|
📊
تحلیل دادههای متنیتحلیل نظرات، بررسی احساسات، دستهبندی متون |
🏥
سلامت و پزشکیتحلیل بازخورد بیماران، دستیار پرسش و پاسخ پزشکی |
🎨
خلاقیت و سرگرمیتولید پادکست، شاعر الکترونیک، داستانپردازی |
🔹 ورودی:
```
هوش مصنوعی در ایران چه جایگاهی دارد؟ لطفاً با ذکر مثال توضیح دهید.
```
🔸 خروجی مدل ایران 1:
```
هوش مصنوعی در ایران طی سالهای اخیر رشد قابل توجهی داشته است. دانشگاههای برتر
مانند صنعتی شریف، تهران و امیرکبیر دورههای تخصصی در این حوزه راهاندازی
کردهاند.
برای مثال:
✅ دانشگاه صنعتی شریف - آزمایشگاه پردازش زبان طبیعی با تمرکز بر فارسی
✅ دانشگاه تهران - مرکز تحقیقات هوش مصنوعی و رباتیک
✅ دانشگاه امیرکبیر - پژوهشکده فناوری اطلاعات و هوش مصنوعی
شرکتهای دانشبنیان متعددی در زمینه پردازش زبان فارسی، بینایی ماشین و
رباتیک فعالیت میکنند. شرکتهایی مانند هوشا، دیجیکالا و اسنپ تیمهای
تخصصی هوش مصنوعی دارند.
با این حال، چالشهایی مانند:
⚠️ دسترسی محدود به سختافزارهای پیشرفته
⚠️ مهاجرت نخبگان
⚠️ کمبود دادههای باکیفیت فارسی
⚠️ تحریمهای بینالمللی
وجود دارد. پیشبینی میشود با سرمایهگذاری بیشتر در این حوزه، ایران بتواند
جایگاه بهتری در منطقه کسب کند.
```
|
| دستهبندی | پارامتر | مقدار پیشفرض | توضیح فنی |
|---|---|---|---|
| 🏗️ مدل | معماری | Decoder-Only Transformer | مدل تولید متن خودرگرسیو |
| 🏗️ مدل | vocab_size | ۳۲,۰۰۰ | اندازه واژهنامه (شامل ۸۰۰۰ توکن فارسی) |
| 🏗️ مدل | hidden_size | ۴,۰۹۶ | ابعاد نمایش پنهان |
| 🏗️ مدل | num_hidden_layers | ۳۲ | عمق شبکه (تعداد لایهها) |
| 🎯 توجه | num_attention_heads | ۳۲ | تعداد سرهای Query |
| 🎯 توجه | num_key_value_heads | ۸ | سرهای KV (نسبت GQA 4:1) |
| 🎯 توجه | attention_bias | False | بدون بایاس (بهینهتر) |
| 🧮 MLP | intermediate_size | ۱۱,۰۰۸ | ابعاد لایه میانی |
| 🧮 MLP | hidden_act | silu | تابع فعالسازی Swish (SiLU) |
| 📍 موقعیت | max_position_embeddings | ۲,۰۴۸ | حداکثر طول توالی |
| 📍 موقعیت | rope_theta | ۱۰,۰۰۰.۰ | پایه فرکانس RoPE |
| 📍 موقعیت | rope_scaling | پویا (dynamic) | مقیاسدهی تطبیقی تا ۸ برابر |
| 📊 نرمالسازی | rms_norm_eps | 1e-6 | اپسیلون RMSNorm |
🎯 GQA۴:۱
کاهش ۷۵٪ مصرف حافظه ۳۲ سر Query • ۸ سر KV |
🔄 RoPE۸x
افزایش طول توالی مقیاسدهی پویا |
🧠 SwiGLU۲۰٪
بهبود کیفیت خروجی SiLU • گیتینگ دوگانه |
📌 نکته: برای اولین بار، مدل به صورت خودکار دانلود میشود (~۱۵ گیگابایت). دفعات بعدی از کش استفاده میکند.
📦 GPU 4GB (کممصرف)```python from configuration_yasin import YasinConfig config = YasinConfig( # کاهش ابعاد اصلی hidden_size=512, num_hidden_layers=12, num_attention_heads=8, num_key_value_heads=2, # GQA فعال intermediate_size=1408, # تنظیمات توالی max_position_embeddings=1024, # بهینهسازی حافظه use_cache=True, _attn_implementation="sdpa", ) model = YasinForCausalLM(config) ```
|
🚀 GPU 24GB+ (حداکثر کیفیت)```python config = YasinConfig( # ابعاد کامل hidden_size=4096, num_hidden_layers=40, num_attention_heads=32, num_key_value_heads=8, intermediate_size=11008, # توالی طولانی max_position_embeddings=8192, rope_theta=500000.0, rope_scaling={"rope_type": "dynamic", "factor": 4.0}, # حداکثر سرعت _attn_implementation="flash_attention_2", use_cache=True, ) ```
|
💾 8-bit Quantization```python model = AutoModelForCausalLM.from_pretrained( model_name, load_in_8bit=True, device_map="auto" ) ```✓ کاهش ۵۰٪ حافظه |
🔄 4-bit Quantization```python model = AutoModelForCausalLM.from_pretrained( model_name, load_in_4bit=True, bnb_4bit_compute_dtype=torch.float16 ) ```✓ کاهش ۷۵٪ حافظه |
🧠 Gradient Checkpointing```python # برای آموزش با حافظه محدود model.gradient_checkpointing_enable() model.config.use_cache = False ```✓ کاهش ۴۰٪ حافظه |
| گام | Training Loss | Perplexity | کاهش نسبی | زمان آموزش |
|---|---|---|---|---|
| ۱۰۰ | ۴.۸۷۱۶ | ۱۳۰.۵ | پایه | ۲ دقیقه |
| ۵۰۰ | ۱.۸۱۲۶ | ۶.۱۱ | ۶۲.۸٪ | ۱۰ دقیقه |
| ۱۰۰۰ | ۱.۶۰۱۸ | ۴.۹۵ | ۶۷.۱٪ | ۲۰ دقیقه |
| ۲۰۰۰ | ۱.۵۱۴۵ | ۴.۵۳ | ۶۸.۹٪ | ۴۰ دقیقه |
| ۳۰۰۰ | ۱.۴۰۱۱ | ۴.۰۶ | ۷۱.۲٪ | ۶۰ دقیقه |
| ۴۰۰۰ | ۱.۲۸۹۶ | ۳.۶۳ | ۷۳.۵٪ | ۸۰ دقیقه |
| ۵۰۰۰ | ۱.۲۸۹۶ | ۳.۶۳ | ۷۳.۵٪ | ۱۰۰ دقیقه |
|
📊
Perplexity
۳.۶۳
یاسین
۴.۸۱
سایر مدلها
|
⚡
سرعت استنتاج
۸۵
توکن/ثانیه
۵۲
سایر مدلها
|
💾
مصرف حافظه
۷.۲
گیگابایت
۲۴.۰
سایر مدلها
|
🎯
دقت فارسی
۹۴٪
یاسین
۷۸٪
سایر مدلها
|
ما به مشارکتکنندگان علاقهمند در تمام سطوح خوشامد میگوییم.
فرقی نمیکند برنامهنویس هستید یا نه، هر کمکی ارزشمند است!
|
⭐
ستاره دادنسادهترین راه برای حمایت |
🐛
گزارش باگدر GitHub Issues گزارش دهید |
📝
مستنداتبهبود و تکمیل راهنماها |
💡
ایده جدیدپیشنهاد ویژگیهای جدید |
|
📄
|
مجوز Apache 2.0آزاد برای استفاده تجاری و غیرتجاری |
✅ مجاز
|
❌ غیرمجاز
|
ما در فیبوناچی، خانوادهای از متخصصان خلاق و پیشرو هستیم
: که با یک هدف مشترک گرد هم آمدهایم
. پیشرفت صنعت هوش مصنوعی در ایران
بنیانگذار
Founder
مدیرعامل
CEO
مدیر ارتباطات بینالملل
International Relations
برنامهنویس وب
Web Developer
متخصص مدلهای زبانی
LLM Specialist
برنامهنویس موبایل
Mobile Developer
اگر خلاق هستید و انگیزه کافی برای رسیدن به اهداف غیر ممکن
و همراهی پیشروان صنعت هوش مصنوعی ایران را دارید...
بیایید با هم، ناممکنها را ممکن سازیم
|
|
|
📧
ایمیلinfo@RealRobot.ir |
📷
اینستاگرام@Fibonacci.ai |
💬
تلگرامT.ME/FibonacciAi |
🤗
Hugging Face/fibonacciai/Iran-v1 |
با یک فنجان قهوه، به توسعه مدل زبانی فارسی ایران کمک کن!
☕ قهوه بده ☕لینک مستقیم: coffeebede.com/realrobot
⭐ از حمایت شما سپاسگزاریم ⭐
توسط تیم جوان فیبوناچی ای آی ساخته شده با عشق ❤️ برای زبان فارسی 🇮🇷
© 2018-2026 هوش مصنوعی فیبوناچی. تمامی حقوق برای شرکت رئال ربات محفوظ است.