کلان پیکره زبان فارسی مشتمل بر ۳۵ میلیارد کلمه رونمایی شد

کد خبر:51630
دوشنبه، ۲۱ اسفند، ۱۴۰۲ | 17:09

کلان پیکره زبان فارسی مشتمل بر ۳۵ میلیارد کلمه رونمایی شد

کلان پیکره زبان فارسی، بزرگترین مجموعه دادگان شامل ۳۵ میلیارد کلمه در همایش الزامات توسعه مدل زبانی بزرگ فارسی با حضور خسروپناه، دبیر شورای عالی انقلاب فرهنگی رونمایی شد.

به گزارش خبرنگار دیده‌بان علم ایران، همایش «الزامات توسعه مدل زبانی بزرگ فارسی» با شعار «هوش مصنوعی مولد قدرت حکومت ها» به همت ستاد توسعه فناوری های هوش مصنوعی و رباتیک ۲۰ اسفندماه در محل پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد.

در این نشست، کلان پیکره زبان فارسی با حمایت ستاد توسعه فناوری های هوش مصنوعی و رباتیک و توسعه داده شده توسط شرکت ترگمان رونمایی شد.

این کلان پیکره با آزادرسانی به صورت open source با تنوع بالا و حفظ بافتار متن در دسترس عموم قرار خواهد گرفت.

گفتنی است «مدل زبان بزرگ» یا LLM (Large language model)، یک نوع نوآوری در حوزه هوش مصنوعی است که از شبکه های عصبی با پارامترهای گسترده برای پردازش پیشرفته زبان استفاده می‌کند.

هوش مصنوعی مولد در یک سال اخیر بیشترین پیشرفت را به خود اختصاص داده و عمده سهم این پیشرفت متکی به مدل‌های زبانی بزرگ(LLM ها) بوده است.

مدل‌های زبان بزرگ یک نوع از مدل‌های هوش مصنوعی است که توانایی پردازش اطلاعات چندجانبه را دارند. این مدل‌ها از قدرت بی‌نظیر خود در پردازش زبان برای ایجاد پاسخ‌های بهینه تر و بهتر به سوالات مختلف کاربران استفاده می‌کنند. در حال حاضر، طراحی و مهندسی دستورالعمل‌های بهینه برای این مدل‌ها از اهمیت زیادی برخوردار است و تیم‌های پژوهشی در دانشگاه‌ها و مراکز تحقیقاتی مختلف به این موضوع توجه ویژه‌ای دارند.

انتهای پیام

مطالب مرتبط

نظر دهید

کلان پیکره زبان فارسی مشتمل بر ۳۵ میلیارد کلمه رونمایی شد

* نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند

ساخت ژنوسنسور تشخیص عفونت گوارشی در دانشگاه تهران

بومی‌سازی پرینتر سه‌بعدی سرامیک در دو مقیاس آزمایشگاهی و صنعتی

اندازه‌گیری زمان با دقت صدم نانوثانیه با «ساعت اتمی» ایران ساخت

نوآوری شیمیدانان ایرانی در طراحی سیستم دوگانه تولید انرژی توام با تصفیه آب شور

شواهد جدید از اثرات خطرناک سیگار الکترونیکی بر قلب

معاون پژوهشی جدید دانشگاه صنعتی امیرکبیر منصوب شد

توقف رشد باکتری‌ها با نانوذرات سلنیوم زیستی

تولید زیست چاپگر سه بعدی با نصف قیمت نمونه وارداتی

توسعه روش‌های تشخیص سریع متانول در مرکز ملی تحقیقات حلال

گزارش انجمن علمی روانپزشکان ایران به مردم در خصوص واقعه‌ مربوط به یک خانم دانشجو در واحد علوم و تحقیقات

فراخوان مشارکت در دو برنامه‌ ملی «تولید داروهای مشتق از پلاسما» و «تولید انسولین»

نرم‌افزار جامع یکپارچه کتابخانه، مرکز اسناد و آرشیو دیجیتال در کشور به بهره‌برداری رسید

حمایت نیروی دریایی در رسیدن جامعه علمی به جنوبگان

تسهیلات یک همتی معاونت علمی برای توسعه دانش‌بنیان های فضایی/ایجاد کانون‌ توسعه فناوری‌های فضایی در هفت دانشگاه

تولید مكمل كاهنده عفونت كیسه زرده جوجه شترمرغ‌ها در کشور

ساخت فرومون آفت برگ‌خوار پاییزه در كشور