Mistral از مدل Large 2 LLM با 123 میلیارد پارامتر معرفی کرد

مرداد ۳, ۱۴۰۳

0 زمان تقریبی مطالعه 2 دقیقه

استارتاپ فرانسوی Mistral AI امروز اعلام کرد که مدل جدید پرچمدار خود، Large 2 را منتشر کرده که قابلیت‌های بیشتری در تولید کد، ریاضیات و استدلال دارد. Mistral همچنین پشتیبانی چندزبانه بهبود یافته و توانایی‌های فراخوانی عملکردهای پیشرفته را به Large 2 افزوده است. مدل Mistral Large 2 با 123 میلیارد پارامتر، قادر است روی یک گره H100 با توانایی عملیاتی بالا فعالیت کند.

این مدل از زبان‌های فرانسوی، آلمانی، اسپانیایی، ایتالیایی، پرتغالی، عربی، هندی، روسی، چینی، ژاپنی و کره‌ای پشتیبانی می‌کند. در زمینه کدنویسی، از بیش از 80 زبان برنامه‌نویسی شامل پایتون، جاوا، سی، سی پلاس پلاس، جاوا اسکریپت و Bash پشتیبانی می‌کند. مدل Mistral Large 2 اکنون با وزنه‌های باز در دسترس است، اما تنها برای تحقیقات و استفاده‌های غیرتجاری به صورت رایگان قابل استفاده است. برای کاربردهای تجاری، نیاز به اخذ مجوز مدل است.

عملکرد Mistral Large 2 (123B) در مقایسه با OpenAI GPT-4o و Claude Opus 3 و Llama 3.1 405B، در معیارهای کدنویسی قابل مقایسه است. در بنچمارک‌های Wild Bench، Arena Hard و MT Bench، عملکرد Large 2 بهتر از Llama 3.1 405B و Claude 3 Opus بوده است. در معیار MMLU که محبوبیت زیادی دارد، این مدل جدید از Llama 3.1 70B بهتر عمل کرده و با Llama 3.1 405B برابری می‌کند.

برای توسعه‌دهندگان، Mistral Large 2 هم اکنون با قابلیت‌های فراخوانی و بازیابی بهبود یافته عرضه می‌شود. این مدل قادر است فراخوانی‌های تابع موازی و متوالی را انجام دهد و به توسعه‌دهندگان امکان می‌دهد تا برنامه‌های کاربردی پیچیده‌ی هوش مصنوعی تجاری را توسعه دهند.

با رونمایی از Large 2، استارتاپ Mistral در حال تثبیت پورتفولیوی مدل‌های خود است. این شرکت دو مدل همه‌منظوره Mistral Nemo و Mistral Large و دو مدل تخصصی Codestral و Embed را خواهد داشت. میسترال در آینده مدل های آپاچی (Mistral 7B، Mistral 8x7B و 8x22B، Codestral Mamba، Mathstral) را متوقف خواهد کرد.

مایکروسافت و میسترال قبلاً برای عرضه مدل های Mistral در Azure شراکت داشتند. امروز، Mistral در حال گسترش همکاری خود با Google است تا مدل‌های Mistral را در Google Cloud در دسترس قرار دهد. انتشار متوالی Mistral Large 2 و Llama 3.1 نقطه عطف مهمی برای اکوسیستم هوش مصنوعی باز است و دو مدل قدرتمند سطح GPT-4 را برای تحقیق و توسعه ارائه می دهد. این پیشرفت سریع به حرکت رو به رشد به سمت چشم انداز هوش مصنوعی بازتر و مشارکتی تر می افزاید.

مرداد ۳, ۱۴۰۳

0 زمان تقریبی مطالعه 2 دقیقه

نمایش بیشتر

Mistral از مدل Large 2 LLM با 123 میلیارد پارامتر معرفی کرد

دیدگاهتان را بنویسید لغو پاسخ

واتس اپ در آینده امکان جلوگیری از ذخیره خودکار رسانه های ارسال شده به دیگران را فراهم می کند

microSD Express چیست و چرا سریعتر از microSD معمولی است؟

سامسونگ از نمایشگرهای Onyx Cinema LED رونمایی کرد

مایکروسافت کوپایلت با امکانات جدید به روز شد

نسخه ویندوز اپل موزیک با پشتیبانی از Dolby Atmos به روز شد

عرضه پوکو C71 با صفحه نمایش 120 هرتز و باتری بزرگ

واتس اپ در آینده امکان جلوگیری از ذخیره خودکار رسانه های ارسال شده به دیگران را فراهم می کند

microSD Express چیست و چرا سریعتر از microSD معمولی است؟

انتشار آپدیت جدید برای وان پلاس نورد، 7T و 7T پرو

نحوه استفاده از حالت پرتره در چت تصویری اینستاگرام

نوشته های مشابه

مایکروسافت کوپایلت با امکانات جدید به روز شد

گوگل سرانجام قابلیت جستجوی وب را به ابزار NotebookLM اضافه کرد

5 اپلیکیشن خوب برای استفاده همزمان از چت بات های هوش مصنوعی

ویژگی تولید تصویر ChatGPT رایگان در دسترس کاربران قرار گرفت

دیدگاهتان را بنویسید لغو پاسخ

واتس اپ در آینده امکان جلوگیری از ذخیره خودکار رسانه های ارسال شده به دیگران را فراهم می کند

microSD Express چیست و چرا سریعتر از microSD معمولی است؟

انتشار آپدیت جدید برای وان پلاس نورد، 7T و 7T پرو

نحوه استفاده از حالت پرتره در چت تصویری اینستاگرام