هوش مصنوعی

Mistral از مدل Large 2 LLM با 123 میلیارد پارامتر معرفی کرد

استارتاپ فرانسوی Mistral AI امروز اعلام کرد که مدل جدید پرچمدار خود، Large 2 را منتشر کرده که قابلیت‌های بیشتری در تولید کد، ریاضیات و استدلال دارد. Mistral همچنین پشتیبانی چندزبانه بهبود یافته و توانایی‌های فراخوانی عملکردهای پیشرفته را به Large 2 افزوده است. مدل Mistral Large 2 با 123 میلیارد پارامتر، قادر است روی یک گره H100 با توانایی عملیاتی بالا فعالیت کند.

این مدل از زبان‌های فرانسوی، آلمانی، اسپانیایی، ایتالیایی، پرتغالی، عربی، هندی، روسی، چینی، ژاپنی و کره‌ای پشتیبانی می‌کند. در زمینه کدنویسی، از بیش از 80 زبان برنامه‌نویسی شامل پایتون، جاوا، سی، سی پلاس پلاس، جاوا اسکریپت و Bash پشتیبانی می‌کند. مدل Mistral Large 2 اکنون با وزنه‌های باز در دسترس است، اما تنها برای تحقیقات و استفاده‌های غیرتجاری به صورت رایگان قابل استفاده است. برای کاربردهای تجاری، نیاز به اخذ مجوز مدل است.

عملکرد Mistral Large 2 (123B) در مقایسه با OpenAI GPT-4o و Claude Opus 3 و Llama 3.1 405B، در معیارهای کدنویسی قابل مقایسه است. در بنچمارک‌های Wild Bench، Arena Hard و MT Bench، عملکرد Large 2 بهتر از Llama 3.1 405B و Claude 3 Opus بوده است. در معیار MMLU که محبوبیت زیادی دارد، این مدل جدید از Llama 3.1 70B بهتر عمل کرده و با Llama 3.1 405B برابری می‌کند.

برای توسعه‌دهندگان، Mistral Large 2 هم اکنون با قابلیت‌های فراخوانی و بازیابی بهبود یافته عرضه می‌شود. این مدل قادر است فراخوانی‌های تابع موازی و متوالی را انجام دهد و به توسعه‌دهندگان امکان می‌دهد تا برنامه‌های کاربردی پیچیده‌ی هوش مصنوعی تجاری را توسعه دهند.

با رونمایی از Large 2، استارتاپ Mistral در حال تثبیت پورتفولیوی مدل‌های خود است. این شرکت دو مدل همه‌منظوره Mistral Nemo و Mistral Large و دو مدل تخصصی Codestral و Embed را خواهد داشت. میسترال در آینده مدل های آپاچی (Mistral 7B، Mistral 8x7B و 8x22B، Codestral Mamba، Mathstral) را متوقف خواهد کرد.

مایکروسافت و میسترال قبلاً برای عرضه مدل های Mistral در Azure شراکت داشتند. امروز، Mistral در حال گسترش همکاری خود با Google است تا مدل‌های Mistral را در Google Cloud در دسترس قرار دهد. انتشار متوالی Mistral Large 2 و Llama 3.1 نقطه عطف مهمی برای اکوسیستم هوش مصنوعی باز است و دو مدل قدرتمند سطح GPT-4 را برای تحقیق و توسعه ارائه می دهد. این پیشرفت سریع به حرکت رو به رشد به سمت چشم انداز هوش مصنوعی بازتر و مشارکتی تر می افزاید.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا