Mistral از مدل Large 2 LLM با 123 میلیارد پارامتر معرفی کرد
استارتاپ فرانسوی Mistral AI امروز اعلام کرد که مدل جدید پرچمدار خود، Large 2 را منتشر کرده که قابلیتهای بیشتری در تولید کد، ریاضیات و استدلال دارد. Mistral همچنین پشتیبانی چندزبانه بهبود یافته و تواناییهای فراخوانی عملکردهای پیشرفته را به Large 2 افزوده است. مدل Mistral Large 2 با 123 میلیارد پارامتر، قادر است روی یک گره H100 با توانایی عملیاتی بالا فعالیت کند.
این مدل از زبانهای فرانسوی، آلمانی، اسپانیایی، ایتالیایی، پرتغالی، عربی، هندی، روسی، چینی، ژاپنی و کرهای پشتیبانی میکند. در زمینه کدنویسی، از بیش از 80 زبان برنامهنویسی شامل پایتون، جاوا، سی، سی پلاس پلاس، جاوا اسکریپت و Bash پشتیبانی میکند. مدل Mistral Large 2 اکنون با وزنههای باز در دسترس است، اما تنها برای تحقیقات و استفادههای غیرتجاری به صورت رایگان قابل استفاده است. برای کاربردهای تجاری، نیاز به اخذ مجوز مدل است.
عملکرد Mistral Large 2 (123B) در مقایسه با OpenAI GPT-4o و Claude Opus 3 و Llama 3.1 405B، در معیارهای کدنویسی قابل مقایسه است. در بنچمارکهای Wild Bench، Arena Hard و MT Bench، عملکرد Large 2 بهتر از Llama 3.1 405B و Claude 3 Opus بوده است. در معیار MMLU که محبوبیت زیادی دارد، این مدل جدید از Llama 3.1 70B بهتر عمل کرده و با Llama 3.1 405B برابری میکند.
برای توسعهدهندگان، Mistral Large 2 هم اکنون با قابلیتهای فراخوانی و بازیابی بهبود یافته عرضه میشود. این مدل قادر است فراخوانیهای تابع موازی و متوالی را انجام دهد و به توسعهدهندگان امکان میدهد تا برنامههای کاربردی پیچیدهی هوش مصنوعی تجاری را توسعه دهند.
با رونمایی از Large 2، استارتاپ Mistral در حال تثبیت پورتفولیوی مدلهای خود است. این شرکت دو مدل همهمنظوره Mistral Nemo و Mistral Large و دو مدل تخصصی Codestral و Embed را خواهد داشت. میسترال در آینده مدل های آپاچی (Mistral 7B، Mistral 8x7B و 8x22B، Codestral Mamba، Mathstral) را متوقف خواهد کرد.
مایکروسافت و میسترال قبلاً برای عرضه مدل های Mistral در Azure شراکت داشتند. امروز، Mistral در حال گسترش همکاری خود با Google است تا مدلهای Mistral را در Google Cloud در دسترس قرار دهد. انتشار متوالی Mistral Large 2 و Llama 3.1 نقطه عطف مهمی برای اکوسیستم هوش مصنوعی باز است و دو مدل قدرتمند سطح GPT-4 را برای تحقیق و توسعه ارائه می دهد. این پیشرفت سریع به حرکت رو به رشد به سمت چشم انداز هوش مصنوعی بازتر و مشارکتی تر می افزاید.