Llama 3.1 آخرین بازی متا در نبرد برای تسلط بر هوش مصنوعی است
شرکت متا روز سهشنبه اعلام کرد که نسخه جدید مدل زبان بزرگ خود، Llama 3.1 را منتشر کرده، که به گفته شرکت قادر به رقابت با رقبایی چون OpenAI و Anthropic میباشد. این مدل جدید تنها سه ماه پس از عرضه Llama 3 توسط متا و ادغام آن در Meta AI، چت رباتی که هم اکنون در فیس بوک، مسنجر، اینستاگرام و واتس اپ فعال است و همچنین عینکهای هوشمند این شرکت را پشتیبانی میکند، منتشر شده است.
در همین حال، OpenAI و Anthropic پیشتر نسخههای جدیدی از مدلهای هوش مصنوعی خود را عرضه کردهاند، که نشان دهنده این است که رقابت در عرصه هوش مصنوعی سیلیکون ولی همچنان با سرعت ادامه دارد. متا اعلام کرده است که مدل جدیدش با نام Llama 3.1 405B، اولین مدلی است که میتواند در زمینههای دانش عمومی، مهارتهای ریاضی و ترجمه به چندین زبان با سایر مدلها رقابت کند.
این شرکت مدعی شده که این مدل روی بیش از 16000 پردازنده گرافیکی انویدیا H100 آموزش دیده، که سریعترین چیپهای موجود هستند و هر کدام به قیمت تقریبی 25000 دلار فروخته میشوند، و توانسته است در بیش از 150 بنچمارک از رقبای خود پیشی بگیرد. “405B” به 405 میلیارد پارامتر اشاره دارد که متغیرهای داخلی یک مدل هوش مصنوعی را تشکیل میدهند و در استدلال و تصمیمگیری به کار میروند.
معمولاً، هر چه تعداد پارامترهای یک مدل هوش مصنوعی بیشتر باشد، آن مدل دارای هوش بالاتری تلقی میشود. برای مقایسه، مدل GPT-4 از OpenAI حدود 1.5 تریلیون پارامتر دارد، هرچند که این شرکت هنوز این تعداد را رسماً اعلام نکرده است. همچنین، متا نسخههای بهبود یافتهای از مدلهای Llama موجود را منتشر کرده است که شامل 70 میلیارد و 8 میلیارد پارامتر میباشند و ادعا میکند که این نسخههای جدیدتر قابلیت استدلال قویتری دارند.
توسعهدهندگان میتوانند Llama 3.1 را از وبسایت رسمی آن دانلود کنند، در حالی که کاربران عمومی میتوانند از طریق Meta AI در واتساپ یا در meta.ai، وبسایت شرکت برای چتبات آن، با آن تعامل داشته باشند. در پست وبلاگ متا آمده است:
قابلیتهای استدلال پیشرفته Llama 3.1 405B به هوش مصنوعی متا اجازه میدهد تا سوالات پیچیدهتر شما را درک کرده و به آنها پاسخ دهد، مخصوصاً در زمینههای ریاضی و برنامهنویسی.” “شما میتوانید برای تکالیف ریاضی خود از توضیحات و بازخورد گامبهگام کمک بگیرید و با استفاده از پشتیبانی در اشکالزدایی و بهینهسازی، کدهای خود را سریعتر بنویسید.
بر خلاف اوپن ایآی، گوگل، مایکروسافت و Anthropic که مدلهای هوش مصنوعی خود را به صورت انحصاری حفظ میکنند، مدلهای هوش مصنوعی متا به صورت منبع باز هستند، به این معنا که هر فردی میتواند بدون اشتراکگذاری دادههای شخصی با متا، به صورت رایگان آنها را تغییر دهد و استفاده کند.
مارک زاکربرگ، مدیرعامل متا، در نامهای که روز سهشنبه منتشر شده، استدلال میکند که یک رویکرد منبع باز در توسعه هوش مصنوعی، دسترسی گستردهتر به مزایای این فناوری را فراهم میآورد، از تمرکز قدرت در دست چند شرکت بزرگ جلوگیری میکند و امکان پیادهسازی هوش مصنوعی ایمنتر در جامعه را میسر میسازد.
زاکربرگ نوشت که متا با منبع باز کردن بزرگترین مدل زبانی خود تا به امروز، قصد دارد لاما را به استاندارد صنعتی برای هر کسی که میخواهد برنامهها و خدمات مبتنی بر هوش مصنوعی را توسعه دهد، تبدیل کند. استفاده از مدلهای هوش مصنوعی منبع باز و ادغام آنها در محصولات موجود که پیشتر توسط میلیاردها نفر مورد استفاده قرار گرفتهاند، میتواند به متا این امکان را بدهد که به طور مؤثرتری با OpenAI رقابت کند، که چترباتهای ChatGPT و DALL-E آن در سال 2022 معرفی شدند و باعث انفجاری در عرصه هوش مصنوعی شدند.
همچنین، این امکان میتواند تعامل کاربران را افزایش دهد. متا اعلام کرده است که به زودی کاربران قادر خواهند بود تصاویر تولیدی توسط هوش مصنوعی را مستقیماً به فیدها، استوری ها، نظرات و پیامهای خود در فیسبوک، مسنجر، واتساپ و اینستاگرام اضافه کنند. زاکربرگ در نامهای نیز به انتقاد از اپل و اکوسیستم بستهاش پرداخته و بیان کرده است که سیاستهای محدودکننده و خودسرانهی سازندهی آیفون، تواناییهای متا در ساخت بر روی پلتفرمهای خود را محدود ساخته است.