هوش مصنوعی

IBM از مدل های هوش مصنوعی چندوجهی و استدلالی Granite پرده برداشت

امروز IBM نسل جدیدی از خانواده مدل‌های زبانی بزرگ خود، Granite 3.2، را معرفی کرد که در راستای تلاش‌های مداوم این شرکت برای ارائه هوش مصنوعی کوچک، کارآمد و عملی برای تأثیر واقعی در دنیای کسب‌وکار است. تمامی مدل‌های Granite 3.2 تحت مجوز Apache 2.0 در Hugging Face در دسترس هستند. برخی از مدل‌ها هم‌اکنون در IBM watsonx.ai، Ollama، Replicate و LM Studio قابل دسترسی هستند و به زودی در RHEL AI 1.5 نیز ارائه خواهند شد که قابلیت‌های پیشرفته‌ای را به کسب‌وکارها و جامعه متن‌باز می‌آورد. از نکات برجسته آنها می توان به موارد زیر اشاره نمود:

  • مدل جدید زبان بصری (VLM) برای وظایف درک مستندات معرفی شده که عملکرد آن با مدل‌های بسیار بزرگ‌تر مانند Llama 3.2 11B و Pixtral 12B در معیارهای کلیدی سازمانی مانند DocVQA، ChartQA، AI2D و OCRBench1 برابر یا حتی فراتر می‌رود. علاوه بر داده‌های آموزشی قوی، IBM از ابزار متن‌باز Docling خود برای پردازش 85 میلیون PDF استفاده کرده و 26 میلیون جفت سؤال و پاسخ مصنوعی تولید کرده تا توانایی VLM را در مدیریت جریان‌های کاری پیچیده و مستندات سنگین تقویت کند.
  • مدل‌های 3.2 2B و 8B دارای قابلیت‌های زنجیره‌ای تفکر هستند که به بهبود استدلال کمک می‌کند و امکان فعال یا غیرفعال کردن استدلال را برای بهینه‌سازی کارایی فراهم می‌آورد. با این قابلیت، مدل 8B در مقایسه با نسخه قبلی خود، بهبودهای دو رقمی را در معیارهای پیروی از دستورالعمل‌ها مانند ArenaHard و Alpaca Eval به دست می‌آورد، بدون اینکه ایمنی یا عملکرد در سایر زمینه‌ها کاهش یابد. علاوه بر این، با استفاده از روش‌های نوین مقیاس‌گذاری استنتاج، مدل Granite 3.2 8B می‌تواند به گونه‌ای تنظیم شود که با عملکرد مدل‌های بزرگ‌تر مانند Claude 3.5 Sonnet یا GPT-4o در معیارهای استدلال ریاضی مانند AIME2024 و MATH500 رقابت کند.
  • مدل‌های ایمنی Granite Guardian با اندازه‌های کوچک‌تر ارائه شده‌اند که عملکرد مدل‌های قبلی Granite 3.1 Guardian را با کاهش 30 درصدی در اندازه حفظ می‌کنند. مدل‌های 3.2 همچنین ویژگی جدیدی به نام اعتماد کلامی را معرفی می‌کنند که ارزیابی ریسک دقیق‌تری را ارائه می‌دهد و به ابهام‌های موجود در نظارت بر ایمنی توجه می‌کند.

استراتژی IBM برای ارائه مدل‌های هوش مصنوعی کوچک و تخصصی برای شرکت‌ها همچنان در آزمایش‌ها اثربخشی خود را نشان می‌دهد، به طوری که مدل Granite 3.1 8B اخیراً در معیار LLM Salesforce برای CRM نمرات بالایی در دقت کسب کرده است. خانواده مدل‌های Granite از یک اکوسیستم قوی از شرکا پشتیبانی می‌شود که شامل شرکت‌های نرم‌افزاری پیشرو است که LLMها را در فناوری‌های خود ادغام می‌کنند.

نسخه Granite 3.2 یک گام مهم در تحول پرتفوی و استراتژی IBM برای ارائه هوش مصنوعی کوچک و عملی به شرکت‌ها است. در حالی که رویکردهای زنجیره‌ای تفکر برای استدلال بسیار قدرتمند هستند، اما نیاز به قدرت محاسباتی قابل توجهی دارند که برای هر وظیفه‌ای ضروری نیست. به همین دلیل، IBM قابلیت فعال یا غیرفعال کردن زنجیره تفکر به صورت برنامه‌نویسی را معرفی کرده است.

برای وظایف ساده‌تر، مدل می‌تواند بدون استدلال عمل کند تا بار محاسباتی غیرضروری را کاهش دهد. علاوه بر این، تکنیک‌های استدلال دیگری مانند مقیاس‌گذاری استنتاج نشان داده‌اند که مدل 8B گرانیت 3.2 می‌تواند عملکردی برابر یا بهتر از مدل‌های بسیار بزرگ‌تر در معیارهای استاندارد استدلال ریاضی داشته باشد. روش‌های در حال تکامل مانند مقیاس‌گذاری استنتاج همچنان یک حوزه کلیدی برای تیم‌های تحقیقاتی IBM به شمار می‌رود.

در کنار مدل‌های Granite 3.2، مدل‌های آموزشی، بینایی و حفاظتی، IBM نسل بعدی مدل‌های TinyTimeMixers (TTM) خود را با کمتر از 10 میلیون پارامتر منتشر می‌کند که قابلیت پیش‌بینی بلندمدت تا دو سال آینده را دارند. این مدل‌ها ابزارهای قدرتمندی برای تحلیل روندهای بلندمدت، از جمله روندهای مالی و اقتصادی، پیش‌بینی تقاضای زنجیره تأمین و برنامه‌ریزی موجودی فصلی در خرده‌فروشی به شمار می‌روند.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا