
IBM از مدل های هوش مصنوعی چندوجهی و استدلالی Granite پرده برداشت
امروز IBM نسل جدیدی از خانواده مدلهای زبانی بزرگ خود، Granite 3.2، را معرفی کرد که در راستای تلاشهای مداوم این شرکت برای ارائه هوش مصنوعی کوچک، کارآمد و عملی برای تأثیر واقعی در دنیای کسبوکار است. تمامی مدلهای Granite 3.2 تحت مجوز Apache 2.0 در Hugging Face در دسترس هستند. برخی از مدلها هماکنون در IBM watsonx.ai، Ollama، Replicate و LM Studio قابل دسترسی هستند و به زودی در RHEL AI 1.5 نیز ارائه خواهند شد که قابلیتهای پیشرفتهای را به کسبوکارها و جامعه متنباز میآورد. از نکات برجسته آنها می توان به موارد زیر اشاره نمود:
- مدل جدید زبان بصری (VLM) برای وظایف درک مستندات معرفی شده که عملکرد آن با مدلهای بسیار بزرگتر مانند Llama 3.2 11B و Pixtral 12B در معیارهای کلیدی سازمانی مانند DocVQA، ChartQA، AI2D و OCRBench1 برابر یا حتی فراتر میرود. علاوه بر دادههای آموزشی قوی، IBM از ابزار متنباز Docling خود برای پردازش 85 میلیون PDF استفاده کرده و 26 میلیون جفت سؤال و پاسخ مصنوعی تولید کرده تا توانایی VLM را در مدیریت جریانهای کاری پیچیده و مستندات سنگین تقویت کند.
- مدلهای 3.2 2B و 8B دارای قابلیتهای زنجیرهای تفکر هستند که به بهبود استدلال کمک میکند و امکان فعال یا غیرفعال کردن استدلال را برای بهینهسازی کارایی فراهم میآورد. با این قابلیت، مدل 8B در مقایسه با نسخه قبلی خود، بهبودهای دو رقمی را در معیارهای پیروی از دستورالعملها مانند ArenaHard و Alpaca Eval به دست میآورد، بدون اینکه ایمنی یا عملکرد در سایر زمینهها کاهش یابد. علاوه بر این، با استفاده از روشهای نوین مقیاسگذاری استنتاج، مدل Granite 3.2 8B میتواند به گونهای تنظیم شود که با عملکرد مدلهای بزرگتر مانند Claude 3.5 Sonnet یا GPT-4o در معیارهای استدلال ریاضی مانند AIME2024 و MATH500 رقابت کند.
- مدلهای ایمنی Granite Guardian با اندازههای کوچکتر ارائه شدهاند که عملکرد مدلهای قبلی Granite 3.1 Guardian را با کاهش 30 درصدی در اندازه حفظ میکنند. مدلهای 3.2 همچنین ویژگی جدیدی به نام اعتماد کلامی را معرفی میکنند که ارزیابی ریسک دقیقتری را ارائه میدهد و به ابهامهای موجود در نظارت بر ایمنی توجه میکند.
استراتژی IBM برای ارائه مدلهای هوش مصنوعی کوچک و تخصصی برای شرکتها همچنان در آزمایشها اثربخشی خود را نشان میدهد، به طوری که مدل Granite 3.1 8B اخیراً در معیار LLM Salesforce برای CRM نمرات بالایی در دقت کسب کرده است. خانواده مدلهای Granite از یک اکوسیستم قوی از شرکا پشتیبانی میشود که شامل شرکتهای نرمافزاری پیشرو است که LLMها را در فناوریهای خود ادغام میکنند.
نسخه Granite 3.2 یک گام مهم در تحول پرتفوی و استراتژی IBM برای ارائه هوش مصنوعی کوچک و عملی به شرکتها است. در حالی که رویکردهای زنجیرهای تفکر برای استدلال بسیار قدرتمند هستند، اما نیاز به قدرت محاسباتی قابل توجهی دارند که برای هر وظیفهای ضروری نیست. به همین دلیل، IBM قابلیت فعال یا غیرفعال کردن زنجیره تفکر به صورت برنامهنویسی را معرفی کرده است.
برای وظایف سادهتر، مدل میتواند بدون استدلال عمل کند تا بار محاسباتی غیرضروری را کاهش دهد. علاوه بر این، تکنیکهای استدلال دیگری مانند مقیاسگذاری استنتاج نشان دادهاند که مدل 8B گرانیت 3.2 میتواند عملکردی برابر یا بهتر از مدلهای بسیار بزرگتر در معیارهای استاندارد استدلال ریاضی داشته باشد. روشهای در حال تکامل مانند مقیاسگذاری استنتاج همچنان یک حوزه کلیدی برای تیمهای تحقیقاتی IBM به شمار میرود.
در کنار مدلهای Granite 3.2، مدلهای آموزشی، بینایی و حفاظتی، IBM نسل بعدی مدلهای TinyTimeMixers (TTM) خود را با کمتر از 10 میلیون پارامتر منتشر میکند که قابلیت پیشبینی بلندمدت تا دو سال آینده را دارند. این مدلها ابزارهای قدرتمندی برای تحلیل روندهای بلندمدت، از جمله روندهای مالی و اقتصادی، پیشبینی تقاضای زنجیره تأمین و برنامهریزی موجودی فصلی در خردهفروشی به شمار میروند.