هوش مصنوعی

IBM از پردازنده Telum II و Spyre Accelerator رونمایی کرد

IBM در کنفرانس Hot Chips 2024 جزئیات معماری پردازنده‌های آینده‌ی خود، IBM Telum II و IBM Spyre Accelerator را اعلام کرد. این فناوری‌های نوین به گونه‌ای طراحی شده‌اند که قابلیت پردازشی سیستم‌های مرکزی نسل بعدی IBM Z را افزایش داده و به تسریع در استفاده از مدل‌های سنتی و مدل‌های هوش مصنوعی با زبان‌های بزرگ از طریق روش‌های جدید گروهی هوش مصنوعی کمک می‌کنند.

با توجه به اینکه بسیاری از پروژه‌های هوش مصنوعی مولد که از مدل‌های زبان بزرگ (LLM) استفاده می‌کنند، در حال گذار از مرحله اثبات مفهوم به تولید هستند، تقاضا برای راه‌حل‌های کارآمد، ایمن و قابل مقیاس‌گذاری به عنوان اولویت‌های اصلی مطرح شده است.

مطالعات منتشر شده توسط مورگان استنلی در ماه آگوست نشان می‌دهد که تقاضا برای انرژی مورد نیاز برای هوش مصنوعی مولد در چند سال آینده سالانه 75 درصد افزایش خواهد یافت، به طوری که پیش‌بینی می‌شود در سال 2026 میزان مصرف انرژی به اندازه کشور اسپانیا در سال 2022 باشد.

تصمیمات معماری بسیاری از مشتریان IBM برای پشتیبانی از مدل‌های فونداسیون با اندازه مناسب و رویکردهای ترکیبی، طراحی شده برای بار کاری هوش مصنوعی، اهمیت فزاینده‌ای پیدا کرده‌اند. نوآوری‌های کلیدی که امروز معرفی شدند، شامل موارد زیر است.

پردازنده IBM Telum II

تراشه جدید IBM که برای تأمین انرژی نسل بعدی سیستم‌های IBM Z طراحی شده، دارای فرکانس بالاتر، ظرفیت حافظه افزایش یافته، 40 درصد رشد در حافظه کش و هسته‌ای مجتمع برای شتاب‌دهی به هوش مصنوعی، به علاوه یک واحد پردازش داده (DPU) که به طور هماهنگ متصل شده است. این تراشه، نسل اول Telum را دنبال می‌کند. انتظار می‌رود که پردازنده جدید از راه‌حل‌های محاسباتی سازمانی برای مدل‌های زبان بزرگ (LLM) پشتیبانی کند و به نیازهای معاملات پیچیده صنعت پاسخ دهد.

واحد پردازش داده کاملاً جدید (DPU) در تراشه پردازنده Telum II برای تسریع پروتکل‌های پیچیده IO برای شبکه و ذخیره‌سازی در پردازنده مرکزی طراحی شده است. DPU عملیات سیستم را تسهیل می‌کند و می‌تواند به بهبود عملکرد اجزای کلیدی کمک کند.

IBM Spyre Accelerator

تراشه‌های Telum II و Spyre با همکاری یکدیگر، یک معماری قابل انعطاف را برای پشتیبانی از روش‌های متنوع مدل‌سازی هوش مصنوعی فراهم می‌کنند، که شامل ترکیب چندین مدل یادگیری ماشین و یادگیری عمیق AI با رمزگذارهای LLM است. با بهره‌گیری از قوت‌های معماری هر مدل، هوش مصنوعی مجموعه می‌تواند نتایجی دقیق‌تر و قوی‌تر نسبت به مدل‌های مستقل ارائه دهد. تراشه شتاب‌دهنده IBM Spyre که در کنفرانس Hot Chips 2024 معرفی شد، به‌عنوان یک افزونه قابل ارائه خواهد بود.

هر تراشه شتاب‌دهنده از طریق یک آداپتور PCIe با توان 75 وات متصل می‌شود و بر پایه فناوری‌های توسعه‌یافته توسط IBM Research است. مانند دیگر کارت‌های PCIe، شتاب دهنده Spyre Accelerator قابلیت انطباق با نیازهای متفاوت کلاینت ها را دارد. پردازنده‌های Telum II و شتاب‌دهنده IBM Spyre توسط Samsung Foundry، شریک تولیدی قدیمی IBM، ساخته خواهند شد و بر اساس فرآیند 5 نانومتری پیشرفته و کارآمد آن‌ها تولید می‌شوند.

با همکاری نزدیک، این محصولات از طیف گسترده‌ای از کاربردهای پیشرفته مبتنی بر هوش مصنوعی که برای ایجاد ارزش تجاری و مزیت‌های رقابتی طراحی شده‌اند، پشتیبانی خواهند کرد. با استفاده از روش‌های ترکیبی هوش مصنوعی، مشتریان قادر خواهند بود نتایجی سریع‌تر و دقیق‌تر در پیش‌بینی‌های خود کسب کنند.

مشخصات و معیارهای عملکرد

Telum II processor: پردازنده‌ای با هشت هسته و کارایی بالا که با فرکانس 5.5 گیگاهرتز کار می‌کند، دارای 36 مگابایت حافظه کش L2 در هر هسته است و ظرفیت کش روی تراشه را 40 درصد افزایش داده تا به مجموع 360 مگابایت برسد. حافظه کش مجازی L4 با ظرفیت 2.88 گیگابایت در هر کشوی پردازنده، 40 درصد بیشتر از نسل قبلی است. شتاب‌دهنده هوش مصنوعی یکپارچه، استنباط هوش مصنوعی را با تأخیر کم و توان عملیاتی بالا ممکن می‌سازد، که به عنوان مثال، قابلیت تشخیص تقلب را در تراکنش‌های مالی بهبود می‌بخشد و ظرفیت محاسباتی هر تراشه را چهار برابر نسل قبلی افزایش می‌دهد.

واحد شتاب I/O جدید DPU در تراشه Telum II ادغام شده و برای بهبود مدیریت داده‌ها با افزایش 50 درصدی تراکم ورودی/خروجی طراحی شده است. این پیشرفت، کارایی و مقیاس‌پذیری کلی سیستم IBM Z را افزایش می‌دهد و آن را برای مدیریت بار کاری هوش مصنوعی در مقیاس بزرگ و برنامه‌های کاربردی داده‌های فشرده مناسب برای کسب‌وکارهای امروزی می‌سازد.

Spyre Accelerator: یک شتاب‌دهنده درجه‌یک سازمانی طراحی شده که قابلیت‌های مقیاس‌پذیر را برای مدل‌های پیچیده هوش مصنوعی و کاربردهای هوش مصنوعی مولد فراهم می‌کند. این شتاب‌دهنده دارای حداکثر یک ترابایت حافظه است و برای کار مداوم در میان 8 کارت یک کشوی معمولی I/O ساخته شده تا از بارهای کاری مدل‌های هوش مصنوعی در سراسر پردازنده مرکزی پشتیبانی کند، در حالی که برای مصرف بیش از 75 وات در هر کارت طراحی شده است. هر چیپ شامل 32 هسته محاسباتی است که از داده‌های int4، int8، fp8 و fp16 برای برنامه‌های هوش مصنوعی با تأخیر کم و توان عملیاتی بالا پشتیبانی می‌کند.

پردازنده Telum II به عنوان پردازنده مرکزی، نسل بعدی پلتفرم‌های IBM Z و IBM LinuxONE را تأمین خواهد کرد. انتظار می‌رود که در سال 2025 برای مشتریان IBM Z و LinuxONE در دسترس باشد. شتاب‌دهنده IBM Spyre، که در حال حاضر در مرحله پیش‌نمایش فناوری قرار دارد، نیز انتظار می‌رود که در سال 2025 در دسترس قرار گیرد.

نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا