OpenAI از پردازش فلکس برای کاهش هزینه‌ مدل ها معرفی کرد

فروردین ۲۹, ۱۴۰۴

0 زمان مطالعه یک دقیقه

OpenAI به تازگی قابلیت جدیدی به نام پردازش فلکس را معرفی کرده که به کاربران اجازه می‌دهد هزینه‌های استفاده از مدل‌های هوش مصنوعی را کاهش دهند. این ویژگی در ازای کاهش قیمت، سرعت پاسخ‌دهی مدل‌ها را کمی کندتر کرده و احتمال عدم دسترسی مقطعی به منابع پردازشی را افزایش می‌دهد. این قابلیت در حال حاضر به‌صورت بتا برای مدل‌های جدید OpenAI شامل o3 و o4-mini فعال شده و بیشتر برای وظایف کم‌اهمیت یا غیرتولیدی مانند ارزیابی مدل‌ها، غنی‌سازی داده‌ها و پردازش‌های غیرهم‌زمان طراحی شده است.

OpenAI اعلام کرده که Flex processing به طور دقیق هزینه‌ها را 50 درصد کاهش می‌دهد. برای مدل o3، هزینه پردازش 5 دلار به ازای هر یک میلیون توکن ورودی و 20 دلار به ازای هر یک میلیون توکن خروجی تعیین شده، در حالی که در حالت استاندارد این هزینه‌ها 10 دلار و 40 دلار بودند. این کاهش قیمت مشابه مدل o4-mini نیز اعمال شده است، به طوری که هزینه‌ پردازش در این مدل از 1.10 دلار به 0.55 دلار برای یک میلیون توکن ورودی و از 4.40 دلار به 2.20 دلار برای یک میلیون توکن خروجی رسیده است.

دلایل عرضه‌ این قابلیت را می‌توان در افزایش هزینه‌ی مدل‌های هوش مصنوعی پیشرفته و معرفی مدل‌های اقتصادی‌تر توسط رقبا جستجو کرد. هم‌زمان با اعلام پردازش فلکس، گوگل مدل جدید Gemini 2.5 Flash را عرضه کرده که عملکردی مشابه مدل DeepSeek R1 دارد اما هزینه پردازش توکن‌های ورودی در آن کمتر است. این رقابت بین شرکت‌های توسعه‌دهنده‌ هوش مصنوعی نشان می‌دهد که ارائه مدل‌های مقرون‌به‌صرفه یکی از اولویت‌های اصلی بازار هوش مصنوعی در حال حاضر است.

OpenAI همچنین اعلام کرده که کاربران سطوح 1 تا 3 در ساختار مصرف API باید فرآیند احراز هویت جدید را تکمیل کنند تا بتوانند به مدل o3 دسترسی پیدا کنند. این شرکت تأکید کرده که این محدودیت‌های جدید به‌منظور جلوگیری از سوءاستفاده از سرویس‌ها و رعایت سیاست‌های مصرف OpenAI وضع شده است. همچنین، ویژگی‌های خلاصه‌سازی استدلالی و قابلیت استریم API در مدل o3 نیز تحت این فرآیند احراز هویت قرار گرفته‌اند.

فروردین ۲۹, ۱۴۰۴

0 زمان مطالعه یک دقیقه

نمایش بیشتر

OpenAI از پردازش فلکس برای کاهش هزینه‌ مدل ها معرفی کرد

دیدگاهتان را بنویسید لغو پاسخ

بررسی اوپو Find X8 Ultra: استاندارد جدید در گوشی های اولترا

لنوو روتر 5G جدیدی با دو سیم‌کارت و قیمت اقتصادی معرفی کرد

محدودیت‌های جدید Synology برای استفاده از هارد دیسک‌های متفرقه در NAS

مایکروسافت یک ویژگی کلیدی را از Classic Teams حذف می‌کند

گوگل ChromeOS M135 را به کانال پایدار آورد

بلیزارد نحوه‌ عملکرد Hero Bans را در بازی Overwatch توضیح داد

بررسی اوپو Find X8 Ultra: استاندارد جدید در گوشی های اولترا

لنوو روتر 5G جدیدی با دو سیم‌کارت و قیمت اقتصادی معرفی کرد

ریزر از سریع دانگل USB بیسیم با نرخ 4000 هرتز رونمایی کرد

نحوه رفع 100 درصد استفاده از دیسک روی هارد

نوشته های مشابه

پیشنهاد گوگل برای دانشجویان: یک سال دسترسی رایگان به Gemini Advanced

آشنایی با ویژگی‌های برجسته مدل‌های هوش مصنوعی متا Llama 4

قابلیت حافظه برای چت‌بات Grok توسط xAI معرفی شد

ویژگی اشتراک‌گذاری صفحه Gemini Live برای کاربران اندروید رایگان شد

دیدگاهتان را بنویسید لغو پاسخ

بررسی اوپو Find X8 Ultra: استاندارد جدید در گوشی های اولترا

لنوو روتر 5G جدیدی با دو سیم‌کارت و قیمت اقتصادی معرفی کرد

ریزر از سریع دانگل USB بیسیم با نرخ 4000 هرتز رونمایی کرد

نحوه رفع 100 درصد استفاده از دیسک روی هارد