
OpenAI از پردازش فلکس برای کاهش هزینه مدل ها معرفی کرد
OpenAI به تازگی قابلیت جدیدی به نام پردازش فلکس را معرفی کرده که به کاربران اجازه میدهد هزینههای استفاده از مدلهای هوش مصنوعی را کاهش دهند. این ویژگی در ازای کاهش قیمت، سرعت پاسخدهی مدلها را کمی کندتر کرده و احتمال عدم دسترسی مقطعی به منابع پردازشی را افزایش میدهد. این قابلیت در حال حاضر بهصورت بتا برای مدلهای جدید OpenAI شامل o3 و o4-mini فعال شده و بیشتر برای وظایف کماهمیت یا غیرتولیدی مانند ارزیابی مدلها، غنیسازی دادهها و پردازشهای غیرهمزمان طراحی شده است.
OpenAI اعلام کرده که Flex processing به طور دقیق هزینهها را 50 درصد کاهش میدهد. برای مدل o3، هزینه پردازش 5 دلار به ازای هر یک میلیون توکن ورودی و 20 دلار به ازای هر یک میلیون توکن خروجی تعیین شده، در حالی که در حالت استاندارد این هزینهها 10 دلار و 40 دلار بودند. این کاهش قیمت مشابه مدل o4-mini نیز اعمال شده است، به طوری که هزینه پردازش در این مدل از 1.10 دلار به 0.55 دلار برای یک میلیون توکن ورودی و از 4.40 دلار به 2.20 دلار برای یک میلیون توکن خروجی رسیده است.
دلایل عرضه این قابلیت را میتوان در افزایش هزینهی مدلهای هوش مصنوعی پیشرفته و معرفی مدلهای اقتصادیتر توسط رقبا جستجو کرد. همزمان با اعلام پردازش فلکس، گوگل مدل جدید Gemini 2.5 Flash را عرضه کرده که عملکردی مشابه مدل DeepSeek R1 دارد اما هزینه پردازش توکنهای ورودی در آن کمتر است. این رقابت بین شرکتهای توسعهدهنده هوش مصنوعی نشان میدهد که ارائه مدلهای مقرونبهصرفه یکی از اولویتهای اصلی بازار هوش مصنوعی در حال حاضر است.
OpenAI همچنین اعلام کرده که کاربران سطوح 1 تا 3 در ساختار مصرف API باید فرآیند احراز هویت جدید را تکمیل کنند تا بتوانند به مدل o3 دسترسی پیدا کنند. این شرکت تأکید کرده که این محدودیتهای جدید بهمنظور جلوگیری از سوءاستفاده از سرویسها و رعایت سیاستهای مصرف OpenAI وضع شده است. همچنین، ویژگیهای خلاصهسازی استدلالی و قابلیت استریم API در مدل o3 نیز تحت این فرآیند احراز هویت قرار گرفتهاند.