
مدلهای جدید o3 و o4-mini: انقلاب در پردازش تصویری و استدلال هوشمند
دو روز پس از معرفی GPT-4.1، شرکت OpenAI مدلهای جدیدی با نام o3 و o4-mini را معرفی کرد. مدل o3 پیشرفتهترین سیستم استدلالی این شرکت تاکنون محسوب میشود و عملکرد فوقالعادهای در حوزههای ریاضیات، علوم و برنامهنویسی دارد. مدل o4-mini نیز یک جایگزین اقتصادی با قابلیتهای قدرتمند در همان حوزهها ارائه میدهد.
آنچه این مدلها را از نسخههای قبلی متمایز میکند، توانایی استفاده از تمام ابزارهای موجود در ChatGPT، از جمله جستجوی وب و تولید تصویر است. این ویژگی به مدلها اجازه میدهد تا مسائل چندمرحلهای پیچیده را بهصورت مستقل حل کنند و قدمهایی به سوی هوش مصنوعی خودمختار بردارند. علاوه بر این، مدلهای جدید نه تنها قادر به دیدن تصاویر هستند، بلکه میتوانند آنها را تجزیهوتحلیل کرده و از آنها برای بهبود فرآیند استدلال استفاده کنند.
بهعنوان مثال، کاربران میتوانند تصاویری از تختههای سفید، نمودارها و اسکچها را بارگذاری کنند (حتی اگر کیفیت آنها پایین باشد) و مدلهای جدید OpenAI قادر به درک و پردازش آنها خواهند بود. همچنین، این مدلها میتوانند تصاویر را تنظیم و اصلاح کنند و از آنها در فرآیند استدلال بهره ببرند.
کدگذاری هوشمند و آینده مدلهای پردازش زبان OpenAI همچنین یک عامل کدگذاری جدید به نام Codex CLI را منتشر کرده که توسعهدهندگان را قادر میسازد تا مدلهای این شرکت را بهصورت مستقیم با کدهای محلی خود ارتباط دهند. این ابزار در حال حاضر با o3 و o4-mini سازگار است و بهزودی از GPT-4.1 نیز پشتیبانی خواهد کرد.
سم آلتمن، اعلام کرده که مسیر توسعه این شرکت تغییر کرده و معرفی این مدلها تأثیر بسزایی در توسعه GPT-5 خواهد داشت. انتظار میرود که این نسخه در ماههای آینده عرضه شود و استانداردهای جدیدی در زمینه هوش مصنوعی و پردازش دادهها تعیین کند. کاربران اشتراکهای ChatGPT Plus، Pro و Team از امروز میتوانند به مدلهای جدید دسترسی داشته باشند. همچنین، نسخه قدرتمندتر o3-pro بهزودی در دسترس مشترکان Pro قرار خواهد گرفت.