با 5 ویژگی برتر در مدل GPT-4 آشنا شوید
OpenAI سرانجام به روز رسانی مورد انتظار GPT خود را با نام GPT-4 راه اندازی کرد. مدل زبان بزرگ (LLM) با برخی ویژگیها و قابلیتهای قدرتمند جدید ارائه میشود که کاربران را در سراسر جهان شوکه کرده است.
علاوه بر اینکه GPT-4 به طور قابل توجهی بهتر از GPT-3.5 است، LLM موجود که ربات چت ویروسی OpenAI ChatGPT را تقویت می کند، GPT-4 می تواند ورودی های پیچیده تری را درک کند، دارای محدودیت ورودی کاراکتر به مراتب بزرگتر است، از قابلیت های چندوجهی بهره می برد، و طبق گزارش ها استفاده از آن ایمن تر است.
1. GPT-4 می تواند ورودی های پیچیده تری را درک کند
یکی از بزرگترین ویژگی های جدید GPT-4 توانایی آن در درک اعلان های پیچیده تر و ظریف تر است. طبق گفته OpenAI، GPT-4 “عملکرد در سطح انسانی را در معیارهای مختلف حرفه ای و آکادمیک نشان می دهد.” این امر با قرار دادن GPT-4 از طریق چندین آزمون در سطح انسانی و تست های استاندارد شده، مانند SAT، BAR، و GRE، بدون آموزش خاص، نشان داده شد. GTP-4 نه تنها این تستها را با نمره نسبتاً بالا در سراسر تخته درک و حل کرد، بلکه هر بار نسخه قبلی خود یعنی GPT-3.5 را شکست داد.
توانایی درک اعلانهای ورودی ظریفتر نیز با این واقعیت کمک میکند که GPT-4 دارای محدودیت کلمات بسیار بزرگتری است. مدل جدید میتواند اعلانهای ورودی تا 25000 کلمه را مدیریت کند (برای زمینه، GPT-3.5 به 8000 کلمه محدود شده بود). این به طور مستقیم بر جزئیاتی که کاربران میتوانند در اعلانهای خود فشار دهند، تأثیر میگذارد، از این رو به مدل اطلاعات بسیار بیشتری برای کار کردن و تولید خروجیهای طولانیتر میدهد.
GPT-4 همچنین از بیش از 26 زبان از جمله زبان های کم منبع مانند لتونی، ولزی و سواحیلی پشتیبانی می کند. هنگامی که در معیار MMLU بر روی دقت three-shot محک زده شد، GPT-4 از نظر عملکرد انگلیسی زبان در 24 زبان، GPT-3.5 و همچنین سایر LLM های پیشرو مانند PaLM و Chinchilla را شکست داد.
2. قابلیت های چندوجهی
نسخه قبلی ChatGPT فقط به پیام های متنی محدود می شد. در مقابل، یکی از جدیدترین ویژگی های GPT-4 قابلیت های چند وجهی آن است. مدل می تواند هر دو درخواست متن و تصویر را بپذیرد. این بدان معنی است که هوش مصنوعی می تواند یک تصویر را به عنوان ورودی بپذیرد و آن را درست مانند یک پیام متنی تفسیر و درک کند. این قابلیت شامل تمام اندازه ها و انواع تصاویر و متن، از جمله اسناد ترکیبی از این دو، طرح های طراحی شده با دست، و حتی اسکرین شات ها می شود.
با این حال، قابلیتهای خواندن تصویر GPT-4 فراتر از تفسیر ساده آنهاست. OpenAI این را در جریان توسعه دهندگان خود به نمایش گذاشت، جایی که آنها GPT-4 را با یک مدل طراحی دستی از یک وب سایت جوک ارائه کردند. این مدل وظیفه داشت کدهای HTML و جاوا اسکریپت را بنویسد تا موکاپ را به یک وب سایت تبدیل کند و در عین حال جوک ها را با جوک های واقعی جایگزین کند.
GPT-4 هنگام استفاده از طرح بندی مشخص شده در ماکت، کد را نوشت. پس از آزمایش، کد یک سایت کاری با، همانطور که می توانید حدس بزنید، جوک های واقعی را تولید کرد. آیا این بدان معناست که پیشرفت های هوش مصنوعی به معنای پایان برنامه نویسی است؟ نه کاملاً، اما همچنان یک ویژگی است که در کمک به برنامه نویسان مفید خواهد بود.
همانطور که این ویژگی امیدوارکننده به نظر می رسد، هنوز در پیش نمایش تحقیقاتی است و به صورت عمومی در دسترس نیست. علاوه بر این، این مدل برای پردازش ورودیهای بصری زمان زیادی را صرف میکند، با خود OpenAI بیان میکند که برای سریعتر شدن ممکن است کار و زمان صرف شود.
3. فرمان پذیری بیشتر
OpenAI همچنین ادعا می کند که GPT-4 دارای درجه بالایی از فرمان پذیری است. همچنین شکستن کاراکترها را برای هوش مصنوعی سختتر کرده است، به این معنی که هنگام اجرای یک برنامه برای بازی یک شخصیت خاص، احتمال شکست آن کمتر است. توسعه دهندگان می توانند سبک و وظیفه هوش مصنوعی خود را با توصیف جهت در پیام “سیستم” تجویز کنند.
این پیامها به کاربران API اجازه میدهند تا تجربه کاربر را در محدودههای خاصی به شدت سفارشی کنند. از آنجایی که این پیامها سادهترین راه برای “جیلبریک” مدل هستند، آنها همچنین در حال کار روی امنتر کردن آنها هستند. نسخه نمایشی GPT-4 این نکته را با واداشتن کاربر به تلاش برای متوقف کردن GPT-4 از معلم سقراطی و پاسخ دادن به درخواست آنها به پایان رساند. با این حال، این مدل از شکستن شخصیت خودداری کرد.
4. ایمن بودن
OpenAI شش ماه را صرف ساخت GPT-4 ایمن تر و هماهنگ تر کرد. این شرکت ادعا میکند که 82 درصد کمتر به درخواستهای محتوای نامناسب یا غیرمجاز پاسخ میدهد، 29 درصد بیشتر احتمال دارد که مطابق با سیاستهای OpenAI به درخواستهای حساس پاسخ دهد و 40 درصد بیشتر احتمال دارد که پاسخهای واقعی را در مقایسه با GPT-3.5 ارائه کند.
این کامل نیست، و شما هنوز هم می توانید انتظار داشته باشید که هر از گاهی “توهم” بزند و ممکن است در پیش بینی های خود اشتباه کند. مطمئناً GPT-4 ادراک و قدرت پیشبینی بهتری دارد، اما همچنان نباید کورکورانه به هوش مصنوعی اعتماد کنید.
5. بهبود عملکرد
خارج از ارزیابی عملکرد مدل در امتحانات انسانی، OpenAI همچنین ربات را بر اساس معیارهای سنتی طراحی شده برای مدلهای یادگیری ماشین ارزیابی کرد. ادعا میکند که GPT-4 «بهطور قابلتوجهی بهتر از LLMهای موجود و «بیشترین مدلهای پیشرفته» عمل میکند. این معیارها عبارتند از MMLU، AI2 Reasoning Challenge (ARC)، WinoGrande، HumanEval و Drop فوق الذکر که همگی قابلیت های فردی را آزمایش می کنند.
هنگام مقایسه عملکرد در معیارهای بینایی تحصیلی، نتایج مشابهی خواهید یافت. تستهای اجرا شده شامل VQAv2، TextVQA، ChartQA، AI2 Diagram (AI2D)، DocVQA، Infographic VQA، TVQA و LSMDC هستند که همگی GPT-4 در صدر هستند. با این حال، OpenAI بیان کرده است که نتایج GPT-4 در این آزمایشها “به طور کامل میزان تواناییهای آن را نشان نمیدهد” زیرا محققان به یافتن چیزهای جدید و چالشبرانگیزتری ادامه میدهند که این مدل میتواند با آنها مقابله کند.