با Sora آشنا شوید: مدل جدید OpenAI برای ایجاد ویدیو با قدرت متن
OpenAI جدیدترین مدل انتشار خود Sora را معرفی کرد که از قدرت متن برای ایجاد ویدیو استفاده می کند. جدیدترین مدل هوش مصنوعی سازنده ChatGPT قادر به تولید ویدیوها با وضوحها و نسبتهای مختلف است و همچنین میتواند ویدیوهای موجود را ویرایش کند که امکان تغییر سریع مناظر، نور و سبک عکسبرداری را از طریق یک پیام متنی فراهم میکند.
Sora همچنین میتواند بر اساس یک تصویر ثابت ویدیو تولید کند یا حتی با پر کردن فریمهای از دست رفته، ویدیوهای موجود را گسترش دهد. OpenAI اشاره کرد که Sora در حال حاضر قادر به تولید حداکثر یک دقیقه محتوای ویدیویی Full HD است و نمونه هایی که ما دیده ایم امیدوارکننده به نظر می رسند. میتوانید صفحه لندینگ Sora را برای نمونههای ویدیوی تولید شده بیشتر بررسی کنید.
این مدل با استفاده از معماری ترانسفورماتور مشابه ChatGPT کار می کند که در آن فیلم ها و تصاویر به عنوان واحدهای کوچکتر داده به نام پچ ارائه می شوند. ویدیوهای تولید شده توسط Sora به صورت نویز ثابت شروع می شوند و مدل به تدریج نویز را حذف می کند تا محصول نهایی را تشکیل دهد. OpenAI گفت که از پروتکل های ایمنی موجود خود در DALL·E 3 استفاده می شود. Sora در حال حاضر توسط “تیم های قرمز” – کارشناسانی که آزمایش ها را انجام می دهند و مدل را برای خطرات احتمالی قبل از راه اندازی رسمی آن ارزیابی می کنند، آزمایش می شود.
OpenAI همچنین با سیاست گذاران، هنرمندان و مربیان گفتگو خواهد کرد تا نگرانی های بالقوه را ببیند و موارد استفاده از سورا را ببیند. در حال حاضر تاریخ رسمی راه اندازی ارائه نشده است.