بیش از یک سال از زمانی که OpenAI مدل تولید ویدیو و صدا “سورا (Sora)” را معرفی کرد، میگذرد. این شرکت اکنون اولین بهروزرسانی بزرگ “سورا ۲ (Sora 2)” را معرفی کرده که میتواند ویدیوهای واقعگرایانهتر و از نظر فیزیکی دقیقتر، همراه با قابلیتهای کنترل و ویرایش بهبودیافته توسط کاربر، تولید کند.
سورا ۲ که به عنوان “GPT 3.5-moment” توصیف میشود، همچنین خروجی صدای بهبود یافتهای را با دیالوگها و جلوههای صوتی هماهنگ ارائه میدهد. این مدل هوش مصنوعی قادر است از مشکلات رایج مرتبط با مدلهای تولید ویدیوی قبلی، مانند تغییر شکل اشیاء و تحریف واقعیت فیزیکی برای تکمیل یک دستور، جلوگیری کند.
ویدیوهای تولیدشده همچنین از دستورالعملهای چند شاتی پیروی کرده و در صحنههای مختلف، ثبات را حفظ میکنند. سورا ۲ از چندین سبک تولید ویدیو، از جمله سینمایی، واقعگرایانه و انیمه، پشتیبانی میکند.
علاوه بر این، OpenAI در حال راهاندازی یک برنامه مستقل Sora iOS با سیستمی فقط با دعوت است. سورا ۲ دارای چندین ضمانت، از جمله محدودیتهایی در استفاده از چهرههای عمومی در تولید ویدیو است. OpenAI همچنین تأیید کرد که کاربران میتوانند به دیگران اجازه دهند تا با تصویر خودشان “کمئو” ایجاد کنند، اما این اجازه میتواند در هر زمانی در آینده توسط کاربر لغو شود.
عرضه اولیه سورا ۲ از روز گذشته آغاز شده و محدود به ایالات متحده و کانادا خواهد بود. در مورد قیمتگذاری، OpenAI تأیید کرد که این مدل هوش مصنوعی در ابتدا رایگان خواهد بود و “محدودیتهای سخاوتمندانهای” دارد تا کاربران بتوانند قابلیتهای آن را بررسی کنند.
البته مشترکین ChatGPT Pro به مدل سورا ۲ پرو با کیفیت بالاتر دسترسی پیدا میکنند. OpenAI همچنین برنامههای خود را برای انتشار قریبالوقوع API Sora 2 تأیید کرد.