کمپانی OpenAI جدیدترین مدل هوش مصنوعی خود، سورا (Sora) را معرفی کرد. جدیدترین مدل هوش مصنوعی کمپانی سازنده ChatGPT، قادر به تولید ویدیوهایی با وضوحها و نسبتهای مختلف از متنهای درخواستی است. این مدل زبانی توانایی این را دارد که ویدیوهای موجود را ویرایش کرده تا امکان تغییر سریع مناظر، نور و سبک عکسبرداری را از طریق یک پیام متنی فراهم کند. سورا همچنین میتواند بر اساس یک تصویر ثابت ویدیو تولید کند یا حتی با پر کردن فریمهای از دسترفته، ویدیوهای موجود را گسترش دهد!
OpenAI گفته است که Sora در حال حاضر قادر به تولید حداکثر یک دقیقه محتوای ویدیویی Full HD است و نمونههایی که از آن منتشر شده بسیار امیدوارکننده بهنظر میرسند.
برای نمونههای ویدیوی تولیدشده بیشتر میتوانید این لینک بررسی کنید.
هوش مصنوعی سورا میتواند صحنههایی پیچیده با شخصیتهای متعدد، انواع حرکتهای خاص و جزئیات دقیق سوژه و پسزمینه را ایجاد کند. این مدل نه تنها آنچه را که کاربر در اعلان درخواست کرده است میفهمد، بلکه چگونگی وجود آن چیزها در دنیای فیزیکی را نیز درک میکند!
این مدل زبانی با استفاده از معماری ترانسفورماتور مشابه ChatGPT توسعه داده شده که در آن فیلمها و تصاویر به عنوان واحدهای کوچکتر “داده” به نام “پچ” ارائه میشوند. ویدیوهای تولیدشده توسط Sora به صورت نویز ثابت شروع میشوند و این مدل به تدریج نویز را حذف میکند تا محصول نهایی را تشکیل دهد.
کارشناسان OpenAI اکنون در حال آزمایش و بررسی بیشتر سورا هستند تا این مدل را برای مقابله خطرات احتمالی قبل از راهاندازی رسمی آن ارزیابی کنند.
در حال حاضر تاریخ رسمی راهاندازی هوش مصنوعی سورا (Sora) مشخص نشده است.
منبع: Gsmarena