اگر پیگیر اخبار تکنولوژی باشید حتما درباره sora شنیدهاید. sora هوش مصنوعی ویدیوساز شرکت اوپن ای آی است که به تازگی منتشر شده و هرچه درباره اش بگوییم کم است! محتوای تولید شده توسط سورا آنقدر باورنکردنی است که فقط باید ببینید تا باورتان شود از چه صحبت می کنیم. در این بلاگ نامبرلند همه چیزهایی که باید درباره سورا بدانیم و چندین ویدیوی مختلفش را برایتان گذاشتهایم.
مثلا ویدیوی زیر که تصویر چشمان یک زن از نزدیک است را از نزدیک ببینید؛ آیا باورتان می شود واقعی نباشد؟
sora: انقلابی در هوش مصنوعیهای ویدیوساز
اخبار مربوط به Sora همه اینترنت را پر کرده، این هوش مصنوعی قادر است ویدیوهایی بسازد که به طرز ترسناکی مشابه دنیای واقعی است. سورا دقیقا چیست؟
هوش مصنوعی sora دقیقا چیست؟
Sora یک مدل هوش مصنوعی تبدیل متن به ویدئو است که توسط سازندگان چت جیپیتی یعنی کمپانی OpenAI توسعه یافته است. اصطلاح «تبدیل متن به ویدیو» به این معنی است که سورا درخواست های متنی را از شما میگیرد و آن را به کلیپ های ویدیویی کوتاه تبدیل می کند. کمپانی OpenAI در وبلاگ رسمیاش درباره توضیح سورا اینطور نوشته:
«سورا میتواند صحنههای پیچیده با شخصیتهای متعدد، انواع حرکات خاص و پیچیده، با جزئیات دقیق سوژه و یک پسزمینه بدون خطا را تولید کند.» این مدل نه تنها قادر است درخواست کاربر را به خوبی درک کند، بلکه چیستی و چگونگی وجود موارد درخواست شده در دنیای فیزیکی را نیز درک میکند.
ساز و کار هوش مصنوعی sora| soraچگونه کار میکند؟
تکنولوژی سورا مشابه مدلهای زبانی خانواده جیپیتی کار میکند. همه آنها از معماری “ترانسفورماتور” استفاده میکنند؛ نوعی شبکه عصبی که ورودی را دریافت میکند و آن را به خروجی “تبدیل” می کند. آنها همچنین از یک سری توانایی های DALLE-3 مانند سیستم بازنویسی استفاده کردهاند. در ادامه چند ویژگی مهم سورا را باهم مرور میکنیم.

ساخت ویدیو دقیقا مثل واقعیت
سورا قادر است به طرز عجیبی واقع گرایانه ویدیو بسازد طوری که در نگاه اول هرگز حدس نخواهید زد که ساخته شده توسط هوش مصنوعی است! حتی در نگاه دوم و سوم هم تشخیص نخواهید داد که این ویدیوها واقعی نیست! به همین جهت تمام ویدیوها واترمارک اوپن ایآی را روی خود دارند تا بلکه از این طریق قابل تشخیص باشد.
تبدیل متن به ویدئو
ویژگی متمایز Sora AI نسبت به دیگر ابزارهای ویدیوساز، توانایی فوق العاده بالایش برای درک دقیق درخواستهای (پرامپت) متنی و تبدیل آنها به کلیپ های ویدیویی با کیفیت است. این ویژگی بسیار مهمی است چراکه یکی از مشکلات بزرگ با ابزارهای هوش مصنوعی را حل کرده و فرصت بسیار خوبی را برای سازندگان ویدیو در صنایع مختلف فراهم میکند که ایده های خود را به راحتی به واقعیت تبدیل کنند.
سورا می تواند هر ویدیویی برای شما بسازد، از منظره های شهری پویا گرفته تا انیمیشن و کارتن!
تولید ویدیو از روی یک عکس یا ساخت ادامه ویدیو
این مدل علاوه بر اینکه میتواند یک ویدیو را صرفاً از دستورالعملهای متنی تولید کند، میتواند یک تصویر را دریافت کند و از آن فیلم بسازد و محتوای تصویر را با دقت و توجه به جزئیات بسیار ریز آن، متحرک کند. این مدل همچنین میتواند یک ویدیو را دریافت کند و آن را گسترش دهد (یا فریمهای از دست رفته را پر کند.
Sora به عنوان پایه ای برای مدل هایی عمل می کند که می توانند دنیای واقعی را درک و شبیه سازی کنند، قابلیتی که ما معتقدیم نقطه عطف مهمی برای دستیابی به AGI خواهد بود.
چه کسانی به sora دسترسی دارند؟
Sora در حال حاضر فقط برای محققان امنیتی که مسئول اطمینان از ایمن بودن سورا هستند در دسترس است و برای عموم مردم در دسترس نیست.
در حال حاضر تاریخ انتشار Sora مشخص نیست و تمام ویدیوهای سورا که در چند روز گذشته در اینترنت پخش شده است، از پست وبلاگی OpenAI برداشته شده است.
OpenAI تا به حال هیچ نشانه و خبری هم درباره اینکه سورا چه زمانی و برای چه کسانی در دسترس خواهند بود نداده، حتی ممکن است کلا امسال عرضه نشود و این موضوع کاملاً غیرمعمول است و میتواند نشانهای باشد که مدت خیلی زیادی تا انتشار عمومیاش مانده.
مقایسه sora با دیگر ابزارهای هوش مصنوعی ویدیوساز
sora | pika | runway | |
تمرکز | متمرکز بر ساخت ویدیوهای واقع گرایانه | متمرکز بر ساخت ویدیو از روی تصویر در استایل انیمیشن | متمرکز بر ویرایش ویدیو |
مدت زمان | تا ۶۰ ثانیه | ۳ ثانیه | ۴ ثانیه |
کارایی | بسیار قوی | ضعیف | نسبتا قوی |
نوع درخواست یا ورودی | متنی | تصویری، به همراه کمی توضیحات متنی | تصویر، ویدیو،متن |
استایل خروجی | بسیار واقع گرایانه | هنری و انیمیشن | متنوع و شامل استایلهای مختلف |
قیمت | نامشخص | رایگان | پولی |
محدودیتها | نامشخص | درخواستهای پیچیده را به خوبی اجرا نمیکند | خروجی احتیاج به ویرایش دارد |
نقاط قوت | واقع گرایانه، خطای بسیار کم | پویانمایی خلاقانه، افکتهای جالب | تطبیق پذیر |
امکان شخصی سازی شدن | نامشخص | دارد | دارد |
مشکلات فعلی sora
البته که مدل فعلی سورا دارای نقاط ضعف مختلفی است! مثلا ممکن است با شبیه سازی دقیق و اصولی یک صحنه پیچیده مشکل داشته باشد یا ممکن است چگونه انجام شدن یک اتفاق در ویدیو را درک نکند. به عنوان مثال، ممکن است فردی به یک بیسکوییت گاز بزند اما پس از دو ثانیه ببینید بیسکوییت سالم و بدون جای خورده شدن باشد!
اثرات سورا بر جامعه
معرفی Sora AI تغییر گسترده ای در تولید محتوا در صنایع مختلف ایجاد می کند. در نتیجه، این فناوری برای فیلمسازان، هنرمندان، فعالان در صنعت تبلیغات و.. یک موهبت عالی است. هنوز که این ابزار منتشر نشده اما وقتی منتشر شد برای تولید سریع و کارآمد محتوای ویدیویی استفاده های فراوان دارد که زمان و هزینه تولید را برای طراحان کاهش می دهد.
اما مانند هر فناوری پیشرفته دیگری در دنیای هوش مصنوعی، سورا میتواند پیامدهای اخلاقی قابل توجهی به همراه داشته باشد. کمپانی OpenAI از این نگرانیها آگاه است و اقدامات ایمنی کارآمدی را برای جلوگیری از سوء استفادهها به کار گرفته است، به عنوان مثال، فیلترهایی برای نوشتن درخواست تولید محتوا و دستورالعمل های استفاده وجود دارد.
پشمام
برگام، پشمام، پرهام
آه ورری یس