هوش مصنوعی می‌تواند ویدیوهایی از آینده بسازد

محققین MIT CSAIL یک الگوریتم یادگیری عمیق ساخته اند که می‌تواند ویدیوهایی با نمایی از آینده و اتفاقاتی که انتظار داریم در آینده رخ بدهند را به تصویر بکشد.



دستگاه های زیادی وجود دارند که قادرند لحظات شما را توسط دوربین ثبت کنند اما اگر می توانستید موقعیت های را ثبت کنید که در آینده اتفاق خواهند افتاد چه؟ این سوال آنقدرها هم که فکر می کنید دور از ذهن نیست. محققین MIT CSAIL یک الگوریتم یادگیری عمیق ساخته اند که می تواند ویدیوهایی با نمایی از آینده و اتفاقاتی که انتظار داریم در آینده رخ بدهند را به تصویر بکشد.


هوش مصنوعی MIT بعد از آموزش های گسترده (حدود 2 میلیون ویدیو) ویدیویی را تولید کرد که حاصل از ایجاد یک حفره بین دو شبکه عصبی بود. یکی از این شبکه ها می تواند با تشخیص اینکه کدام اشیاء در تصاویر ثابت حرکت خواهند کرد صحنه را بسازد. در عین حال دیگری نیز می تواند شبیه به یک تست کیفیت عمل می کند که تشخیص می دهد آیا ویدیوها واقعی هستند و یا شبیه سازی شده اند. بنابراین ویدیوی مصنوعی یک موفقیت به حساب می آید چرا که می تواند هوش مصنوعی چک کننده را فریب دهد تا فکر کند ویدیوی ساخته شده واقعی ست.


قطعاً این تکنولوژی محدودیت های خاص خودش را دارد. این سیستم نمی تواند ویدیوهایی تولید کند که بیش از 1.5 ثانیه آینده را به تصویر بکشند و نتایج به دست آمده آنقدرها واقعی نیستند. این سیستم هنگام حرکت اشیاء متوجه نمی شود که آنها هنوز در سر جای خود هستند و تمایل دارد در سایز آنها نیز اغراق کند. در هر حال توانایی پیش بینی صحنه های پیچیده ای مثل حرکت موج های ساحل و یا مردمی که در حال راه رفتن روی چمن هستند به اندازه کافی جالب است.


اگر CSAIL بتواند پیش گویی ها را گسترش دهد و آنها را واقعی تر کند، تاثیرات گسترده ای ایجاد خواهد شد. مثلاً خودروهای خودران می توانند پیش بینی کنند که سایر ماشین ها و عابرین در چه موقعیتی قرار دارند در حالی که دوربین های امنیتی می توانند عدم تطابق ویدیوها را بر اساس چیزی که انتظار دارند ببینند تشخیص دهند. همچنین این سیستم برای کارهایی روزمره ای مثل اضافه کردن انیمیشن به تصاویر ثابت و یا فشرده سازی ویدیوها نیز کاربرد دارد چرا که احتمالاً به همه فریم ها نیازی نخواهید داشت. بدون در نظر گرفتن شرایط، تشخیص آینده می تواند به هوش مصنوعی کمک کند تا درک بهتری از وقایع کنونی داشته باشد و در مواردی که دید کامپیوترها از اهمیت بالایی برخوردار است کمک کننده باشد.

منبع :