لب خوانی کامپیوترها از انسان‌ها بهتر است!

ظاهراً این بار هم کامپیوترها از انسان‌ها پیشی گرفته اند.



آیا تا به حال تلاش کرده اید صحبت های کسی را لب خوانی کنید؟ اگر بازی هایی مثل چالش زمزمه را امتحان کرده باشید حتماً متوجه شده اید که این کار تا چه اندازه سخت است؛ چرا که کلمات زیادی وجود دارند که در تلفظ آنها حالت لب و دهان درست مثل سایر کلمات است. به این ترتیب به میزان سختی و گمراه کنندگی لب خوانی اضافه می شود. اما ظاهراً این بار هم کامپیوترها از انسان ها پیشی گرفته اند.


امروزه افرادی وجود دارند که در لب خوانی حرفه ای هستند اما متاسفانه به نظر می رسد که کامپیوترها یک بار دیگر توانسته اند از انسان ها جلو بزنند. ظاهراً چند دپارتمان مختلف در دانشگاه آکسفورد به چند روش کارآمد اما مختلف دست یافته اند تا لب خوانی را به کامپیوترها نیز آموزش دهند.


دپارتمان علوم کامپیوتری آکسفورد موفق به توسعه سیستمی به نام LipNet شده و آن را با استفاده از مجموعه داده هایی به نام GRID ساخته اند که بر اساس ویدیوهای کاملاً واضح از افرادی که جلوی دوربین قرار گرفته اند و کلمات سه ثانیه ای را ادا می کنند تهیه شده است. از این رو آنها یک شبکه عصبی آموزش داده اند که بر اساس تست های صورت گرفته قادر است 93.4 درصد کلمات را به درستی تشخیص دهد. افراد داوطلب برای لب خوانی نیز در همان تست مشابه موفق شده اند تنها 52.3 درصد کلمات را درست تشخیص دهند.


دپارتمان علوم تجربی نیز سیستم دیگری توسعه داده است که با هوش مصنوعی DeepMind گوگل کار می کند. این سیستم بر اساس یک سری ویدیوی 100.000 تایی از بی بی سی ساخته شده است که بر اساس کشفیات این گروه، توانسته در 46.8 درصد موارد موفقیت آمیز عمل کند. در حالی که تلاش های متخصصین لب خوانی تنها منجر به 12.4 درصد تشخیص صحیح شده است.
در حالی که این پیشرفت ها در دنیای تکنولوژی بسیار خارق العاده به نظر می رسد اما باید روی مفاهیم و پیاده سازی آن نیز تامل بیشتری شود.

منبع :