فناوری کنترل نویز فعال برای به حداقل رساندن یا مسدود کردن کامل سر و صدای بیرون توسط هدفون های دارای قابلیت حذف نویز استفاده میشود. این هدفونها به این دلیل محبوب هستند که تجربه گوش دادن آرامتر و همهجانبهتری را بهویژه در مناطق پر سر و صدا ارائه میکنند. با این حال، علیرغم پیشرفتهای بسیار در این فناوری، کاربران هنوز کنترل زیادی بر روی صداهایی که هدفونهایشان مسدود میکند، ندارند.
شنوایی معنایی
اکنون، الگوریتمهای یادگیری عمیق توسط گروهی از دانشگاهیان در دانشگاه واشنگتن ایجاد شده است که کاربران را قادر میسازد تا انتخاب کنند که کدام نویزها را از طریق هدفون خود فیلتر کنند. این سیستم توسط سازندگان آن “شنوایی معنایی” نامگذاری شده است. برای اطلاع از جزییات بیشتر این مطالعه با اِروتِک همراه باشید.
هدفون های مجهز به هوش مصنوعی با پخش صدای ضبطشده به گوشی هوشمندی که به دستگاهها متصل است، تمام نویزهای پس زمینه را از بین می برند. از طریق این فرآیند، کاربران این هدفون میتوانند 20 نوع صدا از جمله آژیر، گریه نوزاد، گفتار، جاروبرقی و صدای جیر جیر پرندگان را با استفاده از دستورات صوتی یا یک برنامه گوشی هوشمند تقویت یا لغو کنند. سپس این دستورات در هدفون پردازش میشوند تا فقط صداهایی را که کاربر انتخاب کرده است عبور دهند.
شیام گولاکوتا، نویسنده ارشد این مقاله و استاد علوم و مهندسی کامپیوتر دانشگاه پاول جی آلن، میگوید:
درک صدای یک پرنده و استخراج آن از همه صداهای دیگر در یک محیط مستلزم هوشمندی لحظهای در زمان واقعی است که هدفونهای حذف نویز امروزی به آن دست پیدا نکردهاند.
چالش اصلی این فناوری این است که صداهایی که هدفونها میشنوند باید با حواس بینایی کاربران همگام شوند. شما نمیتوانید صدای کسی را دو ثانیه پس از صحبت با شما بشنوید. این بدان معناست که الگوریتمهای عصبی باید صداها را در کمتر از یک صدم ثانیه پردازش کنند!
با توجه به این محدودیت زمانی، به جای استفاده از سرورهای ابری قابل اعتمادتر، سیستم شنوایی معنایی، فرآیندی را انتخاب میکند که متکی به نویزهای ارسالشده در دستگاهی مانند تلفن هوشمند متصل است. علاوه بر این، برای اینکه انسانها بتوانند بهطور موثر صداها را در محیط خود تجربه کنند، سیستم باید این تاخیرها و سایر نشانههای فضایی را حفظ کند چراکه صداها از جهات مختلف در زمانهای مختلف وارد گوش افراد میشوند.
بهتر از صدای ضبطشده اصلی!
کارآزماییهای این فناوری توسط محققان در محیطهای مختلف، از جمله خیابانها، پارکها و ادارات انجام شد. آزمایشها نشان داد که سیستم شنوایی معنایی قادر است صداهای هدف مانند آژیر و صدای پرنده را جدا کرده و در عین حال صدای پسزمینه را حذف کند. از نظر خروجی صوتی سیستم برای صداهای مورد نظر، 22 شرکت کننده به آن امتیازی بالاتر از صدای ضبطشده اصلی دادند!
با این حال، چند اشکال وجود داشت: سیستم مجهز به هوش مصنوعی گاهی اوقات در تشخیص صداهایی که بیش از حد شبیه به نظر میرسیدند، مانند موسیقی آوازی و گفتار انسان، مشکل داشت. محققان در حال کار بر روی حل این مشکلات هستند و استدلال میکنند که اگر مدلهای یادگیری ماشینی آن بر روی دادههای دنیای واقعیتر آموزش داده شوند، میتواند نتایج بهتری را به دست آورد.
این مطالعه در مجله ACM Digital Library منتشر شده است.
منبع: Interestingengineering