AUDIOSIGNAL BASED EVENT DETECTION USING DEEP LEARNING TECHNIQUES
DOI:
https://doi.org/10.54309/IJICT.2024.19.3.002Аннотация
Глубокое обучение вызывает большой интерес у исследователей при выполнении задач распознавания образов. В частности, стоит отметить выявление событий на основе аудиосигналов и распознавание природных звуков окружающей среды. Мероприятие DCASE challenge — Detection and Classification of Acoustic Scenes and Events — продемонстрировало эффективность глубокого обучения в выполнении этих задач. В данной работе проводится обзор исследований других авторов, которые применяли различные методы глубокого обучения для определения чрезвычайных событий на основе аудиосигналов. Особое внимание уделяется сложности задачи распознавания событий на основе полифонических звуков и особенностям решения этой задачи. Рассматривается применение и структура нейронных сетей, а также использование CNN и RNN для обнаружения событий на основе аудиосигналов. Приведен обзор метрик оценки и баз данных.
Скачивания
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2024 МЕЖДУНАРОДНЫЙ ЖУРНАЛ ИНФОРМАЦИОННЫХ И КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en