ОБЗОР МЕТОДОВ КЛАССИФИКАЦИИ ЭМОЦИЙ НА ОСНОВЕ АНАЛИЗА АУДИОДАННЫХ С ПОМОЩЬЮ ГЛУБОКОГО ОБУЧЕНИЯ
DOI:
https://doi.org/10.54309/IJICT.2023.13.1.009Ключевые слова:
глубокое обучение, свёрточная нейронная сеть, мел-частотный кепстральный коэффициент, многослойный перцептрон.Аннотация
В последние несколько лет наблюдается всё больший интерес к разработке технологий, направленных на определение эмоционального состояния человека. Наиболее затруднительным в решении этой проблемы является субъективность эмоций и сложность их отслеживания. Максимально эффективным инструментом для распознавания эмоций оказалось глубокое обучение, став по этой причине особенно привлекательной областью исследований. В этой статье мы рассматриваем недавние исследовательские работы по классификации эмоций, делая акцент на методах извлечения звуковых признаков и аугментации данных. Мы также сравниваем и анализируем существующие модели свёрточных нейронных сетей, с целью определения наиболее проверенных методов, позволяющих наилучшим образом классифицировать эмоции на основе анализа аудиоданных. Из множества публикаций, посвящённых исследованию распознавания эмоций и разработкам в этой области, мы отобрали только научные статьи, благодаря чему в нашей статье используются наиболее актуальные исследования. При этом мы рассматриваем только статьи хорошего качества, в которых предлагаются наилучшие решения рассматриваемых исследовательских вопросов.
Скачивания
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2023 МЕЖДУНАРОДНЫЙ ЖУРНАЛ ИНФОРМАЦИОННЫХ И КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en