COLLECTION OF DATASETS AND APPLICATION OF NEURAL NETWORK MODELS FOR SIGN LANGUAGE CLASSIFICATION IN PATTERN RECOGNITION TASKS
DOI:
https://doi.org/10.54309/IJICT.2024.20.4.006Ключевые слова:
Наборы данных, CV; CNN (Convulitional neural network); Язык жестов; бинарная классификация; Машинное обучение; Support Vector Machine, AlexNet, LeNet, softmax, ReLU, градиентный спуск, Adam Optimizer, пакетная нормализация, сравнительный анализ.Аннотация
В настоящее время все больше исследований направлено на решение задач с использованием библиотек компьютерного зрения и инструментов искусственного интеллекта. Наиболее распространенными являются решения и подходы с использованием моделей машинного и глубокого обучения искусственных нейронных сетей для распознавания жестов казахского жестового алфавита на основе контролируемого обучения и методов глубокого обучения для обработки последовательных данных. Объектом исследования является казахский жестовый алфавит для построения коммуникации между людьми с ограниченными возможностями. Предметом исследования являются методы машинного обучения и модели искусственных нейронных сетей и глубокого обучения для классификации и распознавания жестов. Методами исследования являются Data Science, Machine Learning, Deep Learning, Neural Networks и Computer Vision.
Распознавание образов представляет собой изображение, на котором расположен объект. Поскольку объект является абстрактным (объектом может быть любая фигура, изображенная на рисунке). Мы решили исследовать одно из актуальных направлений — распознавание жестов. Для распознавания казахского жестового языка для начала необходимо выучить казахский жестовый алфавит. Для обучения нейронной сети распознаванию казахского жестового языка необходимо собрать данные (датасеты) в формате изображений, обозначенных жестами рук. Распознавание жестов — это задача классификации, которая является одним из направлений распознавания образов. Фундаментальной основой распознавания является теория распознавания образов.
Скачивания
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2024 МЕЖДУНАРОДНЫЙ ЖУРНАЛ ИНФОРМАЦИОННЫХ И КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en