ХАЛЫҚАPАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ

Мамандардың кең ауқымы үшін жаңа идеяларды, ғылым мен техника мәселелерін, соңғы әзірлемелер мен зерттеулерді қамту

МӘТІНДІ НОРМАЛАУ ҮШІН NAIVE BAYES КЛАССИФИКАТОРЫ: ҚАЗАҚ ТІЛІНДЕ ЗЕРТТЕУ

Авторлар

  • Assylay Tolegenova Suleyman Demirel University

DOI:

https://doi.org/10.54309/IJICT.2022.11.3.002

Кілт сөздер:

мәтінді қалыпқа келтіру, Naïve Bayes алгоритмі, табиғи тіл, мәтінді өңдеу, классификатор

Аңдатпа

Соңғы жылдары күрделі құжаттар мен мәтіндердің саны экспоненциалды түрде өсті, бұл көптеген қолданбаларда мәтіндерді тиімді анықтау үшін машиналық оқыту технологияларын тереңірек түсінуді талап етеді. Мәтінді қалыпқа келтіру - ең жақсы шешімдердің бірі. Бұл мәтіндегі барлық сөздерді бастапқы түріне келтіру.

Бұл мақалада интернеттен жүктеп алынған қазақ тіліндегі әдебиеттердегі қателерді түзетудің көп деңгейлі стратегиясы қарастырылған. Әлеуметтік желілерді лингвистикалық зерттеулердің көзі ретінде кеңінен пайдалануына байланысты қателерді түзету өзекті мәселе болып табылады. Бұл зерттеудің мақсаты ағылшын тіліндегі қазіргі аңғал Байес алгоритмін, сонымен қатар қазақ тіліне ұқсас алгоритм құру үшін табиғи тілдегі сөздер мен сөйлемдерді нормалауды зерттеу болды. Бұл жұмыстың мақсаты ағылшын тіліндегі қолданыстағы Naive Bayes алгоритмін және табиғи тілдердегі сөздер мен сөйлемдерді нормалауды зерттеу, сондай-ақ қазақ тіліне арналған ұқсас алгоритмді жасау болды. Сөздің түбірін алудың қолданыстағы алгоритмдері және қалыпты форманы синтездеудің мүмкін жолдары қарастырылады.

Сөздікте сөздік өңдеуге қолайлы қазақ сөздерінің морфологиялық әдістемесі және олардың ағылшын тілінен айырмашылығы қарастырылады. Нормалау жүйесінің нәтижесінде бұл әдістің қазақ тілі үшін тиімділігі дәлелденді.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Жүктеулер

Жарияланды

2022-09-15

Журналдың саны

Бөлім

РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ И ИНЖЕНЕРИЯ ЗНАНИЙ
Loading...