МӘТІНДІ НОРМАЛАУ ҮШІН NAIVE BAYES КЛАССИФИКАТОРЫ: ҚАЗАҚ ТІЛІНДЕ ЗЕРТТЕУ
DOI:
https://doi.org/10.54309/IJICT.2022.11.3.002Кілт сөздер:
мәтінді қалыпқа келтіру, Naïve Bayes алгоритмі, табиғи тіл, мәтінді өңдеу, классификаторАңдатпа
Соңғы жылдары күрделі құжаттар мен мәтіндердің саны экспоненциалды түрде өсті, бұл көптеген қолданбаларда мәтіндерді тиімді анықтау үшін машиналық оқыту технологияларын тереңірек түсінуді талап етеді. Мәтінді қалыпқа келтіру - ең жақсы шешімдердің бірі. Бұл мәтіндегі барлық сөздерді бастапқы түріне келтіру.
Бұл мақалада интернеттен жүктеп алынған қазақ тіліндегі әдебиеттердегі қателерді түзетудің көп деңгейлі стратегиясы қарастырылған. Әлеуметтік желілерді лингвистикалық зерттеулердің көзі ретінде кеңінен пайдалануына байланысты қателерді түзету өзекті мәселе болып табылады. Бұл зерттеудің мақсаты ағылшын тіліндегі қазіргі аңғал Байес алгоритмін, сонымен қатар қазақ тіліне ұқсас алгоритм құру үшін табиғи тілдегі сөздер мен сөйлемдерді нормалауды зерттеу болды. Бұл жұмыстың мақсаты ағылшын тіліндегі қолданыстағы Naive Bayes алгоритмін және табиғи тілдердегі сөздер мен сөйлемдерді нормалауды зерттеу, сондай-ақ қазақ тіліне арналған ұқсас алгоритмді жасау болды. Сөздің түбірін алудың қолданыстағы алгоритмдері және қалыпты форманы синтездеудің мүмкін жолдары қарастырылады.
Сөздікте сөздік өңдеуге қолайлы қазақ сөздерінің морфологиялық әдістемесі және олардың ағылшын тілінен айырмашылығы қарастырылады. Нормалау жүйесінің нәтижесінде бұл әдістің қазақ тілі үшін тиімділігі дәлелденді.
##plugins.generic.usageStats.downloads##
Жүктеулер
Жарияланды
Дәйексөзді қалай келтіруге болады
Журналдың саны
Бөлім
Лицензия
Авторлық құқық (c) 2023 International Journal of Information and Communication Technologies
Бұл жұмыс Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Дүние жүзінде.
https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en