A NAIVE BAYESIAN CLASSIFIER FOR NORMALIZATION OF TEXT: A CASE STUDY FOR KAZAKH LANGUAGE

Assylay Tolegenova

doi:10.54309/IJICT.2022.11.3.002

ХАЛЫҚАPАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ

МӘТІНДІ НОРМАЛАУ ҮШІН NAIVE BAYES КЛАССИФИКАТОРЫ: ҚАЗАҚ ТІЛІНДЕ ЗЕРТТЕУ

Авторлар

Assylay Tolegenova Suleyman Demirel University

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.54309/IJICT.2022.11.3.002

Кілт сөздер:

мәтінді қалыпқа келтіру, Naïve Bayes алгоритмі, табиғи тіл, мәтінді өңдеу, классификатор

Аңдатпа

Соңғы жылдары күрделі құжаттар мен мәтіндердің саны экспоненциалды түрде өсті, бұл көптеген қолданбаларда мәтіндерді тиімді анықтау үшін машиналық оқыту технологияларын тереңірек түсінуді талап етеді. Мәтінді қалыпқа келтіру - ең жақсы шешімдердің бірі. Бұл мәтіндегі барлық сөздерді бастапқы түріне келтіру.

Бұл мақалада интернеттен жүктеп алынған қазақ тіліндегі әдебиеттердегі қателерді түзетудің көп деңгейлі стратегиясы қарастырылған. Әлеуметтік желілерді лингвистикалық зерттеулердің көзі ретінде кеңінен пайдалануына байланысты қателерді түзету өзекті мәселе болып табылады. Бұл зерттеудің мақсаты ағылшын тіліндегі қазіргі аңғал Байес алгоритмін, сонымен қатар қазақ тіліне ұқсас алгоритм құру үшін табиғи тілдегі сөздер мен сөйлемдерді нормалауды зерттеу болды. Бұл жұмыстың мақсаты ағылшын тіліндегі қолданыстағы Naive Bayes алгоритмін және табиғи тілдердегі сөздер мен сөйлемдерді нормалауды зерттеу, сондай-ақ қазақ тіліне арналған ұқсас алгоритмді жасау болды. Сөздің түбірін алудың қолданыстағы алгоритмдері және қалыпты форманы синтездеудің мүмкін жолдары қарастырылады.

Сөздікте сөздік өңдеуге қолайлы қазақ сөздерінің морфологиялық әдістемесі және олардың ағылшын тілінен айырмашылығы қарастырылады. Нормалау жүйесінің нәтижесінде бұл әдістің қазақ тілі үшін тиімділігі дәлелденді.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Жүктеулер

PDF (Русский)

Жарияланды

2022-09-15

Дәйексөзді қалай келтіруге болады

Tolegenova, A. (2022). МӘТІНДІ НОРМАЛАУ ҮШІН NAIVE BAYES КЛАССИФИКАТОРЫ: ҚАЗАҚ ТІЛІНДЕ ЗЕРТТЕУ. ХАЛЫҚАPАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ, 3(3), 17–23. https://doi.org/10.54309/IJICT.2022.11.3.002

Жүктеу сілтемесі

Журналдың саны

Нөмір 3 № 3 (2022): ХАЛЫҚАРАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ

Бөлім

SOFTWARE DEVELOPMENT AND KNOWLEDGE ENGINEERING

Лицензия

Бұл жұмыс Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Дүние жүзінде.

https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en

##plugins.generic.recommendBySimilarity.heading##

1 2 3 4 5 6 7 8 9 10 > >>

##plugins.generic.recommendBySimilarity.advancedSearchIntro##