ОНТОЛОГИЯ ЖӘНЕ ІЗДЕУ МЕХАНИЗМДЕРІ АРҚЫЛЫ ҚАЗАҚ ТІЛІНДЕГІ ЭКСТРАКЦИЯЛЫҚ QA-ДАҒЫ СЕМАНТИКАЛЫҚ ТОЛЫҚТЫҚ

Мурат Айтимов; Гаухар Муратова; Жадыра Бисенбаева; Идеят Бапиев; Kassim Murizah

doi:10.54309/IJICT.2026.25.1.005

ОНТОЛОГИЯ ЖӘНЕ ІЗДЕУ МЕХАНИЗМДЕРІ АРҚЫЛЫ ҚАЗАҚ ТІЛІНДЕГІ ЭКСТРАКЦИЯЛЫҚ QA-ДАҒЫ СЕМАНТИКАЛЫҚ ТОЛЫҚТЫҚ

Авторлар

М.Ж. Айтимов
Г.К. Муратова Кызылординский университет имени Коркыт ата
Ж.К. Бисенбаева
И.М. Бапиев
М. Кассим

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.54309/IJICT.2026.25.1.005

Аңдатпа

Бұл мақалада қазақ тіліндегі extractive QA міндетін жақсарту үшін онтологиялық байыту және retrieval-augmentation тәсілдерін біріктіретін гибридті модельдер зерттеледі. Жұмыста PDF оқулығынан мәтінді автоматты алу, тазарту, қабаттасатын фрагменттерге бөлу, Sentence-BERT арқылы векторлау және FAISS индексін құруды қамтитын толық дерек дайындау конвейері жасалды. GPT-4 көмегімен 350 сұрақ–жауап жұбы бар финалдық датасет қалыптастырылды. Төрт модель сыналды: mBERT-QA, XLM-RoBERTa-QA, онтологиямен байытылған XLM-RoBERTa және Retrieval + XLM-RoBERTa + Ontology гибриді. EM, F1, BERTScore-F1, ROUGE-L және SemSim метрикалары бойынша гибридті тәсілдер айтарлықтай артық нәтиже көрсетті. Ең жоғары F1 = 52,6 % көрсеткіші retrieval-augmentation және онтологиялық префикстің үйлесімі арқылы алынды. Зерттеу қазақ тіліндегі extractive QA сапасын арттыруда семантикалық байыту мен релевантты фрагменттерді дәл таңдаудың тиімді екенін дәлелдейді.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Жүктеулер

Жарияланды

2026-03-30

Дәйексөзді қалай келтіруге болады

Айтимов , М., Муратова, Г., Бисенбаева , Ж., Бапиев , И., & Murizah , K. (2026). ОНТОЛОГИЯ ЖӘНЕ ІЗДЕУ МЕХАНИЗМДЕРІ АРҚЫЛЫ ҚАЗАҚ ТІЛІНДЕГІ ЭКСТРАКЦИЯЛЫҚ QA-ДАҒЫ СЕМАНТИКАЛЫҚ ТОЛЫҚТЫҚ. ХАЛЫҚАPАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ, 7(1), 76–88. https://doi.org/10.54309/IJICT.2026.25.1.005

Жүктеу сілтемесі

Журналдың саны

Нөмір 7 № 1 (2026): МЕЖДУНАРОДНЫЙ ЖУРНАЛ ИНФОРМАЦИОННЫХ И КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ

Бөлім

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Лицензия

Бұл жұмыс Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Дүние жүзінде.

https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en

ХАЛЫҚАPАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ

ОНТОЛОГИЯ ЖӘНЕ ІЗДЕУ МЕХАНИЗМДЕРІ АРҚЫЛЫ ҚАЗАҚ ТІЛІНДЕГІ ЭКСТРАКЦИЯЛЫҚ QA-ДАҒЫ СЕМАНТИКАЛЫҚ ТОЛЫҚТЫҚ

Авторлар

##plugins.pubIds.doi.readerDisplayName##:

Аңдатпа

##plugins.generic.usageStats.downloads##

Жүктеулер

Жарияланды

Дәйексөзді қалай келтіруге болады

Журналдың саны

Бөлім

Лицензия

##plugins.generic.recommendByAuthor.heading##