ОНТОЛОГИЯ ЖӘНЕ ІЗДЕУ МЕХАНИЗМДЕРІ АРҚЫЛЫ ҚАЗАҚ ТІЛІНДЕГІ ЭКСТРАКЦИЯЛЫҚ QA-ДАҒЫ СЕМАНТИКАЛЫҚ ТОЛЫҚТЫҚ
##plugins.pubIds.doi.readerDisplayName##:
https://doi.org/10.54309/IJICT.2026.25.1.005Аңдатпа
Бұл мақалада қазақ тіліндегі extractive QA міндетін жақсарту үшін онтологиялық байыту және retrieval-augmentation тәсілдерін біріктіретін гибридті модельдер зерттеледі. Жұмыста PDF оқулығынан мәтінді автоматты алу, тазарту, қабаттасатын фрагменттерге бөлу, Sentence-BERT арқылы векторлау және FAISS индексін құруды қамтитын толық дерек дайындау конвейері жасалды. GPT-4 көмегімен 350 сұрақ–жауап жұбы бар финалдық датасет қалыптастырылды. Төрт модель сыналды: mBERT-QA, XLM-RoBERTa-QA, онтологиямен байытылған XLM-RoBERTa және Retrieval + XLM-RoBERTa + Ontology гибриді. EM, F1, BERTScore-F1, ROUGE-L және SemSim метрикалары бойынша гибридті тәсілдер айтарлықтай артық нәтиже көрсетті. Ең жоғары F1 = 52,6 % көрсеткіші retrieval-augmentation және онтологиялық префикстің үйлесімі арқылы алынды. Зерттеу қазақ тіліндегі extractive QA сапасын арттыруда семантикалық байыту мен релевантты фрагменттерді дәл таңдаудың тиімді екенін дәлелдейді.
##plugins.generic.usageStats.downloads##
Жүктеулер
Жарияланды
Дәйексөзді қалай келтіруге болады
Журналдың саны
Бөлім
Лицензия
Авторлық құқық (c) 2026 ХАЛЫҚАPАЛЫҚ АҚПАРАТТЫҚ ЖӘНЕ КОММУНИКАЦИЯЛЫҚ ТЕХНОЛОГИЯЛАР ЖУРНАЛЫ

Бұл жұмыс Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Дүние жүзінде.
https://creativecommons.org/licenses/by-nc-nd/3.0/deed.en