Қазақ тілінде қолжазба мәтінді тану жүйесін әзірлеу

Авторы

  • A. Разақ Satbayev University, Қазақстан
  • Б. Макежанұлы Satbayev University, Қазақстан
  • О. Әлімсеитов Satbayev University, Қазақстан
  • Ж. Қалпеева Satbayev University, Қазақстан
  • A. Аяпбергенова Satbayev University, Қазақстан

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.51301/ce.2024.i4.01

Ключевые слова:

қолжазба мәтінді тану, машиналық оқыту, қазақ тілі, терең оқыту, конволюциялық нейрондық желілер, қайталана-тын нейрондық желілер, таңбалардағы қателер жиілігі, сөздердегі қателер жиілігі

Аннотация

Қазақ тілін цифрландырудың төмен дәрежесі бюрократияның тиімділігіне, қазақ тіліндегі әдебиет пен білімнің қолжетімділігіне әсер ететін проблема болып табылады. Бұл зерттеуде қазақ тіліне арналған қолжазба мәтінін (HTR) танудың заманауи тәсілі ұсынылған. Ол құжат айналымы мен мәтінді талдауды оңтайландырады, Қазақ әдебиеті мен тарихи ресурстардың қолжетімділігін арттырады, оқытушыларға оқушылардың эсселерін бағалауға, ал судьяларға шешім қабылдауға көмектеседі. Бұл шешім бизнестегі, білім берудегі және мемлекеттік қызметтердегі операциялық процестерді оңтайландырады. Мәтінді аударудың дәлдігі мен өнімділігін арттыру үшін ең заманауи Алгоритмдер біріктірілген. Қазақ тіліне арналған HTR-де қазақ әліпбиіне арнайы бейімделген HTR жүйесін құру үшін машиналық оқытудың (ML) тиімді әдістері қолданылады. Se конволюциялық нейрондық желілердің (CNN), қайталанатын нейрондық желілердің (RNN), кескіндерді үлкейту, тасымалдауды үйрену және классикалық ML әдістерінің мүмкіндіктерін пайдаланады. HTR Python бағдарламалау тілі, oxv кітапханалары, PyTorch және Scikit - learn көмегімен жүзеге асырылады. Жүйе әртүрлі тақырыптағы қазақ қолжазба мәтінінің үлкен деректер жиынтығында оқытылды.

Загрузки

Опубликован

2024-12-31

Как цитировать

Razaque, A. ., Makezhanuly, B. ., Alimseitov, O. ., Kalpeyeva, Z. ., & Ayapbergenova, A. . (2024). Қазақ тілінде қолжазба мәтінді тану жүйесін әзірлеу. Computing &Amp; Engineering, 2(4), 1–7. https://doi.org/10.51301/ce.2024.i4.01

Выпуск

Раздел

Сандық технологиялар және бағдарламалық шешімдер