Қазақ тілінде қолжазба мәтінді тану жүйесін әзірлеу
##plugins.pubIds.doi.readerDisplayName##:
https://doi.org/10.51301/ce.2024.i4.01Ключевые слова:
қолжазба мәтінді тану, машиналық оқыту, қазақ тілі, терең оқыту, конволюциялық нейрондық желілер, қайталана-тын нейрондық желілер, таңбалардағы қателер жиілігі, сөздердегі қателер жиілігіАннотация
Қазақ тілін цифрландырудың төмен дәрежесі бюрократияның тиімділігіне, қазақ тіліндегі әдебиет пен білімнің қолжетімділігіне әсер ететін проблема болып табылады. Бұл зерттеуде қазақ тіліне арналған қолжазба мәтінін (HTR) танудың заманауи тәсілі ұсынылған. Ол құжат айналымы мен мәтінді талдауды оңтайландырады, Қазақ әдебиеті мен тарихи ресурстардың қолжетімділігін арттырады, оқытушыларға оқушылардың эсселерін бағалауға, ал судьяларға шешім қабылдауға көмектеседі. Бұл шешім бизнестегі, білім берудегі және мемлекеттік қызметтердегі операциялық процестерді оңтайландырады. Мәтінді аударудың дәлдігі мен өнімділігін арттыру үшін ең заманауи Алгоритмдер біріктірілген. Қазақ тіліне арналған HTR-де қазақ әліпбиіне арнайы бейімделген HTR жүйесін құру үшін машиналық оқытудың (ML) тиімді әдістері қолданылады. Se конволюциялық нейрондық желілердің (CNN), қайталанатын нейрондық желілердің (RNN), кескіндерді үлкейту, тасымалдауды үйрену және классикалық ML әдістерінің мүмкіндіктерін пайдаланады. HTR Python бағдарламалау тілі, oxv кітапханалары, PyTorch және Scikit - learn көмегімен жүзеге асырылады. Жүйе әртүрлі тақырыптағы қазақ қолжазба мәтінінің үлкен деректер жиынтығында оқытылды.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2024 Computing & Engineering

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.
<div class="pkpfooter-son">
<a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc/4.0/80x15.png"></a><br>This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc/4.0/">Creative Commons Attribution-NonCommercial 4.0 International License</a>.
</div>